В последние десятилетия глубокое обучение стало одной из ведущих технологий в области искусственного интеллекта. Революционные успехи в распознавании образов, обработке естественного языка и играх на высоком уровне породили надежды, что именно эта технология приведет нас к созданию сильного искусственного интеллекта — системы, способной мыслить и рассуждать на уровне человека или превосходить его. Однако среди учёных и исследователей постоянно ведутся дискуссии о том, имеются ли фундаментальные научные ограничения, которые не позволят глубокому обучению достичь таких высот. В этом материале мы подробно рассмотрим ключевые аргументы как в пользу, так и против возможности глубокого обучения стать основой сильного ИИ, а также проанализируем, какие именно научные, математические и философские проблемы оказывают влияние на эти дебаты. Первым стоит отметить позицию, которую изложил известный учёный и философ науки Джудеа Перл.
Он утверждает, что современные системы глубокого обучения по сути представляют сложные статистические методы, которые можно свести к задаче подгонки многомерных данных — или, проще говоря, к сложному «аппроксимированию». С точки зрения Перла, такие системы больше полагаются на обнаружение корреляций и шаблонов в больших массивах информации, но не на настоящее понимание причинно-следственных связей. В его книге «Книга почему» он выделяет три уровня когнитивных способностей: наблюдение (ассоциация), вмешательство (интервенция) и контрфактическое мышление. Глубокое обучение, по его мнению, застряло на первом уровне и не может перейти ко второму и третьему, которые необходимы для полноценного человеческого разума и принятия решений на основе причинных факторов и гипотетических сценариев. Однако стоит понимать, что позиция Перла — это скорее философская и концептуальная критика, нежели жёсткое научное доказательство того, что глубокое обучение недееспособно в роли основания сильного ИИ.
Нет известного физического или математического закона, который бы однозначно запрещал простым или сложным нейросетям научиться моделировать причинные связи. Более того, современные исследования активно направлены на интеграцию причинного анализа с технологиями глубокого обучения, что свидетельствует об отсутствии принципиальных запретов. Другие исследователи указывают на то, что глубокое обучение — это лишь одна из парадигм искусственного интеллекта, и называть её просто «кривой подгонкой» по отношению к всему интеллекту неверно. Современные нейронные сети научились обрабатывать последовательности, работать с памятью, строить иерархические представления, а при сочетании с алгоритмами обучения с подкреплением достигают впечатляющих результатов в решении сложных задач. Тем не менее, эти возможности пока далеки от достаточно универсальной и гибкой модели разума, каким мы представляем сильный ИИ.
Ещё одним важным аргументом является трудность формализации самого понятия «интеллект». Научное сообщество до сих пор не выработало единого формального определения, способного однозначно охарактеризовать, что именно делает разум разумом. Следовательно, нет и формальной математической системы, которая могла бы служить эталоном для создания или оценки искусственного интеллекта с человеческим уровнем понимания, осознания и творческой активности. Отсутствие общепризнанных критериев делает любые утверждения об ограничениях глубокого обучения относительно сильного ИИ во многом предположительными и эмпирическими. Некоторые философские споры касаются также применимости теоремы Гёделя и других фундаментальных результатов математической логики.
Было высказано мнение, что из-за ограничений, связанных с неполнотой формальных систем, сильный ИИ может быть принципиально недостижим. Однако такое рассуждение почти универсально относится и к человеческому разуму, который тоже оперирует ограниченными логическими и вычислительными механизмами. Следовательно, невозможность преодолеть эти математические ограничения в целом не является преградой исключительно для нейросетевых моделей. Не менее важным является критический взгляд на сам процесс обучения в глубоких нейросетях. На данный момент обучение большинства моделей происходит через внешние процедуры, такие как алгоритм обратного распространения ошибки.
Это значит, что основная часть интеллектуальных инноваций и оптимизация параметров проводится вне нейросети, с помощью классических вычислительных методов. С точки зрения некоторых учёных, это сильно отличает современные глубокие обучающие системы от живого мозга, который по сути учится и функционирует в едином интегрированном процессе. Это различие порождает вопросы о том, можно ли изначально ограниченную архитектуру искусственных нейросетей превратить в обобщённый разум, который способен не только учиться, но и оперировать целями, абстракциями, творчеством и самоосознанием. Без решения этих вопросов глубокое обучение может остаться мощным инструментом для выполнения конкретных задач, но не выйти на уровень истинного сильного ИИ. Однако стоит подчеркнуть, что существующие научные возражения не являются доказательством невозможности создания сильного ИИ с помощью глубокого обучения или расширенных гибридных подходов.
ИИ — это комплексная область, объединяющая различные технологии, включая логические системы, обучение с подкреплением, причинное моделирование, нейросети с долгосрочной памятью и другие. Возможно, именно синтез этих подходов приведёт к преодолению современных ограничений. Подводя итог, можно сделать вывод, что прямых научных или физических законов, однозначно запрещающих глубокому обучению эволюционировать в силный искусственный интеллект, не существует. Но есть ряд концептуальных, математических и философских вызовов, которые делают такой переход крайне непростым. Главные проблемы связаны с пониманием и моделированием причинных связей, обучением и онтологией интеллекта, интеграцией обучения и использования знаний в одном механизме.
Развитие науки и технологии в будущем покажет, удастся ли преодолеть эти барьеры и приблизиться к созданию машин с интеллектом, сопоставимым человеческому, или понадобятся новые революционные идеи и архитектуры, радикально отличающиеся от современных моделей глубокого обучения.