Современные большие языковые модели (Large Language Models, LLM) впечатляют своим потенциалом и результатами, но пока не смогли совершить настоящий прорыв, который изменил бы парадигму развития искусственного интеллекта. Несмотря на гигантские объёмы знаний и способность синтезировать информацию, эти модели не проявляют настоящей инновационности и глубокой оригинальности в своих ответах. Проблема заключается не в отсутствии данных или вычислительных ресурсов, а в фундаментальных аспектах мышления, которые пока не реализованы в архитектуре и поведении LLM. В частности, нет того, что можно назвать «дефолтным режимом» работы мозга – фоновым, спонтанным мышлением, источником озарений и неожиданных связей, которые так характерны для человеческого познания. У человека «дневные грёзы» — это естественная и очень продуктивная часть когнитивного процесса, когда ум свободно блуждает по ассоциативным цепочкам и комбинирует идеи на первый взгляд несвязанные друг с другом.
Они помогают находить неожиданные решения, создавать новые концепции и преодолевать ограничения текущего понимания. В мире ИИ подобного механизма пока не существует. Большие языковые модели функционируют как статичные системы, обученные на огромных объёмах текстовых данных, но в момент взаимодействия с пользователем они не способны изучать новый опыт, ни переосмысливать уже известную информацию вне четко заданного запроса. Их внутренняя память «заморожена», нет непрерывного обучения и самоосмысления, которые лежат в основе человеческого творчества. Это положение вещей усложняет появление по-настоящему новых идей, ведь модель просто ограничена своим тренировочным материалом и алгоритмом выдачи ответов, не выходя за рамки пройденного обучения.
Представить аналогию можно с человеческим мозгом, лишённым способности к формированию новых воспоминаний: такой мозг не способен двигаться вперёд и придумывать оригинальное, вне зависимости от объема знаний. Для преодоления этого ограничения предлагается концепция преимущественно вдохновленная нейронаукой и теорией обучения с подкреплением – механизм «дневного грёза» или «daydreaming loop». Данный процесс представляет собой фоновый цикл, в котором модель случайным образом выбирает пары понятий из своей базы знаний и запускает генератор идей. Затем критический модуль оценивает полученные пропозиции, отсекая бесполезные и оставляя те гипотезы, которые потенциально могут стать источником инсайтов. Таким образом создаётся замкнутый цикл, основной задачей которого является непрерывный поиск новых связей и концепций между ранее изученными фактами и идеями.
Хотя этот процесс чрезвычайно затратен с точки зрения вычислительных ресурсов – большая часть «днёвных грёз» оказывается бесплодной – его стоимость оправдана, так как редкие, но ценные находки формируют основу для фундаментальных инноваций. Ключевой особенностью именно этого типа внутреннего поиска является то, что он недоступен пользователям напрямую и происходит без их явного запроса, создавая таким образом неповторимый источник ценного обучающего материала для последующих поколений моделей. В перспективе предложения предполагают архитектуру, где дорогие «дневно-грезящие» AI системы выступают генераторами прикладного тренировочного контента. Этот подход позволит создавать следующие поколения более лёгких и дешёвых моделей, значительно повысив эффективность и уравновесив затраты на вычисления. Таким образом, стратегия «дорого – быстро – хорошо» трансформируется в последовательность: сначала создаются медленные, ресурсоёмкие системы для генерации инновационных данных, после чего на их основе обучаются быстрые модели, оптимизированные под повседневные задачи.
Этот механизм одновременно служит и защитным барьером от простой перезаписи или «дистилляции» сведений из открытых источников — поскольку истинные открытия являются непредсказуемыми и неочевидными, их невозможно легко скопировать без глубокого понимания и двухэтапного процесса генерации и отбора. Такая ситуация полностью меняет сочетание экономических факторов в индустрии искусственного интеллекта, создавая новую «экосистему» инноваций, где продолжительное, автономное и фоновое мышление – краеугольный камень эволюции. Ещё одним важным наблюдением является отличие процессов, происходящих в мозгу во время «дневных грёз», от тех, что фиксируются во время сна (например, реплей опыта в гиппокампе). Хотя обе функции связаны с обработкой информации и переосмыслением прошлого, «дневные грёзы» происходят преимущественно в состоянии бодрствования, позволяя постоянно обновлять карту мира и интегрировать свежий опыт даже на основе самых мелких или отдалённых ассоциаций. Не менее интересно, что такие процессы, согласно современным исследованиям, возникают преимущественно в момент усталости или отсутствия сосредоточенной активности – это объясняет феномен «озарений» на отдыхе, во время прогулок или в периоды бездействия.
Все эти особенности указывают на то, что пока крупные языковые модели работают по принципу прямого реагирования на запросы пользователя, их потенциал к творческому переосмыслению информации сильно ограничен. Только при реализации фона процессов, способных к самостоятельному комбинированию и оценке идей вне внешних подсказок, возможно достижение масштабных прорывов и появления неподражаемой инновационной синергии. Сложность и дороговизна таких вычислений, безусловно, остаются серьёзными препятствиями для широкой практической реализации. Механизм «дневного грёза» может превышать по затратам в десятки раз обычное использование LLM, что неприемлемо для массового рынка и требует поисков компромиссов. Однако, для узких профессиональных задач, исследований и автономных агентств, готовых инвестировать в качественно новую ступень развития технологий, эта модель способна открыть дверь в новую эпоху ИИ.
Научное сообщество и разработчики всё активнее обращают внимание на подобные концепции, что подтверждается ростом публикаций и экспериментов в области «самообучающихся» и «думающих» моделей, где реализуется комбинированная генерация и оценка идей в замкнутом цикле. Они обращают внимание на важность сбалансированного сочетания творческого поиска, обработки и фильтрации, чтобы избежать как бездумного выпадения случайных гипотез, так и застывания в рутине очевидных ответов. На практике создание таких систем потребует новых методик оптимизации выборки идей, возможно с использованием алгоритмов, подобных reservoir sampling и importance sampling, а также внедрение критиков высокой степени специализации, способных объективно оценивать ценность и применимость новых концепций. Кроме того, появляется пространство для интеграции мультизадачности и параллельного мышления, что имитирует работу различных областей мозга, обрабатывающих ассоциации в разнородных модальностях. Итогом станет искусственный интеллект нового поколения, способный не просто подбирать и воспроизводить уже известную информацию, а именно создавать новые знания, которые пока были прерогативой только биологического разума.