Крупные языковые модели (Large Language Models, LLMs) стали неотъемлемой частью современных технологий искусственного интеллекта. Их способность обрабатывать и генерировать текст на основе обширных баз данных привлекает внимание разработчиков, исследователей и бизнес-профессионалов. Однако одна из наиболее острых проблем, с которыми сталкиваются пользователи LLM, — это их ограниченные возможности по формированию новых, оригинальных идей. Почему это происходит и как можно усилить творческий потенциал таких моделей? Последующие практические наблюдения и эксперименты дают важные подсказки, которые помогут раскрыть потенциал LLM в этой области. Скептики искусственного интеллекта часто считают, что модели просто перепечатывают знания из обучающих данных, не создавая ничего принципиально нового.
Им, кажется, что ИИ лишь воспроизводит уже известные комбинации слов и фактов, не способный к истинному творчеству. С другой стороны, сторонники ИИ задаются вполне логичным вопросом: если модель обладает баснословным объемом информации, в чем тогда причина отсутствия глубокого синтеза и инноваций? Очевидно, что ограниченность генерации новых идей связана не только с архитектурой модели, но и с особенностями процесса её обучения и взаимодействия с пользователем. Одним из ключевых факторов является отсутствие «строительных лесов», то есть вспомогательных систем и инструментов, которые могли бы направлять, структурировать и развивать мыслительный процесс LLM. Модель сама по себе не может выйти за рамки простого воспроизведения или поверхностной связи данных без контекста, поддержки и корректного фидбэка. По этой причине современные подходы к применению крупных языковых моделей все чаще включают их интеграцию в полноценные программные экосистемы, которые формируют специальную среду и наполняют входные данные полезной информацией, ускоряя тем самым генерацию и проверку идей.
Примерами такой «поддержки» служат разнообразные вспомогательные инструменты. Чат-боты с функцией запоминания информации о пользователе позволяют моделям удерживать и соотносить детали беседы, а интеллектуальные помощники для программистов, такие как GitHub Copilot, инициируют и внедряют изменения в кодовую базу, что является проявлением более сложного взаимодействия между моделью, программным обеспечением и конечным пользователем. Этот аспект подтверждает мысль о том, что успех в генерации новых идей во многом зависит от правильного создания и настройки «платформы» вокруг модели. Одна из наиболее интересных концепций — «цикл мечтаний» (day-dreaming loop) — была предложена исследователями, чтобы стимулировать генерацию новых связей между казалось бы случайными фактами. В основе этой идеи лежит алгоритм, при котором модель случайным образом извлекает два факта, после чего обдумывает их возможные взаимодействия и, если выявляет интересные точки пересечения, сохраняет их в виде новых знаний.
Такой итеративный процесс напоминает человеческое мышление, когда сознание переключается между несвязанными идеями для поиска свежих решений. Практические испытания показали, что эта модель очень перспективна, хотя и сопровождается рядом сложностей при реализации. Главная проблема, с которой сталкиваются разработчики, — это склонность моделей к созданию слишком общих или неопределённых взаимосвязей. Например, при попытке соединить концепты, вроде «мицелиальные сети» и «сенсорных экранов», языковая модель может вывести формальную идею о сенсорных интерфейсах, использующих сетевую природу мицелия, но без каких-либо конкретных, применимых к реальности деталей и объяснений. Чтобы преодолеть такую поверхностность, эксперты советуют ограничивать типы генерируемых идей конкретными категориями, например, механизмами, а также задавать строго определённые прикладные задачи, что существенно повышает качество и точность ответов.
Немаловажно и умение оценивать полученные от модели идеи на предмет их применимости и ценности. Опыт показывает, что генерация случайных идей без глубокого понимания тематики быстро ведёт к появлению бесполезного контента, что может сбить пользователя с толку. При фокусе на специализированной области знаний и постановке ясных проблемных вопросов становится проще отличить действительно ценные предложения от пустых размышлений. Этот аспект подчёркивает важность экспертного участия при работе с языковыми моделями в процессе генерации новых идей. Интересен и факт, что попытки влиять на творческий потенциал LLM за счёт «креативных» контекстов, таких как введение в запросы отрывков поэзии, прозаических текстов и разнофактов, зачастую не приводят к ожидаемым результатам.
Несмотря на попытки имитировать многозадачное человеческое мышление через насыщение контекста, модели чаще всего игнорируют «нерелевантный» материал и отвечают строго в ключе заданного вопроса. Это связано с особенностями постобучения — моделей приучают концентрироваться на основной задаче и игнорировать лишние детали, что иногда мешает развернутости и креативности ответов. Впрочем, данное направление всё ещё перспективно и требует дальнейшей оптимизации и экспериментов. Еще одна сложность связана с генерацией фактов в обход типичных паттернов. Чтобы смоделировать «день мечтаний», необходимо регулярно получать разнородные, случайные и при этом содержательные факты, которые будут основой для последующих синтезов.
Однако найти универсальную и надёжную формулировку запроса, способную многократно и последовательно выдавать разнообразные данные из корпуса знаний модели, непросто. В одном из экспериментов приходилось вручную запрашивать у одной из моделей (Claude Opus) по несколько десятков фактов на заданную дисциплину, а потом компилировать эти данные во внешнем формате для дальнейшего анализа и комбинирования. Несмотря на все упомянутые трудности, применение таких методов уже принесло несколько действительно оригинальных и многообещающих идей, которых ранее исследователь не замечал. Это подтверждает гипотезу о том, что при дополнительной доработке и улучшении «среды поддержки» эффективность LLM в создании новых идей может значительно возрасти. Примерно на 30% улучшено подобное решение уже становится коммерчески привлекательным и удобным инструментом для разработки инноваций.
Важным моментом является признание того, что LLM способны создавать тривиально новые тексты и истории даже в стандартных условиях, например, сценарии с необычными персонажами или нестандартными сюжетными линиями. Для противников это не совсем новое творчество, а всего лишь перестановка уже известных элементов на базе обучающей информации. Однако для многих исследователей и практиков такая генерация уже имеет признаки осознания и отображения модели внутренней концептуальной картины мира, что открывает широкий спектр возможностей для дальнейшего развития искусственного интеллекта. Помимо технических нюансов, успех в генерации практичных и творческих идей во многом зависит от сочетания инновационных алгоритмов и грамотной архитектуры поддержки. Новые модели, обучающиеся напрямую с использованием специализированных инструментов и расширенных инструкций, лучше приспособлены для работы в средах, где они могут автоматизировать сложные процессы и совершать осмысленные действия, усиливая таким образом потенциал искусственного интеллекта в целом.
Подводя итог, следует отметить, что крупные языковые модели могут стать мощным средством генерации новых идей при условии создания правильной инфрастуктуры, включающей систематизацию входных данных, ограничение области поиска и постоянную обратную связь от экспертов. Несмотря на существующие ограничения и вызовы, ранние эксперименты и проекты показывают, что при должной подготовке и настройках LLM способны не только воспроизводить известное, но и творчески синтезировать новые ценные концепции, способные изменить подходы в различных областях науки и бизнеса. Для заинтересованных в развитии и совершенствовании подобных технологий доступен открытый проект с исходным кодом, который предоставляет возможности для экспериментов и коллаборации в сфере генерации идей с помощью LLM, что открывает широкие горизонты для исследователей и разработчиков, стремящихся вывести искусственный интеллект на следующий уровень.