Два года назад начался необычный эксперимент – создание уникальных изображений единорогов с помощью искусственного интеллекта от OpenAI. Эксперимент получил название GPT Unicorn и в основе своего замысла имел простую идею: попросить языковую модель GPT создавать каждый день по одному изображению единорога в формате SVG. Никаких доработок, генеративных состязательных сетей или постоянного обучения. Лишь один запрос в сутки и результат на выходе. Изначально идея казалась скорее забавной, чем серьезной, однако спустя 700 дней проект доказал свою неординарность и позволил проследить развитие ИИ в сфере генерации графики.
Истоки проекта GPT Unicorn уводят нас в апрель 2023 года, когда автор решил проверить возможности GPT-4 в области создания векторных изображений. В то время большинство людей в области ИИ считали, что модель, ориентированная на текст, не способна генерировать цельные художественные изображения, тем более – непрерывно и с каждым разом лучше. Однако эксперимент позволил взглянуть на язык и творчество с неожиданной стороны – с помощью простого запроса модель постепенно начала формировать все более узнаваемые и сложные изображения, приближаясь к визуальному концепту единорога. Начальные работы GPT-4-0314 были весьма далеки от идеала – большинство изображений представляли собой абстрактные формы, бессвязные линии, нечеткие очертания или забавные «почеркушки», которые сложно было назвать единорогами. Среди них встречались странные лица и неуклюжие попытки изобразить рог.
Однако уже тогда в этих хаотичных рисунках просматривались зачатки примитивной визуальной структуры, которая с развитием модели обрела формы. Переход к версии GPT-4-0613 ознаменовался значительным прогрессом. Количество изображений выросло, и модель научилась добавлять характерные элементы: рог, глаза, контуры морды, наброски гривы. Хотя ошибки и неудачи по-прежнему были частыми, по мере накопления опыта рисунки становились все более узнаваемыми. Это дало основания наблюдать, что даже языковая модель, первоначально созданная для работы с текстом, способна через SVG и векторную графику передавать визуальные образы.
Летняя версия GPT-4o-2024-05-13 вывела проект на новый уровень. Количество «сломанных» или нераспознаваемых изображений снизилось, а угадываемость единорогов значительно возросла. Была заметна продвинутая детализация и обретение тех визуальных элементов, которые ассоциируются с этим мифическим существом. Структура композиций стала более цельной, а метод работы – последовательным. Вторая половина 2024 года принесла обновление до GPT-4o-2024-08-06, которое дало смешанные результаты.
Произошло появление новых артефактов и «стилистических» особенностей, в том числе характерной позы, которая получила шутливое название «боковой взгляд». Несмотря на сохранение редких провалов, генерация изображений стала более стабильной. Нечто вроде уникального почерка модели начало проявляться, что интересно с точки зрения анализа ИИ-компетенций. Непрерывность эксперимента стала важным аспектом, ведь за более чем 750 дней модель выполняла ежедневную задачу без изменения командного запроса. Система ежедневно получала однозначное задание: «Нарисовать единорога в формате SVG размером 500 на 500 пикселей, ответ только в виде SVG без пояснений».
Вся сила эксперимента заключалась в неизменности условий и возможности проследить прогресс исключительно по изменению алгоритма и параметров модели. Не менее примечательно, что модель последовательно обновлялась – с GPT-4-0314, через GPT-4-0613, GPT-4o и далее на GPT-4.1. Каждое обновление отражало усилия разработчиков OpenAI по улучшению архитектуры, понимания визуальных концепций и производительности генерации графики. Автор проекта отметил, что GPT-4.
1 сумела создать изображение единорога, которое можно назвать «совершенным» в сравнении с тем, что было в начале. Феномен GPT Unicorn интересен по нескольким направлениям. Во-первых, это свидетельство того, как языковая модель, признаваемая прежде только за работу с естественным языком, способна освоить и применять визуальное представление, подчиняясь строгим правилам SVG и геометрии. Во-вторых, постоянство и систематичность подхода позволяют оценивать изменения модели в динамике, прослеживать улучшения и выявлять слабые места. Кроме технических достижений, проект привлек внимание сообщества, спровоцировал дискуссии о возможностях генеративного ИИ и ограничениях, которые существуют при преобразовании текстовых моделей в творческие инструменты.
Комментарии и отзывы изначально скептически относились к идее ежедневно получать изображения, боясь, что качество не улучшится, но спустя два года результат говорит сам за себя. Важным моментом в эксперименте является переживание автора, который отмечает чувство гордости при просмотре изображений спустя время. Эмоциональная связь с непрерывным процессом, ежедневным ожиданием и наблюдением за эволюцией модели напоминает живой творческий процесс, даже если за его создание отвечает алгоритм. Промежуточные итоги эксперимента показывают, как строгий и минималистичный подход к формированию запроса может способствовать появлению комплексных результатов. Автор не вносил поправок в указания и не помогал системе формировать идеи более детально, чтобы сохранить «чистоту» эксперимента.
Это позволило увидеть подлинную эволюцию способностей ИИ на равных условиях. С точки зрения будущего, GPT Unicorn задаёт интересную веху: возможно, язык и визуальная информация станут ещё теснее переплетаться в одном инструменте, размывая границы между ими. Сегодня уже видны предпосылки для дальнейших улучшений в области создания графики средствами языковых моделей с поддержкой SVG и других форматов. Не менее важен и образовательный аспект. Проект наглядно демонстрирует не только возможности генеративных моделей, но и силу постоянства в работе, важность системного подхода к творческим задачам с использованием ИИ.
Люди и машины могут совместно создавать новые формы искусства, экспериментируя и совершенствуясь. На момент написания последнего обновления в июле 2025 года, GPT Unicorn уже стал своеобразным символом взаимодействия человечества и искусственного интеллекта, способного с помощью простого SVG рассказать историю о волшебных существах и собственной эволюции в мире технологий. Проект вдохновляет задуматься о том, насколько далеко зайдёт развитие ИИ в творческих индустриях, и какую роль в этом будут играть люди, определяющие правила игры и поддерживающие непрерывность процесса. Два года эксперимента – лишь начало большого пути, в котором каждое изображение является ступенькой к новым открытиям и возможностям искусственного интеллекта.