В современном мире искусственный интеллект становится неотъемлемой частью нашей повседневной жизни. Одной из наиболее заметных технологий является ChatGPT и прочие крупные языковые модели, которые способны генерировать текст практически по любой теме. Однако многие читатели замечают, что стиль написания таких моделей отличается узнаваемыми особенностями. Почему же ChatGPT пишет именно так? В чем причина этого специфического языка и каковы его исторические и риторические корни? Об этом мы расскажем в подробностях. Во-первых, стоит понимать, как работает ChatGPT.
Эта модель создана на основе огромного количества текстовых данных человеческого происхождения, что позволяет ей предсказывать наиболее вероятные слова или конструкции, исходя из предыдущего контекста. Поэтому естественно, что она подражает реальным человеческим способам выражения мысли. Более того, первичные риторические техники, которыми она пользуется, имеют древние корни и многовековую историю использования в литературе и ораторском искусстве. Ключевая особенность, прежде всего бросающаяся в глаза – навязчивая склонность к использованию параллелизма. Параллелизм – это прием, при котором слова, фразы или целые конструкции выстраиваются в структуру, где повторяется один и тот же грамматический тип или синтаксическая форма.
В человеческой речи это создает эффект ритма и способствует лучшему восприятию информации. Знаменитые ораторы, вроде Уинстона Черчилля, использовали параллелизм для усиления выразительности своих речей, что и стало классикой риторики. Однако в текстах, созданных ChatGPT, параллелизм зачастую приобретает чрезмерно механический и навязчивый характер. Например, когда говорится, что что-то является не просто эффективным, но и надежным и действенным – такой прием повторяется слишком часто. В итоге эффект, который в классической литературе вызывает воодушевление и внимание, в написании машин становится монотонным и излишне формальным.
Отдельно стоит упомянуть прием «это не X, а Y», изначально известный как антитеза. Антитеза, как термин из классической риторики, означает противопоставление двух идей в грамматически параллельной конструкции. Примеры этого приема можно найти как в речах великих политиков, например, в знаменитой фразе Джона Кеннеди «Не спрашивай, что твоя страна может сделать для тебя, а спроси, что ты можешь сделать для своей страны», так и в религиозных текстах или произведениях литературы. Что характерно для машинного письма, так это склонность использовать антитезу чрезмерно буквально и явно, вводя отрицание с помощью слов «не», «нет» или «исключая», тогда как в человеческих текстах часто встречаются более утонченные, тонкие противопоставления, которые подразумевают контраст, не делая его таким явным. Еще один широко используемый элемент – правило троек или триколон.
Оно построено на последовательном перечислении трех элементов, каждое из которых подкрепляет предыдущий, создавая динамичный эффект на слушателя или читателя. С древних времен и до современности люди находят этот способ построения речи легким для восприятия и запоминания. Фраза «Veni, vidi, vici» Цезаря является классическим примером триколона. Чрезмерная любовь ChatGPT к триадам проявляется тем, что почти каждое утверждение строится как список из трех качеств или понятий. Все эти риторические приемы прекрасно работают сами по себе, если используются с должным чувством меры и вкуса.
Проблема, как отмечают лингвисты и эксперты, заключается в том, что ChatGPT применяет их чрезмерно последовательно, не имея возможности оперировать таким понятием, как «вкус» или «градация». Иными словами, модель не может интуитивно почувствовать, что определенный стиль уместен в одном контексте и излишен в другом. Она воспринимает стиль как алгоритм и применяет его по всем правилам и на каждом шагу, что для человеческого восприятия выглядит избыточным и шаблонным. Естественно, что именно поэтому тексты, сгенерированные искусственным интеллектом, часто кажутся «искусственными» или однотипными. Отчасти это объясняется тем, что модель настроена на проецирование авторитетного, ясного и безличного стиля речи (что является частью обучения и алгоритмической оптимизации).
Для машинного писателя важно звучать максимально понятно и правильным образом, чтобы минимизировать риск непонимания или неоднозначности. Такие задачи решают приемы, которые на протяжении веков использовали классические ораторы. Важно отметить, что ChatGPT не изобрел эти приемы — наоборот, он лишь воспроизводит и смешивает их на основе статистической вероятности. Анализ датасетов, на которых он обучался, показывает, что в текстах, похожих на классические трактаты, научные статьи, речи и религиозные документы, именно такие конструкции встречаются наиболее часто. Именно поэтому модель так увлеченно «тянется» к подобным формам выражения.
Однако человек никогда не пользуется этими приемами с одинаковой частотой и в одинаковом количестве в каждом тексте. Мы интуитивно меняем тон и стиль в зависимости от ситуации, аудитории и содержания. Искусственный интеллект же работает иначе. Он ограничен алгоритмом прогнозирования следующего слова и не может остановиться или отступить, чтобы создать живое, эмоциональное, гибко строящееся повествование. Когда встречается сомнительная или неуместная частота повторений подобных структур, мы сталкиваемся с тем, что называется «искусственной подобностью» или «AI-солчком» (термин, которым иногда обозначают чрезмерно упрощенную, заезженную речь ИИ).
Этот эффект особенно заметен в письменных текстах средней и малой длины, где стилистическая избыточность не разбавляется разносторонними выразительными элементами, которые свойственны настоящей живой речи и письменности. Нельзя не отметить, что ChatGPT и подобные системы стремятся к безличному и вежливому стилю, часто избегая субъективных оценок и рискованных утверждений. Это тоже влияет на характер текста: формальный тон, использование равных частей и похожих синтаксических конструкций тоже создают ощущение однообразия. Таким образом, если задаться вопросом, почему ChatGPT именно так пишет, ответ лежит в основе его функционирования и технических алгоритмах. Он адаптирует человеческие риторические приемы, но лишен способности творчески их изменять или уместно варьировать.