Современные технологии искусственного интеллекта быстро развиваются, и особое внимание сейчас уделяется генеративным моделям ИИ, способным создавать тексты на основе огромных массивов данных. Одним из ключевых аспектов их работы становится использование актуальной и надежной информации из СМИ. Недавнее исследование, проведенное компанией Muck Rack, показало, что генеративные ИИ модели одинаково часто ссылаются на журналистские источники, особенно на такие издания, как Reuters и Axios. Это поднимает множество вопросов о роли профессиональной журналистики в эпоху искусственного интеллекта и об ответственности разработчиков ИИ за качество информации, которую они предоставляют пользователям. Исследование Muck Rack было основано на анализе более чем миллиона цитирований, которые предлагали генеративные модели искусственного интеллекта в своих ответах.
По его результатам, журналистский контент фигурировал в 27% всех ответов, что уже свидетельствует о значимости информационных ресурсов новостного характера. Но наиболее примечательно, что при обработке запросов, требующих свежей и актуальной информации — к примеру, последние новости, изменения в экономике или состояние различных отраслей — этот показатель возрастал почти до 49%. Это значит, что почти половина цитируемых ссылок в таких случаях относится именно к современным новостным материалам, что подчеркивает доверие ИИ к проверенной и свежей информации. Причина, по которой генерирующие модели так интенсивно обращаются к Reuters и Axios, связана с репутацией этих изданий как надежных источников новостей, способных быстро и точно подавать важные события. Reuters уже давно считается золотым стандартом в мире новостной журналистики с широкой международной сетью корреспондентов.
Axios же выделяется своей лаконичной и современной манерой подачи информации, что делает его удобным для быстрой интерпретации и дальнейшего использования алгоритмами ИИ. Примечательно, что в числе самых часто цитируемых изданий, вместе с Reuters и Axios, оказались Financial Times, Time и Forbes — все они обладают высокой репутацией и охватывают разные области знаний, от финансов и политики до науки и культуры. Дополнительный интерес представляет сравнительный анализ, проведенный в рамках исследования, который показал различия между моделями. Например, модели Claude склонны меньше ссылаться на традиционные новостные агенства и чаще обращаются к корпоративным блогам, специализированным изданиям и менее «журналистским» источникам вроде Good Housekeeping или TechRadar. Это свидетельствует о различных стратегиях и подходах к подбору источников информации, заложенных разработчиками.
В то время как модели ChatGPT и Gemini явно отдают предпочтение «жесткой» новостной журналистике, стараясь оперировать свежими и подтвержденными данными, Claude демонстрирует большую гибкость в источниках, что может влиять на разнообразие и глубину предоставляемых данных. Интересно и то, что большая часть цитируемых статей были опубликованы не позже, чем за последние 12 месяцев. Это особенно характерно для ChatGPT, около 56% ссылок которого были на недавние статьи. Такая тенденция демонстрирует стремление моделей к подаче актуальной информации и уменьшению риска устаревших или искаженных данных. Для Claude этот показатель был немного ниже — 36%, что косвенно свидетельствует о различиях в алгоритмах обновления и выбора источников.
Кроме того, исследование Muck Rack выявило, что сфера запроса сильно влияет на характер используемых источников. В некоторых отраслях, например финансовой сфере, медиа, госуправлении и здравоохранении, журналистские материалы цитируются чаще, чем блоги или официальные пресс-релизы. Это связано с необходимостью предоставлять проверенные данные в ответах, которые традиционно требуют высокого уровня достоверности и своевременности информации. В то же время для более субъективных или специализированных запросов, например советы по уходу за кожей или технические инструкции, модели чаще предпочитают корпоративные блоги и специализированный контент, где более глубокая нишевая экспертиза и практические рекомендации представлены более полно. Однако широко известно, что при работе с ИИ моделями существует проблема галлюцинаций — когда система выдает несуществующую или некорректную информацию, включая фальшивые ссылки на новостные сайты.
Это негативно сказывается на доверии к технологии и вызывает вопросы у профессионального сообщества и пользователей. Несмотря на имеющиеся официальные партнерские соглашения с крупными новостными агентствами, такими как OpenAI с Financial Times, Time и Axios, модели иногда генерируют ссылки на копии статей или неофициальные источники, что подчеркивает важность постоянного контроля и развития механизмов верификации данных. Поскольку искусственный интеллект все активнее интегрируется в ежедневные информационные процессы и становится помощником в принятии решений, роль журналистики приобретает новую ценность. Генеративные модели, являясь финальным инструментом для многих пользователей, вынуждены опираться на качественную, проверенную, и свежую информацию, чтобы сохранить достоверность и релевантность своих ответов. Это создает как возможности для дальнейшего сотрудничества между ИИ и традиционными СМИ, так и одновременно вызовы, связанные с защитой авторских прав и предотвращением распространения дезинформации.
В целом исследование Muck Rack свидетельствует о том, что журналистика продолжает оставаться краеугольным камнем для генеративных ИИ моделей, особенно когда речь идет о предоставлении актуальных и точных данных. Reuters и Axios, являясь ведущими новостными агентствами, играют ключевую роль в этом процессе, гарантируя надежность и оперативность информации, которой оперируют современные технологии. В перспективе ожидается, что тренд на сотрудничество между ИИ и крупными новостными организациями будет только укрепляться. Модели, способные комбинировать информацию из разных источников с использованием передовых алгоритмов, смогут предоставлять пользователям наиболее полные и актуальные ответы, повышая качество взаимодействия с искусственным интеллектом. Для издателей же это открывает новые возможности монетизации контента и расширения аудитории в эпоху цифровой трансформации.
Таким образом, связь генеративных ИИ моделей с профессиональной журналистикой — это не просто технологический факт, а важный элемент инновационного информационного пространства. Поддержание высокого стандарта качества источников и развитие новых подходов к интеграции данных будут определять будущее обеих сфер, обеспечивая баланс между скоростью доступа к информации и её достоверностью.