В последние годы тема искусственного интеллекта (ИИ) и его связи с авторским правом стала одним из самых обсуждаемых вопросов в мире технологий и права. Компании, занимающиеся разработкой больших языковых моделей и генеративных систем, таких как Meta и Anthropic, столкнулись с серьезными обвинениями в незаконном использовании чужих произведений для обучения своих алгоритмов. Недавние судебные решения в США в делах против этих компаний вызвали смешанную реакцию, от триумфальных заявлений об успехе ИИ-индустрии до тревоги со стороны творческого сообщества и юристов. Так что же произошло на самом деле и можно ли считать, что компании с искусственным интеллектом выиграли судебный бой с авторами? Рассмотрим детально все аспекты и нюансы последних событий и их значение для будущего авторского права и ИИ. В основе конфликтов лежит вопрос: может ли обучение больших языковых моделей (LLM) на основе текстов, защищенных авторским правом, быть законным без разрешения правообладателей? Сторона авторов утверждала, что Meta и Anthropic использовали их книги без согласия, причём сначала копируя их незаконно из пиратских источников, а затем, например, Anthropic начал покупать печатные копии для собственных нужд.
В ответ компании настаивали на том, что их действия подпадают под концепцию добросовестного использования (fair use) — правовой принцип, допускающий ограниченное использование охраняемых произведений без разрешения в определённых обстоятельствах, включая трансформационные цели. Судья Вильям Элсап в рассмотрении дела с Anthropic признал обучение на книгах примером трансформационного использования, что соответствует требованиям доктрины добросовестного использования. Он отметил, что процесс создания модели, которая преобразует исходный текст и порождает новые результаты, является отличным от простого копирования. Тем не менее, он резко осудил изначальное использование пиратских копий и подчеркнул, что такой способ получения данных для обучения нелегален и может повлечь серьёзные штрафы. Важным моментом для Элсапа была разница между легально приобретённым материалом и нелегально скачанным, что показывает, что компании должны серьёзно подходить к вопросам легальности источников данных.
Параллельно судья Винс Чхабрия в деле Meta отклонил жалобу группы авторов, не потому что признал использование законным безоговорочно, а потому что сочёл их юридическую позицию недостаточно обоснованной. Ключевым аргументом Чхабрии стала трансформационная ценность обучения модели Llama — он признал, что процесс обучения меняет сырьевой материал, создавая нечто новое. Однако судья также выразил озабоченность по поводу возможного ущерба для творческого рынка, поскольку массовое производство ИИ-контента может снизить спрос на оригинальные произведения и демотивировать авторов. Именно это соображение может привести к суждению, что в ряде обстоятельств копирование для обучения без лицензии будет незаконным. Таким образом, оба решения в какой-то мере поддержали позиции компаний ИИ, отделяя трансформационное обучение от прямого нарушения авторских прав, однако при этом не открыли дорогу к бесконтрольному использованию контента.
Можно сказать, что победы AI-компаний носят оттенок «технической» или «условной» успешности. Ведь ни одно из этих разбирательств не затрагивало напрямую вопрос правомерности вывода или генерации моделей — то есть того, как и в каком объёме ИИ-модели могут воспроизводить или создавать контент, схожий с оригинальными произведениями. На самом деле именно вопрос вывода или генерации текста, изображений, музыки и других творений является наиболее спорным и трудно регулируемым с юридической точки зрения. Судьи в рассмотренных делах отметили, что возможные случаи прямого копирования или плагиата уже могут вызвать отдельные иски. Так, иск New York Times против OpenAI связан с утверждениями о том, что модель ChatGPT может дословно воспроизводить статьи издания.
Аналогичным образом, Disney направила претензии к Midjourney за использование образов из своих франшиз без разрешения. Это демонстрирует, что ни одна компания, создающая ИИ-контент, не может чувствовать себя полностью защищённой от претензий авторов, особенно когда речь идёт о выводе контента, прямо или косвенно основанном на защищённых работах. Тем не менее, проблема авторского права в сфере ИИ гораздо шире и сложнее, чем простое копирование. Главный вопрос заключается в балансе интересов: как не препятствовать развитию технологий, в то же время защищая права и экономические интересы творческих работников. Некоторыми экспертами высказывается мнение, что если обучение моделей будет требовать лицензирования каждого использованного произведения, индустрия ИИ может столкнуться с высокими издержками и торможением инноваций.
С другой стороны, без системы справедливого вознаграждения авторам грозит снижение мотивации к созданию новых оригинальных произведений. Интересно, что даже в своих решениях судьи провели различие между конкурентным воздействием традиционного творческого процесса и эффектом от массового производства ИИ-контента. Судья Элсап, например, считал, что новая модель конкуренции не является тем, что затрагивает авторское право, поскольку закон не защищает авторов от конкуренции в общем смысле. В то же время судья Чхабрия выражал опасение, что генерация огромного количества контента с минимальными усилиями пользователей приведёт к «спаму» и замещению традиционного творчества, что существенно подорвет творческий рынок. Что касается практической стороны, сейчас многие крупные компании уже предпринимают шаги к легализации своих источников данных, заключая лицензии и договариваясь с правообладателями.
Это подтверждает мнение, что модель свободного использования без санкций в будущем может стать неприемлемой с юридической точки зрения. Более того, для стартапов и компаний с меньшими финансами соблюдение таких требований может оказаться существенным барьером к входу на рынок. Сепарация уровней ответственности тоже остаётся нерешённой. Пока в фокусе находятся данные для обучения (input), вопрос о том, кто несёт ответственность за выходные данные (output), особенно в случае нарушения, остаётся на обсуждении в залах судов и законодательных органах по всему миру. В отсутствии чётких правил пространство для судебных тяжб будет только расширяться, давая каждой стороне повод для новых исков и контрпретензий.
В итоге можно констатировать, что победа компаний ИИ в судах пока остаётся полуформальной. Они добились признания трансформационного характера обучения моделей и сумели отбить часть претензий, однако границы допустимого использования защищённых материалов продолжают раздваиваться. Судебные решения подчеркивают необходимость ведения бизнеса на основе легальных источников и открывают дверь для будущих требований компенсаций за использование контента без разрешения. Полноценного и общего правового прецедента, устанавливающего ясные правила для всей индустрии ИИ, на сегодняшний день нет. В финансовом плане крупнейшие технологии и инвесторы хорошо подготовлены к возможным издержкам и штрафам, однако мелким игрокам в области ИИ такие вопросы могут стоить существования.
Это значит, что ещё предстоит много изменений как в законодательстве, так и в практике работы с авторским правом. Разработчики и законодатели должны найти баланс между стимулированием инноваций и защитой интеллектуальной собственности в эпоху цифровой трансформации. Таким образом, ответ на вопрос, выиграли ли компании ИИ борьбу с авторами, будет зависеть от дальнейшего развития судебной практики, законодательства и рыночных соглашений между создателями контента и индустрией искусственного интеллекта. Пока же каждая из сторон получила частичные успехи и предупреждения — и впереди нас ждут новые вызовы и обсуждения, определяющие будущее творчества и технологий в цифровую эпоху.