В последние годы искусственный интеллект стал самой обсуждаемой и одновременно самой спорной темой в сфере контента и интеллектуальной собственности. Возросшее использование огромных массивов данных для обучения AI-моделей привело к многочисленным судебным искам, многие из которых ставят под вопрос, где проходит грань между добросовестным использованием и нарушением авторских прав. Недавно суды США приняли первые значимые решения по делам Bartz et al v. Anthropic и Kadrey v. Meta Platforms, которые могут стать прорывом для всей индустрии и задать тон дальнейшей судебной практике по этой сложной теме.
В чем же суть этих дел, и какие последствия они несут для развития ИИ и прав интеллектуальной собственности? Об этом и поговорим в дальнейшем повествовании. Ключевая проблема, вокруг которой ведется судебная дискуссия, — это справедливость использования оригинальных произведений в процессе обучения AI-моделей. Искусственный интеллект, особенно крупные языковые модели, требует для своей работы огромных объемов данных, включая тексты, изображения, музыку и другие формы контента. Многие из этих данных имеют охраняемые авторским правом характеристики, и вопрос в том, может ли использование таких материалов для обучения считаться добросовестным использованием или же это нелегальное копирование. Традиционно в американском законодательстве существует так называемый принцип «fair use» — добросовестное использование, который позволяет в определенных случаях использовать защищенные произведения без разрешения правообладателя.
Он оценивается по четырем основным факторам: характер использования (преобразовательный или коммерческий), природа авторского произведения, объем и существенность использованной части, а также влияние на потенциальный рынок оригинального произведения. В сфере ИИ эти факторы приобретают особую важность, поскольку AI обучается не просто копированием, а созданием внутренних представлений, которые затем используются для генерации новых произведений. Дело Anthropic примечательно тем, что компания использовала как цифровые пиратские копии, известные как Pirate Library Mirror, так и покупку более двух миллионов подержанных книг, которые затем были оцифрованы. Судья Уолтер Олсап (Alsup) в своем решении признал, что процесс оцифровки и обучение моделей на полученных данных подпадает под доктрину добросовестного использования, ссылаясь на прецеденты Sony Computer Entertainment Inc. v.
Connectix Corp. и Sega Enterprises Ltd. v. Accolade. Судья подчеркнул, что Anthropic не распространяет работу в явном виде, а лишь трансформирует контент для собственного использования в обучении моделей, что существенно отличается от множества копий, размещенных в Napster, которые суд счел нарушением.
С другой стороны, дело Meta Platforms ознаменовано борьбой с претензиями известных авторов, например, Сары Сильверман, которые оспаривали включение своих книг в тренировочный набор, независимо от способа их получения. Хотя утверждалось, что Meta могла использовать пиратские библиотеки, например, LibGen, доказательств этому в ходе судебного разбирательства не было предоставлено. В отличии от Anthropic, здесь судья Уильям Чхабрия сосредоточился на анализе рыночного влияния использования материалов, уделив особое внимание тому, что AI не способствует прямой конкуренции с оригинальными произведениями, однако выразил сомнение в добросовестности такого использования в большинстве случаев. Важным аспектом является то, что в обоих делах обсуждался лишь сам процесс обучения моделей, а не создание или распространение производных работ, что открывает дверь для дальнейших споров о выходных материалах ИИ. Обратите внимание, что эти решения значительно опираются на уже существующие судебные прецеденты, включая дело Authors Guild v.
Google, где было признано, что масштабное сканирование и систематизация книг для поисковой системы представляет добросовестное использование благодаря своей трансформирующей природе и общественной пользе. Судьи в обоих судах также учитывали, что образование AI-модели — процесс не буквального копирования, а преобразования данных в новую цифровую форму знаний, которая не перестает быть защищенной авторским правом, но изменяет ее сущность. Однако эти дела различаются по тональности и глубине анализа факторов добросовестного использования. Судья Олсап в Anthropic выразился с большим оптимизмом, заявив, что требовать оплату каждый раз, когда модель «вспоминает» или опирается на фрагменты книги — это практически невозможно и неадекватно. В сравнении, судья Чхабрия в Meta был более осторожен, отмечая, что возможно, что во многих случаях такое использование будет незаконным, но ограничился анализом фактора трансформативности и потенциального рыночного вреда, пытаясь создать новую теорию рыночного размывания, по аналогии с законодательством о товарных знаках.
Тем не менее, его позиция иногда недооценивает уникальности продукции информационного рынка, характерного нулевой предельной стоимостью производства. Важно, что оба решения подкрепляют идею: обучение моделей как процесс цифровой трансформации больших массивов данных является добросовестным использованием, если данные были получены законным путем. Этот вывод отчасти снимает беспрецедентные риски для развития ИИ, поскольку запрет на использование даже части масштабных датасетов может фактически остановить многие инновации в сфере искусственного интеллекта. При этом акцент на том, что речь идет об обучении, а не об итоговом контенте, оставляет открытым вопрос о юридическом статусе сгенерированных моделей произведений и их охране или нарушении авторских прав. Интересно, что данные решения противоречат некоторым рекомендациям Бюро авторских прав США, которое ранее выражало осторожное мнение по отношению к добросовестному использованию данных для обучения моделей.
Речь шла о необходимости серьезного фокуса на коммерческое воздействие такого использования на рынок и предлагаемых ограничениях, однако окончательное решение за судебными инстанциями, которые проявили большую гибкость и понимание технологических нюансов. Сравнивая эти дела с более ранним прецедентом Thomson Reuters v. ROSS Intelligence, где суд отверг добросовестное использование в случае прямого создания конкурентоспособного продукта, можно увидеть, что ключевым фактором для признания допустимости использования является именно отсутствие прямого конкурирования и намерений к пиратству. В обоих случаях Anthropic и Meta модели стремятся избежать «повторения» защищенных работ и вместо этого использовать знания в качестве инструмента для генерации новых, уникальных материалов, что, в свою очередь, укрепляет позицию защитников AI. В целом, эти решения можно рассматривать как важный ориентир и частичную победу разработчиков искусственного интеллекта.
Они подтверждают, что тренировка моделей на больших объемах информации — это трансформативный и законный процесс, который не требует дополнительных лицензионных отчислений за каждую использованную единицу контента, если данные были правомерно получены. Вместе с тем, акцент на возможность переговоров и поиска коммерческих моделей взаимодействия с правообладателями открывает дверь к новым формам сотрудничества и монетизации творческого контента в эпоху ИИ. Эксперты отмечают, что несмотря на открытое отношение к добросовестному использованию, права создателей произведений не исчезают. На передний план выходит необходимость балансирования интересов технологий и творческих индустрий через механизмы лицензирования, контроля использования торговых марок, защиты права на образ и другие аспекты интеллектуальной собственности, не ограничивающиеся только авторским правом. Такие стратегии могут стать основой устойчивого развития и новым образом партнерства в цифровом мире.
Отдельно стоит подчеркнуть социальный аспект влияния ИИ на рынок творческого контента. ИИ способен создавать оригинальные произведения, ранее не существовавшие, что вызывает вопросы об экономическом воздействии на художников, писателей и музыкантов, особенно начинающих и менее известных. Защита авторского права традиционно касается именно уже существующих произведений, поэтому законодательство и судебная практика вынуждены адаптироваться к новым реалиям, где непредсказуемое влияние технологий требует новых подходов к оценке вреда и справедливого вознаграждения. В заключении можно сказать, что дела Anthropic и Meta становятся отправной точкой для понимания добросовестного использования в контексте искусственного интеллекта и раскрывают сложность вопросов, связанных с обучением моделей на защищенных данных. Они демонстрируют, что суды готовы признавать трансформативность и общественную пользу таких действий, одновременно оставляя за правообладателями возможность влиять на рынок через другие механизмы и форматы взаимодействия.
В условиях стремительного развития ИИ такой баланс является ключевым для продолжения инноваций без ущемления прав авторов и создателей контента.