В мире искусственного интеллекта наблюдается стремительный рост числа моделей, распространяемых под открытыми лицензиями. Однако системы ИИ, где полностью открыты все компоненты — включая архитектуру, веса и тренировочные данные — ещё находятся на стадии становления. На этом фоне, в мае 2025 года, Linux Foundation вместе с такими технологическими гигантами как Amazon, Meta, IBM и Microsoft представили новую лицензию Open Model Definition & Weights License версии 1.0, или сокращённо OpenMDW-1.0.
Эта лицензия призвана покрыть все связанные с ИИ компоненты под единым юридическим зонтиком, предоставляя право на свободное использование и распространение. Рассмотрим детально, что собой представляет OpenMDW, насколько она соответствует стандартам открытого исходного кода и какие вопросы вызывает у сообщества. OpenMDW — это первый в своём роде лицензирующий документ, который охватывает не просто программное обеспечение, но и все составляющие модели ИИ, включая архитектуру, параметры (веса), связанные данные и документацию. В этом смысле она отличается от традиционных лицензий, таких как MIT или Apache-2.0, которые в основном ориентированы на программный код.
OpenMDW представляет собой скорее пермиссивную лицензию, позволяющую свободно использовать материал без ограничений по области применения или разновидности пользователей — стандартное требование для лицензий, которые можно официально признать открытыми. Ключевая особенность OpenMDW — явное предоставление прав не только по авторскому праву, но и по патентам, базам данных и даже коммерческой тайне. В традиционных лицензиях сфера действия часто ограничена авторским правом или патентами, однако включение коммерческой тайны — необычное решение. Юридически, чтобы информация считалась коммерческой тайной, она не должна быть общедоступной, поэтому фактически передаваемые под лицензией материалы коммерческой тайной уже не являются. Тем не менее включение данного пункта может служить декларативным намерением правообладателей не ограничивать использование полученных идей, алгоритмов и настроек посредством притязаний на ноу-хау.
Это добавляет дополнительный уровень уверенности пользователям в том, что они получают доступ к информации без скрытых барьеров. Также вызывает интерес и патентная оговорка OpenMDW, которая в целом схожа с аналогичной в Apache-2.0, но отличается своей широтой. В случае, если пользователь инициирует или участвует в патентном споре, связанной с «Материалами модели», его права автоматически прекращаются. Причём терминология «прямое или косвенное нарушение патента» расширяет сферу потенциальных конфликтов, поскольку разные юрисдикции имеют неодинаковое понимание, что считать косвенным нарушением.
Данный пункт, хоть и направлен на защиту разработчиков и предотвращение судебных тяжб, может восприниматься юристами в организациях как излишне жёсткий. Еще одним моментом, заслуживающим внимания, стали обязательства по проверке прав на третьи стороны, включённых в модель или тренировочные данные. OpenMDW возлагает на пользователя ответственность за проведение всесторонней юридической проверки, подтверждения наличия всех необходимых разрешений и снятия рисков нарушения прав других лиц. С одной стороны, этот пункт минимизирует риски для лиц, распространяющих модели, но с другой — представляет серьёзную нагрузку для пользователей, особенно для стартапов или небольших предприятий, которым сложно самостоятельно проводить подобные аудиты. Тем не менее, в условиях иного отсутствия единых регулировок в области ИИ, подобная ответственность закономерна и соответствует существующей практике.
Стоит отметить, что OpenMDW прямо освобождает пользователей от ограничений в отношении продуктов, создаваемых с помощью модели. Это важный контраст по отношению к ряду других лицензий и правил, включая лицензии Meta Llama и Google Gemma, где выходные данные могут наследовать ограничения модели — так называемый «вирусный» эффект. Таким образом, OpenMDW обеспечивает максимальную свободу для применения и дальнейшего использования сгенерированного содержимого. Несмотря на привлекательность концепции единой комплексной лицензии, имеются веские основания считать, что OpenMDW не будет универсальным решением для всех сценариев распространения ИИ-моделей. В большинстве случаев, особенно когда речь идёт об обучающих данных, гораздо эффективнее использовать традиционные лицензии из семейства Creative Commons, такие как CC-BY или CC0.
Данные лицензии являются уже проверенными и признанными стандартами в глобальном сообществе открытых данных и обеспечивают прозрачность и понятность правового режима. OpenMDW же, акцентируя внимание на патентных рисках и коммерческой тайне, зачастую избыточна для датасетов, и применение одной лицензии для комплексного набора компонентов зачастую ведёт к юридической путанице. Критики также указывают на риск так называемого «openwashing» — явления, когда компании используют яркие заявления о «полной открытости» моделей или данных, которые фактически раскрывают лишь малую часть информации или не являются репрезентативными. Благодаря тому, что OpenMDW распространяется на все вложенные компоненты в едином репозитории, достаточно включить незначительный фрагмент данных или лишь часть параметров модели, чтобы заявить об «открытом исходном коде». Это может привести к ослаблению доверия к открытому сообществу ИИ и снизить ценность понятия «открытости».
В ответ на это специалисты из OSI (Open Source Initiative) призывают к более строгим трактовкам и практике раскрытия, при которой под открытым исходным кодом понимались бы модели, включающие детальную информацию о тренировочных данных и процессах их обработки. Кроме того, с юридической точки зрения включение в OpenMDW понятия «Model Materials», порядком размывающее традиционные границы между программным кодом, данными и документацией, создаёт вопросы интерпретации в разных странах. Разные юрисдикции по-разному трактуют право на базу данных, коммерческую тайну и патенты на алгоритмы, что может привести к неоднозначным судебным решениям и затруднить применение лицензии в глобальном контексте. Тем не менее, OpenMDW можно считать важным этапом эволюции лицензионной базы для ИИ. Это первая лицензия, которая в явной форме пытается объединить юридические нормы для разных видов прав в одну комплексную структуру, учитывая особенности именно искусственного интеллекта, а не программного обеспечения.
Её простота и пермиссивность делают её полезной для компаний и научных организаций, работающих с моделями, где требуется единая юридическая защита. В целом, можно сказать, что OpenMDW идеально подходит для специальных случаев, например, когда тренировочные данные связаны с патентными рисками или не подлежат распространению отдельно от модели, либо когда обеспечивается воспроизводимость модели только при совместной выдаче параметров и данных. Для более обширных и разнородных наборов обучающих данных правильной практикой остаётся раздельное лицензирование, позволяющее сохранить прозрачность для сообщества и исключить юридическую путаницу. Необходимо также учесть, что на момент середины 2025 года OpenMDW ещё не получала одобрения Open Source Initiative, несмотря на полностью соответствующую Основным принципам открытого исходного кода структуру и условия. Возможно, такое решение продиктовано именно озабоченностью относительно последствий популяризации лицензии и проблем, связанных с открытостью моделей и датасетов в сфере ИИ.
Таким образом, OpenMDW — это не просто ещё одна лицензия, а скорее вызов и шаг навстречу юридическому регулированию быстроменяющейся области ИИ. От её принятия и развития зависит дальнейшая судьба концепта «открытого ИИ», доверия к нему со стороны общества и предприятий, а также стандартизации лицензирования инновационных технологий. В конечном итоге вопрос не столько в том, является ли OpenMDW «открытой» лицензией или нет — по базовым критериям она именно такая. Более важным остаётся развитие понимания открытости в контексте ИИ, усиление требований к раскрытию информации о тренировочных данных и процессах, а также создание юридических конструкций, которые смогут предотвратить злоупотребления лицензиями в целях маркетинга и создания иллюзии открытости там, где её нет.