Современные технологии генерации изображений переживают настоящую революцию благодаря развитию глубокого обучения и автогрегрессивных моделей. Эти модели генерируют изображения поэтапно, формируя каждый следующий фрагмент изображения на основе уже сгенерированных данных. Такой подход позволяет получать сложные и детализированные изображения с высоким качеством. Однако с ростом возможностей генерации растёт и опасность злоупотребления: подделка контента, скрытая перепродажа, нарушение авторских прав и распространение дезинформации. В ответ на эти вызовы встала задача надежно и эффективно маркировать сгенерированные данные, обеспечивая прозрачность и возможность устанавливать происхождение изображений.
Водяные знаки — один из ключевых инструментов в этой области. В отличие от классических методов, внедрение водяных знаков в автогрегрессивные модели генерации изображений требует радикально нового подхода, учитывающего специфику работы с токенами и особенностями процесса генерации. Автогрегрессивная генерация изображений основана на последовательном предсказании токенов, то есть мельчайших элементов, кодирующих изображение. Каждый токен влияет на последующий, и итоговое изображение является результатом такой цепочки предсказаний. В связи с этим появление возможности внедрять водяные знаки именно на уровне токенов стало важным этапом в развитии технологий маркировки.
Это гарантирует, что вода или скрытая метка будет интегрирована глубоко в структуру данных, что значительно усложняет её удаление или подделку без искажения самого изображения. Ключевая сложность в реализации водяных знаков в данном контексте — это проблема обратной циклической согласованности (reverse cycle-consistency, RCC). Эта особенность связана с тем, что при повторной токенизации изображения последовательность токенов может существенно измениться, что приводит к повреждению или исчезновению водяного знака. Такая нестабильность напрямую снижает возможную надёжность и защитные свойства водяных знаков, так как любой простой редактор или преобразователь может непреднамеренно стереть идентифицирующие маркеры. Для решения этой проблемы была разработана специализированная процедура дообучения токенизатора и детокенизатора.
Это позволило улучшить степень обратной циклической согласованности, обеспечивая минимальные изменения последовательности токенов при повторном преобразовании. Таким образом удалось сформировать стабильную основу для интеграции водяных знаков, которые сохраняются даже при многократной обработке и редактировании изображения. В дополнение к техникам повышения RCC была предложена синхронизационная водяная метка, реализованная как отдельный слой в архитектуре генератора. Этот слой обеспечивает синхронизацию и коррекцию возможных смещений в последовательностях токенов, что особенно важно при встрече с распространёнными атаками — сжатием изображений, преобразованиями форматов и другими распространёнными методами удаления или искажения данных. Благодаря такой комплексной системе водяные знаки остаются обнаруживаемыми и устойчивыми, несмотря на попытки их удаления или повреждения.
Эксперименты, проведённые с новой технологией, показали высокий уровень надёжности обнаружения водяных знаков с использованием статистически обоснованных p-значений. Это даёт возможность не только маркировать изображения, но и юридически доказывать их происхождение, что крайне важно в борьбе с мошенничеством и нарушением интеллектуальной собственности. Применение водяных знаков в автогрегрессивной генерации изображений открывает перед индустрией новые перспективы. Компании и творцы получают инструмент для уверенного распространения своих творений без страха за копирование или подделку. При этом пользователи и конечные потребители получают гарантию подлинности контента, что способствует формированию более доверительной среды вокруг цифровых медиа.