AMCR: A Framework for Assessing and Mitigating Copyright Risks in Generative Models

2509.00641v1 cs.LG, cs.CR, cs.CV 2025-09-05

Авторы:

Zhipeng Yin, Zichong Wang, Avash Palikhe, Zhen Liu, Jun Liu, Wenbin Zhang

Резюме на русском

Резюме ======= ## Контекст Generative models, особенно в области текста-к-изображению, достигли невероятных успехов, обеспечив новые возможности для творчества и производства визуального содержимого. Однако, эта технология не освобождается от проблем. Использование больших данных для обучения может привести к непреднамеренному копированию авторских работ, что создает серьезные юридические и этические ограничения. Несмотря на то, что ранее предложенные методы, такие как методы на основе подстрокового ввода, позволяли как снизить риск инфингмента, так и улучшить качество изображений, они не могут справиться со всеми случаями, особенно с теми, которые трудно определить на основе простого текста. Для решения этих проблем, авторы предлагают AMCR (Assessing and Mitigating Copyright Risks) — новую рамку для обнаружения и уменьшения рисков копирайта в генеративных моделях. ## Метод AMCR основывается на трёх основных частях: 1. **Переформатирование ввода.** Метод анализирует подстроки запроса и преобразует их в более безопасные формы на случай, если они могут вызвать копирайтные риски. 2. **Обнаружение инфингмента.** Метод включает в себя сопоставление внимания схожести, чтобы выявить возможные возникающие вопросы авторских прав в изображениях. 3. **Адаптивное уменьшение рисков.** Алгоритм адаптивно меняет генерируемые изображения во время генерации, чтобы уменьшить риск нарушения авторских прав без потери качества. ## Результаты Эксперименты показали, что AMCR доказал свою эффективность в обнаружении и уменьшении рисков. Данным использовались большие наборы данных с генерируемыми изображениями, позволив проверить рамку в разных ситуациях. Измерения показали, что AMCR оказывается более эффективным в сравнении с базовым подстроковым вводом, особенно в случае сложных и затрудненных случаев. Это подкрепляет потенциал AMCR в безопасном и эффективном использовании генеративных моделей в реальных условиях. ## Значимость AMCR имеет широкие применения в технологиях генеративных моделей, включая текст-к-изображению, видео-генерацию и другие виды визуальных приложений. Его особенность заключается в том, что он не только может обнаруживать и преобразовывать рискованные запросы, но и может адаптироваться во время генерации, чтобы уменьшать риск нарушения авторских прав. Это не только улучшает безопасность, но и повышает ценность изображений. Будущие исследования будут направлены на совершенствование технологий, улучшение надёжности и расширение применений в различных сферах. ## Выводы AMCR представляет собой новую рамку для обнаружения и уменьшения копира

Abstract

Generative models have achieved impressive results in text to image tasks, significantly advancing visual content creation. However, this progress comes at a cost, as such models rely heavily on large-scale training data and may unintentionally replicate copyrighted elements, creating serious legal and ethical challenges for real-world deployment. To address these concerns, researchers have proposed various strategies to mitigate copyright risks, most of which are prompt based methods that filter or rewrite user inputs to prevent explicit infringement. While effective in handling obvious cases, these approaches often fall short in more subtle situations, where seemingly benign prompts can still lead to infringing outputs. To address these limitations, this paper introduces Assessing and Mitigating Copyright Risks (AMCR), a comprehensive framework which i) builds upon prompt-based strategies by systematically restructuring risky prompts into safe and non-sensitive forms, ii) detects partial infringements through attention-based similarity analysis, and iii) adaptively mitigates risks during generation to reduce copyright violations without compromising image quality. Extensive experiments validate the effectiveness of AMCR in revealing and mitigating latent copyright risks, offering practical insights and benchmarks for the safer deployment of generative models.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

AMCR: A Framework for Assessing and Mitigating Copyright Risks in Generative Models

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Certified but Fooled! Breaking Certified Defences with Ghost Certificates

Tuning for Two Adversaries: Enhancing the Robustness Against Transfer and Query-...

ImpMIA: Leveraging Implicit Bias for Membership Inference Attack under Realistic...

Accurate and Private Diagnosis of Rare Genetic Syndromes from Facial Images with...

Навигация