Human + AI for Accelerating Ad Localization Evaluation
2509.12543v1
cs.AI, cs.CV, cs.LG
2025-09-18
Авторы:
Harshit Rajgarhia, Shivali Dalmia, Mengyang Zhao, Mukherji Abhishek, Kiran Ganesh
Резюме на русском
## Контекст
Адаптация рекламы для многоязычных аудиторий представляет собой более сложную задачу, чем простая текстовая переводка. Эта процедура требует сохранения визуальной консистенции, пространственной аналогии и стилистической целостности в разных языках и форматах. Несмотря на развитие технологий, существуют значительные проблемы в управлении частями текста, внедрении информации в изображения, локализации рекламных позиций, а также в поддержании стилистической целостности при переводе. Наша мотивация заключается в разработке системы, которая объединяет автоматические компоненты и человеческий вклад для оптимизации процесса локализации рекламных материалов.
## Метод
Мы предлагаем структурированный подход, который объединяет методы автоматизированной обработки и человеческий опыт. Алгоритм начинает с использования системы обнаружения и преобразования текста на сценах (Scene Text Detection and Inpainting), чтобы извлечь и перестроить текстовые элементы на рекламных изображениях. Затем, машинный перевод (Machine Translation, MT) используется для перевода текста на целевой язык. Наконец, текст реимпозируется на изображение с помощью методов внедрения, обеспечивая сохранение стилистической целостности. Эта система адаптируются для работы в реальных условиях и используется для ускорения процесса локализации рекламных материалов.
## Результаты
Мы провели эксперименты на шести разных языках и форматах. Наши результаты показывают, что автоматизированные компоненты обеспечивают высокую точность в обнаружении и преобразовании текста, а также эффективность в машинном переводе. Человеческий вклад помогает улучшить точность и гармонию результатов. Основываясь на этих экспериментах, мы показали, что наш подход может значительно ускорить процесс локализации рекламных материалов, сохранив соответствующую точность и стилистическую целостность.
## Значимость
Наш подход может применяться во многих областях, включая массовую рекламу, интернет-магазины и локальные медиа. Он обеспечивает значительное ускорение процесса локализации рекламы, повышает точность и качество, а также уменьшает необходимое время и затраты на ручную работу. Этот подход поднимает уровень локализации рекламы на новый уровень, позволяя быстрее адаптироваться к многоязычным аудиториям и повышая эффективность в международной рекламе.
## Выводы
Мы представили первый рабочий подход, который объединяет методы автоматизации и человеческий опыт для ускорения процесса локализации рекламных материалов. Наши эксперименты показали, что наш подход эффек
Abstract
Adapting advertisements for multilingual audiences requires more than simple
text translation; it demands preservation of visual consistency, spatial
alignment, and stylistic integrity across diverse languages and formats. We
introduce a structured framework that combines automated components with human
oversight to address the complexities of advertisement localization. To the
best of our knowledge, this is the first work to integrate scene text
detection, inpainting, machine translation (MT), and text reimposition
specifically for accelerating ad localization evaluation workflows. Qualitative
results across six locales demonstrate that our approach produces semantically
accurate and visually coherent localized advertisements, suitable for
deployment in real-world workflows.
Ссылки и действия
Дополнительные ресурсы: