Human + AI for Accelerating Ad Localization Evaluation

2509.12543v1 cs.AI, cs.CV, cs.LG 2025-09-18
Авторы:

Harshit Rajgarhia, Shivali Dalmia, Mengyang Zhao, Mukherji Abhishek, Kiran Ganesh

Резюме на русском

## Контекст Адаптация рекламы для многоязычных аудиторий представляет собой более сложную задачу, чем простая текстовая переводка. Эта процедура требует сохранения визуальной консистенции, пространственной аналогии и стилистической целостности в разных языках и форматах. Несмотря на развитие технологий, существуют значительные проблемы в управлении частями текста, внедрении информации в изображения, локализации рекламных позиций, а также в поддержании стилистической целостности при переводе. Наша мотивация заключается в разработке системы, которая объединяет автоматические компоненты и человеческий вклад для оптимизации процесса локализации рекламных материалов. ## Метод Мы предлагаем структурированный подход, который объединяет методы автоматизированной обработки и человеческий опыт. Алгоритм начинает с использования системы обнаружения и преобразования текста на сценах (Scene Text Detection and Inpainting), чтобы извлечь и перестроить текстовые элементы на рекламных изображениях. Затем, машинный перевод (Machine Translation, MT) используется для перевода текста на целевой язык. Наконец, текст реимпозируется на изображение с помощью методов внедрения, обеспечивая сохранение стилистической целостности. Эта система адаптируются для работы в реальных условиях и используется для ускорения процесса локализации рекламных материалов. ## Результаты Мы провели эксперименты на шести разных языках и форматах. Наши результаты показывают, что автоматизированные компоненты обеспечивают высокую точность в обнаружении и преобразовании текста, а также эффективность в машинном переводе. Человеческий вклад помогает улучшить точность и гармонию результатов. Основываясь на этих экспериментах, мы показали, что наш подход может значительно ускорить процесс локализации рекламных материалов, сохранив соответствующую точность и стилистическую целостность. ## Значимость Наш подход может применяться во многих областях, включая массовую рекламу, интернет-магазины и локальные медиа. Он обеспечивает значительное ускорение процесса локализации рекламы, повышает точность и качество, а также уменьшает необходимое время и затраты на ручную работу. Этот подход поднимает уровень локализации рекламы на новый уровень, позволяя быстрее адаптироваться к многоязычным аудиториям и повышая эффективность в международной рекламе. ## Выводы Мы представили первый рабочий подход, который объединяет методы автоматизации и человеческий опыт для ускорения процесса локализации рекламных материалов. Наши эксперименты показали, что наш подход эффек

Abstract

Adapting advertisements for multilingual audiences requires more than simple text translation; it demands preservation of visual consistency, spatial alignment, and stylistic integrity across diverse languages and formats. We introduce a structured framework that combines automated components with human oversight to address the complexities of advertisement localization. To the best of our knowledge, this is the first work to integrate scene text detection, inpainting, machine translation (MT), and text reimposition specifically for accelerating ad localization evaluation workflows. Qualitative results across six locales demonstrate that our approach produces semantically accurate and visually coherent localized advertisements, suitable for deployment in real-world workflows.

Ссылки и действия