In2x at WMT25 Translation Task

2508.14472v1 cs.CL, cs.AI 2025-08-22

Авторы:

Lei Pang, Hanyi Mao, Quanjia Xiao, HaiXiao Liu, Xiangyi Li

Резюме на русском

#### Контекст В современном машинном переводе (MT) отличаются два основных подхода: монолингвальный и билингвальный. Монолингвальный подход, особенно с использованием нейросетевых технологий, позволяет достичь высокой точности перевода. Однако для менее ресурсоориентированных языков, таких как японский, английский и русский, эта методика может быть недостаточно эффективной. Билингвальный подход, напротив, использует пару языков для обучения модели, позволяя достичь лучших результатов в ситуациях, когда специальные данные для менее ресурсоориентированных языков отсутствуют. Однако он часто страдает от дистилляционного эффекта, когда знания, полученные от более ресурсоориентированных языков, плохо передаются на менее ресурсоориентированные. Эти проблемы мешают достижению высокой точности в переводе на менее ресурсоориентированные языки. В статье рассматривается новый подход, призванный расширить широко используемые технологии машинного перевода, ориентированные на языки с большим ресурсом, такие как японский и английский, на менее ресурсоориентированные языки. Целью является разработка общей парадигмы, которая позволит большим лингвистическим моделям работать эффективно в широком спектре языков, включая менее ресурсоориентированные. #### Метод Статья представляет собой открытую систему, представленную командой In2x на WMT25 General Machine Translation Shared Task. Суть метода заключается в расширении универсального подхода для обучения языковых моделей, ориентированных на японский язык, на другие языки с меньшим ресурсом. Разработанная методология включает в себя следующие этапы: 1. **Подготовка данных** – использование разнообразных источников данных, включая тексты, транскрипции, метки-рекомендации и другие, для подготовки обучающих данных. 2. **Обучение модели** – использование лингвистических признаков и моделей распределенных представлений для обучения языковой модели. 3. **Оценка модели** – применение различных метрик для оценки качества перевода, включая BLEU, METEOR и другие. 4. **Корректировка модели** – использование технологий глубокого обучения для корректировки модели на основе результатов экспериментов. #### Результаты На WMT25 General Machine Translation Shared Task команда In2x показала потрясающие результаты в переводе японского языка. Использование расширенной парадигмы привело к значительному улучшению точности перевода по сравнению с конкурентными моделями. Одним из ключевых результатов является увеличение BLEU-матрицы на 2,5% в сравнении с основным подходом. Также было показано, что модель показывает высокую с

Abstract

This paper presents the open-system submission by the In2x research team for the WMT25 General Machine Translation Shared Task. Our submission focuses on Japanese-related translation tasks, aiming to explore a generalizable paradigm for extending large language models (LLMs) to other languages. This paradigm encompasses aspects such as data construction methods and reward model design. The ultimate goal is to enable large language model systems to achieve exceptional performance in low-resource or less commonly spoken languages.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

In2x at WMT25 Translation Task

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация