ALIGN: Word Association Learning for Cross-Cultural Generalization in Large Language Models
2508.13426v1
cs.CL, cs.AI
2025-08-21
Авторы:
Chunhua Liu, Kabir Manandhar Shrestha, Sukai Huang
Резюме на русском
#### Контекст
Современные большие языковые модели (LLMs) широко применяются для поддержки кросс-культурной коммуникации. Однако они часто отражают биазы, возникающие из-за преобладания определенных языков и перспектив в их обучающих данных. Это приводит к неточностям и неудовлетворительному пониманию культурных контекстов, особенно при работе с редкими или менее представленными языками и культурами. Недостаток эффективных методов для моделирования культуры и лимитная доступность качественных культурных норм делают этот вопрос особенно актуальным.
#### Метод
Мы предлагаем параметр-эффективную методику оптимизации готовых моделей на основе норм бесплатного ассоциативного словообразования (free word association), которые хранят в себе глубокие культурные схемы. Для фактических экспериментов использовались нормы англоязычных (США) и китайских ассоциаций из проекта Small-World-of-Words. Мы применили параметр-эффективные методы, включая параметрическую оптимизацию (SFT) и методы оптимизации предпочтений (PPO), для адаптации моделей Llama-3.1-8B и Qwen-2.5-7B.
#### Результаты
Подход показал существенные улучшения в культурной смысловой точности. Llama-3.1-8B на удвоенном корпусе ассоциаций повысил held-out association Precision at 5 на 16-20% для английского и на 43-165% для китайского. Было достигнуто гуман-level результат по валенсу и активности, что подтверждает величину данного шага. Модели стали лучше отражать ценности целевой культуры, в том числе на World-Values-Survey. На высоко-затруднительных вопросах, Qwen показала удвоенное улучшение китайско-алигнированных ответов, в то время как Llama снизилась на треть в своих биазах в пользу англоговорящих культур.
#### Значимость
Этот подход демонстрирует перспективы в использовании бесплатных ассоциативных норм для локализации и культурной алигнации моделей. Он может быть использован в сферах межкультурной коммуникации, медицины, психологии и культурно-психологических исследований. Наш прототип показывает, что малый объем добавленных норм (миллионы норм, а не миллиарды данных) может значительно улучшить модель, не требуя громоздких реинтерпретаций.
#### Выводы
Наша исследовательская работа указывает на важность использования гуман-граундетиджда ассоциационных норм для улучшения культурной алигнации в БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЯХ. Мы продемонстрировали, что данный подход может значительно улучшить продуктивность моделей без необходимости в громоздких тренировках. На
Abstract
As large language models (LLMs) increasingly mediate cross-cultural
communication, their behavior still reflects the distributional bias of the
languages and viewpoints that are over-represented in their pre-training
corpora. Yet, it remains a challenge to model and align culture due to limited
cultural knowledge and a lack of exploration into effective learning
approaches. We introduce a cost-efficient, cognitively grounded remedy:
parameter-efficient fine-tuning on native speakers' free word-association
norms, which encode implicit cultural schemas. Leveraging English-US and
Mandarin associations from the Small-World-of-Words project, we adapt
Llama-3.1-8B and Qwen-2.5-7B via supervised fine-tuning (SFT) and PPO-based
preference optimization. SFT boosts held-out association Precision at 5 by
16-20% in English and 43-165% in Mandarin, lifts median concreteness by +0.20,
and attains human-level valence and arousal. These lexical gains transfer: on
World-Values-Survey questions, fine-tuned models shift answer distributions
toward the target culture, and on a 50-item high-tension subset, Qwen's
Chinese-aligned responses double while Llama's US bias drops by one-third. Our
7-8B models rival or beat vanilla 70B baselines, showing that a few million
culture-grounded associations can instill value alignment without costly
retraining. Our work highlights both the promise and the need for future
research grounded in human cognition in improving cultural alignment in AI
models.
Ссылки и действия
Дополнительные ресурсы: