ALIGN: Word Association Learning for Cross-Cultural Generalization in Large Language Models

2508.13426v1 cs.CL, cs.AI 2025-08-21

Авторы:

Chunhua Liu, Kabir Manandhar Shrestha, Sukai Huang

Резюме на русском

#### Контекст Современные большие языковые модели (LLMs) широко применяются для поддержки кросс-культурной коммуникации. Однако они часто отражают биазы, возникающие из-за преобладания определенных языков и перспектив в их обучающих данных. Это приводит к неточностям и неудовлетворительному пониманию культурных контекстов, особенно при работе с редкими или менее представленными языками и культурами. Недостаток эффективных методов для моделирования культуры и лимитная доступность качественных культурных норм делают этот вопрос особенно актуальным. #### Метод Мы предлагаем параметр-эффективную методику оптимизации готовых моделей на основе норм бесплатного ассоциативного словообразования (free word association), которые хранят в себе глубокие культурные схемы. Для фактических экспериментов использовались нормы англоязычных (США) и китайских ассоциаций из проекта Small-World-of-Words. Мы применили параметр-эффективные методы, включая параметрическую оптимизацию (SFT) и методы оптимизации предпочтений (PPO), для адаптации моделей Llama-3.1-8B и Qwen-2.5-7B. #### Результаты Подход показал существенные улучшения в культурной смысловой точности. Llama-3.1-8B на удвоенном корпусе ассоциаций повысил held-out association Precision at 5 на 16-20% для английского и на 43-165% для китайского. Было достигнуто гуман-level результат по валенсу и активности, что подтверждает величину данного шага. Модели стали лучше отражать ценности целевой культуры, в том числе на World-Values-Survey. На высоко-затруднительных вопросах, Qwen показала удвоенное улучшение китайско-алигнированных ответов, в то время как Llama снизилась на треть в своих биазах в пользу англоговорящих культур. #### Значимость Этот подход демонстрирует перспективы в использовании бесплатных ассоциативных норм для локализации и культурной алигнации моделей. Он может быть использован в сферах межкультурной коммуникации, медицины, психологии и культурно-психологических исследований. Наш прототип показывает, что малый объем добавленных норм (миллионы норм, а не миллиарды данных) может значительно улучшить модель, не требуя громоздких реинтерпретаций. #### Выводы Наша исследовательская работа указывает на важность использования гуман-граундетиджда ассоциационных норм для улучшения культурной алигнации в БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЯХ. Мы продемонстрировали, что данный подход может значительно улучшить продуктивность моделей без необходимости в громоздких тренировках. На

Abstract

As large language models (LLMs) increasingly mediate cross-cultural communication, their behavior still reflects the distributional bias of the languages and viewpoints that are over-represented in their pre-training corpora. Yet, it remains a challenge to model and align culture due to limited cultural knowledge and a lack of exploration into effective learning approaches. We introduce a cost-efficient, cognitively grounded remedy: parameter-efficient fine-tuning on native speakers' free word-association norms, which encode implicit cultural schemas. Leveraging English-US and Mandarin associations from the Small-World-of-Words project, we adapt Llama-3.1-8B and Qwen-2.5-7B via supervised fine-tuning (SFT) and PPO-based preference optimization. SFT boosts held-out association Precision at 5 by 16-20% in English and 43-165% in Mandarin, lifts median concreteness by +0.20, and attains human-level valence and arousal. These lexical gains transfer: on World-Values-Survey questions, fine-tuned models shift answer distributions toward the target culture, and on a 50-item high-tension subset, Qwen's Chinese-aligned responses double while Llama's US bias drops by one-third. Our 7-8B models rival or beat vanilla 70B baselines, showing that a few million culture-grounded associations can instill value alignment without costly retraining. Our work highlights both the promise and the need for future research grounded in human cognition in improving cultural alignment in AI models.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

ALIGN: Word Association Learning for Cross-Cultural Generalization in Large Language Models

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация