How Instruction-Tuning Imparts Length Control: A Cross-Lingual Mechanistic Analysis

2509.02075v1 cs.CL, cs.AI, I.2.7 2025-09-05

Авторы:

Elisabetta Rocchetti, Alfio Ferrara

Резюме на русском

## Контекст Одной из основных проблем для современных бо LLM (Large Language Models) является необходимость придерживаться четких ограничений по длине генерируемого текста, например, количества слов. Такая задача важна для многих приложений, таких как создание текстов с определенным количеством информации, адаптация написанного для конкретных видов текстов, например, резюме, статей или рецептов. Исследователи сталкиваются с проблемой недостаточной гибкости моделей в понимании и применении таких конкретных требований, что приводит к несоответствию генерируемых текстов заданным ограничениям. Данный исследовательский подход адресован разбору и сравнению различий в поведении "основных" моделей, не прошедших инструкционное тюнинг (fine-tuning), и их инструкционно тюнинговых аналогов, с целью выявления факторов, влияющих на эффективность управления длиной текста. Особое внимание уделяется анализу внутренних компонентов моделей, таких как веса и активации нейронов, для понимания, как именно инструкционное тюнинг влияет на решение этой задачи. Рассматриваются задачи генерирования текста в двух языках: английском и итальянском. ## Метод Для исследования использованы две модели языкового тюнинга: основная (без инструкционного тюнинга) и инструкционно тюнинговая. Измерение эффективности контроля длины текста производилось с помощью метрики Cumulative Weighted Attribution (CWA), которая определяет вклад каждого компонента модели в решение задачи. Модели были тестированы на наборе данных, включающий задачи генерирования текста с заданными ограничениями длины в двух языках. Кроме того, проводился анализ внутренних слоев моделей, включая вклад отдельных слоев, включая attention heads (активации внимания) и final-layer MLPs (многослойные перцептроны). Это позволило выявить, какие компоненты причастны к решению проблемы контроля длины и в какой степени. Эксперименты проводились в условиях управления длиной текста в двух языках, чтобы выявить потенциальные различия в поведении моделей в зависимости от языка. ## Результаты Исследование показало, что инструкционное тюнинг значительно улучшает эффективность управления длиной текста в обоих языках. Особенно выражено это в английском языке, где в поздних слоях модели встречаются более сильные вклады от внимательных голов (attention heads), что указывает на специализацию этих компонентов в задачу контроля длины. Для итальянского языка, вклад поздних слоев менее заметен, однако final-layer MLPs демонстрируют более выраженную позитивную роль, что может свидетельствовать о компенсационной стратегии в составе модели. Таким образом

Abstract

Adhering to explicit length constraints, such as generating text with a precise word count, remains a significant challenge for Large Language Models (LLMs). This study aims at investigating the differences between foundation models and their instruction-tuned counterparts, on length-controlled text generation in English and Italian. We analyze both performance and internal component contributions using Cumulative Weighted Attribution, a metric derived from Direct Logit Attribution. Our findings reveal that instruction-tuning substantially improves length control, primarily by specializing components in deeper model layers. Specifically, attention heads in later layers of IT models show increasingly positive contributions, particularly in English. In Italian, while attention contributions are more attenuated, final-layer MLPs exhibit a stronger positive role, suggesting a compensatory mechanism. These results indicate that instruction-tuning reconfigures later layers for task adherence, with component-level strategies potentially adapting to linguistic context.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

How Instruction-Tuning Imparts Length Control: A Cross-Lingual Mechanistic Analysis

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Direct Semantic Communication Between Large Language Models via Vector Translati...

Detecting Data Contamination in LLMs via In-Context Learning

LASTIST: LArge-Scale Target-Independent STance dataset

PerCoR: Evaluating Commonsense Reasoning in Persian via Multiple-Choice Sentence...

A Use-Case Specific Dataset for Measuring Dimensions of Responsible Performance ...

Навигация