Steering Language Models in Multi-Token Generation: A Case Study on Tense and Aspect

2509.12065v1 cs.CL, I.2.7 2025-09-17
Авторы:

Alina Klerings, Jannik Brinkmann, Daniel Ruffinelli, Simone Ponzetto

Резюме на русском

#### Контекст Modern large language models (LLMs) обладают возможностью генерировать текст с высоким уровнем грамматической корректности. Однако, насколько эти модели внутренне кодируют синтаксическую информацию, остается неясным. Несмотря на то, что большая часть предыдущих исследований сосредоточилась на двоичных грамматических характеристиках (например, правильность глагола в бинарной конструкции), настоящее исследование сосредоточено на более сложных, многомерных структурах, таких как глагольные времена и аспекты. Эти понятия имеют множественные составляющие, которые влияют друг на друга. Целью данной работы является раскрытие и контроль этих сложных структур в генеративных моделях. #### Метод Чтобы изучить способность моделей кодировать времена и аспекты глаголов, авторы применяют **linear discriminant analysis (LDA)** для выявления ориентированных направлений в пространстве резидентных весов модели. Эти направления характеризуются как влияющие на конкретные грамматические черты. Далее, авторы применяют **concept steering** для контроля этих грамматических черт в генерации текста. Этот подход включает в себя внесение мелких изменений в веса модели, чтобы управлять выходом генерации. Исследования проводятся на трех различных задачах генерации текста, чтобы проверить устойчивость и точность контроля. #### Результаты В результате экспериментов авторы устанавливают, что модели могут кодировать времена и аспекты глаголов с большим уровнем структурированности. Определены определенные направления в весах, которые влияют на эти грамматические черты. Далее, применение concept steering позволяет контролировать эти черты в ходе генерации, но с определенными ограничениями. Например, для выдачи желаемого результата требуется тщательная настройка параметров, таких как сила, место и длительность концепт-стиринга. Однако, существуют риски, такие как нежелательные эффекты, такие как смена темы или дегенерация текста. #### Значимость Полученные результаты имеют важное применение в области глубокого обучения и генеративных моделей. Например, знание о том, как модели кодируют времена и аспекты глаголов, может помочь в создании более точных текстовых генераторов, используемых в различных приложениях, таких как перевод, синтез речи и генерация ответов на вопросы. Кроме того, эта работа открывает пути к более точному контролю выходов генеративных моделей, что может быть полезно в сферах, где важна точность и контроль, таких как юридическая генерация или генерация текста в определенной сфере. #### Выводы Исследование показывает, что LLM могут кодировать вре

Abstract

Large language models (LLMs) are able to generate grammatically well-formed text, but how do they encode their syntactic knowledge internally? While prior work has focused largely on binary grammatical contrasts, in this work, we study the representation and control of two multidimensional hierarchical grammar phenomena - verb tense and aspect - and for each, identify distinct, orthogonal directions in residual space using linear discriminant analysis. Next, we demonstrate causal control over both grammatical features through concept steering across three generation tasks. Then, we use these identified features in a case study to investigate factors influencing effective steering in multi-token generation. We find that steering strength, location, and duration are crucial parameters for reducing undesirable side effects such as topic shift and degeneration. Our findings suggest that models encode tense and aspect in structurally organized, human-like ways, but effective control of such features during generation is sensitive to multiple factors and requires manual tuning or automated optimization.

Ссылки и действия