Towards Stable and Personalised Profiles for Lexical Alignment in Spoken Human-Agent Dialogue
2509.04104v1
cs.CL, cs.HC
2025-09-06
Авторы:
Keara Schaaij, Roel Boumans, Tibor Bosse, Iris Hendrickx
Резюме на русском
#### Контекст
Лексическая аллюзия (lexical alignment) — процесс, в ходе которого участники диалога начинают использовать похожие лексические единицы, что повышает эффективность общения. Хотя этот прием широко известен и используется в интерполяции между людьми, технологии, основанные на нем, для роботов и агентов еще находятся в ранней стадии исследований. Особенно трудно реализовать эту функцию с учетом последних достижений в области больших языковых моделей (LLMs). В этом исследовании предлагается новый подход к созданию лингвистических профилей, которые могут поддерживать lexical alignment в диалоге между людьми и агентами. Такие профили значительно повышают удобство использования роботов и приводят к более естественным изменениям в общении.
#### Метод
Для создания лингвистических профилей использовались методы персонализации голосовых агентов. Ключевым аспектом является структура профилей, которая определяет, какие лексические аспекты будут использоваться в беседе. Лексические профили были созданы на основе разных объемов транскриптов речи (10 минут, 20 минут и 30 минут), а также различным количеством лексических единиц в каждой части речи (POS, part-of-speech): 5 элементов для прилагательных, 5 для союзов, 10 для местоимений и существительных, 15 для наречий и глаголов. На основе этих параметров проводились эксперименты, измеряясь по таким критериям, как покрытие (coverage), восстановление (recall) и косинусная схожесть (cosine similarity).
#### Результаты
Эксперименты показали, что оптимальный баланс между производительностью и эффективностью данных достигается, когда используется 10 минут транскрипта, содержащих 5 элементов прилагательных, 5 союзов, 10 наречий, 10 местоимений, 10 существительных и 10 глаголов. Эти профили достаточно компактны, чтобы оптимизировать использование ресурсов, и при этом поддерживают высокую эффективность в обеспечении lexical alignment. Таким образом, лексические профили могут быть эффективно использованы в говорящих агентах, улучшая имитацию естественного общения.
#### Значимость
Этот подход может быть применен в различных сферах, например в системах общения с компьютерами, виртуальных помощниках и сервисах клиентской поддержки. Основное преимущество заключается в том, что лингвистические профили позволяют создавать более естественные и персонализированные беседы, улучшая связь между людьми и роботами. Будущие исследования могут сосредоточиться на расширении этих профилей для более сложных диалогов и разных типов мобильных приложений.
#### Выводы
В данном исследовании были
Abstract
Lexical alignment, where speakers start to use similar words across
conversation, is known to contribute to successful communication. However, its
implementation in conversational agents remains underexplored, particularly
considering the recent advancements in large language models (LLMs). As a first
step towards enabling lexical alignment in human-agent dialogue, this study
draws on strategies for personalising conversational agents and investigates
the construction of stable, personalised lexical profiles as a basis for
lexical alignment. Specifically, we varied the amounts of transcribed spoken
data used for construction as well as the number of items included in the
profiles per part-of-speech (POS) category and evaluated profile performance
across time using recall, coverage, and cosine similarity metrics. It was shown
that smaller and more compact profiles, created after 10 min of transcribed
speech containing 5 items for adjectives, 5 items for conjunctions, and 10
items for adverbs, nouns, pronouns, and verbs each, offered the best balance in
both performance and data efficiency. In conclusion, this study offers
practical insights into constructing stable, personalised lexical profiles,
taking into account minimal data requirements, serving as a foundational step
toward lexical alignment strategies in conversational agents.
Ссылки и действия
Дополнительные ресурсы: