Towards Stable and Personalised Profiles for Lexical Alignment in Spoken Human-Agent Dialogue

2509.04104v1 cs.CL, cs.HC 2025-09-06

Авторы:

Keara Schaaij, Roel Boumans, Tibor Bosse, Iris Hendrickx

Резюме на русском

#### Контекст Лексическая аллюзия (lexical alignment) — процесс, в ходе которого участники диалога начинают использовать похожие лексические единицы, что повышает эффективность общения. Хотя этот прием широко известен и используется в интерполяции между людьми, технологии, основанные на нем, для роботов и агентов еще находятся в ранней стадии исследований. Особенно трудно реализовать эту функцию с учетом последних достижений в области больших языковых моделей (LLMs). В этом исследовании предлагается новый подход к созданию лингвистических профилей, которые могут поддерживать lexical alignment в диалоге между людьми и агентами. Такие профили значительно повышают удобство использования роботов и приводят к более естественным изменениям в общении. #### Метод Для создания лингвистических профилей использовались методы персонализации голосовых агентов. Ключевым аспектом является структура профилей, которая определяет, какие лексические аспекты будут использоваться в беседе. Лексические профили были созданы на основе разных объемов транскриптов речи (10 минут, 20 минут и 30 минут), а также различным количеством лексических единиц в каждой части речи (POS, part-of-speech): 5 элементов для прилагательных, 5 для союзов, 10 для местоимений и существительных, 15 для наречий и глаголов. На основе этих параметров проводились эксперименты, измеряясь по таким критериям, как покрытие (coverage), восстановление (recall) и косинусная схожесть (cosine similarity). #### Результаты Эксперименты показали, что оптимальный баланс между производительностью и эффективностью данных достигается, когда используется 10 минут транскрипта, содержащих 5 элементов прилагательных, 5 союзов, 10 наречий, 10 местоимений, 10 существительных и 10 глаголов. Эти профили достаточно компактны, чтобы оптимизировать использование ресурсов, и при этом поддерживают высокую эффективность в обеспечении lexical alignment. Таким образом, лексические профили могут быть эффективно использованы в говорящих агентах, улучшая имитацию естественного общения. #### Значимость Этот подход может быть применен в различных сферах, например в системах общения с компьютерами, виртуальных помощниках и сервисах клиентской поддержки. Основное преимущество заключается в том, что лингвистические профили позволяют создавать более естественные и персонализированные беседы, улучшая связь между людьми и роботами. Будущие исследования могут сосредоточиться на расширении этих профилей для более сложных диалогов и разных типов мобильных приложений. #### Выводы В данном исследовании были

Abstract

Lexical alignment, where speakers start to use similar words across conversation, is known to contribute to successful communication. However, its implementation in conversational agents remains underexplored, particularly considering the recent advancements in large language models (LLMs). As a first step towards enabling lexical alignment in human-agent dialogue, this study draws on strategies for personalising conversational agents and investigates the construction of stable, personalised lexical profiles as a basis for lexical alignment. Specifically, we varied the amounts of transcribed spoken data used for construction as well as the number of items included in the profiles per part-of-speech (POS) category and evaluated profile performance across time using recall, coverage, and cosine similarity metrics. It was shown that smaller and more compact profiles, created after 10 min of transcribed speech containing 5 items for adjectives, 5 items for conjunctions, and 10 items for adverbs, nouns, pronouns, and verbs each, offered the best balance in both performance and data efficiency. In conclusion, this study offers practical insights into constructing stable, personalised lexical profiles, taking into account minimal data requirements, serving as a foundational step toward lexical alignment strategies in conversational agents.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Towards Stable and Personalised Profiles for Lexical Alignment in Spoken Human-Agent Dialogue

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Is Lying Only Sinful in Islam? Exploring Religious Bias in Multilingual Large La...

ELR-1000: A Community-Generated Dataset for Endangered Indic Indigenous Language...

TaleFrame: An Interactive Story Generation System with Fine-Grained Control and ...

Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought E...

Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought E...

Навигация