Dialogue Response Prefetching Based on Semantic Similarity and Prediction Confidence of Language Model

2508.04403v1 cs.CL 2025-08-09

Авторы:

Kiyotada Mori, Seiya Kawano, Angel Fernando Garcia Contreras, Koichiro Yoshino

Резюме на русском

Быстрота реакции систем с голосовым вводом определяется не только производительностью, но и правильностью предсказания пользовательских запросов. Одной из проблем в данной области является **User-Perceived Latency (UPL)** — время, проходящее от момента отправки запроса пользователем до получения ответа. Решить эту проблему можно предварительной загрузкой (prefetching) ответов, но для этого необходимо точно предсказать пользовательский запрос еще до его полного возникновения. В статье предлагается **Prediction Confidence Model (PCM)**, который определяет возможность сделать предположение о пользовательском запросе на основе семантической схожести предложенного предположения и целевого запроса. PCM использует модель языка для вычисления уровня уверенности в том, что предсказанное предложение соответствует услышанному. Эксперименты показали, что **PCM** улучшает точность предсказаний и позволяет снизить UPL без ухудшения качества ответа.

Abstract

Prefetching of dialogue responses has been investigated to reduce user-perceived latency (UPL), which refers to the user's waiting time before receiving the system's response, in spoken dialogue systems. To reduce the UPL, it is necessary to predict complete user utterances before the end of the user's speech, typically by language models, to prepare prefetched dialogue responses. In this study, we proposed a prediction confidence model (PCM) that determines whether prefetching is possible or not by estimating the semantic similarity between the predicted complete user utterance and the complete user utterance. We evaluated our PCM based on the differences between the predicted complete user utterance and the complete user utterance.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Dialogue Response Prefetching Based on Semantic Similarity and Prediction Confidence of Language Model

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Nexus: Higher-Order Attention Mechanisms in Transformers

On GRPO Collapse in Search-R1: The Lazy Likelihood-Displacement Death Spiral

ClusterFusion: Hybrid Clustering with Embedding Guidance and LLM Adaptation

SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats

RapidUn: Influence-Driven Parameter Reweighting for Efficient Large Language Mod...

Навигация