TextOnly: A Unified Function Portal for Text-Related Functions on Smartphones
2508.16926v1
cs.HC, cs.AI
2025-08-27
Авторы:
Minghao Tu, Chun Yu, Xiyuan Shen, Zhi Zheng, Li Chen, Yuanchun Shi
Резюме на русском
#### Контекст
Современные смартфоны предлагают множество функций, обычно подключаемых через различные приложения. Однако доступ к этим функциям часто требует многократного переключения между приложениями и поиска нужных полей ввода. Такие ограничения снижают эффективность и удобство пользователей. Многие пользователи приходят к выводу, что звуковые вводы, такие как ассистенты, не всегда удобны, особенно при необходимости ввода текста. Данная статья предлагает TextOnly, решение, оптимизированное для упрощения доступа к текстовым функциям через единый портал.
#### Метод
TextOnly представляет собой универсальный портал для текстовых функций, который работает на основе больших языковых моделей (LLM) и модели BERT. LLM обеспечивает основной контекст, а BERT модель адаптируется к пользовательским предпочтениям, улучшая прогнозирование. Для реализации TextOnly используется единый текстовый портал, в который пользователь вводит текст. Этот текст обрабатывается с помощью LLM для определения общей цели, а затем с помощью BERT для дополнительной индивидуализации. Благодаря этой структуре, TextOnly может интерпретировать текстовые запросы и активировать соответствующие функции в различных приложениях.
#### Результаты
На основе реальных экспериментов с 27 участниками, проведенных в течение трех недель, TextOnly достиг топ-1 аккуратности 71.35%, что указывает на способность точно интерпретировать пользовательские запросы. Еще более важно, что текстовый портал продемонстрировал повышение скорости и точности в процессе использования. Участники оценили TextOnly как удобный инструмент, выражая приоритет за ним по сравнению с традиционными методами ввода или звуковыми ассистентами. Например, ввод названия ресторана активирует Google Maps, ввод приветствия — начало чата в WhatsApp.
#### Значимость
TextOnly может применяться в различных сферах, где требуется удобный доступ к текстовым функциям, таких как социальные сети, карты, поисковые системы и др. Он обеспечивает более быстрый доступ к функциям и поддерживает большее разнообразие текстовых запросов по сравнению с звуковыми вводами. Благодаря использованию LLM и BERT, TextOnly может быстро адаптироваться к пользовательским предпочтениям, что способствует его эффективности. Этот подход может существенно улучшить удобство использования смартфонов, уменьшив время и усилия на поиск и ввод текста.
#### Выводы
Текстовый портал TextOnly демонстрирует высокую эффективность в интерпретации текстовых запросов и активации функций в различных приложениях. Он показал высокую точность и скорость работы, а также удовлетворительную эффективность в ре
Abstract
Text boxes serve as portals to diverse functionalities in today's smartphone
applications. However, when it comes to specific functionalities, users always
need to navigate through multiple steps to access particular text boxes for
input. We propose TextOnly, a unified function portal that enables users to
access text-related functions from various applications by simply inputting
text into a sole text box. For instance, entering a restaurant name could
trigger a Google Maps search, while a greeting could initiate a conversation in
WhatsApp. Despite their brevity, TextOnly maximizes the utilization of these
raw text inputs, which contain rich information, to interpret user intentions
effectively. TextOnly integrates large language models(LLM) and a BERT model.
The LLM consistently provides general knowledge, while the BERT model can
continuously learn user-specific preferences and enable quicker predictions.
Real-world user studies demonstrated TextOnly's effectiveness with a top-1
accuracy of 71.35%, and its ability to continuously improve both its accuracy
and inference speed. Participants perceived TextOnly as having satisfactory
usability and expressed a preference for TextOnly over manual executions.
Compared with voice assistants, TextOnly supports a greater range of
text-related functions and allows for more concise inputs.
Ссылки и действия
Дополнительные ресурсы: