The ReQAP System for Question Answering over Personal Information

2508.06880v1 cs.CL, cs.IR 2025-08-13
Авторы:

Philipp Christmann, Gerhard Weikum

Резюме на русском

## Контекст Современные пользователи сталкиваются с огромным объемом личной информации, которая распределена по различным источникам: календарях, заказам в интернет-магазинах, фитнес-приложениях, электронной почте и социальных сетях. Несмотря на развитие инструментов поиска и анализа данных, пользователям часто трудно получить конкретные ответы на сложные вопросы, которые могут включать в себя фильтрацию, соединение (join) и агрегацию данных из разных источников. Эта сложность возникает из-за необходимости обрабатывать неструктурированные данные, такие как текст сообщений и социальных постов, и взаимодействовать с ними в рамках сложных запросов. Одной из основных проблем является недостаток инструментов, позволяющих пользователям понять, как система приходит к конкретному ответу. Без понимания этого процесса пользователи не могут доверять результатам. Таким образом, необходимо разработать систему, которая не только эффективно обрабатывала бы сложные запросы, но и давала подробный отчет о процессе вычисления ответов. ## Метод Разработанная система, названная ReQAP (Recursive Question Answering over Personal information), решает эту проблему с помощью рекурсивного декомпозирования вопросов и построения дерева операторов для вычисления. Методология ReQAP включает в себя несколько ключевых компонентов: 1. **Интерпретация вопросов**: Используя легковесные языковые модели, система разбирает запросы пользователей и определяет их компоненты, такие как имена сущностей, операции фильтрации и соединения. 2. **Построение дерева операторов**: Для каждого вопроса система создает дерево операторов, где каждый узел представляет собой конкретную операцию (например, фильтрация, соединение или агрегация). 3. **Использование легковесных языковых моделей**: Локальные модели, специально приведенные под задачи ReQAP, используются для понимания контекста и точного выполнения каждого оператора. 4. **Отслеживание ответов**: Каждый результат трассируется до исходных данных, позволяя пользователям просматривать источники, из которых были получены ответы. ## Результаты На практике ReQAP продемонстрировал высокую точность при обработке сложных запросов, включающих фильтрацию, соединение и агрегацию. В ходе тестов выявлено, что система эффективно работает с неструктурированными данными, такими как текст сообщений и социальных постов. Благодаря трассировке результатов пользователи могут видеть, как каждый ответ связан с источником данных, что улучшает доверие к системе. Разработанная рекурсивная модель позволяет адаптировать систему к разнообразным структурам данных, что делает ее

Abstract

Personal information is abundant on users' devices, from structured data in calendar, shopping records or fitness tools, to unstructured contents in mail and social media posts. This works presents the ReQAP system that supports users with answers for complex questions that involve filters, joins and aggregation over heterogeneous sources. The unique trait of ReQAP is that it recursively decomposes questions and incrementally builds an operator tree for execution. Both the question interpretation and the individual operators make smart use of light-weight language models, with judicious fine-tuning. The demo showcases the rich functionality for advanced user questions, and also offers detailed tracking of how the answers are computed by the operators in the execution tree. Being able to trace answers back to the underlying sources is vital for human comprehensibility and user trust in the system.

Ссылки и действия