Question-to-Knowledge: Multi-Agent Generation of Inspectable Facts for Product Mapping
2509.01182v1
cs.AI, cs.CL, cs.HC, cs.IR, cs.MA
2025-09-05
Авторы:
Wonduk Seo, Taesub Shin, Hyunjin An, Dokyun Kim, Seunghyun Lee
Резюме на русском
#### Контекст
В современной электронной коммерции возникает сложность с идентификацией товаров, когда недостаточно или отсутствуют уникальные идентификаторы, такие как SKU. Два товара могут иметь различные названия, названия производителей и спецификации, что делает необходимым наличие комплексного подхода для их сопоставления. Кроме того, существуют проблемы с ошибками, возникающими из-за подхода с использованием правил и ключевых слов, которые не всегда учитывают тонкие различия в товарах. Это привело к развитию новых подходов, основанных на искусственном интеллекте, для более точного сопоставления товаров и уменьшения человекозатрат в этой области.
#### Метод
Q2K (Question-to-Knowledge) — это многоагентная система, которая использует крупные языковые модели (LLM) для построения проверяемых интерактивных фактов. Фреймворк состоит из трех основных компонентов: 1) Разумащего агента, который формирует целевые вопросы для разъяснения неоднозначностей; 2) Агента знаний, который выполняет поиск информации в Интернете для разрешения вопросов; 3) Дедупликационного агента, который использует результаты проверок для уменьшения количества повторных поисков. Более того, человеко-в-цикле механизм добавляет дополнительное разрешение для неоднозначных случаев. Такой подход обеспечивает не только большую точность, но и эффективность, поскольку он повторно использует обработанные ранее данные, уменьшая затраты на поиск.
#### Результаты
В работе проведены эксперименты на реальных данных различных потребительских товаров. Наборы данных включали в себя товары с разными уровнями сложности, включая товары с большим количеством вариантов бандлов и сложной структурой брендов. Результаты показали, что Q2K превосходит существующие базовые модели, достигая высокой точности при различных типах задач, таких как определение бандлов и разрешение товаров с одинаковыми брендами. Этот подход также показал свою эффективность в сокращении времени поиска и уменьшении человекозатрат при работе с большими наборами данных.
#### Значимость
Q2K может применяться в различных сферах, включая электронную коммерцию, системы управления товарами и системы закупок. Он обеспечивает точность в сопоставлении товаров, что позволяет экономить время и ресурсы. Благодаря использованию LLMs, Q2K обеспечивает прозрачность в процессе принятия решений, что важно для бизнеса. Будущие исследования будут направлены на улучшение модели для работы с более сложными случаями и интеграции ее в системы прогнозирования и анализа.
#### Выводы
Q2K представляет собой продвинутый подход к разрешению проблем сопоставления товаров
Abstract
Identifying whether two product listings refer to the same Stock Keeping Unit
(SKU) is a persistent challenge in ecommerce, especially when explicit
identifiers are missing and product names vary widely across platforms. Rule
based heuristics and keyword similarity often misclassify products by
overlooking subtle distinctions in brand, specification, or bundle
configuration. To overcome these limitations, we propose Question to Knowledge
(Q2K), a multi agent framework that leverages Large Language Models (LLMs) for
reliable SKU mapping. Q2K integrates: (1) a Reasoning Agent that generates
targeted disambiguation questions, (2) a Knowledge Agent that resolves them via
focused web searches, and (3) a Deduplication Agent that reuses validated
reasoning traces to reduce redundancy and ensure consistency. A human in the
loop mechanism further refines uncertain cases. Experiments on real world
consumer goods datasets show that Q2K surpasses strong baselines, achieving
higher accuracy and robustness in difficult scenarios such as bundle
identification and brand origin disambiguation. By reusing retrieved reasoning
instead of issuing repeated searches, Q2K balances accuracy with efficiency,
offering a scalable and interpretable solution for product integration.