AgREE: Agentic Reasoning for Knowledge Graph Completion on Emerging Entities
2508.04118v1
cs.AI, cs.CL
2025-08-09
Авторы:
Ruochen Zhao, Simone Conia, Eric Peng, Min Li, Saloni Potdar
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Комплектация графов знаний (Knowledge Graph Completion, KGC) является ключевой задачей в области знаний, особенно в открытых областях, где данные постоянно изменяются. Существующие подходы к KGC часто основываются на предобученных языковых моделях, предварительно созданных запросах или однократном поиске информации. Однако эти методы сталкиваются с существенными ограничениями, особенно когда речь заходит о неизвестных или растущих сущностях, которые часто не представлены в предобученных моделях. Такие сущности могут включать новые личности, компании, события, которые появляются в новостных потоках или других динамических источниках.
Традиционные подходы к KGC требуют значительных ресурсов для обучения и часто не могут эффективно адаптироваться к динамическим средам. Они могут некорректно обрабатывать непопулярные или новые сущности, что приводит к неполным или неточным графам знаний. Эта проблема становится особенно критичной в условиях быстро меняющихся информационных сред, где необходимо обеспечить актуальность и полноту графов знаний.
Одной из ключевых проблем является невозможность многих существующих методов эффективно использовать динамические и непредсказуемые источники данных, такие как новостные статьи, блоги или социальные сети. Эти источники часто содержат важную информацию о новых сущностях, которая может быть недоступна в предобученных моделях. Таким образом, необходимо разработать новые подходы, которые могут динамически интегрировать информацию из различных источников и обеспечить более полное представление знаний о новых сущностях.
## ПРЕДЛОЖЕННЫЙ МЕТОД
В статье предлагается новый фреймворк под названием AgREE (Agentic Reasoning for Emerging Entities), который использует агентское мышление для комплектации графов знаний. Основная идея AgREE заключается в использовании итеративного поиска и многошагового рассуждения для динамического построения троек знаний (knowledge graph triplets). Агентский подход позволяет системе динамически адаптироваться к новым и неизвестным сущностям, используя стратегический поиск информации и рациональное мышление.
AgREE работает в несколько этапов. Сначала, агент выполняет поисковые запросы для получения информации о новой сущности. Затем, он проводит многошаговое рассуждение на основе полученных данных, чтобы сформировать новые тройки знаний. Этот процесс позволяет AgREE динамически обновлять граф знаний, не требуя предварительного обучения на конкретных данных.
Ключевой особенностью AgREE является его способность обрабатывать непопулярные или недавно появившиеся сущности, которые могут быть не представлены в предобученных моделях. Используя итеративный поиск и многошаговое рассуждение, AgREE может собирать информацию из различных источников и формировать более полные и актуальные графы знаний.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Авторы провели ряд экспериментов, чтобы оценить эффективность AgREE по сравнению с существующими методами KGC. Эксперименты были проведены на новом бенчмарке, созданном для оценки качества комплектации графов знаний на неизвестных сущностях. Для экспериментов использовались данные из различных источников, включая новостные статьи и веб-страницы.
Результаты показали, что AgREE значительно превосходит существующие методы в контексте работы с неизвестными и непопулярными сущностями. В частности, AgREE показал лучшие результаты в построении троек знаний для сущностей, которые не были видны во время предварительного обучения языковых моделей. Повышение качества достигало 13,7% по сравнению с лучшими существующими подходами.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Предложенный метод AgREE имеет широкое применение в областях, требующих поддержания актуальности и полноты графов знаний. Например, в сфере новостей, социальных сетей или электронной коммерции, где необходимо быстро реагировать на появление новых сущностей и информации. AgREE может быть использован для создания более динамических и адаптивных систем знаний, которые могут эффективно интегрировать новую информацию из различных источников.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
AgREE представляет собой новый подход к комплектации графов знаний, который сочетает агентское мышление и стратегический поиск информации. Этот подход демонстрирует высокую эффективность в работе с неизвестными и непопулярными сущностями, что является важной проблемой в современных системах знаний. Будущие исследования могут сосредоточиться на дальнейшей оптимизации метода и его интеграции с другими системами обработки знаний.
Abstract
Open-domain Knowledge Graph Completion (KGC) faces significant challenges in
an ever-changing world, especially when considering the continual emergence of
new entities in daily news. Existing approaches for KGC mainly rely on
pretrained language models' parametric knowledge, pre-constructed queries, or
single-step retrieval, typically requiring substantial supervision and training
data. Even so, they often fail to capture comprehensive and up-to-date
information about unpopular and/or emerging entities. To this end, we introduce
Agentic Reasoning for Emerging Entities (AgREE), a novel agent-based framework
that combines iterative retrieval actions and multi-step reasoning to
dynamically construct rich knowledge graph triplets. Experiments show that,
despite requiring zero training efforts, AgREE significantly outperforms
existing methods in constructing knowledge graph triplets, especially for
emerging entities that were not seen during language models' training
processes, outperforming previous methods by up to 13.7%. Moreover, we propose
a new evaluation methodology that addresses a fundamental weakness of existing
setups and a new benchmark for KGC on emerging entities. Our work demonstrates
the effectiveness of combining agent-based reasoning with strategic information
retrieval for maintaining up-to-date knowledge graphs in dynamic information
environments.
Ссылки и действия
Дополнительные ресурсы: