PanelTR: Zero-Shot Table Reasoning Framework Through Multi-Agent Scientific Discussion

2508.06110v1 cs.AI, cs.MA 2025-08-12
Авторы:

Yiran Rex Ma

Резюме на русском

## Контекст Table reasoning, включая табулярные запросы и проверку фактов, часто опирается на аннотированные данные или сложные методы аугментации, что ограничивает гибкость и общий потенциал. Логические модели языка (LLMs), несмотря на их универсальность, часто не достигают равноценного эффекта по сравнению с простыми моделями супервизированного обучения. Эти ограничения вдохновили создание PanelTR, рамфреймворка, воспользовавшегося ЛЛМ-агентами-учеными для укрепления логического моделирования таблиц. Эта модель применяет структурированную научную методологию, включающую индивидуальные исследования, самопроверку и коллективные переобсуждения, чтобы обеспечить трансфер семантического содержания без потребности в аугментации данных или параметрической оптимизации. ## Метод PanelTR разделяет задачи на четыре ключевых этапа: индивидуальное исследование, самопроверка, переобсуждение и внедрение предложений. Для этого используются пять ЛЛМ-агентов-ученых, каждый с определенным специальным вниманием (например, агент-исследователь, агент-рецензент). Агенты взаимодействуют в системе стимулирующей дискуссии, позволяя им улучшать свои доказательства и понимание задачи. Эта архитектура требует только начального набора данных и не зависит от дополнительных аугментаций, обеспечивая гибкость и устойчивость в нулевом слое обучения. ## Результаты На тестах TabFact, WikiTableQuestions, TabMC, и WTQ, PanelTR показывает значительные достижения. Он превосходит vanilla LLMs и в некоторых случаях даже супервизированные модели, не имея доступа к обучающим данным. Это достигается благодаря уникальной структуре дискуссии и самостоятельной самопроверке, которая усиливает семантическое обобщение и достигает высокой точности в задачах табулярного логического моделирования. ## Значимость PanelTR может применяться в различных сферах, таких как распознавание таблиц и фактовая верификация, обеспечивая прочное понимание данных без дополнительных данных для обучения. Его гибкость и способность создавать обобщаемые модели позволяют решать широкий спектр задач, включая не только табличные задачи, но и другие задачи, требующие семантического понимания. Это решение может повлиять на развитие ИИ в области естественного языка, обеспечив эффективность и гибкость. ## Выводы Результаты PanelTR указывают на эффективность структурированной научной методологии в решении сложных задач, включая табулярное логическое моделирование. Будущие исследования могут сосредоточиться на расширении фреймворка на другие типы задач и оптимизации его интеграции с другими технологиями, чтобы

Abstract

Table reasoning, including tabular QA and fact verification, often depends on annotated data or complex data augmentation, limiting flexibility and generalization. LLMs, despite their versatility, often underperform compared to simple supervised models. To approach these issues, we introduce PanelTR, a framework utilizing LLM agent scientists for robust table reasoning through a structured scientific approach. PanelTR's workflow involves agent scientists conducting individual investigations, engaging in self-review, and participating in collaborative peer-review discussions. This process, driven by five scientist personas, enables semantic-level transfer without relying on data augmentation or parametric optimization. Experiments across four benchmarks show that PanelTR outperforms vanilla LLMs and rivals fully supervised models, all while remaining independent of training data. Our findings indicate that structured scientific methodology can effectively handle complex tasks beyond table reasoning with flexible semantic understanding in a zero-shot context.

Ссылки и действия