TEN: Table Explicitization, Neurosymbolically

2508.09324v1 cs.CL, cs.AI 2025-08-15
Авторы:

Nikita Mehrotra, Aayush Kumar, Sumit Gulwani, Arjun Radhakrishna, Ashish Tiwari

Резюме на русском

#### Контекст Многие данные, представленные в виде текста, имеют структуру, которую можно представить в виде таблиц. Однако выделение таких таблиц из семиструктурированного текста остается сложной задачей из-за отсутствия четких символьных разделителей между столбцами и строками. Это препятствует обработке таких данных с помощью полностью нейронных подходов, которые часто страдают от халлуцинаций (генерации несуществующих данных) и не могут обеспечивать жесткого принудительного контроля. Наша мотивация заключается в создании метода, который мог бы справиться с этими проблемами, объединив нейронные и символические подходы. #### Метод Мы предлагаем метод TEN (Table Explicitization, Neurosymbolically), основанный на нейросемантическом подходе. Он использует Structural Decomposition Prompting — специальный цепочно-мышленческий подход — с применением большой модели языка (LLM) для создания исходной таблицы. Далее, символический контроллер проверяет не только корректность таблицы, но и отсутствие халлуцинаций или забытости. Результаты проверки передаются в критическую модель языка (Critique-LLM) для генерации совета по исправлению таблицы. Эти рекомендации возвращаются в LLM в виде цикла самостоятельного диагностирования, чтобы улучшить таблицу. #### Результаты Мы провести эксперименты на нескольких датасетах, сравнивая результаты TEN с нейронными базовыми моделями. Наши результаты показывают, что TEN существенно превосходит базовые модели по всем метрикам, в том числе точности точного совпадения (exact match accuracy) и уменьшению частоты халлуцинаций. Также мы провели 21-участническую испытательную программу, в которой пользователи оценили качество таблиц TEN. Они отметили, что TEN выдает таблицы, являющиеся более точными (средний рейтинг: 5,0 против 4,3; p = 0,021), и легче для проверки и исправления. #### Значимость TEN может применяться в различных областях, где требуется извлечение табличных данных из текста, например в системах автоматической обработки документов, веб-скрейпинге и анализе текстов. Этот подход обеспечивает высокую точность, минимизирует халлуцинации и обеспечивает удобную проверку и исправление результатов. Будущие исследования будут направлены на улучшение метода для работы с более сложными сценариями и увеличения скорости обработки. #### Выводы Мы представили TEN — уникальный подход, который справляется с проблемами халлуцинаций и неточностей, характерных для полностью нейронных подходов. Наши эксперименты показали, что TEN значительно превосходит базовые модели в задаче извлечения табличных данных. Мы также отметили высокую оценку пользователей,

Abstract

We present a neurosymbolic approach, TEN, for extracting tabular data from semistructured input text. This task is particularly challenging for text input that does not use special delimiters consistently to separate columns and rows. Purely neural approaches perform poorly due to hallucinations and their inability to enforce hard constraints. TEN uses Structural Decomposition prompting - a specialized chain-of-thought prompting approach - on a large language model (LLM) to generate an initial table, and thereafter uses a symbolic checker to evaluate not only the well-formedness of that table, but also detect cases of hallucinations or forgetting. The output of the symbolic checker is processed by a critique-LLM to generate guidance for fixing the table, which is presented to the original LLM in a self-debug loop. Our extensive experiments demonstrate that TEN significantly outperforms purely neural baselines across multiple datasets and metrics, achieving significantly higher exact match accuracy and substantially reduced hallucination rates. A 21-participant user study further confirms that TEN's tables are rated significantly more accurate (mean score: 5.0 vs 4.3; p = 0.021), and are consistently preferred for ease of verification and correction, with participants favoring our method in over 60% of the cases.

Ссылки и действия