TEN: Table Explicitization, Neurosymbolically
2508.09324v1
cs.CL, cs.AI
2025-08-15
Авторы:
Nikita Mehrotra, Aayush Kumar, Sumit Gulwani, Arjun Radhakrishna, Ashish Tiwari
Резюме на русском
#### Контекст
Многие данные, представленные в виде текста, имеют структуру, которую можно представить в виде таблиц. Однако выделение таких таблиц из семиструктурированного текста остается сложной задачей из-за отсутствия четких символьных разделителей между столбцами и строками. Это препятствует обработке таких данных с помощью полностью нейронных подходов, которые часто страдают от халлуцинаций (генерации несуществующих данных) и не могут обеспечивать жесткого принудительного контроля. Наша мотивация заключается в создании метода, который мог бы справиться с этими проблемами, объединив нейронные и символические подходы.
#### Метод
Мы предлагаем метод TEN (Table Explicitization, Neurosymbolically), основанный на нейросемантическом подходе. Он использует Structural Decomposition Prompting — специальный цепочно-мышленческий подход — с применением большой модели языка (LLM) для создания исходной таблицы. Далее, символический контроллер проверяет не только корректность таблицы, но и отсутствие халлуцинаций или забытости. Результаты проверки передаются в критическую модель языка (Critique-LLM) для генерации совета по исправлению таблицы. Эти рекомендации возвращаются в LLM в виде цикла самостоятельного диагностирования, чтобы улучшить таблицу.
#### Результаты
Мы провести эксперименты на нескольких датасетах, сравнивая результаты TEN с нейронными базовыми моделями. Наши результаты показывают, что TEN существенно превосходит базовые модели по всем метрикам, в том числе точности точного совпадения (exact match accuracy) и уменьшению частоты халлуцинаций. Также мы провели 21-участническую испытательную программу, в которой пользователи оценили качество таблиц TEN. Они отметили, что TEN выдает таблицы, являющиеся более точными (средний рейтинг: 5,0 против 4,3; p = 0,021), и легче для проверки и исправления.
#### Значимость
TEN может применяться в различных областях, где требуется извлечение табличных данных из текста, например в системах автоматической обработки документов, веб-скрейпинге и анализе текстов. Этот подход обеспечивает высокую точность, минимизирует халлуцинации и обеспечивает удобную проверку и исправление результатов. Будущие исследования будут направлены на улучшение метода для работы с более сложными сценариями и увеличения скорости обработки.
#### Выводы
Мы представили TEN — уникальный подход, который справляется с проблемами халлуцинаций и неточностей, характерных для полностью нейронных подходов. Наши эксперименты показали, что TEN значительно превосходит базовые модели в задаче извлечения табличных данных. Мы также отметили высокую оценку пользователей,
Abstract
We present a neurosymbolic approach, TEN, for extracting tabular data from
semistructured input text. This task is particularly challenging for text input
that does not use special delimiters consistently to separate columns and rows.
Purely neural approaches perform poorly due to hallucinations and their
inability to enforce hard constraints. TEN uses Structural Decomposition
prompting - a specialized chain-of-thought prompting approach - on a large
language model (LLM) to generate an initial table, and thereafter uses a
symbolic checker to evaluate not only the well-formedness of that table, but
also detect cases of hallucinations or forgetting. The output of the symbolic
checker is processed by a critique-LLM to generate guidance for fixing the
table, which is presented to the original LLM in a self-debug loop. Our
extensive experiments demonstrate that TEN significantly outperforms purely
neural baselines across multiple datasets and metrics, achieving significantly
higher exact match accuracy and substantially reduced hallucination rates. A
21-participant user study further confirms that TEN's tables are rated
significantly more accurate (mean score: 5.0 vs 4.3; p = 0.021), and are
consistently preferred for ease of verification and correction, with
participants favoring our method in over 60% of the cases.
Ссылки и действия
Дополнительные ресурсы: