TComQA: Extracting Temporal Commonsense from Text
2508.15274v1
cs.CL, cs.IR
2025-08-23
Авторы:
Lekshmi R Nair, Arun Sankar, Koninika Pal
Резюме на русском
## Контекст
Проблематика понимания и выражения временных концепций в текстах естественного языка широко изучается в области искусственного интеллекта. Однако существуют значительные трудности в выделении и использовании временных коммерсиантов, которые неявно представлены в тексте. Например, для того, чтобы понять, что музейный тур может длиться несколько часов, но не может длиться несколько месяцев, требуется не только понимание языка, но и коммуникативных контекстных сведений. Такие сложности создают препятствия для создания надежных языковых моделей. Мотивирует решение этой проблемы желание улучшить возможности текстовых моделей в сфере естественного языка, основываясь на обобщении и автоматизации временных коммерсиантов.
## Метод
В нашем исследовании мы предлагаем подход, основанный на машинном обучении, для выделения временных коммерсиантов из текстов. Мы используем доступные текстовые модели, такие как BERT и GPT-2, в качестве основы для построения нашей экспериментальной среды. Чтобы получить данные для обучения, мы строим TComQA, датасет, полученный из существующих коллекций SAMSum и RealNews. Данные трансформируются с помощью автоматических алгоритмов для выделения временных свойств. Мы также применяем техники разметки и валидации для обеспечения качества данных. Таким образом, мы создаем датасет, который может эффективно обучать модели понимания временных концепций.
## Результаты
Мы проводим эксперименты с TComQA для оценки его эффективности в выделении временных коммерсиантов. Для этого мы используем модели, которые обучаются на нашем датасете и сравниваем их с современными моделями текстового понимания. Также мы проводим кросс-валидацию, чтобы проверить точность и надежность наших результатов. Результаты показывают, что модели, обученные на TComQA, достигают высокой точности — 80,4%, что значительно превышает результаты моделей, обученных на других датасетах. Это демонстрирует эффективность нашего подхода в достижении целей.
## Значимость
Наш подход имеет значительное значение для развития текстовых моделей, особенно в сферах, требующих высокого уровня компрессии и понимания контекста. Мы показываем, что данные TComQA могут быть использованы для улучшения текстовых моделей в области естественного языка. Это может привести к улучшению хранения и извлечения информации, а также к предотвращению неточностей в генерации текста. Кроме того, наш подход открывает пути к развитию новых технологий, включая системы вопросов-ответов и автоматическое разметки текстов, что может повлиять на развитие интеллектуальных систем в целом.
## Выводы
Мы пре
Abstract
Understanding events necessitates grasping their temporal context, which is
often not explicitly stated in natural language. For example, it is not a
trivial task for a machine to infer that a museum tour may last for a few
hours, but can not take months. Recent studies indicate that even advanced
large language models (LLMs) struggle in generating text that require reasoning
with temporal commonsense due to its infrequent explicit mention in text.
Therefore, automatically mining temporal commonsense for events enables the
creation of robust language models. In this work, we investigate the capacity
of LLMs to extract temporal commonsense from text and evaluate multiple
experimental setups to assess their effectiveness. Here, we propose a temporal
commonsense extraction pipeline that leverages LLMs to automatically mine
temporal commonsense and use it to construct TComQA, a dataset derived from
SAMSum and RealNews corpora. TComQA has been validated through crowdsourcing
and achieves over 80\% precision in extracting temporal commonsense. The model
trained with TComQA also outperforms an LLM fine-tuned on existing dataset of
temporal question answering task.
Ссылки и действия
Дополнительные ресурсы: