TComQA: Extracting Temporal Commonsense from Text

2508.15274v1 cs.CL, cs.IR 2025-08-23

Авторы:

Lekshmi R Nair, Arun Sankar, Koninika Pal

Резюме на русском

## Контекст Проблематика понимания и выражения временных концепций в текстах естественного языка широко изучается в области искусственного интеллекта. Однако существуют значительные трудности в выделении и использовании временных коммерсиантов, которые неявно представлены в тексте. Например, для того, чтобы понять, что музейный тур может длиться несколько часов, но не может длиться несколько месяцев, требуется не только понимание языка, но и коммуникативных контекстных сведений. Такие сложности создают препятствия для создания надежных языковых моделей. Мотивирует решение этой проблемы желание улучшить возможности текстовых моделей в сфере естественного языка, основываясь на обобщении и автоматизации временных коммерсиантов. ## Метод В нашем исследовании мы предлагаем подход, основанный на машинном обучении, для выделения временных коммерсиантов из текстов. Мы используем доступные текстовые модели, такие как BERT и GPT-2, в качестве основы для построения нашей экспериментальной среды. Чтобы получить данные для обучения, мы строим TComQA, датасет, полученный из существующих коллекций SAMSum и RealNews. Данные трансформируются с помощью автоматических алгоритмов для выделения временных свойств. Мы также применяем техники разметки и валидации для обеспечения качества данных. Таким образом, мы создаем датасет, который может эффективно обучать модели понимания временных концепций. ## Результаты Мы проводим эксперименты с TComQA для оценки его эффективности в выделении временных коммерсиантов. Для этого мы используем модели, которые обучаются на нашем датасете и сравниваем их с современными моделями текстового понимания. Также мы проводим кросс-валидацию, чтобы проверить точность и надежность наших результатов. Результаты показывают, что модели, обученные на TComQA, достигают высокой точности — 80,4%, что значительно превышает результаты моделей, обученных на других датасетах. Это демонстрирует эффективность нашего подхода в достижении целей. ## Значимость Наш подход имеет значительное значение для развития текстовых моделей, особенно в сферах, требующих высокого уровня компрессии и понимания контекста. Мы показываем, что данные TComQA могут быть использованы для улучшения текстовых моделей в области естественного языка. Это может привести к улучшению хранения и извлечения информации, а также к предотвращению неточностей в генерации текста. Кроме того, наш подход открывает пути к развитию новых технологий, включая системы вопросов-ответов и автоматическое разметки текстов, что может повлиять на развитие интеллектуальных систем в целом. ## Выводы Мы пре

Abstract

Understanding events necessitates grasping their temporal context, which is often not explicitly stated in natural language. For example, it is not a trivial task for a machine to infer that a museum tour may last for a few hours, but can not take months. Recent studies indicate that even advanced large language models (LLMs) struggle in generating text that require reasoning with temporal commonsense due to its infrequent explicit mention in text. Therefore, automatically mining temporal commonsense for events enables the creation of robust language models. In this work, we investigate the capacity of LLMs to extract temporal commonsense from text and evaluate multiple experimental setups to assess their effectiveness. Here, we propose a temporal commonsense extraction pipeline that leverages LLMs to automatically mine temporal commonsense and use it to construct TComQA, a dataset derived from SAMSum and RealNews corpora. TComQA has been validated through crowdsourcing and achieves over 80\% precision in extracting temporal commonsense. The model trained with TComQA also outperforms an LLM fine-tuned on existing dataset of temporal question answering task.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

TComQA: Extracting Temporal Commonsense from Text

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

AR-Med: Automated Relevance Enhancement in Medical Search via LLM-Driven Informa...

Mitigating the Threshold Priming Effect in Large Language Model-Based Relevance ...

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

Towards Unification of Hallucination Detection and Fact Verification for Large L...

Навигация