GDLLM: A Global Distance-aware Modeling Approach Based on Large Language Models for Event Temporal Relation Extraction

2508.20828v1 cs.CL, cs.IR 2025-08-30

Авторы:

Jie Zhao, Wanting Ning, Yuxiao Fei, Yubo Feng, Lishuang Li

Резюме на русском

#### Контекст Научное исследование ориентируется на область естественного языкового процессинга (NLP), а точнее, на задачу извлечения временных отношений событий (Event Temporal Relation Extraction, ETRE). Это задача, направленная на определение взаимосвязей между событиями в тексте, такими как предшествование, совпадение или последовалое следование. Несмотря на то, что языковые модели (LLMs) доказали свою эффективность в этой области, они сталкиваются с рядом проблем. Малые языковые модели (SLMs) страдают от ограниченного предварительно обученного знания, что приводит к неэффективности в работе с малочисленными классами в несбалансированных датасетах. Для LLMs применяются ручно сконструированные как стимулы (prompts), что может привести к лишней шумности и помехам в выводе модели, особенно при работе с зависимостями между событиями на больших расстояниях. Эти ограничения вдохновили разработку **GDLLM** — нового подхода, основанного на LLMs, который не только учитывает глобальные зависимости, но и повышает точность в работе с небольшими классами классификации. #### Метод Методология **GDLLM** основывается на двух ключевых компонентах. Во-первых, предлагается дистанционно-отзывчивая графовая структура, построенная на основе Graph Attention Network (GAT), которая позволяет языковой модели лучше учитывать зависимости на больших расстояниях. Во-вторых, введена парадигма обучения функций времени (temporal feature learning paradigm), основанная на мягком инференсе (soft inference). Она способствует лучшему распознаванию отношений событий, имеющих близкое расстояние, и интегрирует мощь пробабольных выводов LLMs в механизм множественного внимания (multi-head attention). Объединение этих компонентов обеспечивает эффективную обработку данных, улучшает восприятие далеких зависимостей и увеличивает точность работы модели, особенно в случае малочисленных классов. #### Результаты Выполнены эксперименты с использованием двух открытых датасетов: TB-Dense и MATRES. Замеры показали, что **GDLLM** обеспечивает значительное улучшение качества работы, особенно в сравнении с предыдущими моделями. Она показала свою эффективность в распознавании малочисленных классов в несбалансированных датасетах и, в целом, демонстрирует лучшую общую точность. Эти результаты подтверждают то, что **GDLLM** не только расширяет границы возможностей LLMs в задачах ETRE, но и становится значительным шагом в направлении более точного и универсального понимания текстов. #### Значимость Разработанный подход имеет широкое применение в различных областях, включая медицину, финансы, юриспруденцию и другие, где распознавание временных отношений явля

Abstract

In Natural Language Processing(NLP), Event Temporal Relation Extraction (ETRE) is to recognize the temporal relations of two events. Prior studies have noted the importance of language models for ETRE. However, the restricted pre-trained knowledge of Small Language Models(SLMs) limits their capability to handle minority class relations in imbalanced classification datasets. For Large Language Models(LLMs), researchers adopt manually designed prompts or instructions, which may introduce extra noise, leading to interference with the model's judgment of the long-distance dependencies between events. To address these issues, we propose GDLLM, a Global Distance-aware modeling approach based on LLMs. We first present a distance-aware graph structure utilizing Graph Attention Network(GAT) to assist the LLMs in capturing long-distance dependency features. Additionally, we design a temporal feature learning paradigm based on soft inference to augment the identification of relations with a short-distance proximity band, which supplements the probabilistic information generated by LLMs into the multi-head attention mechanism. Since the global feature can be captured effectively, our framework substantially enhances the performance of minority relation classes and improves the overall learning ability. Experiments on two publicly available datasets, TB-Dense and MATRES, demonstrate that our approach achieves state-of-the-art (SOTA) performance.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

GDLLM: A Global Distance-aware Modeling Approach Based on Large Language Models for Event Temporal Relation Extraction

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

AR-Med: Automated Relevance Enhancement in Medical Search via LLM-Driven Informa...

Mitigating the Threshold Priming Effect in Large Language Model-Based Relevance ...

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

Towards Unification of Hallucination Detection and Fact Verification for Large L...

Навигация