GDLLM: A Global Distance-aware Modeling Approach Based on Large Language Models for Event Temporal Relation Extraction
2508.20828v1
cs.CL, cs.IR
2025-08-30
Авторы:
Jie Zhao, Wanting Ning, Yuxiao Fei, Yubo Feng, Lishuang Li
Резюме на русском
#### Контекст
Научное исследование ориентируется на область естественного языкового процессинга (NLP), а точнее, на задачу извлечения временных отношений событий (Event Temporal Relation Extraction, ETRE). Это задача, направленная на определение взаимосвязей между событиями в тексте, такими как предшествование, совпадение или последовалое следование. Несмотря на то, что языковые модели (LLMs) доказали свою эффективность в этой области, они сталкиваются с рядом проблем. Малые языковые модели (SLMs) страдают от ограниченного предварительно обученного знания, что приводит к неэффективности в работе с малочисленными классами в несбалансированных датасетах. Для LLMs применяются ручно сконструированные как стимулы (prompts), что может привести к лишней шумности и помехам в выводе модели, особенно при работе с зависимостями между событиями на больших расстояниях. Эти ограничения вдохновили разработку **GDLLM** — нового подхода, основанного на LLMs, который не только учитывает глобальные зависимости, но и повышает точность в работе с небольшими классами классификации.
#### Метод
Методология **GDLLM** основывается на двух ключевых компонентах. Во-первых, предлагается дистанционно-отзывчивая графовая структура, построенная на основе Graph Attention Network (GAT), которая позволяет языковой модели лучше учитывать зависимости на больших расстояниях. Во-вторых, введена парадигма обучения функций времени (temporal feature learning paradigm), основанная на мягком инференсе (soft inference). Она способствует лучшему распознаванию отношений событий, имеющих близкое расстояние, и интегрирует мощь пробабольных выводов LLMs в механизм множественного внимания (multi-head attention). Объединение этих компонентов обеспечивает эффективную обработку данных, улучшает восприятие далеких зависимостей и увеличивает точность работы модели, особенно в случае малочисленных классов.
#### Результаты
Выполнены эксперименты с использованием двух открытых датасетов: TB-Dense и MATRES. Замеры показали, что **GDLLM** обеспечивает значительное улучшение качества работы, особенно в сравнении с предыдущими моделями. Она показала свою эффективность в распознавании малочисленных классов в несбалансированных датасетах и, в целом, демонстрирует лучшую общую точность. Эти результаты подтверждают то, что **GDLLM** не только расширяет границы возможностей LLMs в задачах ETRE, но и становится значительным шагом в направлении более точного и универсального понимания текстов.
#### Значимость
Разработанный подход имеет широкое применение в различных областях, включая медицину, финансы, юриспруденцию и другие, где распознавание временных отношений явля
Abstract
In Natural Language Processing(NLP), Event Temporal Relation Extraction
(ETRE) is to recognize the temporal relations of two events. Prior studies have
noted the importance of language models for ETRE. However, the restricted
pre-trained knowledge of Small Language Models(SLMs) limits their capability to
handle minority class relations in imbalanced classification datasets. For
Large Language Models(LLMs), researchers adopt manually designed prompts or
instructions, which may introduce extra noise, leading to interference with the
model's judgment of the long-distance dependencies between events. To address
these issues, we propose GDLLM, a Global Distance-aware modeling approach based
on LLMs. We first present a distance-aware graph structure utilizing Graph
Attention Network(GAT) to assist the LLMs in capturing long-distance dependency
features. Additionally, we design a temporal feature learning paradigm based on
soft inference to augment the identification of relations with a short-distance
proximity band, which supplements the probabilistic information generated by
LLMs into the multi-head attention mechanism. Since the global feature can be
captured effectively, our framework substantially enhances the performance of
minority relation classes and improves the overall learning ability.
Experiments on two publicly available datasets, TB-Dense and MATRES,
demonstrate that our approach achieves state-of-the-art (SOTA) performance.
Ссылки и действия
Дополнительные ресурсы: