RanAT4BIE: Random Adversarial Training for Biomedical Information Extraction

2509.11191v1 cs.CL, cs.IR 2025-09-17

Авторы:

Jian Chen, Shengyi Lv, Leilei Su

Резюме на русском

## Контекст Биомедицинская информационная обработка (BioIE) является ключевым разделом в области прикладной науки и искусственного интеллекта, нацеленным на извлечение полезной информации из биомедицинских текстов. Одним из основных задач в BioIE является классификация медицинских сущностей, таких как лекарственные средства, болезни и лечебные процедуры. Несмотря на то, что в последние годы были достигнуты существенные улучшения в этой области с помощью предварительно обученных языковых моделей (PLMs), таких как PubMedBERT, эти модели часто сталкиваются с проблемами, такими как нехватка гибкости и высокая зависимость от больших объемов данных для обучения. Беспокоят также высокие затраты на вычислительные ресурсы, которые необходимы для обучения и использования этих моделей. Ранее применение методов адверсарного обучения (adversarial training, AT) в BioIE показало улучшение производительности, однако они также приводят к дополнительным затратам на вычислительные ресурсы. Данное исследование ориентируется на создание эффективного метода, который сочетает гибкость и эффективность обучения, уменьшая в то же время требования к вычислительным ресурсам. ## Метод Разработанная методология, названная **Random Adversarial Training (RAT)**, представляет собой усовершенствованный подход к адверсарному обучению. Основная идея заключается в использовании стратегии случайного выбора данных для создания адверсарных примеров, чтобы улучшить гибкость и устойчивость модели. Это отличается от традиционных методов, где адверсарные примеры генерируются статично или во всем масштабе данных. Метод RAT позволяет уменьшить вычислительные затраты, поскольку только выбранные случайно примеры учавствуют в адверсарном обучении. Для реализации этого подхода, авторы используют предварительно обученную языковую модель PubMedBERT, добавляя дополнительные слои для адаптации к задаче. Архитектура RAT включает в себя следующие шаги: 1) случайный выбор данных для адверсарных примеров, 2) формирование адверсарного примера с помощью метода градиентного подрыва (gradient-based perturbation), 3) обновление весов модели на основе исходного примера и адверсарного примера. Это улучшение способствует более эффективному использованию ресурсов и повышению производительности на задачах BioIE. ## Результаты Для оценки эффективности RAT, авторы проводили подробное сравнение с традиционными методами адверсарного обучения, а также с другими современными предварительно обученными языковыми моделями, такими как BioBERT и ClinicalBERT. Использовались данные из больших биомедицинских коллекций, таких как PubMed. Результаты показали, что RAT не только пре

Abstract

We introduce random adversarial training (RAT), a novel framework successfully applied to biomedical information extraction (BioIE) tasks. Building on PubMedBERT as the foundational architecture, our study first validates the effectiveness of conventional adversarial training in enhancing pre-trained language models' performance on BioIE tasks. While adversarial training yields significant improvements across various performance metrics, it also introduces considerable computational overhead. To address this limitation, we propose RAT as an efficiency solution for biomedical information extraction. This framework strategically integrates random sampling mechanisms with adversarial training principles, achieving dual objectives: enhanced model generalization and robustness while significantly reducing computational costs. Through comprehensive evaluations, RAT demonstrates superior performance compared to baseline models in BioIE tasks. The results highlight RAT's potential as a transformative framework for biomedical natural language processing, offering a balanced solution to the model performance and computational efficiency.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

RanAT4BIE: Random Adversarial Training for Biomedical Information Extraction

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

AR-Med: Automated Relevance Enhancement in Medical Search via LLM-Driven Informa...

Mitigating the Threshold Priming Effect in Large Language Model-Based Relevance ...

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

Towards Unification of Hallucination Detection and Fact Verification for Large L...

Навигация