RanAT4BIE: Random Adversarial Training for Biomedical Information Extraction
2509.11191v1
cs.CL, cs.IR
2025-09-17
Авторы:
Jian Chen, Shengyi Lv, Leilei Su
Резюме на русском
## Контекст
Биомедицинская информационная обработка (BioIE) является ключевым разделом в области прикладной науки и искусственного интеллекта, нацеленным на извлечение полезной информации из биомедицинских текстов. Одним из основных задач в BioIE является классификация медицинских сущностей, таких как лекарственные средства, болезни и лечебные процедуры. Несмотря на то, что в последние годы были достигнуты существенные улучшения в этой области с помощью предварительно обученных языковых моделей (PLMs), таких как PubMedBERT, эти модели часто сталкиваются с проблемами, такими как нехватка гибкости и высокая зависимость от больших объемов данных для обучения. Беспокоят также высокие затраты на вычислительные ресурсы, которые необходимы для обучения и использования этих моделей. Ранее применение методов адверсарного обучения (adversarial training, AT) в BioIE показало улучшение производительности, однако они также приводят к дополнительным затратам на вычислительные ресурсы. Данное исследование ориентируется на создание эффективного метода, который сочетает гибкость и эффективность обучения, уменьшая в то же время требования к вычислительным ресурсам.
## Метод
Разработанная методология, названная **Random Adversarial Training (RAT)**, представляет собой усовершенствованный подход к адверсарному обучению. Основная идея заключается в использовании стратегии случайного выбора данных для создания адверсарных примеров, чтобы улучшить гибкость и устойчивость модели. Это отличается от традиционных методов, где адверсарные примеры генерируются статично или во всем масштабе данных. Метод RAT позволяет уменьшить вычислительные затраты, поскольку только выбранные случайно примеры учавствуют в адверсарном обучении. Для реализации этого подхода, авторы используют предварительно обученную языковую модель PubMedBERT, добавляя дополнительные слои для адаптации к задаче. Архитектура RAT включает в себя следующие шаги: 1) случайный выбор данных для адверсарных примеров, 2) формирование адверсарного примера с помощью метода градиентного подрыва (gradient-based perturbation), 3) обновление весов модели на основе исходного примера и адверсарного примера. Это улучшение способствует более эффективному использованию ресурсов и повышению производительности на задачах BioIE.
## Результаты
Для оценки эффективности RAT, авторы проводили подробное сравнение с традиционными методами адверсарного обучения, а также с другими современными предварительно обученными языковыми моделями, такими как BioBERT и ClinicalBERT. Использовались данные из больших биомедицинских коллекций, таких как PubMed. Результаты показали, что RAT не только пре
Abstract
We introduce random adversarial training (RAT), a novel framework
successfully applied to biomedical information extraction (BioIE) tasks.
Building on PubMedBERT as the foundational architecture, our study first
validates the effectiveness of conventional adversarial training in enhancing
pre-trained language models' performance on BioIE tasks. While adversarial
training yields significant improvements across various performance metrics, it
also introduces considerable computational overhead. To address this
limitation, we propose RAT as an efficiency solution for biomedical information
extraction. This framework strategically integrates random sampling mechanisms
with adversarial training principles, achieving dual objectives: enhanced model
generalization and robustness while significantly reducing computational costs.
Through comprehensive evaluations, RAT demonstrates superior performance
compared to baseline models in BioIE tasks. The results highlight RAT's
potential as a transformative framework for biomedical natural language
processing, offering a balanced solution to the model performance and
computational efficiency.
Ссылки и действия
Дополнительные ресурсы: