Bridging Performance Gaps for Foundation Models: A Post-Training Strategy for ECGFounder
2509.12991v1
cs.LG, cs.AI, stat.AP
2025-09-18
Авторы:
Ya Zhou, Yujie Yang, Xiaohan Fan, Wei Zhao
Резюме на русском
#### Контекст
Фундаментальные модели (foundation models) получили большое применение в медицине, включая обработку электрокардиограмм (ECG). Однако, даже после пре-тренировки на больших данных и оптимизации для конкретных задач, эти модели часто сталкиваются с проблемой выполнения в сравнении с задачевоспособными моделями. Это относится и к ECGFounder, предложенной в современной работе, которая, несмотря на предварительное обучение на 7 миллионов ECG-записей, сталкивается с проблемой выполнения после подготовки к конкретным задачам. Это вызвано тем, что существующие методы пост-тренировки неэффективны для оптимизации таких моделей. Мы предлагаем новую пост-тренировочную стратегию, которая улучшает показатели ECGFounder и демонстрирует высокую эффективность в сравнении с другими подходами.
#### Метод
Мы предложили простой, но эффективный пост-тренировочный подход для улучшения ECGFounder. Архитектура основывается на использовании **stochastic depth** и **preview linear probing**. Эти методы позволяют улучшить устойчивость модели и её возможность предсказать на небольших обучающих выборках. Мы использовали данные PTB-XL для экспериментов, измеряя показатели качества, такие как AUROC и AUPRC. Метод был сравнен с текущими лучшими подходами, включая другие модели, оптимизированные для электрокардиографии.
#### Результаты
Наши эксперименты показали, что пост-тренировка с помощью нашего подхода улучшает базовый показатель AUROC на 1.2%-3.3% и AUPRC на 5.3%-20.9% по сравнению с текущими лучшими подходами. Этот подход также демонстрирует более высокую устойчивость и эффективность в обучении на небольших выборках, улучшая результаты на 9,1% в AUROC и 34,9% в AUPRC при использовании только 10% обучающих данных. Мы также проверили эффективность отдельных компонентов, таких как stochastic depth и preview linear probing, которые способствуют улучшению модели.
#### Значимость
Наш подход имеет широкое применение для улучшения фундаментальных моделей в области обработки ECG, решая проблему производительности после подготовки к задаче. Он демонстрирует высокую эффективность в сравнении с другими подходами и может быть применен для улучшения других моделей в медицинских задачах. Этот подход может повысить уровень доступности и точности обработки ECG в клинической практике.
#### Выводы
Мы показали, что наша пост-тренировочная стратегия эффективно улучшает производительность ECGFounder и превосходит другие подходы в области обработки ECG. Наши результаты открывают путь для дальнейшего исследования пост-тренировочных методов для фундаментальных моделей, которые могут повысить уровень доступности и точности обработки данных в медицине. Мы планируем провести допо
Abstract
ECG foundation models are increasingly popular due to their adaptability
across various tasks. However, their clinical applicability is often limited by
performance gaps compared to task-specific models, even after pre-training on
large ECG datasets and fine-tuning on target data. This limitation is likely
due to the lack of an effective post-training strategy. In this paper, we
propose a simple yet effective post-training approach to enhance ECGFounder, a
state-of-the-art ECG foundation model pre-trained on over 7 million ECG
recordings. Experiments on the PTB-XL benchmark show that our approach improves
the baseline fine-tuning strategy by 1.2%-3.3% in macro AUROC and 5.3%-20.9% in
macro AUPRC. Additionally, our method outperforms several recent
state-of-the-art approaches, including task-specific and advanced
architectures. Further evaluation reveals that our method is more stable and
sample-efficient compared to the baseline, achieving a 9.1% improvement in
macro AUROC and a 34.9% improvement in macro AUPRC using just 10% of the
training data. Ablation studies identify key components, such as stochastic
depth and preview linear probing, that contribute to the enhanced performance.
These findings underscore the potential of post-training strategies to improve
ECG foundation models, and we hope this work will contribute to the continued
development of foundation models in the ECG domain.
Ссылки и действия
Дополнительные ресурсы: