Bridging Performance Gaps for Foundation Models: A Post-Training Strategy for ECGFounder

2509.12991v1 cs.LG, cs.AI, stat.AP 2025-09-18
Авторы:

Ya Zhou, Yujie Yang, Xiaohan Fan, Wei Zhao

Резюме на русском

#### Контекст Фундаментальные модели (foundation models) получили большое применение в медицине, включая обработку электрокардиограмм (ECG). Однако, даже после пре-тренировки на больших данных и оптимизации для конкретных задач, эти модели часто сталкиваются с проблемой выполнения в сравнении с задачевоспособными моделями. Это относится и к ECGFounder, предложенной в современной работе, которая, несмотря на предварительное обучение на 7 миллионов ECG-записей, сталкивается с проблемой выполнения после подготовки к конкретным задачам. Это вызвано тем, что существующие методы пост-тренировки неэффективны для оптимизации таких моделей. Мы предлагаем новую пост-тренировочную стратегию, которая улучшает показатели ECGFounder и демонстрирует высокую эффективность в сравнении с другими подходами. #### Метод Мы предложили простой, но эффективный пост-тренировочный подход для улучшения ECGFounder. Архитектура основывается на использовании **stochastic depth** и **preview linear probing**. Эти методы позволяют улучшить устойчивость модели и её возможность предсказать на небольших обучающих выборках. Мы использовали данные PTB-XL для экспериментов, измеряя показатели качества, такие как AUROC и AUPRC. Метод был сравнен с текущими лучшими подходами, включая другие модели, оптимизированные для электрокардиографии. #### Результаты Наши эксперименты показали, что пост-тренировка с помощью нашего подхода улучшает базовый показатель AUROC на 1.2%-3.3% и AUPRC на 5.3%-20.9% по сравнению с текущими лучшими подходами. Этот подход также демонстрирует более высокую устойчивость и эффективность в обучении на небольших выборках, улучшая результаты на 9,1% в AUROC и 34,9% в AUPRC при использовании только 10% обучающих данных. Мы также проверили эффективность отдельных компонентов, таких как stochastic depth и preview linear probing, которые способствуют улучшению модели. #### Значимость Наш подход имеет широкое применение для улучшения фундаментальных моделей в области обработки ECG, решая проблему производительности после подготовки к задаче. Он демонстрирует высокую эффективность в сравнении с другими подходами и может быть применен для улучшения других моделей в медицинских задачах. Этот подход может повысить уровень доступности и точности обработки ECG в клинической практике. #### Выводы Мы показали, что наша пост-тренировочная стратегия эффективно улучшает производительность ECGFounder и превосходит другие подходы в области обработки ECG. Наши результаты открывают путь для дальнейшего исследования пост-тренировочных методов для фундаментальных моделей, которые могут повысить уровень доступности и точности обработки данных в медицине. Мы планируем провести допо

Abstract

ECG foundation models are increasingly popular due to their adaptability across various tasks. However, their clinical applicability is often limited by performance gaps compared to task-specific models, even after pre-training on large ECG datasets and fine-tuning on target data. This limitation is likely due to the lack of an effective post-training strategy. In this paper, we propose a simple yet effective post-training approach to enhance ECGFounder, a state-of-the-art ECG foundation model pre-trained on over 7 million ECG recordings. Experiments on the PTB-XL benchmark show that our approach improves the baseline fine-tuning strategy by 1.2%-3.3% in macro AUROC and 5.3%-20.9% in macro AUPRC. Additionally, our method outperforms several recent state-of-the-art approaches, including task-specific and advanced architectures. Further evaluation reveals that our method is more stable and sample-efficient compared to the baseline, achieving a 9.1% improvement in macro AUROC and a 34.9% improvement in macro AUPRC using just 10% of the training data. Ablation studies identify key components, such as stochastic depth and preview linear probing, that contribute to the enhanced performance. These findings underscore the potential of post-training strategies to improve ECG foundation models, and we hope this work will contribute to the continued development of foundation models in the ECG domain.

Ссылки и действия

Связанные статьи

A Realistic Evaluation of Cross-Frequency Transfer Learning and Foundation Forec...

## Контекст Cross-frequency transfer learning (CFTL) является популярной стратегией для создания больших наборов данных ...

2025-09-26