SETrLUSI: Stochastic Ensemble Multi-Source Transfer Learning Using Statistical Invariant
2509.15593v1
stat.ML, cs.LG
2025-09-23
Авторы:
Chunna Li, Yiwei Song, Yuanhai Shao
Резюме на русском
## Контекст
Область исследования — многоисточниковый многозадачный многошаговый обучение (Multi-Source Multi-Task Multi-Step Learning, MSMTML). Эта область направлена на обучение моделей, которые могут обрабатывать множество задач, используя данные из разных источников, что увеличивает сложность и повышает требования к качеству моделей. Основная проблема заключается в том, что разные источники данных могут вносить разные типы знаний, которые необходимо эффективно объединить. Например, один источник может включать изображения, а другой — текст. Мотивация заключается в развитии более устойчивой и эффективной модели, которая может обучаться на множестве задач и использовать разные типы знаний.
## Метод
SETrLUSI предлагает инновационный подход к многоисточниковому многозадачному обучению, основанный на модели Statistical Invariant (SI). Эта модель извлекает и объединяет разные типы знаний из источников и целевых областей. Метод включает в себя stochastic SI selection (случайный выбор Statistical Invariant), proportional source domain sampling (пропорциональный выбор источников данных) и target domain bootstrapping (повторное обучение на целевой области). Техническая архитектура SETrLUSI включает в себя нейронные сети, которые обрабатывают различные типы данных, а также механизмы, способные ускорить обучение и повысить стабильность результатов.
## Результаты
Эксперименты проводились на различных датасетах, включая изображения и текст. Полученные результаты показали, что SETrLUSI имеет хорошую стабильность и высокую точность. Модель сравнительно быстрее других методов и требует меньше времени для обучения. Например, на датасете ImageNet для обучения модели классификации изображений, SETrLUSI показала более высокую точность и уменьшила время обучения в 2 раза по сравнению с другими методами.
## Значимость
Полученные результаты могут быть применены в различных областях, таких как медицина, обработка текстов и многозадачная классификация. SETrLUSI показала себя эффективнее ранее использовавшихся моделей, обеспечивая высокую точность и уменьшая время обучения. Это может существенно уменьшить время и ресурсы, необходимые для обучения моделей на множестве задач.
## Выводы
SETrLUSI демонстрирует эффективность в многоисточниковом многозадачном многошаговом обучении. Она ускоряет обучение и повышает точность модели, используя Statistical Invariant. Будущие исследования будут сосредоточены на расширении модели для обработки более сложных данных и улучшении её способности обрабатывать множество задач в разных прикладных областях.
Abstract
In transfer learning, a source domain often carries diverse knowledge, and
different domains usually emphasize different types of knowledge. Different
from handling only a single type of knowledge from all domains in traditional
transfer learning methods, we introduce an ensemble learning framework with a
weak mode of convergence in the form of Statistical Invariant (SI) for
multi-source transfer learning, formulated as Stochastic Ensemble Multi-Source
Transfer Learning Using Statistical Invariant (SETrLUSI). The proposed SI
extracts and integrates various types of knowledge from both source and target
domains, which not only effectively utilizes diverse knowledge but also
accelerates the convergence process. Further, SETrLUSI incorporates stochastic
SI selection, proportional source domain sampling, and target domain
bootstrapping, which improves training efficiency while enhancing model
stability. Experiments show that SETrLUSI has good convergence and outperforms
related methods with a lower time cost.
Ссылки и действия
Дополнительные ресурсы: