SETrLUSI: Stochastic Ensemble Multi-Source Transfer Learning Using Statistical Invariant

2509.15593v1 stat.ML, cs.LG 2025-09-23

Авторы:

Chunna Li, Yiwei Song, Yuanhai Shao

Резюме на русском

## Контекст Область исследования — многоисточниковый многозадачный многошаговый обучение (Multi-Source Multi-Task Multi-Step Learning, MSMTML). Эта область направлена на обучение моделей, которые могут обрабатывать множество задач, используя данные из разных источников, что увеличивает сложность и повышает требования к качеству моделей. Основная проблема заключается в том, что разные источники данных могут вносить разные типы знаний, которые необходимо эффективно объединить. Например, один источник может включать изображения, а другой — текст. Мотивация заключается в развитии более устойчивой и эффективной модели, которая может обучаться на множестве задач и использовать разные типы знаний. ## Метод SETrLUSI предлагает инновационный подход к многоисточниковому многозадачному обучению, основанный на модели Statistical Invariant (SI). Эта модель извлекает и объединяет разные типы знаний из источников и целевых областей. Метод включает в себя stochastic SI selection (случайный выбор Statistical Invariant), proportional source domain sampling (пропорциональный выбор источников данных) и target domain bootstrapping (повторное обучение на целевой области). Техническая архитектура SETrLUSI включает в себя нейронные сети, которые обрабатывают различные типы данных, а также механизмы, способные ускорить обучение и повысить стабильность результатов. ## Результаты Эксперименты проводились на различных датасетах, включая изображения и текст. Полученные результаты показали, что SETrLUSI имеет хорошую стабильность и высокую точность. Модель сравнительно быстрее других методов и требует меньше времени для обучения. Например, на датасете ImageNet для обучения модели классификации изображений, SETrLUSI показала более высокую точность и уменьшила время обучения в 2 раза по сравнению с другими методами. ## Значимость Полученные результаты могут быть применены в различных областях, таких как медицина, обработка текстов и многозадачная классификация. SETrLUSI показала себя эффективнее ранее использовавшихся моделей, обеспечивая высокую точность и уменьшая время обучения. Это может существенно уменьшить время и ресурсы, необходимые для обучения моделей на множестве задач. ## Выводы SETrLUSI демонстрирует эффективность в многоисточниковом многозадачном многошаговом обучении. Она ускоряет обучение и повышает точность модели, используя Statistical Invariant. Будущие исследования будут сосредоточены на расширении модели для обработки более сложных данных и улучшении её способности обрабатывать множество задач в разных прикладных областях.

Abstract

In transfer learning, a source domain often carries diverse knowledge, and different domains usually emphasize different types of knowledge. Different from handling only a single type of knowledge from all domains in traditional transfer learning methods, we introduce an ensemble learning framework with a weak mode of convergence in the form of Statistical Invariant (SI) for multi-source transfer learning, formulated as Stochastic Ensemble Multi-Source Transfer Learning Using Statistical Invariant (SETrLUSI). The proposed SI extracts and integrates various types of knowledge from both source and target domains, which not only effectively utilizes diverse knowledge but also accelerates the convergence process. Further, SETrLUSI incorporates stochastic SI selection, proportional source domain sampling, and target domain bootstrapping, which improves training efficiency while enhancing model stability. Experiments show that SETrLUSI has good convergence and outperforms related methods with a lower time cost.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

SETrLUSI: Stochastic Ensemble Multi-Source Transfer Learning Using Statistical Invariant

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Comparison of neural network training strategies for the simulation of dynamical...

Informative missingness and its implications in semi-supervised learning

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasti...

Control Consistency Losses for Diffusion Bridges

Foundations of Diffusion Models in General State Spaces: A Self-Contained Introd...

Навигация