LoFT: Parameter-Efficient Fine-Tuning for Long-tailed Semi-Supervised Learning in Open-World Scenarios

2509.09926v1 cs.LG, cs.CV 2025-09-16

Авторы:

Jiahao Chen, Zhiyuan Huang, Yurou Liu, Bing Su

Резюме на русском

#### Контекст Long-tailed learning широко применяется в реальных сценариях, где выборки выстраиваются в имперфектные распределения. Long-Tailed Semi-Supervised Learning (LTSSL) позволяет повысить эффективность обучения за счет использования большого объема необъективных данных. Однако, существующие методы обучения LTSSL часто обучаются с нуля, что приводит к проблемам, таким как оверфиттинг и недостоверные псевдометки. В этом контексте возникает потребность в методах, которые могут повысить качество обучения, особенно в условиях неоднородных данных. #### Метод Мы предлагаем LoFT (Long-Tailed Fine-Tuning), расширяющий LTSSL в парадигму переноса базовых моделей. Наш алгоритм основывается на фине-тюнинге предобученных моделей с помощью параметр-эффективных методов. Мы используем прототипы и адаптируемные методы, чтобы улучшить генерацию псевдометок и уменьшить ошибки в имперфектных распределениях. Для улучшения устойчивости в пространстве данных, мы предложили LoFT-OW (Long-Tailed Fine-Tuning under Open-World), который решает проблему выявления выходных данных из распределения. #### Результаты Мы проводим эксперименты на нескольких задачах, включая CIFAR-10-LT и ImageNet-LT. Мы сравниваем наш метод с тремя основными подходами LTSSL. Используя только 1% от необъективных данных, LoFT показывает значительное улучшение в производительности по сравнению с предыдущими подходами. Особенно выдающимися результатами LoFT показывает при открытом мире сценариях, где OOD-данные присутствуют в обучающей выборке. #### Значимость Метод LoFT широко применим в сценариях, где данные имеют неоднородные распределения и существует необходимость в улучшении качества обучения. Он позволяет увеличить устойчивость моделей к искажениям и улучшить их применение в реальном мире. Благодаря параметр-эффективному применению, LoFT экономит ресурсы и показывает высокую эффективность, даже в условиях недостатка данных. #### Выводы Мы представили LoFT, новый подход к LTSSL, который способен улучшить точность и устойчивость моделей в условиях необъективных данных. Наши результаты показывают, что LoFT превосходит предшествующие методы в обучении на небольших объемах данных. В будущем, мы планируем расширить LoFT для работы с более сложными распределениями и объективными данными.

Abstract

Long-tailed learning has garnered increasing attention due to its wide applicability in real-world scenarios. Among existing approaches, Long-Tailed Semi-Supervised Learning (LTSSL) has emerged as an effective solution by incorporating a large amount of unlabeled data into the imbalanced labeled dataset. However, most prior LTSSL methods are designed to train models from scratch, which often leads to issues such as overconfidence and low-quality pseudo-labels. To address these challenges, we extend LTSSL into the foundation model fine-tuning paradigm and propose a novel framework: LoFT (Long-tailed semi-supervised learning via parameter-efficient Fine-Tuning). We demonstrate that fine-tuned foundation models can generate more reliable pseudolabels, thereby benefiting imbalanced learning. Furthermore, we explore a more practical setting by investigating semi-supervised learning under open-world conditions, where the unlabeled data may include out-of-distribution (OOD) samples. To handle this problem, we propose LoFT-OW (LoFT under Open-World scenarios) to improve the discriminative ability. Experimental results on multiple benchmarks demonstrate that our method achieves superior performance compared to previous approaches, even when utilizing only 1\% of the unlabeled data compared with previous works.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

LoFT: Parameter-Efficient Fine-Tuning for Long-tailed Semi-Supervised Learning in Open-World Scenarios

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Studying Various Activation Functions and Non-IID Data for Machine Learning Mode...

Feature Engineering vs. Deep Learning for Automated Coin Grading: A Comparative ...

Rethinking Decoupled Knowledge Distillation: A Predictive Distribution Perspecti...

Value Gradient Guidance for Flow Matching Alignment

Efficient Training of Diffusion Mixture-of-Experts Models: A Practical Recipe

Навигация