Preserving Domain Generalization in Fine-Tuning via Joint Parameter Selection
2508.16976v1
cs.CV, cs.LG
2025-08-27
Авторы:
Bin Pan, Shiyu Shen, Zongbin Wang, Zhenwei Shi, Xia Xu
Резюме на русском
## Контекст
Domain generalization является задачей развития моделей, которые могут обучаться на ограниченном количестве исходных доменов и эффективно обобщаться на неизвестных целевых доменах. Однако существующие подходы часто используют большие предварительно обученные модели в качестве инициализации, но эти модели могут лишаться их универсальных способностей во время полной оптимизации. Это снижает их общую жизнеспособность и способность обобщаться. Задача статьи — разработать метод, который способен поддерживать общую способность модели, оптимизируя только часть её параметров. Это позволит сохранить ценность предварительной модели, сделав модели более устойчивыми и гибкими для различных задач.
## Метод
Метод, предложенный в статье, называется Joint Parameter Selection (JPS). Он стремится ограничить обновление параметров только самыми важными, спарсими, но в то же время эффективными. Решение включает два оператора: один для выбора параметров, способных принести самое большое влияние и сохранить универсальные свойства, а другой — для регулирования этих параметров. Архитектура является универсальной и может быть сочетана с различными предварительно обученными моделями. Теоретический анализ показывает, что этот подход гарантирует уменьшение обобщающей ошибки, если учитывать только самые важные параметры. Это позволяет установить теоретическую основу для JPS, оправдывающую его эффективность.
## Результаты
Разработанные эксперименты проводились на различных бенчмарках в области данных изображений, где использовались предварительно обученные модели. Метод JPS был сравнен с текущими стандартами в области domain generalization. Результаты показали, что JPS не только повышает предсказательную точность, но и сохраняет генеральную способность модели. Этот подход показал лучшие результаты в сравнении с современными методами, установив новый стандарт для области domain generalization. Это подтверждает то, что JPS эффективно обеспечивает сбалансированное уменьшение ошибки и сохранение универсальных возможностей модели.
## Значимость
Предложенный подход может применяться в области обработки изображений, машинного обучения, где требуется поддержать универсальность моделей в разных задачах, включая медицину, автоматизированные системы и многие другие. Он позволяет улучшить качество моделей в целом, сохраняя их универсальные способности. Это значительно увеличивает их применимость в различных сферах. За счет того, что JPS ограничивает обновление, он экономит ресурсы и улучшает общую эффективность машинного обучения.
## Выводы
В статье был представлен новый подход к domain generalization, который
Abstract
Domain generalization seeks to develop models trained on a limited set of
source domains that are capable of generalizing effectively to unseen target
domains. While the predominant approach leverages large-scale pre-trained
vision models as initialization, recent studies have highlighted that full
fine-tuning can compromise the intrinsic generalization capabilities of these
models. To address this limitation, parameter-efficient adaptation strategies
have emerged, wherein only a subset of model parameters is selectively
fine-tuned, thereby balancing task adaptation with the preservation of
generalization. Motivated by this paradigm, we introduce Joint Parameter
Selection (JPS), a novel method that restricts updates to a small, sparse
subset of parameters, thereby retaining and harnessing the generalization
strength of pre-trained models. Theoretically, we establish a generalization
error bound that explicitly accounts for the sparsity of parameter updates,
thereby providing a principled justification for selective fine-tuning.
Practically, we design a selection mechanism employing dual operators to
identify and update parameters exhibiting consistent and significant gradients
across all source domains. Extensive benchmark experiments demonstrate that JPS
achieves superior performance compared to state-of-the-art domain
generalization methods, substantiating both the efficiency and efficacy of the
proposed approach.
Ссылки и действия
Дополнительные ресурсы: