Hierarchical Adaptive networks with Task vectors for Test-Time Adaptation
2508.09223v1
cs.LG, cs.AI
2025-08-15
Авторы:
Sameer Ambekar, Daniel M. Lang, Julia A. Schnabel
Резюме на русском
## Контекст
Проблема тест-тайм адаптации заключается в том, что наиболее распространенные методы недостаточно эффективны при работе с разнообразными и сложными переходами доменов. Они оперируют одномерными линейными слоями, которые не могут полностью учесть все сложности в тест-тайм адаптации. Недостаточность этих методов влечет за собой ухудшение производительности моделей в нестандартных условиях. Мы предлагаем новую архитектуру, **Hierarchical Adaptive Networks with Task Vectors (Hi-Vec)**, которая использует несколько слоев различных размеров для динамической тест-тайм адаптации. Эта архитектура позволяет декомпозировать пространство представлений как в размерность, так и в сложность, чтобы повысить способность модели адаптироваться к разнообразным сценариям. Мы стремимся решить проблему недостаточности текущих методов по адаптации к изменениям доменов, обеспечивая гибкость и надежность в подборе слоев для адаптации при тесте.
## Метод
**Hi-Vec** предлагает новую структуру, которая включает в себя несколько слоев, организованных в иерархический порядок, для более тонкой адаптации во время теста. Эти слои работают в динамическом режиме, при этом выбирается оптимальный слой для каждой конкретной батч-батче. Метод также использует **механизм динамического объединения весов**, который позволяет объединить веса из выбранного слоя с другими слоями, чтобы обеспечить постоянную синхронизацию целевой информации. Для того, чтобы избежать неточностей в адаптации, мы вводим **гейтинговую функцию**, которая определяет, насколько батч является шумным. Это позволяет избежать нежелательного применения адаптации на некорректных данных. Таким образом, Hi-Vec предлагает сложную, но эффективную методологию, которая динамически реагирует на разнообразие тестовых данных.
## Результаты
Мы провели эксперименты, используя разнообразные данные, включая сценарии с высокой степенью перехода доменов и сложных шумовых условий. Модель Hi-Vec показала значительное повышение точности и улучшение способности адаптироваться к изменениям доменов в сравнении с базовыми методами. Мы протестировали Hi-Vec на нескольких целевых датасетов и показали, что она обеспечивает улучшение в метриках производительности, редкости и восприятия шума. Наши результаты доказали, что Hi-Vec может обрабатывать высокую степень изменения доменов, обеспечивая лучший результат в сегментации, классификации и других задачах, где требуется жесткая адаптация к изменениям в данных.
## Значимость
Мы видим применение Hi-Vec во многих областях, где необходима гибкая адаптация моделей во время теста, например, в медицине, г
Abstract
Test-time adaptation allows pretrained models to adjust to incoming data
streams, addressing distribution shifts between source and target domains.
However, standard methods rely on single-dimensional linear classification
layers, which often fail to handle diverse and complex shifts. We propose
Hierarchical Adaptive Networks with Task Vectors (Hi-Vec), which leverages
multiple layers of increasing size for dynamic test-time adaptation. By
decomposing the encoder's representation space into such hierarchically
organized layers, Hi-Vec, in a plug-and-play manner, allows existing methods to
adapt to shifts of varying complexity. Our contributions are threefold: First,
we propose dynamic layer selection for automatic identification of the optimal
layer for adaptation to each test batch. Second, we propose a mechanism that
merges weights from the dynamic layer to other layers, ensuring all layers
receive target information. Third, we propose linear layer agreement that acts
as a gating function, preventing erroneous fine-tuning by adaptation on noisy
batches. We rigorously evaluate the performance of Hi-Vec in challenging
scenarios and on multiple target datasets, proving its strong capability to
advance state-of-the-art methods. Our results show that Hi-Vec improves
robustness, addresses uncertainty, and handles limited batch sizes and
increased outlier rates.
Ссылки и действия
Дополнительные ресурсы: