Hierarchical Adaptive networks with Task vectors for Test-Time Adaptation

2508.09223v1 cs.LG, cs.AI 2025-08-15
Авторы:

Sameer Ambekar, Daniel M. Lang, Julia A. Schnabel

Резюме на русском

## Контекст Проблема тест-тайм адаптации заключается в том, что наиболее распространенные методы недостаточно эффективны при работе с разнообразными и сложными переходами доменов. Они оперируют одномерными линейными слоями, которые не могут полностью учесть все сложности в тест-тайм адаптации. Недостаточность этих методов влечет за собой ухудшение производительности моделей в нестандартных условиях. Мы предлагаем новую архитектуру, **Hierarchical Adaptive Networks with Task Vectors (Hi-Vec)**, которая использует несколько слоев различных размеров для динамической тест-тайм адаптации. Эта архитектура позволяет декомпозировать пространство представлений как в размерность, так и в сложность, чтобы повысить способность модели адаптироваться к разнообразным сценариям. Мы стремимся решить проблему недостаточности текущих методов по адаптации к изменениям доменов, обеспечивая гибкость и надежность в подборе слоев для адаптации при тесте. ## Метод **Hi-Vec** предлагает новую структуру, которая включает в себя несколько слоев, организованных в иерархический порядок, для более тонкой адаптации во время теста. Эти слои работают в динамическом режиме, при этом выбирается оптимальный слой для каждой конкретной батч-батче. Метод также использует **механизм динамического объединения весов**, который позволяет объединить веса из выбранного слоя с другими слоями, чтобы обеспечить постоянную синхронизацию целевой информации. Для того, чтобы избежать неточностей в адаптации, мы вводим **гейтинговую функцию**, которая определяет, насколько батч является шумным. Это позволяет избежать нежелательного применения адаптации на некорректных данных. Таким образом, Hi-Vec предлагает сложную, но эффективную методологию, которая динамически реагирует на разнообразие тестовых данных. ## Результаты Мы провели эксперименты, используя разнообразные данные, включая сценарии с высокой степенью перехода доменов и сложных шумовых условий. Модель Hi-Vec показала значительное повышение точности и улучшение способности адаптироваться к изменениям доменов в сравнении с базовыми методами. Мы протестировали Hi-Vec на нескольких целевых датасетов и показали, что она обеспечивает улучшение в метриках производительности, редкости и восприятия шума. Наши результаты доказали, что Hi-Vec может обрабатывать высокую степень изменения доменов, обеспечивая лучший результат в сегментации, классификации и других задачах, где требуется жесткая адаптация к изменениям в данных. ## Значимость Мы видим применение Hi-Vec во многих областях, где необходима гибкая адаптация моделей во время теста, например, в медицине, г

Abstract

Test-time adaptation allows pretrained models to adjust to incoming data streams, addressing distribution shifts between source and target domains. However, standard methods rely on single-dimensional linear classification layers, which often fail to handle diverse and complex shifts. We propose Hierarchical Adaptive Networks with Task Vectors (Hi-Vec), which leverages multiple layers of increasing size for dynamic test-time adaptation. By decomposing the encoder's representation space into such hierarchically organized layers, Hi-Vec, in a plug-and-play manner, allows existing methods to adapt to shifts of varying complexity. Our contributions are threefold: First, we propose dynamic layer selection for automatic identification of the optimal layer for adaptation to each test batch. Second, we propose a mechanism that merges weights from the dynamic layer to other layers, ensuring all layers receive target information. Third, we propose linear layer agreement that acts as a gating function, preventing erroneous fine-tuning by adaptation on noisy batches. We rigorously evaluate the performance of Hi-Vec in challenging scenarios and on multiple target datasets, proving its strong capability to advance state-of-the-art methods. Our results show that Hi-Vec improves robustness, addresses uncertainty, and handles limited batch sizes and increased outlier rates.

Ссылки и действия