Predictive Coding-based Deep Neural Network Fine-tuning for Computationally Efficient Domain Adaptation
2509.20269v2
cs.LG, cs.CV, cs.NE
2025-09-26
Авторы:
Matteo Cardoni, Sam Leroux
Резюме на русском
#### Контекст
Во внедрении глубоких нейронных сетей в реальные динамические среды возникают проблемы стабильности вывода. Изменения дистрибуции входных данных, возникающие из-за дрейфа сенсоров или изменений освещения, требуют универсальных решений для адаптации моделей. На данный момент, многие подходы склоняются либо к точному, но вычислительно тяжелому обучению (Backpropagation), либо к эффективному, но недостаточно точному обучению (Predictive Coding). Наша исследовательская цель заключается в создании метода, который объединит эти подходы в одном гибридном решении.
#### Метод
Мы предлагаем метод, основанный на использовании глубоких нейронных сетей, обученных с помощью Backpropagation в оффлайн-режиме для получения базового представления. Далее, используется Predictive Coding для онлайн-адаптации. Метод основывается на представлении динамических изменений в данных в виде как локальных, так и глобальных корреляций. Он выполняется в два этапа: в первом этапе, модель обучается с Backpropagation для оптимизации представлений. Затем, Predictive Coding применяется для адаптации модели во время работы, используя небольшие обучающие выборки. Этот подход использует активные вычислительные ресурсы только для тех слоев, которые требуют адаптации, что эффективно экономит ресурсы.
#### Результаты
Мы проверили нашу модель на двух наборах данных: MNIST и CIFAR-10. Мы использовали видеоданные для проверки на живых условиях. По сравнению с моделями, обученными только с помощью Backpropagation, наш подход показал значительное увеличение точности при одновременной эффективности вычислений. Мы также проверили нашу модель на вычислительной эффективности, и она демонстрировала существенно меньший потребление ресурсов. Это подтверждает ее подходящую для реальных условий, где модели должны быть высокоточными и ресурсо-эффективными.
#### Значимость
Модель может быть применена в таких областях, как робототехника, смарт-города, интеллектуальные транспортные системы, где ресурсы для обучения ограничены. Она также может быть использована в глубоком обучении на будущих устройствах с низким энергопотреблением. Наши результаты указывают на возможность создания моделей, которые могут быть постоянно адаптированы в реальном времени, что значительно повышает их ценность в динамичных средах.
#### Выводы
Мы доказали, что наш метод оптимален для регулярного обновления нейронных сетей в реальных условиях. В будущем, мы планируем провести эксперименты на более сложных наборах данных и расширить исследования, чтобы понять, как этот подход может быть применен к более широким данным и наборам задач. Наш подход может стать кл
Abstract
As deep neural networks are increasingly deployed in dynamic, real-world
environments, relying on a single static model is often insufficient. Changes
in input data distributions caused by sensor drift or lighting variations
necessitate continual model adaptation. In this paper, we propose a hybrid
training methodology that enables efficient on-device domain adaptation by
combining the strengths of Backpropagation and Predictive Coding. The method
begins with a deep neural network trained offline using Backpropagation to
achieve high initial performance. Subsequently, Predictive Coding is employed
for online adaptation, allowing the model to recover accuracy lost due to
shifts in the input data distribution. This approach leverages the robustness
of Backpropagation for initial representation learning and the computational
efficiency of Predictive Coding for continual learning, making it particularly
well-suited for resource-constrained edge devices or future neuromorphic
accelerators. Experimental results on the MNIST and CIFAR-10 datasets
demonstrate that this hybrid strategy enables effective adaptation with a
reduced computational overhead, offering a promising solution for maintaining
model performance in dynamic environments.
Ссылки и действия
Дополнительные ресурсы: