Predictive Coding-based Deep Neural Network Fine-tuning for Computationally Efficient Domain Adaptation

2509.20269v2 cs.LG, cs.CV, cs.NE 2025-09-26
Авторы:

Matteo Cardoni, Sam Leroux

Резюме на русском

#### Контекст Во внедрении глубоких нейронных сетей в реальные динамические среды возникают проблемы стабильности вывода. Изменения дистрибуции входных данных, возникающие из-за дрейфа сенсоров или изменений освещения, требуют универсальных решений для адаптации моделей. На данный момент, многие подходы склоняются либо к точному, но вычислительно тяжелому обучению (Backpropagation), либо к эффективному, но недостаточно точному обучению (Predictive Coding). Наша исследовательская цель заключается в создании метода, который объединит эти подходы в одном гибридном решении. #### Метод Мы предлагаем метод, основанный на использовании глубоких нейронных сетей, обученных с помощью Backpropagation в оффлайн-режиме для получения базового представления. Далее, используется Predictive Coding для онлайн-адаптации. Метод основывается на представлении динамических изменений в данных в виде как локальных, так и глобальных корреляций. Он выполняется в два этапа: в первом этапе, модель обучается с Backpropagation для оптимизации представлений. Затем, Predictive Coding применяется для адаптации модели во время работы, используя небольшие обучающие выборки. Этот подход использует активные вычислительные ресурсы только для тех слоев, которые требуют адаптации, что эффективно экономит ресурсы. #### Результаты Мы проверили нашу модель на двух наборах данных: MNIST и CIFAR-10. Мы использовали видеоданные для проверки на живых условиях. По сравнению с моделями, обученными только с помощью Backpropagation, наш подход показал значительное увеличение точности при одновременной эффективности вычислений. Мы также проверили нашу модель на вычислительной эффективности, и она демонстрировала существенно меньший потребление ресурсов. Это подтверждает ее подходящую для реальных условий, где модели должны быть высокоточными и ресурсо-эффективными. #### Значимость Модель может быть применена в таких областях, как робототехника, смарт-города, интеллектуальные транспортные системы, где ресурсы для обучения ограничены. Она также может быть использована в глубоком обучении на будущих устройствах с низким энергопотреблением. Наши результаты указывают на возможность создания моделей, которые могут быть постоянно адаптированы в реальном времени, что значительно повышает их ценность в динамичных средах. #### Выводы Мы доказали, что наш метод оптимален для регулярного обновления нейронных сетей в реальных условиях. В будущем, мы планируем провести эксперименты на более сложных наборах данных и расширить исследования, чтобы понять, как этот подход может быть применен к более широким данным и наборам задач. Наш подход может стать кл

Abstract

As deep neural networks are increasingly deployed in dynamic, real-world environments, relying on a single static model is often insufficient. Changes in input data distributions caused by sensor drift or lighting variations necessitate continual model adaptation. In this paper, we propose a hybrid training methodology that enables efficient on-device domain adaptation by combining the strengths of Backpropagation and Predictive Coding. The method begins with a deep neural network trained offline using Backpropagation to achieve high initial performance. Subsequently, Predictive Coding is employed for online adaptation, allowing the model to recover accuracy lost due to shifts in the input data distribution. This approach leverages the robustness of Backpropagation for initial representation learning and the computational efficiency of Predictive Coding for continual learning, making it particularly well-suited for resource-constrained edge devices or future neuromorphic accelerators. Experimental results on the MNIST and CIFAR-10 datasets demonstrate that this hybrid strategy enables effective adaptation with a reduced computational overhead, offering a promising solution for maintaining model performance in dynamic environments.

Ссылки и действия