Dynamical Learning in Deep Asymmetric Recurrent Neural Networks

2509.05041v1 cond-mat.dis-nn, cs.LG, q-bio.NC 2025-09-09
Авторы:

Davide Badalotti, Carlo Baldassi, Marc Mézard, Mattia Scardecchia, Riccardo Zecchina

Резюме на русском

## Контекст Глубокие асимметричные рекуррентные нейронные сети (DARNN) представляют собой мощный класс моделей, которые обладают уникальными свойствами, включая способность хранить и обрабатывать значительное количество данных в их внутренних состояниях. Однако их использование в задачах машинного обучения столкнулось с рядом сложностей, включая необходимость тщательной инициализации параметров и затрудненную обучаемость в ситуациях, требующих большого количества вычислительных ресурсов. Одним из основных трудностей является необходимость использования оптимизационных процедур, таких как градиентный спуск, для обновления весов, что может ограничивать их применение в ситуациях, где недоступны вычислительные мощности для длительных итераций. Авторы статьи предлагают расширенную модель DARNN, в которой добавляются новые аспекты, такие как спарсие вывода и динамическое обучение, что позволяет модели более эффективно решать задачи машинного обучения. ## Метод Проposed алгоритм основывается на идее геометрических свойств стабильных конфигураций внутренних состояний DARNN. Авторы предлагают использовать новую структуру сети, включающую асимметричные связи между слоями, что позволяет создать богатую многомерную пространственную структуру для представления данных. Благодаря этой структуре, модель может обнаружить информацию о связях в данных без необходимости затрат на вычисление градиентов. Для выполнения обучения используется динамический подход, в котором сеть сама обнаруживает паттерны и взаимосвязи в данных, без необходимости внешнего сигнала. Это достигается за счет использования спарсия, что позволяет модели более эффективно регулировать свои состояния и обнаруживать существующие связи в данных. ## Результаты Авторы проводят обширные эксперименты для сравнения новой модели с традиционными архитектурами. Используются различные данные, включая стандартные бенчмарк-задачи в области текстового и изображенияй обработки. Результаты показывают, что новая модель может достигать высокой точности в решении задач, которые требуют хранения и обработки больших объемов данных. Заметное преимущество новой модели заключается в том, что она может выполнять обучение даже при отсутствии градиентного спуска, что делает ее более универсальной и эффективной в ситуациях, где вычислительные ресурсы ограничены. ## Значимость Новая модель может быть применена в различных областях, включая нейроинформатику, биоинформатику и машинное обучение. Одним из основных преимуществ является возможность решать задачи

Abstract

We show that asymmetric deep recurrent neural networks, enhanced with additional sparse excitatory couplings, give rise to an exponentially large, dense accessible manifold of internal representations which can be found by different algorithms, including simple iterative dynamics. Building on the geometrical properties of the stable configurations, we propose a distributed learning scheme in which input-output associations emerge naturally from the recurrent dynamics, without any need of gradient evaluation. A critical feature enabling the learning process is the stability of the configurations reached at convergence, even after removal of the supervisory output signal. Extensive simulations demonstrate that this approach performs competitively on standard AI benchmarks. The model can be generalized in multiple directions, both computational and biological, potentially contributing to narrowing the gap between AI and computational neuroscience.

Ссылки и действия