Sensory robustness through top-down feedback and neural stochasticity in recurrent vision models

2508.07115v1 q-bio.NC, cs.CV, cs.LG 2025-08-13

Авторы:

Antonino Greco, Marco D'Alessandro, Karl J. Friston, Giovanni Pezzulo, Markus Siegel

Резюме на русском

## Контекст В области визуального обработки существует длительное противоречие между функциональной ролью верхне-внизу (top-down) мозговых путей и их отсутствием в существующих моделях артифициального видения. Хотя биологические системы такие как мозг человека используют верхне-внизу мозговые пути для улучшения визуального распознавания, большинство моделей искусственного видения основываются лишь на нижне-вверху (feedforward) или рекуррентных архитектурах. Эта разница поднимает вопросы о функциональной важности верхне-внизу мозговых путей. Мотивируется поиском разъяснения, как верхне-внизу мозговые пути могут вкладывать в визуальную процессингу, и как они могут быть реализованы в моделировании. ## Метод Для изучения этой проблемы в данном исследовании использовались конволюционные рекуррентные нейронные сети (ConvRNN). Эти модели были обучены классифицировать изображения, со включенным и отключенным верхне-внизу мозговыми путями. Была также внедрена техника стохастической нейронной вариабельности, в частности, dropout, которая случайным образом подавляла отдельные нейроны в каждой итерации обучения. Эта реализация значительно увеличила результат модели, демонстрируя важность нейронной вариабельности и верхне-внизу мозговых путей для улучшения визуальной обработки. ## Результаты Исследования показали, что ConvRNNs с верхне-внизу мозговыми путями и dropout имели значительные преимущества в скорости обучения и точности. Эти модели были менее чувствительны к шумным помехам и атакам адверсарных входов. Репрезентация выходного слоя, полученная с верхне-внизу мозговыми путями и dropout, стала более оптимальна, что привело к сжатой, но эффективной кодированию информации. Также выявлено, что верхне-внизу мозговые пути способствуют устойчивости динамики сети в условиях выхода за пределы дистрибуции (out-of-distribution). ## Значимость Результаты этого исследования имеют широкие приложения в области искусственного видения, включая обработку изображений, обнаружение объектов и понимание языка. Модель с верхне-внизу мозговыми путями и dropout может использоваться в ситуациях, где необходимо высокое разрешение, высокая производительность и устойчивость к помехам. Также модель может применяться в ситуациях, где важно обеспечить точность, даже при неоптимальных условиях ввода. ## Выводы Выводы показывают, что верхне-внизу мозговые пути и нейронная вариабельность играют ключевую роль в улучшении визуальной обработки. Верхне-внизу мозговые пути помогают стабилизировать динамику сети, в то в

Abstract

Biological systems leverage top-down feedback for visual processing, yet most artificial vision models succeed in image classification using purely feedforward or recurrent architectures, calling into question the functional significance of descending cortical pathways. Here, we trained convolutional recurrent neural networks (ConvRNN) on image classification in the presence or absence of top-down feedback projections to elucidate the specific computational contributions of those feedback pathways. We found that ConvRNNs with top-down feedback exhibited remarkable speed-accuracy trade-off and robustness to noise perturbations and adversarial attacks, but only when they were trained with stochastic neural variability, simulated by randomly silencing single units via dropout. By performing detailed analyses to identify the reasons for such benefits, we observed that feedback information substantially shaped the representational geometry of the post-integration layer, combining the bottom-up and top-down streams, and this effect was amplified by dropout. Moreover, feedback signals coupled with dropout optimally constrained network activity onto a low-dimensional manifold and encoded object information more efficiently in out-of-distribution regimes, with top-down information stabilizing the representational dynamics at the population level. Together, these findings uncover a dual mechanism for resilient sensory coding. On the one hand, neural stochasticity prevents unit-level co-adaptation albeit at the cost of more chaotic dynamics. On the other hand, top-down feedback harnesses high-level information to stabilize network activity on compact low-dimensional manifolds.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Sensory robustness through top-down feedback and neural stochasticity in recurrent vision models

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Aligning Video Models with Human Social Judgments via Behavior-Guided Fine-Tunin...

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mu...

Automatic Screening of Parkinson's Disease from Visual Explorations

Навигация