Sensory robustness through top-down feedback and neural stochasticity in recurrent vision models
2508.07115v1
q-bio.NC, cs.CV, cs.LG
2025-08-13
Авторы:
Antonino Greco, Marco D'Alessandro, Karl J. Friston, Giovanni Pezzulo, Markus Siegel
Резюме на русском
## Контекст
В области визуального обработки существует длительное противоречие между функциональной ролью верхне-внизу (top-down) мозговых путей и их отсутствием в существующих моделях артифициального видения. Хотя биологические системы такие как мозг человека используют верхне-внизу мозговые пути для улучшения визуального распознавания, большинство моделей искусственного видения основываются лишь на нижне-вверху (feedforward) или рекуррентных архитектурах. Эта разница поднимает вопросы о функциональной важности верхне-внизу мозговых путей. Мотивируется поиском разъяснения, как верхне-внизу мозговые пути могут вкладывать в визуальную процессингу, и как они могут быть реализованы в моделировании.
## Метод
Для изучения этой проблемы в данном исследовании использовались конволюционные рекуррентные нейронные сети (ConvRNN). Эти модели были обучены классифицировать изображения, со включенным и отключенным верхне-внизу мозговыми путями. Была также внедрена техника стохастической нейронной вариабельности, в частности, dropout, которая случайным образом подавляла отдельные нейроны в каждой итерации обучения. Эта реализация значительно увеличила результат модели, демонстрируя важность нейронной вариабельности и верхне-внизу мозговых путей для улучшения визуальной обработки.
## Результаты
Исследования показали, что ConvRNNs с верхне-внизу мозговыми путями и dropout имели значительные преимущества в скорости обучения и точности. Эти модели были менее чувствительны к шумным помехам и атакам адверсарных входов. Репрезентация выходного слоя, полученная с верхне-внизу мозговыми путями и dropout, стала более оптимальна, что привело к сжатой, но эффективной кодированию информации. Также выявлено, что верхне-внизу мозговые пути способствуют устойчивости динамики сети в условиях выхода за пределы дистрибуции (out-of-distribution).
## Значимость
Результаты этого исследования имеют широкие приложения в области искусственного видения, включая обработку изображений, обнаружение объектов и понимание языка. Модель с верхне-внизу мозговыми путями и dropout может использоваться в ситуациях, где необходимо высокое разрешение, высокая производительность и устойчивость к помехам. Также модель может применяться в ситуациях, где важно обеспечить точность, даже при неоптимальных условиях ввода.
## Выводы
Выводы показывают, что верхне-внизу мозговые пути и нейронная вариабельность играют ключевую роль в улучшении визуальной обработки. Верхне-внизу мозговые пути помогают стабилизировать динамику сети, в то в
Abstract
Biological systems leverage top-down feedback for visual processing, yet most
artificial vision models succeed in image classification using purely
feedforward or recurrent architectures, calling into question the functional
significance of descending cortical pathways. Here, we trained convolutional
recurrent neural networks (ConvRNN) on image classification in the presence or
absence of top-down feedback projections to elucidate the specific
computational contributions of those feedback pathways. We found that ConvRNNs
with top-down feedback exhibited remarkable speed-accuracy trade-off and
robustness to noise perturbations and adversarial attacks, but only when they
were trained with stochastic neural variability, simulated by randomly
silencing single units via dropout. By performing detailed analyses to identify
the reasons for such benefits, we observed that feedback information
substantially shaped the representational geometry of the post-integration
layer, combining the bottom-up and top-down streams, and this effect was
amplified by dropout. Moreover, feedback signals coupled with dropout optimally
constrained network activity onto a low-dimensional manifold and encoded object
information more efficiently in out-of-distribution regimes, with top-down
information stabilizing the representational dynamics at the population level.
Together, these findings uncover a dual mechanism for resilient sensory coding.
On the one hand, neural stochasticity prevents unit-level co-adaptation albeit
at the cost of more chaotic dynamics. On the other hand, top-down feedback
harnesses high-level information to stabilize network activity on compact
low-dimensional manifolds.
Ссылки и действия
Дополнительные ресурсы: