Incorporating Visual Cortical Lateral Connection Properties into CNN: Recurrent Activation and Excitatory-Inhibitory Separation
2509.15460v1
q-bio.NC, cs.AI, cs.CV
2025-09-23
Авторы:
Jin Hyun Park, Cheng Zhang, Yoonsuck Choe
Резюме на русском
## Контекст
Современные Сверточные Нейронные Сети (СНС), такие как ResNet, опираются на принципы функционирования визуальной системы млекопитающих. Они эмулируют афферентные связи (от ретины и LGN к визуальному кортексу) и долгорадийные проекции (между различными визуальными кортикальными областями). Однако, в биологической системе, существуют внутрикортикальные связи, называемые латеральными (или горизонтальными), которые имитируют связи внутри feature maps CNN. Эти связи значительно влияют на обработку визуальной информации в мозгу и их отсутствие в традиционных CNN-моделях ограничивает их биологическую аналогичность и эффективность. Мы исследуем, как моделировать эти связи в рамках стандартных CNN, обосновывая их потенциальное влияние на моделирование визуального распознавания.
## Метод
Мы предлагаем модификацию стандартной CNN-архитектуры, включающую внутрислоевые латеральные связи. Используя весовую связность для рекуррентных активаций, мы эмулируем латеральные связи, аналогичные биологической системе. Для того чтобы отделить эксцитаторные и ингибиторные связи, мы предлагаем настраиваемую функцию потерь. Эти модификации позволяют создать модель, поддерживающую биологические принципы визуальной обработки. Мы проверили эффективность нашего подхода на задаче классификации изображений, анализировав качество распознавания и биологичность моделирования.
## Результаты
Мы провели эксперименты с использованием объемных данных классификации (например, CIFAR-10 или ImageNet). Наша модифицированная CNN-модель показала улучшенную точность классификации по сравнению с оригинальными моделями без латеральных связей. Мы также проанализировали свойства активаций и типы связей внутри модели. Было показано, что рекуррентные активации и отделение эксцитаторных и ингибиторных связей приводят к более биологичному распределению весов и повышенной стабильности модели.
## Значимость
Наш подход может быть применен во всех областях, где используются CNN, включая распознавание изображений, обработку сигналов и медицинский анализ изображений. Он позволяет не только повысить точность распознавания, но и сделать модели более биологично соответствующими, что может способствовать лучшему пониманию принципов визуальной обработки в мозге. Этот подход может стать важной основой для создания более эффективных и биологично природных моделей машинного обучения.
## Выводы
Мы успешно доказали, что добавление латеральных связей в CNN модели приводит к улучшению их качества и биологично
Abstract
The original Convolutional Neural Networks (CNNs) and their modern updates
such as the ResNet are heavily inspired by the mammalian visual system. These
models include afferent connections (retina and LGN to the visual cortex) and
long-range projections (connections across different visual cortical areas).
However, in the mammalian visual system, there are connections within each
visual cortical area, known as lateral (or horizontal) connections. These would
roughly correspond to connections within CNN feature maps, and this important
architectural feature is missing in current CNN models. In this paper, we
present how such lateral connections can be modeled within the standard CNN
framework, and test its benefits and analyze its emergent properties in
relation to the biological visual system. We will focus on two main
architectural features of lateral connections: (1) recurrent activation and (2)
separation of excitatory and inhibitory connections. We show that recurrent CNN
using weight sharing is equivalent to lateral connections, and propose a custom
loss function to separate excitatory and inhibitory weights. The addition of
these two leads to increased classification accuracy, and importantly, the
activation properties and connection properties of the resulting model show
properties similar to those observed in the biological visual system. We expect
our approach to help align CNN closer to its biological counterpart and better
understand the principles of visual cortical computation.
Ссылки и действия
Дополнительные ресурсы: