Incorporating Visual Cortical Lateral Connection Properties into CNN: Recurrent Activation and Excitatory-Inhibitory Separation

2509.15460v1 q-bio.NC, cs.AI, cs.CV 2025-09-23

Авторы:

Jin Hyun Park, Cheng Zhang, Yoonsuck Choe

Резюме на русском

## Контекст Современные Сверточные Нейронные Сети (СНС), такие как ResNet, опираются на принципы функционирования визуальной системы млекопитающих. Они эмулируют афферентные связи (от ретины и LGN к визуальному кортексу) и долгорадийные проекции (между различными визуальными кортикальными областями). Однако, в биологической системе, существуют внутрикортикальные связи, называемые латеральными (или горизонтальными), которые имитируют связи внутри feature maps CNN. Эти связи значительно влияют на обработку визуальной информации в мозгу и их отсутствие в традиционных CNN-моделях ограничивает их биологическую аналогичность и эффективность. Мы исследуем, как моделировать эти связи в рамках стандартных CNN, обосновывая их потенциальное влияние на моделирование визуального распознавания. ## Метод Мы предлагаем модификацию стандартной CNN-архитектуры, включающую внутрислоевые латеральные связи. Используя весовую связность для рекуррентных активаций, мы эмулируем латеральные связи, аналогичные биологической системе. Для того чтобы отделить эксцитаторные и ингибиторные связи, мы предлагаем настраиваемую функцию потерь. Эти модификации позволяют создать модель, поддерживающую биологические принципы визуальной обработки. Мы проверили эффективность нашего подхода на задаче классификации изображений, анализировав качество распознавания и биологичность моделирования. ## Результаты Мы провели эксперименты с использованием объемных данных классификации (например, CIFAR-10 или ImageNet). Наша модифицированная CNN-модель показала улучшенную точность классификации по сравнению с оригинальными моделями без латеральных связей. Мы также проанализировали свойства активаций и типы связей внутри модели. Было показано, что рекуррентные активации и отделение эксцитаторных и ингибиторных связей приводят к более биологичному распределению весов и повышенной стабильности модели. ## Значимость Наш подход может быть применен во всех областях, где используются CNN, включая распознавание изображений, обработку сигналов и медицинский анализ изображений. Он позволяет не только повысить точность распознавания, но и сделать модели более биологично соответствующими, что может способствовать лучшему пониманию принципов визуальной обработки в мозге. Этот подход может стать важной основой для создания более эффективных и биологично природных моделей машинного обучения. ## Выводы Мы успешно доказали, что добавление латеральных связей в CNN модели приводит к улучшению их качества и биологично

Abstract

The original Convolutional Neural Networks (CNNs) and their modern updates such as the ResNet are heavily inspired by the mammalian visual system. These models include afferent connections (retina and LGN to the visual cortex) and long-range projections (connections across different visual cortical areas). However, in the mammalian visual system, there are connections within each visual cortical area, known as lateral (or horizontal) connections. These would roughly correspond to connections within CNN feature maps, and this important architectural feature is missing in current CNN models. In this paper, we present how such lateral connections can be modeled within the standard CNN framework, and test its benefits and analyze its emergent properties in relation to the biological visual system. We will focus on two main architectural features of lateral connections: (1) recurrent activation and (2) separation of excitatory and inhibitory connections. We show that recurrent CNN using weight sharing is equivalent to lateral connections, and propose a custom loss function to separate excitatory and inhibitory weights. The addition of these two leads to increased classification accuracy, and importantly, the activation properties and connection properties of the resulting model show properties similar to those observed in the biological visual system. We expect our approach to help align CNN closer to its biological counterpart and better understand the principles of visual cortical computation.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Incorporating Visual Cortical Lateral Connection Properties into CNN: Recurrent Activation and Excitatory-Inhibitory Separation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

DCA: Graph-Guided Deep Embedding Clustering for Brain Atlases

Навигация