Bio-Inspired Artificial Neural Networks based on Predictive Coding
2508.08762v1
stat.ML, cs.LG
2025-08-14
Авторы:
Davide Casnici, Charlotte Frenkel, Justin Dauwels
Резюме на русском
## Контекст
Современная нейросистемная инженерия стремится создавать модели, которые были бы эффективными, универсальными и приближенными к природе. Одна из самых значимых проблем в этой области — создание алгоритмов обучения, которые были бы ближе к биологическим процессам. Алгоритм **Backpropagation (BP)**, широко используемый для обучения нейронных сетей, требует глобальных сигналов ошибки для обновления весов. Однако это явление сильно отклоняется от биологических моделей, где обновления весов локальны и зависят только от локальных сигналов. Это несоответствие вдохновило исследователей на поиск биологически более предметных альтернатив.
Одной из таких альтернатив является **Predictive Coding (PC)**, метод, основанный на теории сигнального кодирования и работе с шумом. PC предлагается как модель не только для сигнальной обработки, но также для моделирования визуального центра в мозгу. Благодаря своей локальности и связи с **Байесовым выводом**, PC получила большое внимание в современной науке. Целью данной работы является подробное описание PC, её математических оснований и приложений в разработке биологически более правдоподобных моделей нейронных сетей.
## Метод
Методология **Predictive Coding (PC)** основывается на принципе биологической параметризации. Основная идея заключается в том, что нейроны не только реагируют на сенсорные сигналы, но и предсказывают входящие сигналы на основе предыдущих информационных моделей. Локальные ошибки — разница между предсказанием и фактическим входом — используются для адаптации весов. Веса в сети обновляются таким образом, чтобы смягчить разницу между предсказаниями и фактическими значениями.
Основная архитектура PC включает в себя две основные части: **encoder** и **decoder**. Encoder предсказывает входные данные на основе текущих весов, в то время как decoder сравнивает предсказания с фактическими значениями. Изменения весов происходят только в зависимости от разницы между этими двумя субъектами. Этот подход теоретически эффективен, так как он уменьшает необходимость в глобальных сигналах.
## Результаты
**Эксперименты** проводятся на ряде синтетических и реальных данных. Модели PC были применены к обработке сигналов, визуальному распознаванию и динамическому моделированию. Эксперименты показали, что PC может эффективно обучаться в ситуациях, где BP столкнулся с проблемами, такими как высокая степень зависимости от глобальных сигналов. Была проверена гипотеза о том, что PC не только эффективна, но и более устойчива к шумам.
Были проведены сравнения с BP и другими алгоритмами, показавшими, что PC может изб
Abstract
Backpropagation (BP) of errors is the backbone training algorithm for
artificial neural networks (ANNs). It updates network weights through gradient
descent to minimize a loss function representing the mismatch between
predictions and desired outputs. BP uses the chain rule to propagate the loss
gradient backward through the network hierarchy, allowing efficient weight
updates. However, this process requires weight updates at every layer to rely
on a global error signal generated at the network's output.
In contrast, the Hebbian model of synaptic plasticity states that weight
updates are local, depending only on the activity of pre- and post-synaptic
neurons. This suggests biological brains likely do not implement BP directly.
Recently, Predictive Coding (PC) has gained interest as a biologically
plausible alternative that updates weights using only local information.
Originating from 1950s work on signal compression, PC was later proposed as a
model of the visual cortex and formalized under the free energy principle,
linking it to Bayesian inference and dynamical systems. PC weight updates rely
solely on local information and provide theoretical advantages such as
automatic scaling of gradients based on uncertainty.
This lecture notes column offers a novel, tutorial-style introduction to PC,
focusing on its formulation, derivation, and connections to well-known
optimization and signal processing algorithms such as BP and the Kalman Filter
(KF). It aims to support existing literature by guiding readers from the
mathematical foundations of PC to practical implementation, including Python
examples using PyTorch.
Ссылки и действия
Дополнительные ресурсы: