Active inference for action-unaware agents

2508.12027v1 cs.AI, cs.LG, q-bio.NC 2025-08-19

Авторы:

Filippo Torresan, Keisuke Suzuki, Ryota Kanai, Manuel Baltieri

Резюме на русском

## Контекст Active inference является формальным подходом для изучения мышления, основанным на представлении, что адаптивные агенты могут быть рассмотрены как участники процесса приблизительной байесовской инференции. Это достигается за счет минимизации разности вариационной и ожидаемой свободной энергии. Минимизация разности вариационной энергии обеспечивает аккумуляцию доказательств в процессе перцепции и обучения, в то время как минимизация ожидаемой свободной энергии контролирует поведение агента во времени. Таким образом, адаптивные агенты могут максимизировать вероятность предпочтительных наблюдений или состояний, используя генерирующую модель среды. Однако различные подходы были предложены для описания как агенты планируют свои действия. Некоторые исходят из того, что агенты знают свои действия и используют эту информацию для планирования будущих действий. Другие подходы предполагают, что агенты не знают своих действий и должны их выводить из последних наблюдений. Это отличие отражает двухвдохновенную традицию в моторном управлении: с учетом или без использования сигнала от эффекции, представляющего знания об агентских действиях. В этой работе мы сравниваем активные инференции у агентов, знакомых и незнакомых с своими действиями, в двух задачах навигации, показывая, что незнакомые с своими действиями агенты достигают похожих результатов, несмотря на их серьезное недоразвитие. ## Метод Мы использовали модель активной инференции, которая описывает как агенты выбирают действия, оптимизируя вариационную и ожидаемую свободную энергию. Для сравнения мы разработали две модели: одну с полным знанием действий (action-aware) и другую без знания действий (action-unaware). Модели были тренированы на двух задачах навигации: первая задача требует планирования траекторий в пространстве, а вторая — планирования последовательностей действий для достижения цели. Мы сравнивали показатели эффективности, точности и времени решения задач для каждой модели. Для обеспечения справедливости экспериментов использовались одинаковые условия и начальные данные для обеих моделей. ## Результаты Наши результаты показали, что action-unaware агенты не только достигают подходящих результатов, но и демонстрируют почти одинаковую эффективность по сравнению с action-aware агентами в обоих задачах. Однако action-unaware агенты вынуждены интерпретировать все наблюдения в своей модели как результат своих действий, что приводит к дополнительным вычислительным затратам и некоторой потерей точности. Мы также обнаружили, что action-unaware агенты вынуждены выполн

Abstract

Active inference is a formal approach to study cognition based on the notion that adaptive agents can be seen as engaging in a process of approximate Bayesian inference, via the minimisation of variational and expected free energies. Minimising the former provides an account of perceptual processes and learning as evidence accumulation, while minimising the latter describes how agents select their actions over time. In this way, adaptive agents are able to maximise the likelihood of preferred observations or states, given a generative model of the environment. In the literature, however, different strategies have been proposed to describe how agents can plan their future actions. While they all share the notion that some kind of expected free energy offers an appropriate way to score policies, sequences of actions, in terms of their desirability, there are different ways to consider the contribution of past motor experience to the agent's future behaviour. In some approaches, agents are assumed to know their own actions, and use such knowledge to better plan for the future. In other approaches, agents are unaware of their actions, and must infer their motor behaviour from recent observations in order to plan for the future. This difference reflects a standard point of departure in two leading frameworks in motor control based on the presence, or not, of an efference copy signal representing knowledge about an agent's own actions. In this work we compare the performances of action-aware and action-unaware agents in two navigations tasks, showing how action-unaware agents can achieve performances comparable to action-aware ones while at a severe disadvantage.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация