Mutual Information Surprise: Rethinking Unexpectedness in Autonomous Systems
2508.17403v1
cs.LG, stat.AP
2025-08-27
Авторы:
Yinsong Wang, Xiao Liu, Quan Zeng, Yu Ding
Резюме на русском
## Контекст
Исследование автономных систем направлено на создание систем, которые могут принимать решения с минимальным вмешательством человека. Однако, существующие системы часто ограничены статическими групповыми методами и классическими методами оптимизации, которые не подходят для управления непредсказуемыми ситуациями. Одной из ключевых проблем является несостоятельность обнаружения и адаптации к неожиданностям, которые могут возникать во время выполнения задач.
Традиционные меры неожиданности, такие как Shannon Surprise или Bayesian Surprise, позволяют обнаруживать отклонения, но не оценивают возможность системы научиться и адаптироваться. В данной работе предлагается новый подход, который переопределяет неожиданность как сигнал эпистемического роста (learning progress). Этот подход может помочь автономным системам становиться более самостоятельными и адаптивными.
## Метод
Новая методология, представленная в работе, называется Mutual Information Surprise (MIS). Разработана архитектура, которая использует методы статистического анализа и машинного обучения для оценки эпистемического роста.
MIS определяет неожиданность как изменение в mutual information между системными состояниями и внешними входными данными. Для того, чтобы выявить существенные изменения, разработана последовательность статистических тестов. Далее, предложена стратегия реакции MISRP, которая модифицирует процесс сбора данных и создает альтернативные пути развития для системы.
Эта методология тестировалась на синтетических задачах и реальной задачей оценки динамической повреждаемости окружения.
## Результаты
На синтетических задачах было показано, что MISRP приводит к более стабильному и реактивному поведению системы. Реальная задача оценки повреждаемости окружения также показала, что MISRP превосходит классические методы в прогностической точности и удовлетворяет критериям эффективного управления. Особенно заметно повышение реактивности при адаптации к непредсказуемым условиям окружения.
## Значимость
Основное применение MISRP включает системы, требующие адаптации к нестандартным условиям, такие как автономные роботы, системы самостоятельного управления и системы мониторинга окружающей среды. Выделяется ряд преимуществ: лучшая реактивность к неожиданностям, увеличение прогностической точности и стабильности. Эти преимущества могут положительно сказаться на различных областях, включая robot autonomy, environmental monitoring и другие.
## Выводы
Результаты показывают, что MISRP является эффективным подходом для реализации самосознательных систем, которые могут адаптироваться к неожиданностям. Будущие исследования будут направлен
Abstract
Recent breakthroughs in autonomous experimentation have demonstrated
remarkable physical capabilities, yet their cognitive control remains
limited--often relying on static heuristics or classical optimization. A core
limitation is the absence of a principled mechanism to detect and adapt to the
unexpectedness. While traditional surprise measures--such as Shannon or
Bayesian Surprise--offer momentary detection of deviation, they fail to capture
whether a system is truly learning and adapting. In this work, we introduce
Mutual Information Surprise (MIS), a new framework that redefines surprise not
as anomaly detection, but as a signal of epistemic growth. MIS quantifies the
impact of new observations on mutual information, enabling autonomous systems
to reflect on their learning progression. We develop a statistical test
sequence to detect meaningful shifts in estimated mutual information and
propose a mutual information surprise reaction policy (MISRP) that dynamically
governs system behavior through sampling adjustment and process forking.
Empirical evaluations--on both synthetic domains and a dynamic pollution map
estimation task--show that MISRP-governed strategies significantly outperform
classical surprise-based approaches in stability, responsiveness, and
predictive accuracy. By shifting surprise from reactive to reflective, MIS
offers a path toward more self-aware and adaptive autonomous systems.
Ссылки и действия
Дополнительные ресурсы: