Mutual Information Surprise: Rethinking Unexpectedness in Autonomous Systems

2508.17403v1 cs.LG, stat.AP 2025-08-27
Авторы:

Yinsong Wang, Xiao Liu, Quan Zeng, Yu Ding

Резюме на русском

## Контекст Исследование автономных систем направлено на создание систем, которые могут принимать решения с минимальным вмешательством человека. Однако, существующие системы часто ограничены статическими групповыми методами и классическими методами оптимизации, которые не подходят для управления непредсказуемыми ситуациями. Одной из ключевых проблем является несостоятельность обнаружения и адаптации к неожиданностям, которые могут возникать во время выполнения задач. Традиционные меры неожиданности, такие как Shannon Surprise или Bayesian Surprise, позволяют обнаруживать отклонения, но не оценивают возможность системы научиться и адаптироваться. В данной работе предлагается новый подход, который переопределяет неожиданность как сигнал эпистемического роста (learning progress). Этот подход может помочь автономным системам становиться более самостоятельными и адаптивными. ## Метод Новая методология, представленная в работе, называется Mutual Information Surprise (MIS). Разработана архитектура, которая использует методы статистического анализа и машинного обучения для оценки эпистемического роста. MIS определяет неожиданность как изменение в mutual information между системными состояниями и внешними входными данными. Для того, чтобы выявить существенные изменения, разработана последовательность статистических тестов. Далее, предложена стратегия реакции MISRP, которая модифицирует процесс сбора данных и создает альтернативные пути развития для системы. Эта методология тестировалась на синтетических задачах и реальной задачей оценки динамической повреждаемости окружения. ## Результаты На синтетических задачах было показано, что MISRP приводит к более стабильному и реактивному поведению системы. Реальная задача оценки повреждаемости окружения также показала, что MISRP превосходит классические методы в прогностической точности и удовлетворяет критериям эффективного управления. Особенно заметно повышение реактивности при адаптации к непредсказуемым условиям окружения. ## Значимость Основное применение MISRP включает системы, требующие адаптации к нестандартным условиям, такие как автономные роботы, системы самостоятельного управления и системы мониторинга окружающей среды. Выделяется ряд преимуществ: лучшая реактивность к неожиданностям, увеличение прогностической точности и стабильности. Эти преимущества могут положительно сказаться на различных областях, включая robot autonomy, environmental monitoring и другие. ## Выводы Результаты показывают, что MISRP является эффективным подходом для реализации самосознательных систем, которые могут адаптироваться к неожиданностям. Будущие исследования будут направлен

Abstract

Recent breakthroughs in autonomous experimentation have demonstrated remarkable physical capabilities, yet their cognitive control remains limited--often relying on static heuristics or classical optimization. A core limitation is the absence of a principled mechanism to detect and adapt to the unexpectedness. While traditional surprise measures--such as Shannon or Bayesian Surprise--offer momentary detection of deviation, they fail to capture whether a system is truly learning and adapting. In this work, we introduce Mutual Information Surprise (MIS), a new framework that redefines surprise not as anomaly detection, but as a signal of epistemic growth. MIS quantifies the impact of new observations on mutual information, enabling autonomous systems to reflect on their learning progression. We develop a statistical test sequence to detect meaningful shifts in estimated mutual information and propose a mutual information surprise reaction policy (MISRP) that dynamically governs system behavior through sampling adjustment and process forking. Empirical evaluations--on both synthetic domains and a dynamic pollution map estimation task--show that MISRP-governed strategies significantly outperform classical surprise-based approaches in stability, responsiveness, and predictive accuracy. By shifting surprise from reactive to reflective, MIS offers a path toward more self-aware and adaptive autonomous systems.

Ссылки и действия