Comparing Data Assimilation and Likelihood-Based Inference on Latent State Estimation in Agent-Based Models

2509.17625v1 cs.LG, cs.CY, physics.soc-ph, stat.ME 2025-09-24
Авторы:

Blas Kolic, Corrado Monti, Gianmarco De Francisci Morales, Marco Pangallo

Резюме на русском

## Контекст Поведение крупных социальных систем, таких как рынки, политические системы или массовые события, часто описывается с помощью Агентно-Базированных Моделей (ABM). В этих моделях, системные свойства порождаются от множества независимых агентов, каждый из которых следует простым локальным правилам. Несмотря на простоту моделирования, такие модели могут дать оптимальные прогнозы игр, логистики или других сложных систем. Однако, проблема в том, что ABM-модели не описывают точно все факторы, влияющие на реальные системы, поэтому требуется процесс **алгоритмической интеграции данных** (Data Assimilation, DA) для уточнения поведения системы на основе внешних данных. Хотя DA используется в различных областях (например, климатологии и финансах), его преимущества и ограничения в ABM-моделях не до конца изучены. Другой подход к интеграции данных заключается в **вполне логическом выводе** (Likelihood-Based Inference, LBI), который оптимизирует поведение модели напрямую, используя конкретную функцию вероятности. В статье рассматривается сравнение этих двух подходов в ABM, чтобы определить, какой из них подходит лучше для различных задач прогнозирования. ## Метод В статье используется модель **Bounded-Confidence Model** (BCM), которая описывает динамику мнений в рамках диалога между агентами. В этой модели, агенты меняют свое мнение только с теми, кого считают достаточно близкими. Для сравнения DA и LBI были проведены эксперименты, в которых необходимо было восстановить скрытые состояния внутри модели на основе наблюдаемых данных. Оба подхода были применены к ситуациям с разным уровнем сложности, включая сценарии с неточными предположениями о модели (model mis-specification). Было также рассмотрено поведение DA и LBI при разной агрегированности данных — от индивидуальных агентов до системных показателей. Особое внимание было уделено сравнению точности и затратных ресурсов каждого подхода. ## Результаты Результаты экспериментов показали, что LBI превосходит DA в восстановлении скрытых состояний на уровне индивидуальных агентов, особенно когда модель неточно описывает реальность. Это связано с тем, что LBI может воспользоваться полной функцией вероятности модели, что позволяет более точно оптимизировать состояния. Однако, DA по-прежнему демонстрирует высокую точность при агрегированных данных, позволяя делать достаточно точные прогнозы в целом. Кроме того, LBI потребляет больше вычислительных ресурсов в сравнении с DA, что может быть критично при работе с большими объемами данных. Из этого следует, что DA оптимизальен для целей прогноза на высоких уровнях агрегации, в то время как LBI более ценится при необходимости индивидуального прогнозирования. ##

Abstract

In this paper, we present the first systematic comparison of Data Assimilation (DA) and Likelihood-Based Inference (LBI) in the context of Agent-Based Models (ABMs). These models generate observable time series driven by evolving, partially-latent microstates. Latent states need to be estimated to align simulations with real-world data -- a task traditionally addressed by DA, especially in continuous and equation-based models such as those used in weather forecasting. However, the nature of ABMs poses challenges for standard DA methods. Solving such issues requires adaptation of previous DA techniques, or ad-hoc alternatives such as LBI. DA approximates the likelihood in a model-agnostic way, making it broadly applicable but potentially less precise. In contrast, LBI provides more accurate state estimation by directly leveraging the model's likelihood, but at the cost of requiring a hand-crafted, model-specific likelihood function, which may be complex or infeasible to derive. We compare the two methods on the Bounded-Confidence Model, a well-known opinion dynamics ABM, where agents are affected only by others holding sufficiently similar opinions. We find that LBI better recovers latent agent-level opinions, even under model mis-specification, leading to improved individual-level forecasts. At the aggregate level, however, both methods perform comparably, and DA remains competitive across levels of aggregation under certain parameter settings. Our findings suggest that DA is well-suited for aggregate predictions, while LBI is preferable for agent-level inference.

Ссылки и действия