Seeing the Many: Exploring Parameter Distributions Conditioned on Features in Surrogates
2508.13088v1
cs.LG, cs.HC
2025-08-20
Авторы:
Xiaohan Wang, Zhimin Li, Joshua A. Levine, Matthew Berger
Резюме на русском
#### Контекст
В последние годы neural surrogate models стали выделяться как более подходящая альтернатива традиционным симуляционным процессам в научных исследованиях. Эти модели эффективно моделируют функционал симуляционных процессов, устраняя необходимость запуска дорогостоящих симуляций. В дополнение к моделированию простых функций входных и выходных параметров, суррогатные модели также показали свою полезность в решении инверских задач. Инверсионные задачи могут быть определены как поисковые, где целью является найти параметры, генерирующие заданный выход с указанной особенностью. Однако, нахождение таких параметров в высокомишченодименсиональных пространствах может оказаться дорогостоящим, поскольку поиск может требовать много запусков симуляций. На данный момент, большинство суррогатных решений ограничиваются только поиском небольшого набора параметров, которые удовлетворяют заданному критерию, но не охватывают широкий круг возможных вариантов. Мы адресуем эту проблему, стремясь моделировать и визуализировать распределение возможных входных параметров, которые приводят к заданной особенности вывода.
#### Метод
Мы разработали метод, который моделирует распределение входных параметров с помощью density estimation. Наша модель доверительного распределения основывается на близости новых параметров к тем, которые были использованы в обучении модели, как в пространстве входных параметров, так и в пространстве выходных функций. Мы используем эту модель для формирования предварительных убеждений о возможных параметрах, что позволяет эффективно оптимизировать поиск. В комбинации с likelihood-распределением по фичам, это позволяет генерировать эффективные итоговые параметры, которые соответствуют заданной выходной функции. Мы реализовали данную модель внутри интерактивного инструмента, который позволяет проводить интерактивный анализ входных параметров с целью поиска и визуализации тех, которые могут привести к заданной особенности вывода.
#### Результаты
Мы проверили нашу модель на трех наборах данных, каждый из которых представляет собой различный набор симуляционных моделей. Мы проводили эксперименты, используя широкую область входных параметров для каждой модели. Наше решение позволило эффективно моделировать распределение возможных параметров, которые могут привести к заданному выходу. Мы также продемонстрировали возможность нашего инструмента для проведения интерактивного анализа параметров, что позволяет пользователю быстро и эффективно идентифицировать значимые параметры с помощью визуальных инструментов.
#### Значимость
Наше решение может быть применено в различных областях
Abstract
Recently, neural surrogate models have emerged as a compelling alternative to
traditional simulation workflows. This is accomplished by modeling the
underlying function of scientific simulations, removing the need to run
expensive simulations. Beyond just mapping from input parameter to output,
surrogates have also been shown useful for inverse problems: output to input
parameters. Inverse problems can be understood as search, where we aim to find
parameters whose surrogate outputs contain a specified feature. Yet finding
these parameters can be costly, especially for high-dimensional parameter
spaces. Thus, existing surrogate-based solutions primarily focus on finding a
small set of matching parameters, in the process overlooking the broader
picture of plausible parameters. Our work aims to model and visualize the
distribution of possible input parameters that produce a given output feature.
To achieve this goal, we aim to address two challenges: (1) the approximation
error inherent in the surrogate model and (2) forming the parameter
distribution in an interactive manner. We model error via density estimation,
reporting high density only if a given parameter configuration is close to
training parameters, measured both over the input and output space. Our density
estimate is used to form a prior belief on parameters, and when combined with a
likelihood on features, gives us an efficient way to sample plausible parameter
configurations that generate a target output feature. We demonstrate the
usability of our solution through a visualization interface by performing
feature-driven parameter analysis over the input parameter space of three
simulation datasets. Source code is available at
https://github.com/matthewberger/seeing-the-many
Ссылки и действия
Дополнительные ресурсы: