A PC Algorithm for Max-Linear Bayesian Networks

2508.13967v1 stat.ML, cs.LG, math.CO, math.ST, stat.TH, 62H22, 14T90, 05C20, 62R01 2025-08-21
Авторы:

Carlos Améndola, Benjamin Hollering, Francesco Nowell

Резюме на русском

## Контекст Максимальное линейное Байесовское сетки (Max-Linear Bayesian Network, MLBN) являются недавно развивающейся классом структурных уравнений, возникающих при использовании случайных величин с тяжеловатыми хвостами. Так как в большинстве директивных графических моделей соответствие с d-разделением не гарантируется, классические методы как PC-алгоритм или greedy equivalence search не могут точно восстанавливать истинные графы. Наше исследование посвящено изучению ограниченных конструктов для MLBN с учетом локального теста на независимость в реальном, неизвестном графе. Мы доказали, что если организовывать такой тест на основе $\ast$-сепарации, то PC-алгоритм остается консистентным, даже при добавлении дополнительных условий независимости. Также мы представили новый алгоритм, PCstar, который работает по принципу $\ast$-сепарации и позволяет исправлять граф, добавляя дополнительные рёбра. ## Метод Методология PCstar построена на основе стандартного PC-алгоритма. Она использует локальную оценку независимости, основанную на $\ast$-сепарации вместо d-сепарации. Это позволяет алгоритму распознавать дополнительные рёбра, которые не могут быть ориентированы на основе первоначальных условий. Мы показали, что этот подход работает даже при неточном выполнении полных условий независимости в графе. Кроме того, мы разработали синтетические данные, которые помогают проверить точность алгоритма в реальных условиях. ## Результаты Мы провели эксперименты с синтетическими данными и реальными примерами, чтобы проверить целесообразность PCstar. Данные были сгенерированы с учетом тяжеловатых хвостов, что дало нам возможность исследовать корреляции и независимости, которые встречаются в MLBN. Мы сравнили результаты с оригинальным PC-алгоритмом и обнаружили, что PCstar позволяет повысить точность восстановления графа в ситуациях, когда d-сепарация недостаточно. Наши результаты показали, что в чисто теоретическом плане PCstar обеспечивает более точное восстановление графа по сравнению с классическим PC-алгоритмом. ## Значимость Предложенный подход может иметь широкую применяемость в области теории графов, машинного обучения и линейных сетей. Он предоставляет более точные средства для восстановления истинной структуры графа в случае, когда используется не только d-нормальность, но и $\ast$-сепарация. Это может иметь практическое значение в ситуациях, где данные имеют тяжеловатые хвосты, таких как в финансовой аналитике, биоинформатике и других областях, где важна точность восстановления структуры. ## Выводы Мы демонстрируем, что PCstar эффективен в восстанов

Abstract

Max-linear Bayesian networks (MLBNs) are a relatively recent class of structural equation models which arise when the random variables involved have heavy-tailed distributions. Unlike most directed graphical models, MLBNs are typically not faithful to d-separation and thus classical causal discovery algorithms such as the PC algorithm or greedy equivalence search can not be used to accurately recover the true graph structure. In this paper, we begin the study of constraint-based discovery algorithms for MLBNs given an oracle for testing conditional independence in the true, unknown graph. We show that if the oracle is given by the $\ast$-separation criteria in the true graph, then the PC algorithm remains consistent despite the presence of additional CI statements implied by $\ast$-separation. We also introduce a new causal discovery algorithm named "PCstar" which assumes faithfulness to $C^\ast$-separation and is able to orient additional edges which cannot be oriented with only d- or $\ast$-separation.

Ссылки и действия