📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Carlos Améndola, Benjamin Hollering, Francesco Nowell
## Контекст
Максимальное линейное Байесовское сетки (Max-Linear Bayesian Network, MLBN) являются недавно развивающейся классом структурных уравнений, возникающих при использовании случайных величин с тяжеловатыми хвостами. Так как в большинстве директивных графических моделей соответствие с d-разделением не гарантируется, классические методы как PC-алгоритм или greedy equivalence search не могут точно восстанавливать истинные графы. Наше исследование посвящено изучению ограниченных конструктов для MLBN с учетом локального теста на независимость в реальном, неизвестном графе. Мы доказали, что если организовывать такой тест на основе $\ast$-сепарации, то PC-алгоритм остается консистентным, даже при добавлении дополнительных условий независимости. Также мы представили новый алгоритм, PCstar, который работает по принципу $\ast$-сепарации и позволяет исправлять граф, добавляя дополнительные рёбра.
## Метод
Методология PCstar построена на основе стандартного PC-алгоритма. Она использует локальную оценку независимости, основанную на $\ast$-сепарации вместо d-сепарации. Это позволяет алгоритму распознавать дополнительные рёбра, которые не могут быть ориентированы на основе первоначальных условий. Мы показали, что этот подход работает даже при неточном выполнении полных условий независимости в графе. Кроме того, мы разработали синтетические данные, которые помогают проверить точность алгоритма в реальных условиях.
## Результаты
Мы провели эксперименты с синтетическими данными и реальными примерами, чтобы проверить целесообразность PCstar. Данные были сгенерированы с учетом тяжеловатых хвостов, что дало нам возможность исследовать корреляции и независимости, которые встречаются в MLBN. Мы сравнили результаты с оригинальным PC-алгоритмом и обнаружили, что PCstar позволяет повысить точность восстановления графа в ситуациях, когда d-сепарация недостаточно. Наши результаты показали, что в чисто теоретическом плане PCstar обеспечивает более точное восстановление графа по сравнению с классическим PC-алгоритмом.
## Значимость
Предложенный подход может иметь широкую применяемость в области теории графов, машинного обучения и линейных сетей. Он предоставляет более точные средства для восстановления истинной структуры графа в случае, когда используется не только d-нормальность, но и $\ast$-сепарация. Это может иметь практическое значение в ситуациях, где данные имеют тяжеловатые хвосты, таких как в финансовой аналитике, биоинформатике и других областях, где важна точность восстановления структуры.
## Выводы
Мы демонстрируем, что PCstar эффективен в восстанов
Annotation:
Max-linear Bayesian networks (MLBNs) are a relatively recent class of
structural equation models which arise when the random variables involved have
heavy-tailed distributions. Unlike most directed graphical models, MLBNs are
typically not faithful to d-separation and thus classical causal discovery
algorithms such as the PC algorithm or greedy equivalence search can not be
used to accurately recover the true graph structure. In this paper, we begin
the study of constraint-based discovery algori...