Asynchronous Gossip Algorithms for Rank-Based Statistical Methods
2509.07543v1
stat.ML, cs.LG
2025-09-11
Авторы:
Anna Van Elst, Igor Colin, Stephan Clémençon
Резюме на русском
## Контекст
В последние годы рост децентрализованных сетей и развитие ИИ на границах (edge intelligence) привело к возникновению критических проблем, связанных со стабильностью и доверительностью в распределенных системах. Использование простых статистических мер, таких как среднее или суммарное значение, делает такие системы уязвимыми к повреждению данных, в том числе злонамеренным воздействием. Необходимость развития более надежных методов вызвана ростом требований к защите от выбросов и атак.
В результате, акцент сделан на развитии статистических методов, основанных на рангировании, таких как ранговые тестове и L-статистики, известные своей устойчивостью к выбросам. Однако, применение этих методов в распределенных сетях, где узлы обмениваются данными асинхронно, остается практически нераскрытым. Это мотивирует нашу работу над разработкой асинхронных голосований для вычисления ранговых статистик.
## Метод
Мы разработали асинхронные голосования для вычисления ранговых статистик, включая L-статистики и ранговые тесты. Наша методика основана на методологии голосований, где узлы обмениваются своими ранговыми значениями, используя локальные вычисления. Для гарантии точности и сходимости, мы использовали технику регуляризации и адаптивного удаления выбросов.
Главным инновационным элементом является наша реализация асинхронного протокола, который позволяет узлам обмениваться информацией независимо от синхронности в сети. Это значительно увеличивает устойчивость к дефекту в сети и делает алгоритмы более гибкими в различных условиях.
## Результаты
Мы провели эксперименты на различных сетевых топологиях, включая звездообразную, цепочечную и случайную топологии. Наши результаты показали, что асинхронное голосование позволяет достичь точности, сопоставимой с синхронным подходом, при этом значительно сокращая время обмена данными. Мы также получили первые результаты по сходимости асинхронных голосований для вычисления ранговых статистик, в том числе для Wilcoxon rank-sum теста.
## Значимость
Наша работа имеет значительное значение для развития децентрализованных систем AI и edge intelligence. Мы предлагаем методы, которые могут быть использованы в области статистики, тестирования гипотез, и робастной обработке данных. Наш подход широко применим в ситуациях, где необходима надежность в распределенных сетях, присутствие подрывных данных или атак.
## Выводы
Мы разработали эффективный асинхронный подход для вычисления ранговых статистик, обеспечивающий высокую точность и устойчивость в распределенных сетях. Наши результаты открывают новые
Abstract
As decentralized AI and edge intelligence become increasingly prevalent,
ensuring robustness and trustworthiness in such distributed settings has become
a critical issue-especially in the presence of corrupted or adversarial data.
Traditional decentralized algorithms are vulnerable to data contamination as
they typically rely on simple statistics (e.g., means or sum), motivating the
need for more robust statistics. In line with recent work on decentralized
estimation of trimmed means and ranks, we develop gossip algorithms for
computing a broad class of rank-based statistics, including L-statistics and
rank statistics-both known for their robustness to outliers. We apply our
method to perform robust distributed two-sample hypothesis testing, introducing
the first gossip algorithm for Wilcoxon rank-sum tests. We provide rigorous
convergence guarantees, including the first convergence rate bound for
asynchronous gossip-based rank estimation. We empirically validate our
theoretical results through experiments on diverse network topologies.
Ссылки и действия
Дополнительные ресурсы: