Testing for correlation between network structure and high-dimensional node covariates
2509.03772v1
stat.ML, cs.LG, math.ST, stat.TH
2025-09-06
Авторы:
Alexander Fuchs-Kreiss, Keith Levin
Резюме на русском
## Контекст
Во многих приложениях сети объединяются с характеристиками узлов, называемыми узловыми ковариатами. Одной из основных задач в этой области является оценка степени корреляции узловых ковариатов со структурой сети. Эта проблема возникает в различных областях, таких как социальные сети, биология, экономика и технические системы. Оценка такой корреляции помогает понять, как особенности узлов влияют на структуру сети и наоборот, что имеет решающее значение для понимания динамики сетей и предсказания их поведения. Несмотря на важность этой задачи, её решение становится сложнее при большом размере узлов и высокомерных ковариатов. Настоящая работа предлагает новые методы для эффективного и точного решения этой задачи.
## Метод
Мы предлагаем четыре новых подхода для тестирования корреляции между узловыми ковариатами и структурой сети. Два из них основываются на линейной модели, которая устанавливает связь между узловыми ковариатами и некоторыми латентными переменными, определяющими структуру сети. Другие два подходы основываются на классической методике тестирования зависимости — анализе канонической корреляции (Canonical Correlation Analysis, CCA). CCA позволяет выявить сильные корреляции между двумя наборами переменных, в нашем случае — узловыми ковариатами и структурой сети, без необходимости использовать линейные модели. Кроме того, мы предоставляем теоретические гарантии того, что наши методы эффективны и точны для сетей, генерируемых низкоранговой моделью латентного пространства, в которой узлы имеют высокомерные ковариаты. Методы, предложенные в нашей работе, значительно экономнее и гибче, чем предыдущие подходы.
## Результаты
Мы проводили многочисленные эксперименты с использованием обогащенных симуляционных данных и реальных сетей, таких как сети социальных связей и биологические сети. Наши методы показали высокую точность в определении зависимости между узловыми ковариатами и структурой сети, особенно в случаях, когда латентное пространство имеет низкую размерность. Мы также сравнили нашу методику с другими подходами и показали, что она значительно эффективнее в терминах вычислительных затрат и производительности. Эксперименты подтвердили, что наши методы могут быть применены к сетям с высокомерными узловыми ковариатами, что является важной находкой в сетевых исследованиях.
## Значимость
Наши методы могут быть применены в различных приложениях, где важно понять, как узловые особенности влияют на структуру сети. Например, в социальных сетях, это может помочь определить, как характеристики пользователей влияют на то, как они связа
Abstract
In many application domains, networks are observed with node-level features.
In such settings, a common problem is to assess whether or not nodal covariates
are correlated with the network structure itself. Here, we present four novel
methods for addressing this problem. Two of these are based on a linear model
relating node-level covariates to latent node-level variables that drive
network structure. The other two are based on applying canonical correlation
analysis to the node features and network structure, avoiding the linear
modeling assumptions. We provide theoretical guarantees for all four methods
when the observed network is generated according to a low-rank latent space
model endowed with node-level covariates, which we allow to be
high-dimensional. Our methods are computationally cheaper and require fewer
modeling assumptions than previous approaches to network dependency testing. We
demonstrate and compare the performance of our novel methods on both simulated
and real-world data.