Faster Inference of Cell Complexes from Flows via Matrix Factorization

2508.21372v1 cs.SI, cs.LG, eess.SP 2025-09-02
Авторы:

Til Spreuer, Josef Hoppe, Michael T. Schaub

Резюме на русском

#### Контекст В этом исследовании адресуется вопрос о выводе информации о ячейках из данных потоков на графах. Графы широко используются для моделирования систем, где существуют связи между компонентами, но не все компоненты могут быть строго определены в пространственном плане. Чтобы расширить модель, необходимо ввести дополнительные структуры, такие как 2-ячейки (полигоны, образуемые замкнутыми ненакрывающимися путями). Цель состоит в том, чтобы создать такую модель, чтобы представленные потоки могли быть адекватно описаны с помощью градиентных и крылатых потоков внутри созданных ячеек. Это позволяет повысить точность и интерпретируемость моделирования сложных систем. #### Метод Методология алгоритма основывается на методе матричного факторирования. Основной идеей является представить граф как ячейку, содержащую слои, которые могут быть представлены градиентным и крылатым потоком. Алгоритм использует матрицу, соответствующую графу, и строит новую матрицу, представляющую ячейки. Основное решение заключается в нахождении минимальных по норме факторов матрицы, которые соответствуют градиентным и крылатым потокам. Этот подход позволяет эффективно находить ячейки, которые могут быть добавлены к графу для лучшего представления потоков. #### Результаты Для проверки эффективности нового подхода проводились вычислительные эксперименты с разными количеством данных потоков и разным уровнем шума. Наборы данных были получены из реальных задач моделирования. Эксперименты показали, что новый метод работает значительно быстрее существующих алгоритмов, при этом делая только незначительные компромиссы в точности решения. Также было выявлено, что в шумных условиях новый алгоритм демонстрирует лучшую точность и быстродействие по сравнению с предыдущими подходами. #### Значимость Этот подход может быть применен в различных областях, где необходимо моделировать сложные системы, включая телекоммуникации, электронные системы и живые организмы. Он позволяет повысить точность моделей, уменьшить время расчета и повысить интерпретируемость результатов. Благодаря более быстрому и эффективному выводу ячеек, этот метод может стать ключевым инструментом в проектировании и анализе сложных систем, особенно в условиях высокой шумовой загрязненности. #### Выводы Новый метод оказался эффективным для решения проблемы вывода ячеек из потоков на графах, показав существенные выигрыши в скорости и частично в точности по сравнению с предыдущими подходами. Будущие исследовани

Abstract

We consider the following inference problem: Given a set of edge-flow signals observed on a graph, lift the graph to a cell complex, such that the observed edge-flow signals can be represented as a sparse combination of gradient and curl flows on the cell complex. Specifically, we aim to augment the observed graph by a set of 2-cells (polygons encircled by closed, non-intersecting paths), such that the eigenvectors of the Hodge Laplacian of the associated cell complex provide a sparse, interpretable representation of the observed edge flows on the graph. As it has been shown that the general problem is NP-hard in prior work, we here develop a novel matrix-factorization-based heuristic to solve the problem. Using computational experiments, we demonstrate that our new approach is significantly less computationally expensive than prior heuristics, while achieving only marginally worse performance in most settings. In fact, we find that for specifically noisy settings, our new approach outperforms the previous state of the art in both solution quality and computational speed.

Ссылки и действия