Quasi-Clique Discovery via Energy Diffusion
2508.04174v1
cs.SI, cs.AI
2025-08-09
Авторы:
Yu Zhang, Yilong Luo, Mingyuan Ma, Yao Chen, Enqiang Zhu, Jin Xu, Chanjuan Liu
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Графовое майнинг — это область, которая играет ключевую роль в анализе сетей, включая социальные сети, биоинформатику и электронную коммерцию. Одним из фундаментальных задач в этой области является обнаружение квази-клики, то есть подграфов, где плотность ребер не меньше заданного порогового значения. Такие подграфы характеризуют структурную когезию и могут быть интерпретированы как группы сильно связанных элементов, что делает их применимыми в различных приложениях, от анализа социальных взаимодействий до прогнозирования взаимодействий в электронной коммерции.
Традиционные методы обнаружения квази-клик обычно основываются на жадных правилах, мерах подобия или метаэвристиках поиска. Однако эти методы сталкиваются с серьезными ограничениями. Например, они могут быть неэффективными при обработке больших и разнообразных графов, а также не всегда гарантируют согласованность решений при изменении наборов данных. Эти недостатки осложняют применение существующих решений в реальных сценариях, где необходимо обеспечить высокую производительность и качество результатов.
В связи с этим, требуется разработка новых подходов, которые могли бы обеспечить более эффективное и надежное обнаружение квази-клик в различных типах графов. Новый подход должен упростить процесс поиска без необходимости подробной настройки для конкретных наборов данных или перебора всех возможных кандидатов.
## ПРЕДЛОЖЕННЫЙ МЕТОД
В данной работе представлен новый алгоритм EDQC (Energy Diffusion for Quasi-Clique Discovery), который использует концепцию энергодиффузии для обнаружения квази-клик. Основная идея заключается в том, чтобы вместо явного перебора всех кандидатов на подграфы, проводить стохастическую диффузию энергии из исходных вершин. Эта диффузия естественно концентрирует энергию в регионах, которые являются структурно когезивными, то есть обладают высокой плотностью ребер.
Алгоритм EDQC работает следующим образом: из начальных вершин (источников) энергия распространяется по графу, при этом регионы с высокой когезией получают больше энергии за счет своей структурной природы. Этот процесс позволяет выделять потенциальные квази-клики без необходимости явного перебора всех возможных подмножеств вершин. Этот подход не только эффективен в вычислительном плане, но и устраняет необходимость в настройке алгоритма для конкретных наборов данных, что делает его более универсальным по отношению к различным типам графов.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Для оценки эффективности алгоритма EDQC проведены эксперименты на 30 реальных наборах данных, которые включают графы различного масштаба и структурной сложности. Результаты экспериментов показывают, что EDQC позволяет обнаруживать квази-клики, которые значительно больше по размеру, по сравнению с состоянием искусства базовыми методами, на большинстве из использованных наборов данных. Кроме того, EDQC демонстрирует меньшую дисперсию в качестве решений, что указывает на более стабильные и надежные результаты.
Авторы также отмечают, что EDQC является первым методом, который интегрирует концепцию энергодиффузии в задачу обнаружения квази-клик, что делает его уникальным в своем подходе.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Предложенный метод EDQC может быть применен в различных областях, где необходимо выявлять структурно когезивные подграфы. В социальных сетях, например, это может помочь выявить группы пользователей, которые активно взаимодействуют друг с другом. В биоинформатике, EDQC может быть использован для выявления сетей взаимодействия между биологическими сущностями. Для электронной коммерции, этот метод может помочь определять группы товаров или пользователей, которые сильно связаны друг с другом, что может быть полезно для рекомендаций и анализа поведения покупателей.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
В работе представлен новый алгоритм EDQC, который использует энергодиффузию для обнаружения квази-клик. EDQC демонстрирует высокую эффективность и стабильность решений на различных типах графов. Будущие исследования могут быть направлены на дальнейшее улучшение алгоритма, включая оптимизацию его производительности и применение к более сложным типам графов, таким как темпоральные и мультимодальные сети.
Abstract
Discovering quasi-cliques -- subgraphs with edge density no less than a given
threshold -- is a fundamental task in graph mining, with broad applications in
social networks, bioinformatics, and e-commerce. Existing heuristics often rely
on greedy rules, similarity measures, or metaheuristic search, but struggle to
maintain both efficiency and solution consistency across diverse graphs. This
paper introduces EDQC, a novel quasi-clique discovery algorithm inspired by
energy diffusion. Instead of explicitly enumerating candidate subgraphs, EDQC
performs stochastic energy diffusion from source vertices, naturally
concentrating energy within structurally cohesive regions. The approach enables
efficient dense subgraph discovery without exhaustive search or
dataset-specific tuning. Experimental results on 30 real-world datasets
demonstrate that EDQC consistently discovers larger quasi-cliques than
state-of-the-art baselines on the majority of datasets, while also yielding
lower variance in solution quality. To the best of our knowledge, EDQC is the
first method to incorporate energy diffusion into quasi-clique discovery.
Ссылки и действия
Дополнительные ресурсы: