Learning to accelerate distributed ADMM using graph neural networks
2509.05288v1
cs.LG, math.OC
2025-09-09
Авторы:
Henri Doerks, Paul Häusner, Daniel Hernández Escobar, Jens Sjölund
Резюме на русском
#### Контекст
Distributed optimization является ключевым инструментом в области машинного обучения и контроля в задачах, требующих обработки больших данных. Один из популярных подходов — Alternating Direction Method of Multipliers (ADMM) — привлекает внимание благодаря своим сильным свойствам сходимости и возможности распараллеливания вычислений. Однако, ADMM часто страдает от медлительной сходимости и чувствительности к выбору гиперпараметров, что затрудняет его применение в практических задачах. Этот резюме посвящен исследованию способа адаптивной адаптировать ADMM с использованием графовых нейронных сетей (GNN) для ускорения и улучшения результатов.
#### Метод
Предлагаемая методология основывается на использовании графовых нейронных сетей для оптимизации ADMM. Итерации ADMM представляются в виде message-passing framework, позволяя использовать GNN для предсказания гиперпараметров, таких как веса связей и шаги адаптации. Архитектура GNN обучается с помощью управляемых экспериментов с заданным числом итераций ADMM для оптимизации функционала ошибки. Эта модель способна учитывать структуру данных и динамический характер итераций, что позволяет улучшить качество решения и скорость сходимости.
#### Результаты
Проведенные эксперименты показали, что метод, основанный на GNN, существенно улучшает скорость сходимости и качество решений по сравнению с стандартным ADMM. Это достигается за счет точного адаптивного выбора гиперпараметров в каждой итерации. Использованные данные включили различные задачи распределенной оптимизации, такие как задачи с матричным разложением и задачи с множественными субъектами. Результаты подтверждают, что использование GNN для предсказания шагов ADMM приводит к более эффективному и устойчивому решению.
#### Значимость
Этот подход открывает широкие перспективы в применении к различным областям, таким как машинное обучение, контроль систем, информационные системы. Особенно полезен в ситуациях, когда необходимо быстрое решение задач оптимизации с распределенными данными. Преимущества включают улучшение скорости сходимости, уменьшение чувствительности к гиперпараметрам и увеличение стабильности решений. Эти достижения могут привести к более эффективному использованию ресурсов и улучшению результатов в многоузловых системах.
#### Выводы
Основные достижения этого исследования заключаются в разработке нового подхода к ускорению ADMM с использованием GNN. Доказано, что этот подход позволяет повысить качество решения и скорость сходимости в распределенных задачах. Будущие исследования будут посвящены усовершенствованию архитектуры GNN, расширению возможностей применения к различным типам задач и
Abstract
Distributed optimization is fundamental in large-scale machine learning and
control applications. Among existing methods, the Alternating Direction Method
of Multipliers (ADMM) has gained popularity due to its strong convergence
guarantees and suitability for decentralized computation. However, ADMM often
suffers from slow convergence and sensitivity to hyperparameter choices. In
this work, we show that distributed ADMM iterations can be naturally
represented within the message-passing framework of graph neural networks
(GNNs). Building on this connection, we propose to learn adaptive step sizes
and communication weights by a graph neural network that predicts the
hyperparameters based on the iterates. By unrolling ADMM for a fixed number of
iterations, we train the network parameters end-to-end to minimize the final
iterates error for a given problem class, while preserving the algorithm's
convergence properties. Numerical experiments demonstrate that our learned
variant consistently improves convergence speed and solution quality compared
to standard ADMM. The code is available at
https://github.com/paulhausner/learning-distributed-admm.
Ссылки и действия
Дополнительные ресурсы: