Learning to accelerate distributed ADMM using graph neural networks

2509.05288v1 cs.LG, math.OC 2025-09-09

Авторы:

Henri Doerks, Paul Häusner, Daniel Hernández Escobar, Jens Sjölund

Резюме на русском

#### Контекст Distributed optimization является ключевым инструментом в области машинного обучения и контроля в задачах, требующих обработки больших данных. Один из популярных подходов — Alternating Direction Method of Multipliers (ADMM) — привлекает внимание благодаря своим сильным свойствам сходимости и возможности распараллеливания вычислений. Однако, ADMM часто страдает от медлительной сходимости и чувствительности к выбору гиперпараметров, что затрудняет его применение в практических задачах. Этот резюме посвящен исследованию способа адаптивной адаптировать ADMM с использованием графовых нейронных сетей (GNN) для ускорения и улучшения результатов. #### Метод Предлагаемая методология основывается на использовании графовых нейронных сетей для оптимизации ADMM. Итерации ADMM представляются в виде message-passing framework, позволяя использовать GNN для предсказания гиперпараметров, таких как веса связей и шаги адаптации. Архитектура GNN обучается с помощью управляемых экспериментов с заданным числом итераций ADMM для оптимизации функционала ошибки. Эта модель способна учитывать структуру данных и динамический характер итераций, что позволяет улучшить качество решения и скорость сходимости. #### Результаты Проведенные эксперименты показали, что метод, основанный на GNN, существенно улучшает скорость сходимости и качество решений по сравнению с стандартным ADMM. Это достигается за счет точного адаптивного выбора гиперпараметров в каждой итерации. Использованные данные включили различные задачи распределенной оптимизации, такие как задачи с матричным разложением и задачи с множественными субъектами. Результаты подтверждают, что использование GNN для предсказания шагов ADMM приводит к более эффективному и устойчивому решению. #### Значимость Этот подход открывает широкие перспективы в применении к различным областям, таким как машинное обучение, контроль систем, информационные системы. Особенно полезен в ситуациях, когда необходимо быстрое решение задач оптимизации с распределенными данными. Преимущества включают улучшение скорости сходимости, уменьшение чувствительности к гиперпараметрам и увеличение стабильности решений. Эти достижения могут привести к более эффективному использованию ресурсов и улучшению результатов в многоузловых системах. #### Выводы Основные достижения этого исследования заключаются в разработке нового подхода к ускорению ADMM с использованием GNN. Доказано, что этот подход позволяет повысить качество решения и скорость сходимости в распределенных задачах. Будущие исследования будут посвящены усовершенствованию архитектуры GNN, расширению возможностей применения к различным типам задач и

Abstract

Distributed optimization is fundamental in large-scale machine learning and control applications. Among existing methods, the Alternating Direction Method of Multipliers (ADMM) has gained popularity due to its strong convergence guarantees and suitability for decentralized computation. However, ADMM often suffers from slow convergence and sensitivity to hyperparameter choices. In this work, we show that distributed ADMM iterations can be naturally represented within the message-passing framework of graph neural networks (GNNs). Building on this connection, we propose to learn adaptive step sizes and communication weights by a graph neural network that predicts the hyperparameters based on the iterates. By unrolling ADMM for a fixed number of iterations, we train the network parameters end-to-end to minimize the final iterates error for a given problem class, while preserving the algorithm's convergence properties. Numerical experiments demonstrate that our learned variant consistently improves convergence speed and solution quality compared to standard ADMM. The code is available at https://github.com/paulhausner/learning-distributed-admm.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Learning to accelerate distributed ADMM using graph neural networks

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Convergence for Discrete Parameter Updates

The Geometry of Intelligence: Deterministic Functional Topology as a Foundation ...

Beyond Scaffold: A Unified Spatio-Temporal Gradient Tracking Method

Risk-Sensitive Q-Learning in Continuous Time with Application to Dynamic Portfol...

ARM-Explainer -- Explaining and improving graph neural network predictions for t...

Навигация