Scalable Fairness Shaping with LLM-Guided Multi-Agent Reinforcement Learning for Peer-to-Peer Electricity Markets
2508.18610v1
eess.SY, cs.LG, cs.SY
2025-08-28
Авторы:
Shrenik Jadhav, Birva Sevak, Srijita Das, Akhtar Hussain, Wencong Su, Van-Hai Bui
Резюме на русском
#### Контекст
Повсеместное распространение ротационных солнечных панелей и устройств управления домашним энергопотреблением делает торговлю электричеством тиражированным (P2P) центральной частью современных систем распределения энергии. Однако большинство существующих моделей и алгоритмов рынков электричества и методов оптимизации рассматриваются с целью максимизировать эффективность или прибыль, не обеспечивая во время реальных операций решения, которые обеспечивают справедливость. Особенно это актуально в условиях неопределенности, когда неравенство может существенно усилиться. Для противостояния этой проблеме предлагается новый подход, основанный на многоагентной мультиагентной оптимизации, который использует критическую роль большой модели языка (LLM) для руководства поведением участников в рынке P2P.
#### Метод
Предлагаемый подход, FairMarket-RL, основывается на мультиагентной оптимизации, в которой каждый участник рынка выступает в роли агента. Большая модель языка (LLM) используется в качестве критика, который оценивает возможные действия и создает гибкое руководство по поведению. В рамках каждого торгового слота, агенты осуществляют дискретные действия, такие как изменение цены и количества, в рамках двойного аукциона. Оценки справедливости, включающие в себя Grid Fairness (FTG), Between-Sellers Fairness (FBS) и Pricing Fairness (FPP), включены в целевую функцию в виде коэффициентов, которые гармонизируют экономические и социальные цели. Эта система включает запасные ресурсы, предназначенные для оптимизации долгосрочных целей.
#### Результаты
В экспериментах был продемонстрирован переход от локального рынка до создания широкомасштабного симулированного общества. Был применен реальный датасет, включающий различные активы, и показано, что FairMarket-RL увеличивает процент P2P-торгового обмена, снижает затраты для потребителей по сравнению с традиционным подключением к сети, обеспечивает справедливость во взаимодействии между участниками и сохраняет возможность прибыли для участников. Эксперименты показали, что фреймворк достигает сбалансированного соотношения между экономическими мотивами и социальными ценностями.
#### Значимость
Предлагаемый подход имеет широкие приложения в сфере управления энергией, включая распределенные системы энергетического управления, P2P-биржи электричества и управление локальными сетями. Он обеспечивает высокую экономическую эффективность, при этом не менее важным является уравновешивание социальных и финансовых мотивов. В долгосрочной перспективе, FairMarket-RL может стать моделью для создания скейли
Abstract
Peer-to-peer (P2P) energy trading is becoming central to modern distribution
systems as rooftop PV and home energy management systems become pervasive, yet
most existing market and reinforcement learning designs emphasize efficiency or
private profit and offer little real-time guidance to ensure equitable outcomes
under uncertainty. To address this gap, a fairness-aware multiagent
reinforcement learning framework, FairMarket-RL, is proposed in which a large
language model (LLM) critic shapes bidding policies within a continuous double
auction under partial observability and discrete price-quantity actions. After
each trading slot, the LLM returns normalized fairness scores Fairness-to-Grid
(FTG), Fairness-Between-Sellers (FBS), and Fairness-of-Pricing (FPP) that are
integrated into the reward via ramped coefficients and tunable scaling, so that
fairness guidance complements, rather than overwhelms, economic incentives. The
environment models realistic residential load and PV profiles and enforce hard
constraints on prices, physical feasibility, and policy-update stability.
Across a progression of experiments from a small pilot to a larger simulated
community and a mixed-asset real-world dataset, the framework shifts exchanges
toward local P2P trades, lowers consumer costs relative to grid-only
procurement, sustains strong fairness across participants, and preserves
utility viability. Sensitivity analyses over solar availability and aggregate
demand further indicate robust performance, suggesting a scalable, LLM-guided
pathway to decentralized electricity markets that are economically efficient,
socially equitable, and technically sound.
Ссылки и действия
Дополнительные ресурсы: