Scalable Fairness Shaping with LLM-Guided Multi-Agent Reinforcement Learning for Peer-to-Peer Electricity Markets

2508.18610v1 eess.SY, cs.LG, cs.SY 2025-08-28
Авторы:

Shrenik Jadhav, Birva Sevak, Srijita Das, Akhtar Hussain, Wencong Su, Van-Hai Bui

Резюме на русском

#### Контекст Повсеместное распространение ротационных солнечных панелей и устройств управления домашним энергопотреблением делает торговлю электричеством тиражированным (P2P) центральной частью современных систем распределения энергии. Однако большинство существующих моделей и алгоритмов рынков электричества и методов оптимизации рассматриваются с целью максимизировать эффективность или прибыль, не обеспечивая во время реальных операций решения, которые обеспечивают справедливость. Особенно это актуально в условиях неопределенности, когда неравенство может существенно усилиться. Для противостояния этой проблеме предлагается новый подход, основанный на многоагентной мультиагентной оптимизации, который использует критическую роль большой модели языка (LLM) для руководства поведением участников в рынке P2P. #### Метод Предлагаемый подход, FairMarket-RL, основывается на мультиагентной оптимизации, в которой каждый участник рынка выступает в роли агента. Большая модель языка (LLM) используется в качестве критика, который оценивает возможные действия и создает гибкое руководство по поведению. В рамках каждого торгового слота, агенты осуществляют дискретные действия, такие как изменение цены и количества, в рамках двойного аукциона. Оценки справедливости, включающие в себя Grid Fairness (FTG), Between-Sellers Fairness (FBS) и Pricing Fairness (FPP), включены в целевую функцию в виде коэффициентов, которые гармонизируют экономические и социальные цели. Эта система включает запасные ресурсы, предназначенные для оптимизации долгосрочных целей. #### Результаты В экспериментах был продемонстрирован переход от локального рынка до создания широкомасштабного симулированного общества. Был применен реальный датасет, включающий различные активы, и показано, что FairMarket-RL увеличивает процент P2P-торгового обмена, снижает затраты для потребителей по сравнению с традиционным подключением к сети, обеспечивает справедливость во взаимодействии между участниками и сохраняет возможность прибыли для участников. Эксперименты показали, что фреймворк достигает сбалансированного соотношения между экономическими мотивами и социальными ценностями. #### Значимость Предлагаемый подход имеет широкие приложения в сфере управления энергией, включая распределенные системы энергетического управления, P2P-биржи электричества и управление локальными сетями. Он обеспечивает высокую экономическую эффективность, при этом не менее важным является уравновешивание социальных и финансовых мотивов. В долгосрочной перспективе, FairMarket-RL может стать моделью для создания скейли

Abstract

Peer-to-peer (P2P) energy trading is becoming central to modern distribution systems as rooftop PV and home energy management systems become pervasive, yet most existing market and reinforcement learning designs emphasize efficiency or private profit and offer little real-time guidance to ensure equitable outcomes under uncertainty. To address this gap, a fairness-aware multiagent reinforcement learning framework, FairMarket-RL, is proposed in which a large language model (LLM) critic shapes bidding policies within a continuous double auction under partial observability and discrete price-quantity actions. After each trading slot, the LLM returns normalized fairness scores Fairness-to-Grid (FTG), Fairness-Between-Sellers (FBS), and Fairness-of-Pricing (FPP) that are integrated into the reward via ramped coefficients and tunable scaling, so that fairness guidance complements, rather than overwhelms, economic incentives. The environment models realistic residential load and PV profiles and enforce hard constraints on prices, physical feasibility, and policy-update stability. Across a progression of experiments from a small pilot to a larger simulated community and a mixed-asset real-world dataset, the framework shifts exchanges toward local P2P trades, lowers consumer costs relative to grid-only procurement, sustains strong fairness across participants, and preserves utility viability. Sensitivity analyses over solar availability and aggregate demand further indicate robust performance, suggesting a scalable, LLM-guided pathway to decentralized electricity markets that are economically efficient, socially equitable, and technically sound.

Ссылки и действия