Reinforcement Learning for Robust Ageing-Aware Control of Li-ion Battery Systems with Data-Driven Formal Verification

2509.04288v2 eess.SY, cs.AI, cs.SY 2025-09-09
Авторы:

Rudi Coppola, Hovsep Touloujian, Pierfrancesco Ombrini, Manuel Mazo Jr

Резюме на русском

#### Контекст Аккумуляторы литий-ионных (Li-ion) являются ключевым элементом современных технологий, широко используемых в электронных устройствах, электромобилях и системах хранения энергии. Однако их эффективная эксплуатация связана с рядом проблем. Одна из основных задач в этой области — обеспечение быстрого зарядки аккумулятора при минимальном воздействии на его процессы старения, которые приводят к уменьшению емкости. Этот конфликт требует разработки усовершенствованных Battery Management Systems (BMS), которые могут эффективно контролировать процесс зарядки, обеспечивая оптимальный баланс между производительностью и продолжительностью жизненного цикла аккумулятора. Наша мотивация заключается в разработке инновационных подходов к проектированию BMS, позволяющим решать эти проблемы с помощью машинного обучения и формальных методов. #### Метод Мы применяем метод Counterexample-Guided Inductive Synthesis (CEGIS), который сочетает Reinforcement Learning (RL) с формальными методами для построения управляющих стратегий. Алгоритм CEGIS позволяет эффективно обучать RL-контроллеры, используя данные, полученные из физической модели аккумулятора. Для получения общей стратегии мы используем моделирование связанных систем, где RL-контроллеры работают в зависимости от начальных данных о состоянии аккумулятора. Этот подход позволяет оптимизировать систему, используя RL для локальной оптимизации и формальные методы для получения гарантий на уровне системы. Технически, мы используем абстракцию данных для разделения зон работы BMS, каждая из которых связана с конкретным RL-контроллером. Это разделение обеспечивает эффективность и точность в решении задач управления. #### Результаты Мы проводим эксперименты на высокоточной физической модели Li-ion батареи. Наши результаты показывают, что RL-контроллеры, синтезированные с помощью CEGIS, эффективно регулируют процесс зарядки, минимизируя влияние на старение батареи. Мы проверяем наши решения на множестве задач зарядки с различными начальными условиями и показываем, что они обеспечивают более высокую продолжительность жизненного цикла и более быструю зарядку по сравнению с существующими методами. Абстракция, полученная формальными методами, дает нам возможность давать прогнозы о производительности системы с поддержкой статистических гарантий. #### Значимость Разработанный подход может быть применен в различных областях, включая электронные технологии, электромобили и системы хранения энергии. Он обеспечивает более высокую эффективность зарядки и более долговременную эксплуатацию аккумуляторов. Наши результа

Abstract

Rechargeable lithium-ion (Li-ion) batteries are a ubiquitous element of modern technology. In the last decades, the production and design of such batteries and their adjacent embedded charging and safety protocols, denoted by Battery Management Systems (BMS), has taken central stage. A fundamental challenge to be addressed is the trade-off between the speed of charging and the ageing behavior, resulting in the loss of capacity in the battery cell. We rely on a high-fidelity physics-based battery model and propose an approach to data-driven charging and safety protocol design. Following a Counterexample-Guided Inductive Synthesis scheme, we combine Reinforcement Learning (RL) with recent developments in data-driven formal methods to obtain a hybrid control strategy: RL is used to synthesise the individual controllers, and a data-driven abstraction guides their partitioning into a switched structure, depending on the initial output measurements of the battery. The resulting discrete selection among RL-based controllers, coupled with the continuous battery dynamics, realises a hybrid system. When a design meets the desired criteria, the abstraction provides probabilistic guarantees on the closed-loop performance of the cell.

Ссылки и действия

Связанные статьи

The Use of the Simplex Architecture to Enhance Safety in Deep-Learning-Powered A...

## Контекст В последние годы нейронные сети достигли выдающихся результатов в многих задачах, что привело к их использов...

2025-09-27

Near-Real-Time Resource Slicing for QoS Optimization in 5G O-RAN using Deep Rein...

#### Контекст Открытый Радио-Доступный Набор (O-RAN) является ключевым подходом для строительства 5G и будущих телекомм...

2025-09-20

Control Analysis and Design for Autonomous Vehicles Subject to Imperfect AI-Base...

## Контекст В последние годы автономные транспортные средства (AV) вызывают все большую популярность в связи с их потенц...

2025-09-17