Reinforcement Learning for Robust Ageing-Aware Control of Li-ion Battery Systems with Data-Driven Formal Verification
2509.04288v2
eess.SY, cs.AI, cs.SY
2025-09-09
Авторы:
Rudi Coppola, Hovsep Touloujian, Pierfrancesco Ombrini, Manuel Mazo Jr
Резюме на русском
#### Контекст
Аккумуляторы литий-ионных (Li-ion) являются ключевым элементом современных технологий, широко используемых в электронных устройствах, электромобилях и системах хранения энергии. Однако их эффективная эксплуатация связана с рядом проблем. Одна из основных задач в этой области — обеспечение быстрого зарядки аккумулятора при минимальном воздействии на его процессы старения, которые приводят к уменьшению емкости. Этот конфликт требует разработки усовершенствованных Battery Management Systems (BMS), которые могут эффективно контролировать процесс зарядки, обеспечивая оптимальный баланс между производительностью и продолжительностью жизненного цикла аккумулятора. Наша мотивация заключается в разработке инновационных подходов к проектированию BMS, позволяющим решать эти проблемы с помощью машинного обучения и формальных методов.
#### Метод
Мы применяем метод Counterexample-Guided Inductive Synthesis (CEGIS), который сочетает Reinforcement Learning (RL) с формальными методами для построения управляющих стратегий. Алгоритм CEGIS позволяет эффективно обучать RL-контроллеры, используя данные, полученные из физической модели аккумулятора. Для получения общей стратегии мы используем моделирование связанных систем, где RL-контроллеры работают в зависимости от начальных данных о состоянии аккумулятора. Этот подход позволяет оптимизировать систему, используя RL для локальной оптимизации и формальные методы для получения гарантий на уровне системы. Технически, мы используем абстракцию данных для разделения зон работы BMS, каждая из которых связана с конкретным RL-контроллером. Это разделение обеспечивает эффективность и точность в решении задач управления.
#### Результаты
Мы проводим эксперименты на высокоточной физической модели Li-ion батареи. Наши результаты показывают, что RL-контроллеры, синтезированные с помощью CEGIS, эффективно регулируют процесс зарядки, минимизируя влияние на старение батареи. Мы проверяем наши решения на множестве задач зарядки с различными начальными условиями и показываем, что они обеспечивают более высокую продолжительность жизненного цикла и более быструю зарядку по сравнению с существующими методами. Абстракция, полученная формальными методами, дает нам возможность давать прогнозы о производительности системы с поддержкой статистических гарантий.
#### Значимость
Разработанный подход может быть применен в различных областях, включая электронные технологии, электромобили и системы хранения энергии. Он обеспечивает более высокую эффективность зарядки и более долговременную эксплуатацию аккумуляторов. Наши результа
Abstract
Rechargeable lithium-ion (Li-ion) batteries are a ubiquitous element of
modern technology. In the last decades, the production and design of such
batteries and their adjacent embedded charging and safety protocols, denoted by
Battery Management Systems (BMS), has taken central stage. A fundamental
challenge to be addressed is the trade-off between the speed of charging and
the ageing behavior, resulting in the loss of capacity in the battery cell. We
rely on a high-fidelity physics-based battery model and propose an approach to
data-driven charging and safety protocol design. Following a
Counterexample-Guided Inductive Synthesis scheme, we combine Reinforcement
Learning (RL) with recent developments in data-driven formal methods to obtain
a hybrid control strategy: RL is used to synthesise the individual controllers,
and a data-driven abstraction guides their partitioning into a switched
structure, depending on the initial output measurements of the battery. The
resulting discrete selection among RL-based controllers, coupled with the
continuous battery dynamics, realises a hybrid system. When a design meets the
desired criteria, the abstraction provides probabilistic guarantees on the
closed-loop performance of the cell.
Ссылки и действия
Дополнительные ресурсы: