Reinforcement Learning for Robust Ageing-Aware Control of Li-ion Battery Systems with Data-Driven Formal Verification
2509.04288v1
eess.SY, cs.AI, cs.SY
2025-09-06
Авторы:
Rudi Coppola, Hovsep Touloujian, Pierfrancesco Ombrini, Manuel Mazo Jr
Резюме на русском
## Контекст
Управление мощными аккумуляторными батареями Li-ion является ключевым элементом современных технологий, включая электромобили, хранилища энергии и мобильные устройства. Однако их эффективное использование связано с рядом проблем, в том числе сбалансированной зарядки и минимизацией затрат на ресурс. Эти проблемы связаны с тем, что зарядка Li-ion аккумуляторов может привести к их снижению в продолжительности жизни. Обычной практикой является использование традиционных физических моделей и аналитических методов для управления батареями. Однако эти методы часто ограничиваются в единичной точке или линейных предположениях, что недостаточно эффективно. Мы предлагаем расширенную модель, основанную на Reinforcement Learning (RL), которая нацелена на улучшение управления в широком диапазоне условий работы.
## Метод
Мы разрабатываем метод, который сочетает RL с data-driven formal verification (DDFV). Для этого мы разрабатываем новую архитектуру, в которой RL используется для синтеза элементов управления, а DDFV используется для поиска противоречий. Мы разрабатываем высокоточную физическую модель Li-ion батареи, используя аппроксимацию на основе нейронных сетей. Для управления зарядкой мы развиваем структуру switched control, где каждый регулятор RL выбирается в зависимости от положения заряда и температуры батареи. Решение получается с помощью схемы Counterexample-Guided Inductive Synthesis (CEGIS), которая обеспечивает проверку показателей заданных критериев.
## Результаты
Мы проводим эксперименты с использованием реальных данных заряда/разряда Li-ion батарей. Мы проверяем модель на различных сценариях заряда, включая различные температуры и состояния заряда. Мы показываем, что наше решение превышает существующие методы в скорости заряда, сохраняя при этом ресурс батареи. Мы получаем проверку на защиту от износа, которая позволяет увеличить продолжительность жизни батареи. Наши наблюдения показывают, что RL-модели превосходят обычные методы в тех областях, где потребность в скорости и надежности обеспечения ресурса критична.
## Значимость
Решение, предложенное в этой статье, имеет широкие приложения в развитии энергосберегающих систем, электромобилей и мобильных устройств. Оно обеспечивает увеличение продолжительности жизни аккумуляторов и эффективность их использования. Наш метод также может быть применен в области технологий безопасности, где важны достоверные абстракции и проверки. Мы также показываем, что наше решение может иметь более широкое применение в том числе в технологиях, где нужно удовлетворять критериим уровня доверия и прогностической модели.
## В
Abstract
Rechargeable lithium-ion (Li-ion) batteries are a ubiquitous element of
modern technology. In the last decades, the production and design of such
batteries and their adjacent embedded charging and safety protocols, denoted by
Battery Management Systems (BMS), has taken central stage. A fundamental
challenge to be addressed is the trade-off between the speed of charging and
the ageing behavior, resulting in the loss of capacity in the battery cell. We
rely on a high-fidelity physics-based battery model and propose an approach to
data-driven charging and safety protocol design. Following a
Counterexample-Guided Inductive Synthesis scheme, we combine Reinforcement
Learning (RL) with recent developments in data-driven formal methods to obtain
a hybrid control strategy: RL is used to synthesise the individual controllers,
and a data-driven abstraction guides their partitioning into a switched
structure, depending on the initial output measurements of the battery. The
resulting discrete selection among RL-based controllers, coupled with the
continuous battery dynamics, realises a hybrid system. When a design meets the
desired criteria, the abstraction provides probabilistic guarantees on the
closed-loop performance of the cell.
Ссылки и действия
Дополнительные ресурсы: