📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 LILAD: Learning In-context Lyapunov-stable Adaptive Dynamics Models

2025-12-01

Авторы:

Amit Jena, Na Li, Le Xie

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

System identification in control theory aims to approximate dynamical systems from trajectory data. While neural networks have demonstrated strong predictive accuracy, they often fail to preserve critical physical properties such as stability and typically assume stationary dynamics, limiting their applicability under distribution shifts. Existing approaches generally address either stability or adaptability in isolation, lacking a unified framework that ensures both. We propose LILAD (Learning ...

ID: 2511.21846v1 eess.SY, cs.AI, cs.LG

arXiv PDF

📄 Deep Koopman Economic Model Predictive Control of a Pasteurisation Unit

2025-11-08

Авторы:

Patrik Valábek, Michaela Horváthová, Martin Klaučo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This paper presents a deep Koopman-based Economic Model Predictive Control (EMPC) for efficient operation of a laboratory-scale pasteurization unit (PU). The method uses Koopman operator theory to transform the complex, nonlinear system dynamics into a linear representation, enabling the application of convex optimization while representing the complex PU accurately. The deep Koopman model utilizes neural networks to learn the linear dynamics from experimental data, achieving a 45% improvement i...

ID: 2511.04437v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 Deep Dictionary-Free Method for Identifying Linear Model of Nonlinear System with Input Delay

2025-11-08

Авторы:

Patrik Valábek, Marek Wadinger, Michal Kvasnica, Martin Klaučo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Nonlinear dynamical systems with input delays pose significant challenges for prediction, estimation, and control due to their inherent complexity and the impact of delays on system behavior. Traditional linear control techniques often fail in these contexts, necessitating innovative approaches. This paper introduces a novel approach to approximate the Koopman operator using an LSTM-enhanced Deep Koopman model, enabling linear representations of nonlinear systems with time delays. By incorporati...

ID: 2511.04451v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 TubeDAgger: Reducing the Number of Expert Interventions with Stochastic Reach-Tubes

2025-10-04

Авторы:

Julian Lemmel, Manuel Kranzl, Adam Lamine, Philipp Neubauer, Radu Grosu, Sophie A. Neubauer

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Interactive Imitation Learning deals with training a novice policy from expert demonstrations in an online fashion. The established DAgger algorithm trains a robust novice policy by alternating between interacting with the environment and retraining of the network. Many variants thereof exist, that differ in the method of discerning whether to allow the novice to act or return control to the expert. We propose the use of stochastic reachtubes - common in verification of dynamical systems - as a ...

ID: 2510.00906v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 Synergies between Federated Foundation Models and Smart Power Grids

2025-09-24

Авторы:

Seyyedali Hosseinalipour, Shimiao Li, Adedoyin Inaolaji, Filippo Malandra, Luis Herrera, Nicholas Mastronarde

## Контекст Появление больших языковых моделей (LLMs), таких как GPT-3, проявило важное парадигменное переложение в машинном обучении. Обученные на огромных корпусах данных, они достигли выдающихся результатов в области языкового понимания, генерирования текста, сводки информации и логического рассуждения. Это полностью изменило способ обработки и взаимодействия с человеческим языком. Однако, несмотря на свою недавний первобытность, этот направление уже приобретает новое развитие в виде моделей, обладающих более общими характеристиками. Многомерные, многозадачные фондаментальные модели (M3T FMs) представляют собой новый класс систем, которые могут обрабатывать широкий спектр типов данных, включая временные ряды, аудио, изображения, табличные данные и неструктурированные журналы. Эти модели также бывают независимыми от задачи и могут выполнять такие задачи, как прогнозирование, классификация, управление и поиск. Когда эти модели интегрируются с федеративным обучением (FL), они образуют класс новых моделей, называемых M3T Federated Foundation Models (FedFMs). Это высоконаучная и еще низкая изученная область, предлагающая возможность строить высокоэффективные модели, обучаемые в распределенной среде с сохранением приватности данных. В данной работе мы привносим новый взгляд на развитие этих моделей, сфокусировавшись на их применении в области управления энергосистемами. ## Метод Методология разработки FedFMs включает в себя несколько ключевых элементов. Вначале, на модели применяется метод федеративного обучения, позволяющий обучать модель на данных, распределенных по независимым узлам, не требуя централизованного доступа к информации. Это гарантирует высокую защиту приватности данных и уменьшает риск несанкционированного доступа. Далее, FedFMs обучаются на многомерных данных, включая временные ряды, изображения, табличные данные и другие типы данных, которые могут возникать в системе управления энергосистемами. Архитектура FedFMs основана на технологиях глубокого обучения, начиная с моделей типа Transformer, и заканчивая сложными архитектурами, поддерживающими многозадачность и многомодальность. Такие модели созданы для того, чтобы обеспечивать высокую точность в задачах, таких как прогнозирование теплового запроса, детекция аномалий и управление тепловым энергопотоком. Также, FedFMs включают в себя разработку методов для оптимизации обучения, включая снижение вычислительных затрат и повышение скорости обучения. ## Результаты Для проверки моделей FedFMs, мы провели ряд экспериментов в среде управления энергосистемами. Мы использовали реа

Annotation:

The recent emergence of large language models (LLMs) such as GPT-3 has marked a significant paradigm shift in machine learning. Trained on massive corpora of data, these models demonstrate remarkable capabilities in language understanding, generation, summarization, and reasoning, transforming how intelligent systems process and interact with human language. Although LLMs may still seem like a recent breakthrough, the field is already witnessing the rise of a new and more general category: multi...

ID: 2509.16496v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 Factor Graph Optimization for Leak Localization in Water Distribution Networks

2025-09-17

Авторы:

Paul Irofti, Luis Romero-Ben, Florin Stoican, Vicenç Puig

## Контекст Водоснабжение городов и регионов — ключевая инфраструктурная система, требующая постоянного мониторинга и управления. Одной из самых критических проблем в таких системах является обнаружение и локализация утечек воды. Утечки приводят к потере ресурсов, негативно сказываются на экологии и могут привести к экономическим потерям. Несмотря на существующие методы локализации утечек, такие как методы линейной и нелинейной интерполяции, они часто лишаются точности в условиях реальных сетей и имеют ограниченную способность объединять данные от различных датчиков. Мотивация для настоящего исследования заключается в разработке эффективного, высокоточного и универсального подхода к локализации утечек, использующему новые методы оптимизации. ## Метод Предлагаемый подход основывается на факторной оптимизации графов. Основной идеей является разработка конкретных факторов, отражающих характеристики водоснабжения, таких как давление и спрос. Для локализации утечек вводится новая архитектура, состоящая из двух факторных графов: (1) граф для оценки сети в условиях отсутствия утечек и (2) граф для локализации утечек. Эта архитектура позволяет обновлять не только текущую сетевую модель, но и ее историю в прошлом. Технические решения включают интеграцию датчиков давления и спроса, а также использование оптимизационных методов для решения сложных задач локализации. ## Результаты Эксперименты проводились на данных сетей Modena, L-TOWN и синтетических сетях. Результаты показали, что факторные графы оказались значительно быстрее в вычислениях по сравнению с нелинейным гауссовским фильтром (UKF). Кроме того, факторные графы показали улучшение точности локализации утечек в сравнении с другими существующими методами. Это достигнуто благодаря совместному использованию давления и спроса, а также способности метода обновлять все состояния в сети в прошлом. Эти результаты доступны в репозитории GitHub по адресу https://github.com/pirofti/FGLL. ## Значимость Факторные графы могут быть применены в различных сценариях, включая мониторинг и управление водоснабжением, а также другие инфраструктурные системы, где необходима точная локализация неисправностей. Основное преимущество — высокая скорость и точность работы, способность обрабатывать большие объемы данных и объединять различные рабочие модели. Этот подход может существенно улучшить эффективность управления водоснабжением и снизить экономические и экологические потери. ## Выводы Настоящая ра

Annotation:

Detecting and localizing leaks in water distribution network systems is an important topic with direct environmental, economic, and social impact. Our paper is the first to explore the use of factor graph optimization techniques for leak localization in water distribution networks, enabling us to perform sensor fusion between pressure and demand sensor readings and to estimate the network's temporal and structural state evolution across all network nodes. The methodology introduces specific wate...

ID: 2509.10982v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 Reinforcement learning meets bioprocess control through behaviour cloning: Real-world deployment in an industrial photobioreactor

2025-09-10

Авторы:

Juan D. Gil, Ehecatl Antonio Del Rio Chanona, José L. Guzmán, Manuel Berenguel

#### Контекст Биопроцессы, особенно те, что проводятся в открытых фотобиореакторах (PBR), сталкиваются с большими сложностями в поддержании стабильных и оптимальных условий. Это связано с тем, что производственные системы, основанные на живых клетках, чувствительны к внешним факторам, таким как температура, освещение и водородный потенциал. Эти внешние факторы, зачастую непредсказуемы, приводят к нестабильности процесса и снижению продуктивности. Настоящая работа адресует эту проблему, предлагая инновационный подход, объединяющий методы учения по примеру (behavior cloning) и усовершенствованные методы управления с помощью усиленного обучения (reinforcement learning, RL). #### Метод Разработанная методика включает две фазы: оффлайн-обучение и онлайн-файнтюнинг. В первой фазе RL-агент обучается на основе путей, сгенерированных традиционным контроллером PID. Это позволяет агенту учиться без непосредственного взаимодействия с реальным PBR. Во второй фазе, проводимая ежедневно, RL-агент адаптируется к изменениям в процессе, используя данные, собранные за предыдущий день. Этот гибкий подход позволяет агенту корректно реагировать на ненормальные состояния и быстрые динамические изменения. Такой гибридный подход обеспечивает лучшую устойчивость и эффективность управления в открытых PBR. #### Результаты Эксперименты показали, что использование совместного подхода RL с behavior cloning приводит к существенному улучшению метрик качества регулирования. Так, Интегральная Абсолютная Ошибка (IAE) уменьшилась на 8% по сравнению с традиционным PID-контроллером и на 5% по сравнению с стандартной безразмерной RL-стратегией. Более того, уменьшился количество операционных действий (control effort), что позволило снизить расходы на эксплуатацию процесса. Эксперименты проведены в реальных условиях предприятия в течение 8 дней, подтвердив робастность и надежность предложенного подхода к реальному выполнению биопроцесса. #### Значимость Предложенный подход имеет широкие применения в сфере биотехнологий и запирательного производства. Он позволяет уменьшить расходы на эксплуатацию биопроцессов, обеспечить стабильность производственных условий и повысить производительность. Это первый пример применения методов RL в регулировании биопроцесса, что открывает новые перспективы для применения умных технологий в агробиотехнологиях. #### Выводы Результаты экспериментов подтвердили эффективность и надежность использования RL-методов в управлении биопроцессами. Будущими направлениями исследований будет исследование возможности применения этих методов

Annotation:

The inherent complexity of living cells as production units creates major challenges for maintaining stable and optimal bioprocess conditions, especially in open Photobioreactors (PBRs) exposed to fluctuating environments. To address this, we propose a Reinforcement Learning (RL) control approach, combined with Behavior Cloning (BC), for pH regulation in open PBR systems. This represents, to the best of our knowledge, the first application of an RL-based control strategy to such a nonlinear and ...

ID: 2509.06853v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF

📄 Sequence Aware SAC Control for Engine Fuel Consumption Optimization in Electrified Powertrain

2025-08-09

Авторы:

Wafeeq Jaleel, Md Ragib Rownak, Athar Hanif, Sidra Ghayour Bhatti, Qadeer Ahmed

## КОНТЕКСТ И ПРОБЛЕМАТИКА Гибридные электромобили (HEV) становятся важным элементом стратегии декарбонизации грузового транспорта, особенно в сегменте тяжелых грузовиков. Однако эффективное управление энергопотреблением в таких системах представляет собой сложную задачу, требующую одновременного учета множества переменных: текущего состояния батареи, мощностных характеристик двигателя, условий движения и продолжительности маршрута. Традиционные методы управления, основанные на правилах или оптимизации в реальном времени, часто не обеспечивают оптимальный баланс между экономией топлива и сохранением заряда батареи для длительных поездок. Проблема усложняется тем, что в серийной архитектуре HEV двигатель внутреннего сгорания (ДВС) не напрямую приводит колеса, а работает как генератор, заряжая батарею и/или питая электродвигатель. Это создает дополнительные степени свободы в управлении, но также увеличивает пространство возможных стратегий управления. Существующие подходы, включая динамическое программирование (DP), обеспечивают теоретически оптимальные решения, но требуют полного знания будущего цикла вождения и не применимы в реальных условиях. Авторы статьи выделяют ключевую проблему: большинство существующих систем управления не учитывают последовательную природу задачи и временные зависимости между решениями. Текущие методы обучения с подкреплением (RL) часто используют нейронные сети прямого распространения (FFN), которые рассматривают каждое состояние независимо, теряя важную информацию о контексте предыдущих состояний и действий. Это особенно критично для тяжелых грузовиков, где решения о включении ДВС имеют длительные последствия из-за большой инерционности системы. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения проблемы авторы предлагают новую архитектуру RL-агента на базе алгоритма Soft Actor-Critic (SAC), специально адаптированного для учета последовательной природы задачи управления энергопотоками в серийных HEV. Ключевой инновацией является интеграция механизмов памяти в обе сети актора и критика, что позволяет агенту учитывать историю состояний и действий при принятии решений. Архитектура предлагает три варианта реализации: первый использует в акторе Decision Transformer (DT) - трансформерную архитектуру, способную моделировать сложные длинные зависимости в последовательностях, и в критике - Gated Recurrent Units (GRU) для эффективного захвата среднесрочных временных паттернов. Второй вариант применяет GRU в обеих сетях, обеспечивая более компактную модель с сохранением способности к учету временных зависимостей. Третий вариант служит базовым, используя традиционные FFN-сети для сравнения эффективности. Методология включает несколько ключевых компонентов: формальную постановку задачи как процесса принятия последовательных решений в частично наблюдаемой среде, разработку специальной функции вознаграждения, балансирующей между топливной экономичностью и поддержанием заряда батареи, и механизм обучения с учетом различных начальных условий и сценариев вождения. Авторы также вводят концепцию "последовательного планирования", где агент не только реагирует на текущее состояние, но и прогнозирует последствия своих действий в контексте предполагаемого будущего цикла движения. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Экспериментальная кампания была направлена на всестороннюю оценку предложенных методов по трем ключевым критериям: эффективность топливной экономии по сравнению с теоретическим оптимумом, способность обобщаться на незнакомых циклах вождения и робастность к изменениям параметров системы. Для этого использовались три различных цикла вождения: стандартный Highway Fuel Economy Test (HFET) для базового сравнения, агрессивный US06 для проверки экстремальных условий и HHDDT cruise segment для моделирования специфических условий тяжелых грузовиков. Обучение проводилось на диверсифицированном наборе данных, включающем 5000 эпизодов с варьированием начального состояния заряда батареи (20-80%), продолжительности цикла (от 200 до 1200 секунд) и профилей мощности. Для каждого варианта архитектуры проводилось обучение с 10 различ

Annotation:

As hybrid electric vehicles (HEVs) gain traction in heavy-duty trucks, adaptive and efficient energy management is critical for reducing fuel consumption while maintaining battery charge for long operation times. We present a new reinforcement learning (RL) framework based on the Soft Actor-Critic (SAC) algorithm to optimize engine control in series HEVs. We reformulate the control task as a sequential decision-making problem and enhance SAC by incorporating Gated Recurrent Units (GRUs) and Deci...

ID: 2508.04874v1 eess.SY, cs.AI, cs.LG, cs.SY

arXiv PDF