📚 Саммари научных статей из arXiv

Найдено 40 результатов по запросу 'eess.SY, cs.LG, cs.SY' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 BERT4beam: Large AI Model Enabled Generalized Beamforming Optimization

2025-09-17

Авторы:

Yuhang Li, Yang Lu, Wei Chen, Bo Ai, Zhiguo Ding, Dusit Niyato

#### Контекст Искусственный интеллект (AI) предполагается стать ключевым двигателем для шестого поколения (6G) беспроводных систем коммуникации. Однако до сих пор большинство исследований в области AI для беспроводных систем фокусируются на тонком настройке предобученных больших языковых моделей (LLMs) для конкретных задач. Это ограничивает их общеуниверсальность и применимость к различным ситуациям. В частности, проблема оптимизации биконным выпуклым декомпаратором (beamforming) в беспроводных системах остается относительно нетронутой в этом контексте. Необходимо развить универсальные AI-модели, которые могли бы эффективно адаптироваться к различным системным целям и масштабам. #### Метод Мы предлагаем новую архитектуру для оптимизации биконного выпуклого декомпаратора, основанную на бидректорном преобразователе векторов (BERT). Модель, названная BERT4beam, формулирует задачу оптимизации биконного декомпаратора как задачу последовательной обработки токенов. Мы проводим токенизацию входных данных, в частности, сигналов состояния канала (channel state information, CSI), и построение модели BERT. Для решения специфичных задач применяются задачи предварительного обучения (pre-training) и дообучение (fine-tuning). Модель разработана с учетом гибкости и может быть применена в различных системных условиях, включая разные конфигурации антенн и целевые целевые функции. Для достижения более высокой универсальности, мы предлагаем расширенную модель UBERT, которая использует более тонкую токенизацию и может оптимизироваться для различных задач сразу. #### Результаты Мы проводим эксперименты с использованием различных данных, включая симуляции беспроводных систем с различными масштабами и условиями. Модель BERT4beam показывает высокую точность и универсальность, близкую к оптимальным решениям, и превосходит существующие AI-модели в различных задачах оптимизации биконного декомпаратора. Модель UBERT, в свою очередь, достигает ещё более высокой гибкости и универсальности, позволяя эффективно решать разные задачи без переобучения. #### Значимость Предлагаемые модели могут быть применены в различных беспроводных системах, включая 5G и 6G, для оптимизации биконного декомпаратора. Они предоставляют высокую гибкость и универсальность, что позволяет применять их в различных условиях систем и конфигураций. Эти модели также могут способствовать эффективному использованию ресурсов и улучшению качества связи, что имеет потенциал для повышения производительности и энергосбережения. #### Выводы Мы успешно разработали модели BERT4beam и UBERT, которые эффективно решают

Annotation:

Artificial intelligence (AI) is anticipated to emerge as a pivotal enabler for the forthcoming sixth-generation (6G) wireless communication systems. However, current research efforts regarding large AI models for wireless communications primarily focus on fine-tuning pre-trained large language models (LLMs) for specific tasks. This paper investigates the large-scale AI model designed for beamforming optimization to adapt and generalize to diverse tasks defined by system utilities and scales. We ...

ID: 2509.11056v1 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 High Effort, Low Gain: Fundamental Limits of Active Learning for Linear Dynamical Systems

2025-09-17

Авторы:

Nicolas Chatzikiriakos, Kevin Jamieson, Andrea Iannelli

## Контекст Линейные динамические системы (LDS) широко применяются в различных областях, включая машинное обучение, робототехнику и системы управления. Однако идентификация LDS с ограниченными наблюдениями остается сложной задачей, особенно когда используется активное обучение (active learning). Активное обучение предполагает выбор особых входных сигналов для максимизации информативности наблюдений. Несмотря на потенциальные преимущества этого подхода, он требует понимания фундаментальных ограничений и зависимостей между входными сигналами, используемыми для идентификации, и сложностью обучения. Эта работа исследует эти ограничения и их влияние на эффективность активного обучения для LDS. ## Метод Методология основывается на анализе нижних и верхних оценок сложности выбора (sample complexity) в задаче идентификации LDS с помощью активного обучения. Авторы предлагают условие "постоянного возбуждения" (persistent excitation, PE), которое позволяет анализировать различные входные сигналы в отдельности. Это условие является более гибким, чем в случае бесконечного множества возможных входных сигналов. Основываясь на этом условии, авторы выявляют фундаментальные характеристики LDS, которые влияют на процесс идентификации. Была разработана активная обучающаяся система, которая оптимизирует выбор входных сигналов в процессе обучения. ## Результаты Выполнены эксперименты с различными моделями LDS и входными сигналами. Для оценки сложности обучения рассчитывались вероятности того, что идентификация LDS будет выполнена с заданной долей успеха. Были получены нижние оценки сложности выбора, которые зависят от уровня возбуждения вводимых сигналов. Вы most upper и нижние оценки сложности выбора демонстрировали ту же зависимость от ключевых параметров системы, что подтверждает корректность разработанного подхода. Была проведена серия моделирований, подтвердившая эффективность предложенного алгоритма. ## Значимость Результаты имеют значительное значение для области идентификации динамических систем и активного обучения. Они позволяют оптимизировать вводимые сигналы для эффективного обучения, уменьшая необходимое количество наблюдений. Это может быть применено в системах управления, робототехнике и анализе данных в реальном времени. Основным преимуществом является уменьшение сложности обучения при ограниченных наблюдениях. Будущие исследования могут быть направлены на расширение этого подхода к более сложным системам и учету дополнительных факторов, таких как шум и стохастические воздействия. ## Выводы В данной работе были выявлены фундаментальные ограни

Annotation:

In this work, we consider the problem of identifying an unknown linear dynamical system given a finite hypothesis class. In particular, we analyze the effect of the excitation input on the sample complexity of identifying the true system with high probability. To this end, we present sample complexity lower bounds that capture the choice of the selected excitation input. The sample complexity lower bound gives rise to a system theoretic condition to determine the potential benefit of experiment ...

ID: 2509.11907v1 eess.SY, cs.LG, cs.SY, stat.ML

arXiv PDF

📄 Enhancing Low-Altitude Airspace Security: MLLM-Enabled UAV Intent Recognition

2025-09-10

Авторы:

Guangyu Lei, Tianhao Liang, Yuqi Ping, Xinglin Chen, Longyu Zhou, Junwei Wu, Xiyuan Zhang, Huahao Ding, Xingjian Zhang, Weijie Yuan, Tingting Zhang, Qinyu Zhang

## Контекст В последние годы возрастает важность обеспечения безопасности низкоальтитудного космоса в связи с развитием низкоальтитудной экономики. Одной из ключевых задач в этой области является определение намерений неприятельских беспилотных летательных аппаратов (БПЛА), чтобы предотвратить потенциальные риски и угрозы. Несмотря на развитие технологий, существуют проблемы, такие как неточность в определении намерений БПЛА, ограниченность обнаружения с помощью существующих методов и недостаток реакции на изменения ситуации в реальном времени. Мотивацией для этого исследования является необходимость в развитии более эффективных методов определения намерений БПЛА, которые могут обеспечить быстрое и точное распознавание целей, даже в условиях сложных внешних условий. Использование многомодальных больших языковых моделей (MLLMs) может стать решением задачи, так как они обладают высокой точностью и могут обрабатывать многообразие данных в реальном времени. ## Метод Для решения поставленной задачи предлагается использовать архитектуру, основанную на MLLMs, для распознавания намерений БПЛА. Эта архитектура включает несколько этапов: 1. **Сбор данных**: Многомодальная система сбора данных позволяет получать реального времени информацию о движении и нагрузке БПЛА. 2. **Преобразование данных**: Данные, полученные из различных моделей, объединяются и обрабатываются с помощью специальных методов представления для формирования структурированной входной информации. 3. **Обучение и распознавание**: MLLM-модель использует полученную информацию, включая окружающую среду, предварительные знания и тактические предпочтения, для вывода результата распознавания намерения. Эта модель включает в себя несколько модификаций, таких как подключение внешних источников данных, адаптивное обучение на основе реальных ситуаций и использование сложных логических моделей для оптимизации результатов. ## Результаты Результаты исследования показали, что новая архитектура демонстрирует высокую точность распознавания намерений БПЛА в различных условиях. В ходе экспериментов был проведен сценарий угрозы в низкой альтитуде, где модель показала способность своевременно и точно определять намерения БПЛА. Данные были получены с помощью симуляции и реальных тестов, в том числе использовались многомодальные данные, такие как видео, звук и данные сенсоров. Отмечено, что модель показала лучшую точность по сравнению с другими подходами в сложных условиях. ## Значимость Предложенная модель может быть применена в различных областях, таких как

Annotation:

The rapid development of the low-altitude economy emphasizes the critical need for effective perception and intent recognition of non-cooperative unmanned aerial vehicles (UAVs). The advanced generative reasoning capabilities of multimodal large language models (MLLMs) present a promising approach in such tasks. In this paper, we focus on the combination of UAV intent recognition and the MLLMs. Specifically, we first present an MLLM-enabled UAV intent recognition architecture, where the multimod...

ID: 2509.06312v1 eess.SY, cs.LG, cs.SY, 68T07, 68T45, 93C85, 94A12, I.2.10; I.2.6; I.2.9; C.2.1

arXiv PDF

📄 Selection of Optimal Number and Location of PMUs for CNN Based Fault Location and Identification

2025-09-06

Авторы:

Khalid Daud Khattak, Muhammad A. Choudhry

## Контекст В последние годы системы питания становятся все более сложными и интеллектуальными, что приводит к повышению требований к их надёжности и эффективности. Одной из ключевых задач в этой области является точное обнаружение и расположение неисправностей в электрических сетях. Традиционные методы распознавания неисправностей часто ограничиваются в своих возможностях и требуют дополнительных средств мониторинга. Недавние разработки в области статистического обучения, особенно в сфере глубокого обучения, открыли новые перспективы для решения этой задачи. Одним из наиболее обещающих подходов является использование глубоких нейронных сетей (CNN) для распознавания неисправностей. Тем не менее, для эффективного применения глубоких нейронных сетей в системах питании необходимо выбрать оптимальный набор сенсоров, который обеспечит мониторинг и достаточное количество информации для точного распознавания неисправностей. В этом контексте целью данной работы является разработка метода для оптимизации размера и местонахождения сенсоров (PMU) для максимальной эффективности их использования в глубоких нейронных сетях. ## Метод Разработанный метод, Forward Selection with Neighborhood Refinement (FSNR), представляет собой алгоритм, основанный на данных, который применяется для оптимизации размера и расположения PMU. Алгоритм начинает с выбора начального набора сенсоров, который проверяется с помощью кросс-валидационного Support Vector Machine (SVM) classifier. Этот набор проверяется на всех возможных местах для размещения сенсоров, чтобы определить, каким образом наиболее эффективно разместить их. Затем, после определения кандидатов, алгоритм использует локальный рефининг (local neighborhood exploration) для доработки решения и получения максимальной точности. Этот результат используется в виде входных данных для 1D Convolutional Neural Network (CNN), которая используется для распознавания неисправностей. Этот подход позволяет оптимизировать выбор PMU, чтобы улучшить точность распознавания неисправностей, в то же время сокращая количество сенсоров, необходимых для выполнения этой задачи. ## Результаты Чтобы оценить эффективность FSNR-SVM метода, он был протестирован на двух системах: IEEE 34- и IEEE 123-bus systems. В качестве входных данных были использованы time-series измерения, которые были предоставлены для распознавания неисправностей и расположения неисправных линий. Использование FSNR-SVM позволило выбрать оптимальный набор PMU, который обеспечивал максимальную точность распознавания неисправностей, как в локализации неисправных линий, так и в классификации типа неисправности. На IEEE 34-bus system точность распознавания неисправности составила более 96%, а классификация типа неисправности - боле

Annotation:

In this paper, we present a data-driven Forward Selection with Neighborhood Refinement (FSNR) algorithm to determine the number and placement of Phasor Measurement Units (PMUs) for maximizing deep-learning-based fault diagnosis performance. Candidate PMU locations are ranked via a cross-validated Support Vector Machine (SVM) classifier, and each selection is refined through local neighborhood exploration to produce a near-optimal sensor set. The resulting PMU subset is then supplied to a 1D Conv...

ID: 2509.02192v1 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics

2025-09-06

Авторы:

Daisuke Inoue, Tadayoshi Matsumori, Gouhei Tanaka, Yuji Ito

## Контекст Управление нелинейными динамическими системами представляет собой ключевую проблему в различных областях, включая робототехнику, энергетику и промышленность. Однако традиционные методы, такие как модельно-предиктивный управленческий (MPC) контроль, часто требуют значительных вычислительных ресурсов и предполагают полное знание динамических моделей систем. В случае неизвестных или недостаточно известных динамик, эти методы оказываются неэффективными. Одновременно, нейронные сети, интересующиеся проблемой аппроксимации нелинейных функций, стали обширно применяться в контроле данных. Необходимость быстного онлайн-обучения динамик, сочетанная с необходимостью эффективного управления, мотивирует развитие методологий, которые могут эффективно объединить эти подходы. ## Метод Предлагаемая методология, называемая Reservoir Predictive Path Integral (RPPI) control, строится на основе двух основных компонентов: Echo-state networks (ESN) и Model Predictive Path Integral (MPPI) control. ESN, являясь моделью вычислений с рекуррентными нейросетями, эффективно аппроксимирует неизвестные динамические модели. MPPI, в свою очередь, является контрольным подходом, основанным на семействе моделей Монте-Карло, который может работать с неизвестными динамическими моделями без нужды в их прямой моделировании. RPPI комбинирует эти две модели, используя ESN для быстрого онлайн-обучения динамики, а затем интегрирует эти модели в одноименный MPPI-контроль. Общая архитектура RPPI позволяет эффективно обучать динамику и распараллеливать вычисления MPPI, в то же время обойдя требования к линеаризации модели, которое обычно требуется в традиционных MPC-подходах. ## Результаты Для оценки эффективности RPPI, авторы провели эксперименты на двух разных системах: Duffing oscillator и four-tank system. Результаты показали, что URPPI не только улучшает управление, но и снижает контрольные затраты на до 60% по сравнению с традиционным задачным MPC. Эксперименты также подтвердили, что URPPI может эффективно обучаться в режиме реального времени, адаптируясь к изменениям в динамике системы. Особое внимание было уделено эксперименту с многоконфигурационным тестированием, чтобы продемонстрировать то, что РППИ может быстро аппроксимировать новые динамики и выполнять эффективное управление в различных условиях. ## Значимость Предлагаемый подход имеет широкое применение в технических областях, где необходимо быстрое онлайн-обучение динамики системы и эффективное управление. Особый потенциал URPPI заключается в его применении в системах с ограниченным доступом к моделям, таких как системы робото

Annotation:

Neural networks capable of approximating complex nonlinearities have found extensive application in data-driven control of nonlinear dynamical systems. However, fast online identification and control of unknown dynamics remain central challenges. This paper integrates echo-state networks (ESNs) -- reservoir computing models implemented with recurrent neural networks -- and model predictive path integral (MPPI) control -- sampling-based variants of model predictive control -- to meet these challe...

ID: 2509.03839v1 eess.SY, cs.LG, cs.SY, math.OC, nlin.CD

arXiv PDF

📄 Sample Efficient Certification of Discrete-Time Control Barrier Functions

2025-09-06

Авторы:

Sampath Kumar Mulagaleti, Andrea Del Prete

## Контекст Обеспечение безопасности динамических систем является ключевым аспектом в различных приложениях, включая автомобильную отрасль, авиацию и индустрию. Для этого необходимо проверить, находится ли система внутри безопасного инвариантного множества в течение всего времени работы. Для этого используются Control Invariant (CI) множества, которые позволяют гарантировать безопасность системы. Control Barrier Functions (CBFs) являются мощными инструментами для вычисления CI-множеств. Они определяются как нулевые поднивелсовые множества, которые также являются CI-множествами. Однако вычисление CBFs часто связано с решением сложных задач оптимизации, которые могут быть вычислительно трудоемкими или даже невыполнимыми. Для решения этой проблемы были предложены сценарий-зависимые методы, которые упрощают расчет CBFs. Но в этом случае необходимо проверить, что вычисленный CBF удовлетворяет всем требованиям. Предлагаемая работа предлагает алгоритм для проверки CBFs, использующий аргументы Липшица. Этот алгоритм характеризуется высокой эффективностью в выборке, что делает его привлекательным для реальных приложений. ## Метод Предложенный метод основывается на анализе Липшица, который позволяет проверить, что CBF удовлетворяет требованиям безопасности в рамках сценарий-зависимого подхода. Алгоритм работает следующим образом: 1. **Построение модели системы**: Модель динамической системы задается в виде отношений Лапласа или другой формы, позволяющей описать поведение системы в дискретном времени. 2. **Определение CBF**: CBF определяется как функция, которая позволяет описать CI-множество. 3. **Анализ Липшица**: Алгоритм использует аргументы Липшица для проверки того, что CBF удовлетворяет условиям Липшица и, следовательно, может быть использован для гарантии безопасности. 4. **Проверка условий**: Алгоритм проверяет, что вычисленный CBF удовлетворяет всем условиям, необходимым для гарантии безопасности. Эталонные методы, такие как сценарий-зависимые подходы, используются для расчета CBFs, но предлагаемый метод отличается высокой эффективностью в выборке и простотой реализации. ## Результаты Проведенные эксперименты показали, что предложенный метод эффективен в выборке и позволяет быстро проверить удовлетворение условий безопасности. Использовались симуляционные данные для тестирования, что позволило проверить работу алгоритма в различных условиях. Полученные результаты показали, что алгоритм способен быстро проверить CBF на соответствие требованиям безопасности, что делает его применимым в реальных ситуациях. Нап

Annotation:

Control Invariant (CI) sets are instrumental in certifying the safety of dynamical systems. Control Barrier Functions (CBFs) are effective tools to compute such sets, since the zero sublevel sets of CBFs are CI sets. However, computing CBFs generally involves addressing a complex robust optimization problem, which can be intractable. Scenario-based methods have been proposed to simplify this computation. Then, one needs to verify if the CBF actually satisfies the robust constraints. We present a...

ID: 2509.03899v1 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 Sailing Towards Zero-Shot State Estimation using Foundation Models Combined with a UKF

2025-09-06

Авторы:

Tobin Holtmann, David Stenger, Andres Posada-Moreno, Friedrich Solowjow, Sebastian Trimpe

#### Контекст State estimation является ключевым заданием в областях управления и системного инжиниринга. Традиционно, этот процесс требует значительных усилий в области системной идентификации или сбора больших объемов данных. Новые подходы, основанные на transformer-based foundation models, уменьшают эти требования, используя предварительно обученные общие модели, которые могут работать даже в неизвестных условиях. Однако существующие модели часто ограничены возможностью работы только с моделями датчиков, которые были видны во время обучения. Эта ситуация приводит к необходимости в разработке новых подходов, которые бы способствовали общей гибкости в работе с различными динамическими системами. #### Метод Мы предлагаем сочетание transformer-based model system dynamics с аналитически известной моделью датчика в рамках unscented Kalman filter (UKF). Данная комбинация позволяет генерировать представления данных, которые могут быть интегрированы с неизвестными динамическими системами. Этот подход, называемый foundation model unscented Kalman filter (FM-UKF), работает без необходимости повторного обучения при изменении динамики системы или сенсорной конфигурации. Мы оптимизировали FM-UKF для работы с динамическими системами, характерными для контейнеровых судов, используя новую бенчмарк-среду, аналогичную реальной среде сложного динамического поведения. #### Результаты Мы провести эксперименты на новой бенчмарк-среде, содержащей модели контейнеровых судов с детальными динамическими характеристиками. FM-UKF показал высокую точность и устойчивость в сравнении с классическими методами, использующими аппроксимативные модели динамики, а также с единородными end-to-end transformer-based подходами. Мы также сравнили FM-UKF с другими моделями, продемонстрировав лучшую точность при сравнительно меньшем требовании к данным и усилиям в условиях изменения динамики. #### Значимость Результаты FM-UKF открывают новый путь к реализации zero-shot state estimation в системах, требующих значительных усилий в идентификации и моделировании. Этот подход может быть применен в различных областях, включая авиацию, робототехнику и инфраструктурное мониторинг, позволяя сократить усилия при моделировании и обучении моделей. Открытие исходных кодов и данных бенчмарка позволяет другим исследователям продолжить развитие этого подхода и расширить его возможности. #### Выводы FM-UKF доказал свою эффективность в решении задачи zero-shot state estimation, объединяя преимущества transformer-based моделей и аналитической модели UKF. Он значительно сокращает требования к данным и усилиям при моделировании систем с новыми динамическими характеристиками. Мы планируем продолжить развитие этого подхода, расширив его применение к дру

Annotation:

State estimation in control and systems engineering traditionally requires extensive manual system identification or data-collection effort. However, transformer-based foundation models in other domains have reduced data requirements by leveraging pre-trained generalist models. Ultimately, developing zero-shot foundation models of system dynamics could drastically reduce manual deployment effort. While recent work shows that transformer-based end-to-end approaches can achieve zero-shot performan...

ID: 2509.04213v1 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 RadioDiff-Loc: Diffusion Model Enhanced Scattering Congnition for NLoS Localization with Sparse Radio Map Estimation

2025-09-05

Авторы:

Xiucheng Wang, Qiming Zhang, Nan Cheng

#### Контекст Аккуратная локализация некооперативных источников сигналов в нелинейно-зрящих (NLoS) окружениях является ключевым заданием в сферах, таких как автономное вождение, промышленная автоматизация и чрезвычайная служба. Однако, существующие методы, основанные на линейно-зрящих (LoS) или кооперативных сигнальных методах, оказываются неэффективными из-за существующих проблем, таких как серьезная мультипатховая пропагация и неизвестная мощность передачи. Данная работа предлагает новую генерирующую инференциальную модель для NLoS-локализации, основанную на условных моделях размытия. Метод использует физический принцип, согласно которому диффракционная энергия радиоволн сосредотачивается вокруг краёв зданий. Это позволяет оптимизировать стратегию сбора небольших объёмов данных о полученной мощности сигнала (RSS) в точках, максимизирующих информацию о источнике сигнала. #### Метод Предлагаемый подход использует условные модели размытия для построения полного радио-карты (RM) на основе среды и небольших данных RSS. Распространение сигнала оценивается с учетом физического распределения диффракции, что позволяет учесть отклонения мощности передачи. Для устранения этой проблемы все RSS-данные нормализуются относительно максимального значения мощности, что обеспечивает устойчивость к изменениям мощности передачи. Условная модель размытия обучается на основе структуры окружения и небольших данных RSS, чтобы восстановить полную карту RSS. Для локализации используется метод, определяющий наиболее яркую точку на воссозданной карте. Модель легко интегрируется с другими методами RSS-локализации, что обеспечивает функциональность двойной стратегии: гибридное использование физической информации и глубокого обучения. #### Результаты Эксперименты проводились на реальных данных, включающих различные среды и условия. Метод показал высокую точность локализации, особенно в условиях спарсе RSS-данных. Использовались различные среды, в том числе промышленные помещения и городские ландшафты. Результаты показали, что данный подход превосходит традиционные методы в скорости и точности локализации. Отметим, что высокая точность достигается с минимальным количеством данных RSS, что значительно снижает накладные расходы. #### Значимость Предлагаемая модель имеет широкие возможности для применения в различных областях, таких как автоматизированные системы, геолокация в чрезвычайных ситуациях и системы позиционирования в городских средах. Она обеспечивает высокую точность, эффективность и гибкость. Благодар

Annotation:

Accurate localization of non-cooperative signal sources in non-line-of-sight (NLoS) environments remains a critical challenge with a wide range of applications, including autonomous navigation, industrial automation, and emergency response. In such settings, traditional positioning techniques relying on line-of-sight (LoS) or cooperative signaling fail due to severe multipath propagation and unknown transmit power. This paper proposes a novel generative inference framework for NLoS localization ...

ID: 2509.01875v2 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 Adapting to Change: A Comparison of Continual and Transfer Learning for Modeling Building Thermal Dynamics under Concept Drifts

2025-09-02

Авторы:

Fabian Raisch, Max Langtry, Felix Koch, Ruchi Choudhary, Christoph Goebel, Benjamin Tischler

#### Контекст Обеспечение энергоэффективности и комфорта в зданиях требует точного моделирования термодинамических динамик строений. Однако получение боLтoйшего объема данных для точного моделирования часто становится ограниченным из-за сложности сбора или недостатка данных в достаточном количестве. Традиционно используется метод переобучения (Transfer Learning, TL), который позволяет использовать предобученные модели для точного моделирования термодинамических динамик зданий при недостатке данных. Однако, существуют проблемы, связанные с увеличением объема данных в течение времени в результате внедрения новых систем, изменения окружающей среды или внедрения технологий, что приводит к концептуальным изменениям (concept drifts). Для этих ситуаций необходимы методы, позволяющие адаптировать модели в течение времени, чтобы оптимизировать точность прогнозирования. Настоящее исследование адресует эти проблемы, сравнивая Continual Learning (CL) и Transfer Learning (TL) стратегии для моделирования термодинамических динамик зданий в условиях concept drifts. #### Метод Исследование основывается на симуляционных данных, представляющих ситуации с зданиями в центральной Европе, в течение 5–7 лет. Мы использовали несколько стратегий: Transfer Learning (TL), Continual Learning (CL), включая Seasonal Memory Learning (SML), и модель, обученную с нуля. TL и SML используют предобученные модели, которые последующими этапами fine-tuning адаптируются к конкретным изменениям в динамике здания. Мы сравнивали эти методы по точности прогнозирования, эффективности вычислений и способности справляться с концептуальными изменениями. Эксперименты проводились на имитационных данных, в том числе сценариях с retrofits и изменениями окружающей среды. #### Результаты Результаты экспериментов показали, что SML превосходит TL и CL в точности прогнозирования в условиях concept drifts. Обученная с нуля модель показала самую низкую точность. TL показался эффективным в начальной стадии моделирования, но не справлялся с изменением термодинамических динамик в течение времени. SML показал самый стабильный результат, обеспечивая улучшение точности прогнозирования в 28.1% при отсутствии concept drifts и 34.9% при их присутствии. Этот результат достигнут без значительного увеличения вычислительных затрат. #### Значимость Наша исследовательская работа может быть применена в области энергоэффективности зданий, а также для мониторинга и оптимизации термодинамических динамик зданий в ходе эксплуатации. SML стабильно показал высокую точность и эффективность в адаптации к изменениям в динамике здания, что делает его привлекательным для реального применения. Кроме того, наши методы могут быть расширены для моделиро

Annotation:

Transfer Learning (TL) is currently the most effective approach for modeling building thermal dynamics when only limited data are available. TL uses a pretrained model that is fine-tuned to a specific target building. However, it remains unclear how to proceed after initial fine-tuning, as more operational measurement data are collected over time. This challenge becomes even more complex when the dynamics of the building change, for example, after a retrofit or a change in occupancy. In Machine ...

ID: 2508.21615v1 eess.SY, cs.LG, cs.SY

arXiv PDF

📄 Neural Spline Operators for Risk Quantification in Stochastic Systems

2025-08-29

Авторы:

Zhuoyuan Wang, Raffaele Romagnoli, Kamyar Azizzadenesheli, Yorie Nakahira

## Контекст Квантификация долгосрочных риск-пробабилитетов в различных стохастических системах является критически важной задачей для безопасного контроля. Однако существующие способы, основанные на семплировании и частных дифференциальных уравнениях (PDE), часто сталкиваются с трудностями при работе с системами, имеющими сложные и произвольно меняющиеся динамики. Физико-информированные нейронные сети (PINN) успешно применяются для обучения суррогатных моделей риск-пробабилитетов для систем с фиксированными и конечными параметрами. Тем не менее, они не могут учитывать функциональные изменения в динамике системы. Этот ограничение становится критическим при работе с динамически характеризуемыми системами, где динамика может меняться в зависимости от внешних условий. Наша цель заключается в развитии новых методов для точной квантификации рисков в таких системах. ## Метод Мы предлагаем Neural Spline Operators (NeSO), расширенный фреймворк физико-информированных нейронных операторов (PINO) для работы с системами, имеющими функционально варьирующиеся динамики. Основной идеей NeSO является использование B-spline представлений для улучшения эффективности обучения и повышения точности при вычислении риска. Разработанная архитектура основывается на физико-информированных нейронных сетях, но включает дополнительные механизмы для надёжного обучения с учётом инвариантности к группам и условий начала и границы. Таким образом, NeSO могут эффективно аппроксимировать риск-пробабилитеты для систем с функционально меняющимися динамиками. Эта модель также обладает теоретическим доказательством универсальной аппроксимации, что даёт ей широкие возможности по применению. ## Результаты Мы проводим эксперименты на двух сценариях. В первом сценарии мы рассматриваем системы с произвольно меняющейся динамикой, второй сценарий — системы с высокомерностью, включающие целые множества агентов. Наши эксперименты показывают, что NeSO не только значительно быстрее существующих методов в режиме онлайн, но и обеспечивает более точные оценки риска. Мы также показываем, что NeSO обладает высокой точностью при вычислении риск-пробабилитетов в системах с нестандартными условиями начала и границы. Эти результаты подтверждают эффективность NeSO в таких задачах, как защита от риска в системах с внешними воздействиями. ## Значимость Наши результаты имеют прямое применение в области безопасного контроля, контроля технологических процессов и финансовых моделей, где точная квантификация риска

Annotation:

Accurately quantifying long-term risk probabilities in diverse stochastic systems is essential for safety-critical control. However, existing sampling-based and partial differential equation (PDE)-based methods often struggle to handle complex varying dynamics. Physics-informed neural networks learn surrogate mappings for risk probabilities from varying system parameters of fixed and finite dimensions, yet can not account for functional variations in system dynamics. To address these challenges,...

ID: 2508.20288v1 eess.SY, cs.LG, cs.SY

arXiv PDF

1
2
3
4

Показано 21 - 30 из 40 записей