📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Filippo Fabiani, Andrea Simonetto
## Контекст
Семейство прикладных задач, включающих поиск решений семейств базисных функций, оказалось востребованным в различных областях, включая машинное обучение, теорию игр, линейные системы и управление. Одной из популярных моделей является семейство семейств полуопределенных матриц, которые могут представиться в виде решений менее сложных задач. Однако, поиск этих решений часто связан с высокой априорной сложностью. Это приводит к необходимости в разработке эффективных методов для построения элементарных решений, уменьшающих сложность и обеспечивающих надежные гарантии. Например, в задачах машинного обучения, таких как задачи классификации и регрессии, такие методы позволяют значительно уменьшить время вычислений и оптимизировать производительность.
## Метод
Авторы разработали метод, основанный на теории интервальных оценок и интерпретации решений в виде экспоненциальных функций. Метод заключается в следующем:
1. Использование теории пакетного оптимизационного решения для построения интервала, в котором могут находиться решения.
2. Использование экспоненциального преобразования для построения погрешности оценок.
3. Оценка множества всех возможных решений, построенных на основе интервальных оценок.
Технически, метод реализуется через нелинейную модель, состоящую из двух этапов:
- Начальная поисковая оптимизация.
- Дальнейшая регуляризация и сжатие погрешности.
## Результаты
Авторы провели эксперименты на двух наборах данных, обладающих различными структурами и размерами. Они сравнили результаты с двумя методами: стандартным методом построения интервалов и методом, основанным на градиентном спуске. Результаты показали, что метод, предложенный в статье, обеспечивает:
- Более точные оценки решений.
- Уменьшение времени работы при построении интервалов.
- Улучшение точности решений при использовании регуляризации.
## Значимость
Разработанный метод может быть применен в различных областях, включая машинное обучение, теорию игр, линейные системы и управление. Он обеспечивает:
- Улучшение точности решений.
- Увеличение скорости работы систем.
- Эффективное решение задач с повышенной сложностью.
## Выводы
Разработанный метод доказал свою эффективность в построении интервалов и уменьшении погрешности оценок в семействе семейств полуопределенных матриц. Будущие исследования будут сконцентрированы на расширении данного метода для работы с более сложными структурами данных и увеличении его универсальности в различных прикладных задачах.
Annotation:
We study data-driven least squares (LS) problems with semidefinite (SD)
constraints and derive finite-sample guarantees on the spectrum of their
optimal solutions when these constraints are relaxed. In particular, we provide
a high confidence bound allowing one to solve a simpler program in place of the
full SDLS problem, while ensuring that the eigenvalues of the resulting
solution are $\varepsilon$-close of those enforced by the SD constraints. The
developed certificate, which consistently shr...
Авторы:
Yuhang Li, Yang Lu, Wei Chen, Bo Ai, Zhiguo Ding, Dusit Niyato
#### Контекст
Искусственный интеллект (AI) предполагается стать ключевым двигателем для шестого поколения (6G) беспроводных систем коммуникации. Однако до сих пор большинство исследований в области AI для беспроводных систем фокусируются на тонком настройке предобученных больших языковых моделей (LLMs) для конкретных задач. Это ограничивает их общеуниверсальность и применимость к различным ситуациям. В частности, проблема оптимизации биконным выпуклым декомпаратором (beamforming) в беспроводных системах остается относительно нетронутой в этом контексте. Необходимо развить универсальные AI-модели, которые могли бы эффективно адаптироваться к различным системным целям и масштабам.
#### Метод
Мы предлагаем новую архитектуру для оптимизации биконного выпуклого декомпаратора, основанную на бидректорном преобразователе векторов (BERT). Модель, названная BERT4beam, формулирует задачу оптимизации биконного декомпаратора как задачу последовательной обработки токенов. Мы проводим токенизацию входных данных, в частности, сигналов состояния канала (channel state information, CSI), и построение модели BERT. Для решения специфичных задач применяются задачи предварительного обучения (pre-training) и дообучение (fine-tuning). Модель разработана с учетом гибкости и может быть применена в различных системных условиях, включая разные конфигурации антенн и целевые целевые функции. Для достижения более высокой универсальности, мы предлагаем расширенную модель UBERT, которая использует более тонкую токенизацию и может оптимизироваться для различных задач сразу.
#### Результаты
Мы проводим эксперименты с использованием различных данных, включая симуляции беспроводных систем с различными масштабами и условиями. Модель BERT4beam показывает высокую точность и универсальность, близкую к оптимальным решениям, и превосходит существующие AI-модели в различных задачах оптимизации биконного декомпаратора. Модель UBERT, в свою очередь, достигает ещё более высокой гибкости и универсальности, позволяя эффективно решать разные задачи без переобучения.
#### Значимость
Предлагаемые модели могут быть применены в различных беспроводных системах, включая 5G и 6G, для оптимизации биконного декомпаратора. Они предоставляют высокую гибкость и универсальность, что позволяет применять их в различных условиях систем и конфигураций. Эти модели также могут способствовать эффективному использованию ресурсов и улучшению качества связи, что имеет потенциал для повышения производительности и энергосбережения.
#### Выводы
Мы успешно разработали модели BERT4beam и UBERT, которые эффективно решают
Annotation:
Artificial intelligence (AI) is anticipated to emerge as a pivotal enabler
for the forthcoming sixth-generation (6G) wireless communication systems.
However, current research efforts regarding large AI models for wireless
communications primarily focus on fine-tuning pre-trained large language models
(LLMs) for specific tasks. This paper investigates the large-scale AI model
designed for beamforming optimization to adapt and generalize to diverse tasks
defined by system utilities and scales. We ...
📄 High Effort, Low Gain: Fundamental Limits of Active Learning for Linear Dynamical Systems
2025-09-17Авторы:
Nicolas Chatzikiriakos, Kevin Jamieson, Andrea Iannelli
## Контекст
Линейные динамические системы (LDS) широко применяются в различных областях, включая машинное обучение, робототехнику и системы управления. Однако идентификация LDS с ограниченными наблюдениями остается сложной задачей, особенно когда используется активное обучение (active learning). Активное обучение предполагает выбор особых входных сигналов для максимизации информативности наблюдений. Несмотря на потенциальные преимущества этого подхода, он требует понимания фундаментальных ограничений и зависимостей между входными сигналами, используемыми для идентификации, и сложностью обучения. Эта работа исследует эти ограничения и их влияние на эффективность активного обучения для LDS.
## Метод
Методология основывается на анализе нижних и верхних оценок сложности выбора (sample complexity) в задаче идентификации LDS с помощью активного обучения. Авторы предлагают условие "постоянного возбуждения" (persistent excitation, PE), которое позволяет анализировать различные входные сигналы в отдельности. Это условие является более гибким, чем в случае бесконечного множества возможных входных сигналов. Основываясь на этом условии, авторы выявляют фундаментальные характеристики LDS, которые влияют на процесс идентификации. Была разработана активная обучающаяся система, которая оптимизирует выбор входных сигналов в процессе обучения.
## Результаты
Выполнены эксперименты с различными моделями LDS и входными сигналами. Для оценки сложности обучения рассчитывались вероятности того, что идентификация LDS будет выполнена с заданной долей успеха. Были получены нижние оценки сложности выбора, которые зависят от уровня возбуждения вводимых сигналов. Вы most upper и нижние оценки сложности выбора демонстрировали ту же зависимость от ключевых параметров системы, что подтверждает корректность разработанного подхода. Была проведена серия моделирований, подтвердившая эффективность предложенного алгоритма.
## Значимость
Результаты имеют значительное значение для области идентификации динамических систем и активного обучения. Они позволяют оптимизировать вводимые сигналы для эффективного обучения, уменьшая необходимое количество наблюдений. Это может быть применено в системах управления, робототехнике и анализе данных в реальном времени. Основным преимуществом является уменьшение сложности обучения при ограниченных наблюдениях. Будущие исследования могут быть направлены на расширение этого подхода к более сложным системам и учету дополнительных факторов, таких как шум и стохастические воздействия.
## Выводы
В данной работе были выявлены фундаментальные ограни
Annotation:
In this work, we consider the problem of identifying an unknown linear
dynamical system given a finite hypothesis class. In particular, we analyze the
effect of the excitation input on the sample complexity of identifying the true
system with high probability. To this end, we present sample complexity lower
bounds that capture the choice of the selected excitation input. The sample
complexity lower bound gives rise to a system theoretic condition to determine
the potential benefit of experiment ...
Авторы:
Sarvan Gill, Daniela Constantinescu
## Контекст
Решение задач контроля в средах с неубывающим временем работы часто требует обеспечения стабильности системы. Однако, традиционные алгоритмы реинфорсментного обучения (RL) не обеспечивают стабильности по своей природе. Недавние разработки, использующие самообучаемые Lyapunov-функции, призваны решить эту проблему. Однако, эти Lyapunov-функции обучаются с использованием on-policy методов, что приводит к высокой экспериментальной неэффективности.
Предложенный подход нацелен на решение этих проблем, предлагая метод для обучения Lyapunov-функций с использованием off-policy методов. Этот подход может быть интегрирован с уже существующими методами обучения RL, чтобы обеспечить лучшую эффективность и стабильность обучения. Это важно для применения в системах, требующих высокой точности и надежности, например, в авиации и робототехнике.
## Метод
Предлагаемый подход включает несколько ключевых технических решений. Во-первых, разработана методология для обучения Lyapunov-функций с использованием off-policy методов, что позволяет эффективно использовать данные с большим объемом в реальном времени. Во-вторых, внедрена архитектура, которая позволяет интегрировать эту Lyapunov-функцию в алгоритмы Soft Actor Critic (SAC) и Proximal Policy Optimization (PPO). Это позволяет эти алгоритмы использовать для получения более точных и стабильных решений в задачах контроля.
Эта архитектура включает несколько модулей, таких как нейронные сети для вычисления Lyapunov-функций и методы восстановления данных для эффективного использования off-policy методов. Это позволяет избежать некоторых проблем, связанных с on-policy методами, таких как ограниченность объема данных и высокая стоимость экспериментов.
## Результаты
В ходе экспериментов, проведенных на моделях инвертированного пендюла и квадротора, были получены следующие результаты. Алгоритмы SAC и PPO, внедренные с Lyapunov-функцией, показали значительное улучшение в стабильности и эффективности сравнительно с оригинальными алгоритмами. Были проведены сравнения с традиционными методами, показав значительное преимущество в эффективности обучения и стабильности решения.
Представленные результаты показывают, что основным преимуществом является улучшение эффективности обучения благодаря использованию off-policy методов. Это позволяет использовать большие объемы данных для эффективного обучения Lyapunov-функций, что делает эти алгоритмы более пригодными для применения в реальных системах, где необходима высокая стабильность и точность.
## Значимость
Результаты работы имеют большое значение для развития методологий RL, особенно
Annotation:
Traditional reinforcement learning lacks the ability to provide stability
guarantees. More recent algorithms learn Lyapunov functions alongside the
control policies to ensure stable learning. However, the current self-learned
Lyapunov functions are sample inefficient due to their on-policy nature. This
paper introduces a method for learning Lyapunov functions off-policy and
incorporates the proposed off-policy Lyapunov function into the Soft Actor
Critic and Proximal Policy Optimization algorith...
Авторы:
Guangyu Lei, Tianhao Liang, Yuqi Ping, Xinglin Chen, Longyu Zhou, Junwei Wu, Xiyuan Zhang, Huahao Ding, Xingjian Zhang, Weijie Yuan, Tingting Zhang, Qinyu Zhang
## Контекст
В последние годы возрастает важность обеспечения безопасности низкоальтитудного космоса в связи с развитием низкоальтитудной экономики. Одной из ключевых задач в этой области является определение намерений неприятельских беспилотных летательных аппаратов (БПЛА), чтобы предотвратить потенциальные риски и угрозы. Несмотря на развитие технологий, существуют проблемы, такие как неточность в определении намерений БПЛА, ограниченность обнаружения с помощью существующих методов и недостаток реакции на изменения ситуации в реальном времени.
Мотивацией для этого исследования является необходимость в развитии более эффективных методов определения намерений БПЛА, которые могут обеспечить быстрое и точное распознавание целей, даже в условиях сложных внешних условий. Использование многомодальных больших языковых моделей (MLLMs) может стать решением задачи, так как они обладают высокой точностью и могут обрабатывать многообразие данных в реальном времени.
## Метод
Для решения поставленной задачи предлагается использовать архитектуру, основанную на MLLMs, для распознавания намерений БПЛА. Эта архитектура включает несколько этапов:
1. **Сбор данных**: Многомодальная система сбора данных позволяет получать реального времени информацию о движении и нагрузке БПЛА.
2. **Преобразование данных**: Данные, полученные из различных моделей, объединяются и обрабатываются с помощью специальных методов представления для формирования структурированной входной информации.
3. **Обучение и распознавание**: MLLM-модель использует полученную информацию, включая окружающую среду, предварительные знания и тактические предпочтения, для вывода результата распознавания намерения.
Эта модель включает в себя несколько модификаций, таких как подключение внешних источников данных, адаптивное обучение на основе реальных ситуаций и использование сложных логических моделей для оптимизации результатов.
## Результаты
Результаты исследования показали, что новая архитектура демонстрирует высокую точность распознавания намерений БПЛА в различных условиях. В ходе экспериментов был проведен сценарий угрозы в низкой альтитуде, где модель показала способность своевременно и точно определять намерения БПЛА. Данные были получены с помощью симуляции и реальных тестов, в том числе использовались многомодальные данные, такие как видео, звук и данные сенсоров. Отмечено, что модель показала лучшую точность по сравнению с другими подходами в сложных условиях.
## Значимость
Предложенная модель может быть применена в различных областях, таких как
Annotation:
The rapid development of the low-altitude economy emphasizes the critical
need for effective perception and intent recognition of non-cooperative
unmanned aerial vehicles (UAVs). The advanced generative reasoning capabilities
of multimodal large language models (MLLMs) present a promising approach in
such tasks. In this paper, we focus on the combination of UAV intent
recognition and the MLLMs. Specifically, we first present an MLLM-enabled UAV
intent recognition architecture, where the multimod...
📄 Selection of Optimal Number and Location of PMUs for CNN Based Fault Location and Identification
2025-09-06Авторы:
Khalid Daud Khattak, Muhammad A. Choudhry
## Контекст
В последние годы системы питания становятся все более сложными и интеллектуальными, что приводит к повышению требований к их надёжности и эффективности. Одной из ключевых задач в этой области является точное обнаружение и расположение неисправностей в электрических сетях. Традиционные методы распознавания неисправностей часто ограничиваются в своих возможностях и требуют дополнительных средств мониторинга. Недавние разработки в области статистического обучения, особенно в сфере глубокого обучения, открыли новые перспективы для решения этой задачи. Одним из наиболее обещающих подходов является использование глубоких нейронных сетей (CNN) для распознавания неисправностей. Тем не менее, для эффективного применения глубоких нейронных сетей в системах питании необходимо выбрать оптимальный набор сенсоров, который обеспечит мониторинг и достаточное количество информации для точного распознавания неисправностей. В этом контексте целью данной работы является разработка метода для оптимизации размера и местонахождения сенсоров (PMU) для максимальной эффективности их использования в глубоких нейронных сетях.
## Метод
Разработанный метод, Forward Selection with Neighborhood Refinement (FSNR), представляет собой алгоритм, основанный на данных, который применяется для оптимизации размера и расположения PMU. Алгоритм начинает с выбора начального набора сенсоров, который проверяется с помощью кросс-валидационного Support Vector Machine (SVM) classifier. Этот набор проверяется на всех возможных местах для размещения сенсоров, чтобы определить, каким образом наиболее эффективно разместить их. Затем, после определения кандидатов, алгоритм использует локальный рефининг (local neighborhood exploration) для доработки решения и получения максимальной точности. Этот результат используется в виде входных данных для 1D Convolutional Neural Network (CNN), которая используется для распознавания неисправностей. Этот подход позволяет оптимизировать выбор PMU, чтобы улучшить точность распознавания неисправностей, в то же время сокращая количество сенсоров, необходимых для выполнения этой задачи.
## Результаты
Чтобы оценить эффективность FSNR-SVM метода, он был протестирован на двух системах: IEEE 34- и IEEE 123-bus systems. В качестве входных данных были использованы time-series измерения, которые были предоставлены для распознавания неисправностей и расположения неисправных линий. Использование FSNR-SVM позволило выбрать оптимальный набор PMU, который обеспечивал максимальную точность распознавания неисправностей, как в локализации неисправных линий, так и в классификации типа неисправности. На IEEE 34-bus system точность распознавания неисправности составила более 96%, а классификация типа неисправности - боле
Annotation:
In this paper, we present a data-driven Forward Selection with Neighborhood
Refinement (FSNR) algorithm to determine the number and placement of Phasor
Measurement Units (PMUs) for maximizing deep-learning-based fault diagnosis
performance. Candidate PMU locations are ranked via a cross-validated Support
Vector Machine (SVM) classifier, and each selection is refined through local
neighborhood exploration to produce a near-optimal sensor set. The resulting
PMU subset is then supplied to a 1D Conv...
Авторы:
Daisuke Inoue, Tadayoshi Matsumori, Gouhei Tanaka, Yuji Ito
## Контекст
Управление нелинейными динамическими системами представляет собой ключевую проблему в различных областях, включая робототехнику, энергетику и промышленность. Однако традиционные методы, такие как модельно-предиктивный управленческий (MPC) контроль, часто требуют значительных вычислительных ресурсов и предполагают полное знание динамических моделей систем. В случае неизвестных или недостаточно известных динамик, эти методы оказываются неэффективными. Одновременно, нейронные сети, интересующиеся проблемой аппроксимации нелинейных функций, стали обширно применяться в контроле данных. Необходимость быстного онлайн-обучения динамик, сочетанная с необходимостью эффективного управления, мотивирует развитие методологий, которые могут эффективно объединить эти подходы.
## Метод
Предлагаемая методология, называемая Reservoir Predictive Path Integral (RPPI) control, строится на основе двух основных компонентов: Echo-state networks (ESN) и Model Predictive Path Integral (MPPI) control. ESN, являясь моделью вычислений с рекуррентными нейросетями, эффективно аппроксимирует неизвестные динамические модели. MPPI, в свою очередь, является контрольным подходом, основанным на семействе моделей Монте-Карло, который может работать с неизвестными динамическими моделями без нужды в их прямой моделировании. RPPI комбинирует эти две модели, используя ESN для быстрого онлайн-обучения динамики, а затем интегрирует эти модели в одноименный MPPI-контроль. Общая архитектура RPPI позволяет эффективно обучать динамику и распараллеливать вычисления MPPI, в то же время обойдя требования к линеаризации модели, которое обычно требуется в традиционных MPC-подходах.
## Результаты
Для оценки эффективности RPPI, авторы провели эксперименты на двух разных системах: Duffing oscillator и four-tank system. Результаты показали, что URPPI не только улучшает управление, но и снижает контрольные затраты на до 60% по сравнению с традиционным задачным MPC. Эксперименты также подтвердили, что URPPI может эффективно обучаться в режиме реального времени, адаптируясь к изменениям в динамике системы. Особое внимание было уделено эксперименту с многоконфигурационным тестированием, чтобы продемонстрировать то, что РППИ может быстро аппроксимировать новые динамики и выполнять эффективное управление в различных условиях.
## Значимость
Предлагаемый подход имеет широкое применение в технических областях, где необходимо быстрое онлайн-обучение динамики системы и эффективное управление. Особый потенциал URPPI заключается в его применении в системах с ограниченным доступом к моделям, таких как системы робото
Annotation:
Neural networks capable of approximating complex nonlinearities have found
extensive application in data-driven control of nonlinear dynamical systems.
However, fast online identification and control of unknown dynamics remain
central challenges. This paper integrates echo-state networks (ESNs) --
reservoir computing models implemented with recurrent neural networks -- and
model predictive path integral (MPPI) control -- sampling-based variants of
model predictive control -- to meet these challe...
Авторы:
Sampath Kumar Mulagaleti, Andrea Del Prete
## Контекст
Обеспечение безопасности динамических систем является ключевым аспектом в различных приложениях, включая автомобильную отрасль, авиацию и индустрию. Для этого необходимо проверить, находится ли система внутри безопасного инвариантного множества в течение всего времени работы. Для этого используются Control Invariant (CI) множества, которые позволяют гарантировать безопасность системы.
Control Barrier Functions (CBFs) являются мощными инструментами для вычисления CI-множеств. Они определяются как нулевые поднивелсовые множества, которые также являются CI-множествами. Однако вычисление CBFs часто связано с решением сложных задач оптимизации, которые могут быть вычислительно трудоемкими или даже невыполнимыми. Для решения этой проблемы были предложены сценарий-зависимые методы, которые упрощают расчет CBFs. Но в этом случае необходимо проверить, что вычисленный CBF удовлетворяет всем требованиям.
Предлагаемая работа предлагает алгоритм для проверки CBFs, использующий аргументы Липшица. Этот алгоритм характеризуется высокой эффективностью в выборке, что делает его привлекательным для реальных приложений.
## Метод
Предложенный метод основывается на анализе Липшица, который позволяет проверить, что CBF удовлетворяет требованиям безопасности в рамках сценарий-зависимого подхода. Алгоритм работает следующим образом:
1. **Построение модели системы**: Модель динамической системы задается в виде отношений Лапласа или другой формы, позволяющей описать поведение системы в дискретном времени.
2. **Определение CBF**: CBF определяется как функция, которая позволяет описать CI-множество.
3. **Анализ Липшица**: Алгоритм использует аргументы Липшица для проверки того, что CBF удовлетворяет условиям Липшица и, следовательно, может быть использован для гарантии безопасности.
4. **Проверка условий**: Алгоритм проверяет, что вычисленный CBF удовлетворяет всем условиям, необходимым для гарантии безопасности.
Эталонные методы, такие как сценарий-зависимые подходы, используются для расчета CBFs, но предлагаемый метод отличается высокой эффективностью в выборке и простотой реализации.
## Результаты
Проведенные эксперименты показали, что предложенный метод эффективен в выборке и позволяет быстро проверить удовлетворение условий безопасности. Использовались симуляционные данные для тестирования, что позволило проверить работу алгоритма в различных условиях.
Полученные результаты показали, что алгоритм способен быстро проверить CBF на соответствие требованиям безопасности, что делает его применимым в реальных ситуациях. Нап
Annotation:
Control Invariant (CI) sets are instrumental in certifying the safety of
dynamical systems. Control Barrier Functions (CBFs) are effective tools to
compute such sets, since the zero sublevel sets of CBFs are CI sets. However,
computing CBFs generally involves addressing a complex robust optimization
problem, which can be intractable. Scenario-based methods have been proposed to
simplify this computation. Then, one needs to verify if the CBF actually
satisfies the robust constraints. We present a...
Авторы:
Tobin Holtmann, David Stenger, Andres Posada-Moreno, Friedrich Solowjow, Sebastian Trimpe
#### Контекст
State estimation является ключевым заданием в областях управления и системного инжиниринга. Традиционно, этот процесс требует значительных усилий в области системной идентификации или сбора больших объемов данных. Новые подходы, основанные на transformer-based foundation models, уменьшают эти требования, используя предварительно обученные общие модели, которые могут работать даже в неизвестных условиях. Однако существующие модели часто ограничены возможностью работы только с моделями датчиков, которые были видны во время обучения. Эта ситуация приводит к необходимости в разработке новых подходов, которые бы способствовали общей гибкости в работе с различными динамическими системами.
#### Метод
Мы предлагаем сочетание transformer-based model system dynamics с аналитически известной моделью датчика в рамках unscented Kalman filter (UKF). Данная комбинация позволяет генерировать представления данных, которые могут быть интегрированы с неизвестными динамическими системами. Этот подход, называемый foundation model unscented Kalman filter (FM-UKF), работает без необходимости повторного обучения при изменении динамики системы или сенсорной конфигурации. Мы оптимизировали FM-UKF для работы с динамическими системами, характерными для контейнеровых судов, используя новую бенчмарк-среду, аналогичную реальной среде сложного динамического поведения.
#### Результаты
Мы провести эксперименты на новой бенчмарк-среде, содержащей модели контейнеровых судов с детальными динамическими характеристиками. FM-UKF показал высокую точность и устойчивость в сравнении с классическими методами, использующими аппроксимативные модели динамики, а также с единородными end-to-end transformer-based подходами. Мы также сравнили FM-UKF с другими моделями, продемонстрировав лучшую точность при сравнительно меньшем требовании к данным и усилиям в условиях изменения динамики.
#### Значимость
Результаты FM-UKF открывают новый путь к реализации zero-shot state estimation в системах, требующих значительных усилий в идентификации и моделировании. Этот подход может быть применен в различных областях, включая авиацию, робототехнику и инфраструктурное мониторинг, позволяя сократить усилия при моделировании и обучении моделей. Открытие исходных кодов и данных бенчмарка позволяет другим исследователям продолжить развитие этого подхода и расширить его возможности.
#### Выводы
FM-UKF доказал свою эффективность в решении задачи zero-shot state estimation, объединяя преимущества transformer-based моделей и аналитической модели UKF. Он значительно сокращает требования к данным и усилиям при моделировании систем с новыми динамическими характеристиками. Мы планируем продолжить развитие этого подхода, расширив его применение к дру
Annotation:
State estimation in control and systems engineering traditionally requires
extensive manual system identification or data-collection effort. However,
transformer-based foundation models in other domains have reduced data
requirements by leveraging pre-trained generalist models. Ultimately,
developing zero-shot foundation models of system dynamics could drastically
reduce manual deployment effort. While recent work shows that transformer-based
end-to-end approaches can achieve zero-shot performan...
Авторы:
Babak Esmaeili, Hamidreza Modares
## Контекст
Данная статья посвящена разработке метода планирования движения для хорошо известной класса линейных многоагентных систем, работающих в общем пространстве, заполненном препятствиями. Рассматриваемые системы не обладают доступом к явному моделированию или детальной информации о своих динамиках. Это ставит перед исследователями задачу разработки метода, который бы позволил эффективно планировать движение в пространстве с ограничениями, используя только данные, полученные в результате экспериментов, и технологии конвексного оптимизации.
## Метод
Предлагаемый подход, названный SAFE--MA--RRT, основывается на самообучении каждого агента из данных, полученных в результате экспериментов. Для каждого агента создается локальная графическая модель, описывающая его динамику и связанные с ней ограничения безопасности. Эти модели генерируются путем решения задач оптимизации, которые ведутся в рамках метода семейства семейства безупречных многоагентных RRT (Rapidly Exploring Random Trees). Эти графические модели, в свою очередь, определяют эллипсоиды, которые являются инвариантными для динамики и одновременно определяют "безопасные" регионы для каждого агента. Далее, используя эти модели, планировщик создает дерево путей, где каждая ветвь соответствует одному агенту и представляет собой последовательность "безопасных" переходов, определяемых этими эллипсоидами. Этот подход позволяет гарантировать соблюдение ограничений безопасности в процессе планирования и даже во время исполнения плана.
## Результаты
Эксперименты проводились на моделях различных многоагентных систем в симуляционных условиях. Было показано, что SAFE--MA--RRT эффективно справляется с задачей планирования движения в ситуациях, где предъявляется требование к соблюдению безопасности в пространстве, заполненном препятствиями. Также было продемонстрировано, что данный метод позволяет эффективно синхронизировать движение нескольких агентов, даже когда они работают в условиях жесткого взаимодействия, необходимости соблюдения условий безопасности и ограничений на ресурсы.
## Значимость
Предложенный метод может быть применен в различных областях, где необходимо эффективное планирование движения и управление многоагентными системами в среде с ограничениями и препятствиями. Например, он может быть применен в системах автоматизации производства, логистике, а также в системах самоориентирующихся транспорта. Одним из преимуществ SAFE--MA--RRT является то, что он не требует использования явного моделирования динамических систем, что упрощает эксп
Annotation:
This paper proposes a fully data-driven motion-planning framework for
homogeneous linear multi-agent systems that operate in shared, obstacle-filled
workspaces without access to explicit system models. Each agent independently
learns its closed-loop behavior from experimental data by solving convex
semidefinite programs that generate locally invariant ellipsoids and
corresponding state-feedback gains. These ellipsoids, centered along grid-based
waypoints, certify the dynamic feasibility of short...
Показано 41 -
50
из 63 записей