📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Improving the Resilience of Quadrotors in Underground Environments by Combining Learning-based and Safety Controllers

2025-09-05

Авторы:

Isaac Ronald Ward, Mark Paral, Kristopher Riordan, Mykel J. Kochenderfer

#### Контекст Одна из самых вызовов при использовании автономных роботов в подземных окружениях является обеспечение их устойчивости и безопасности в условиях неопределенности и неизвестности. Такие окружения часто имеют уникальные, непредсказуемые характеристики, которые не могут быть полностью охвачены во время обучения. Это влечет за собой риск выхода из рабочего диапазона (out-of-distribution), что может привести к нежелательным последствиям. Для практического применения, таких как поисковые и спасательные операции, окраины минеральных ресурсов и окружающая среда, необходимо создать системы, которые обладают характеристикой быстрого реагирования (liveness) и безопасностью (safety). Наша мотивация заключается в создании метода, который объединяет преимущества обучения-на-борту (learning-based) и традиционных безопасных алгоритмов. #### Метод Мы предлагаем комбинированный подход к контролю автономных квадроторов, который использует модель нормализующего потока (normalizing flow) для оценки выхода квадротора за пределы обучающей выборки. Эта модель функционирует как раннее предупреждение (runtime monitor), которое срабатывает при выходе за допустимый диапазон. В случае выхода, алгоритм переключается на безопасный контроллер, а в случае возвращения к ожидаемому диапазону — на обученный, наушный робот. Мы использовали обученную модель для контроля движения в трехмерной симуляции лабиринта, основанной на реальных данных из DARPA Subterranean Challenge. Наша архитектура включает в себя два основных модуля: модель нормализующего потока для мониторинга и выборки контроллера, и саму систему контроля. #### Результаты Мы проводили эксперименты в симуляторе, сравнивая нашу систему с отдельными моделями — только обученным и только безопасным контроллером. Наши результаты показали, что комбинированный подход обеспечивает более быструю проходимость лабиринта (liveness), чем безопасный контроллер, при этом сохраняя безопасность (невозможность выхода за пределы между двумя контроллерами). Также мы проверили способность модели выявлять и реагировать на различные типы выходов за допустимый диапазон. Наши метрики показали, что у нашей системы лучшая производительность в отношении времени отклика и точности в сравнении с конкурентными подходами. #### Значимость Наш подход может быть применен в различных подземных операциях, таких как поисковые и спасательные задачи, измерение и мониторинг подземных ресурсов, а также сбор данных в условиях ограниченной видимости. Он обеспечивает высокую точность и быстроту действия, без ущерба для безопасности. Помимо этого, наш метод может быть расширен для других видов

Annotation:

Autonomously controlling quadrotors in large-scale subterranean environments is applicable to many areas such as environmental surveying, mining operations, and search and rescue. Learning-based controllers represent an appealing approach to autonomy, but are known to not generalize well to `out-of-distribution' environments not encountered during training. In this work, we train a normalizing flow-based prior over the environment, which provides a measure of how far out-of-distribution the quad...

ID: 2509.02808v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 AgriChrono: A Multi-modal Dataset Capturing Crop Growth and Lighting Variability with a Field Robot

2025-08-28

Авторы:

Jaehwan Jeong, Tuan-Anh Vu, Mohammad Jony, Shahab Ahmad, Md. Mukhlesur Rahman, Sangpil Kim, M. Khalid Jawed

## Контекст Модернизация сельского хозяйства с помощью интеллектуальных технологий требует развития систем, устойчивых к разнообразию условий реальных сельскохозяйственных сред. Несмотря на прогресс в сельскохозяйственной робототехнике, существующие данные для обучения и тестирования моделей часто генерируются в условиях статических или контролируемых сред, таких как лабораторные или теплицы. Эти условия не соответствуют динамичности настоящих полевых условий, включая изменения освещения, развитие культур и природные помехи. Это приводит к недостатку универсальности и надежности моделей при их применении в реальных полевых ситуациях. Наша мотивация заключается в создании новой платформы для сбора данных и многомодального набора данных, которые будут отражать динамику настоящих сельскохозяйственных сред, позволяя улучшить модели и их применимость. ## Метод Мы разработали AgriChrono — новую платформу для сбора данных, которая интегрирует несколько сенсоров для получения RGB, глубинных карт, LiDAR и данных IMU. Эта платформа развёрнута на борту робота, работающего в полевых условиях. Робот собирает данные в реальном времени, а многомодальность и встроенная синхронизация времени обеспечивают точность и повторяемость. Архитектура системы разработана таким образом, чтобы обеспечить эффективность и гибкость при сборе данных в зависимости от разных стадий роста культур и изменений освещения. Это позволяет получать высококачественные данные для обучения и тестирования моделей в сельскохозяйственных задачах. ## Результаты Мы провели эксперименты с использованием наших данных для оценки современных моделей 3D-реконструкции. Использовались данные, собранные в различных условиях освещения и развития культур. Результаты показали, что данные AgriChrono являются вызовом для существующих моделей, поскольку они отражают динамику реальной сельскохозяйственной среды. Мы также показали, что AgriChrono может стать мощным инструментом для улучшения универсальности моделей и их надежности в реальных полевых условиях. ## Значимость Платформа AgriChrono и её набор данных могут быть применены в различных областях, включая агроинтеллектуальные системы, моделирование растительности, оценку урожая и другие сельскохозяйственные задачи. Их значимость заключается в том, что они позволяют развитию моделей с более высокой универсальностью и надежностью при работе в динамичных сельскохозяйственных условиях. Это может привести к более эффективному использованию ресурсов в сельском хозяйстве и к повышению точности решения важных проблем в этой области. ## Выводы Платформа AgriChrono и набор

Annotation:

Existing datasets for precision agriculture have primarily been collected in static or controlled environments such as indoor labs or greenhouses, often with limited sensor diversity and restricted temporal span. These conditions fail to reflect the dynamic nature of real farmland, including illumination changes, crop growth variation, and natural disturbances. As a result, models trained on such data often lack robustness and generalization when applied to real-world field scenarios. In this pa...

ID: 2508.18694v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion

2025-08-16

Авторы:

Qi Liu, Xiaopeng Zhang, Mingshan Tan, Shuaikang Ma, Jinliang Ding, Yanjie Li

#### Контекст Локомоция человеческого робота представляет одну из наиболее трудных и интересных областей исследований в области робототехники и искусственного интеллекта. Однако, существующие методы, основанные на сингл-агентных алгоритмах, часто не полностью раскрывают потенциал робота в условиях сложных локальных условий. Это приводит к узким и неэффективным решениям. Требуется новая парадигма, позволяющая улучшить локомоционные стратегии через более глубокое коллективное взаимодействие. Мотивация заключается в развитии многоагентных методов, которые могут более эффективно использовать характеристики робота в целом. #### Метод Метод MASH (Multi-Agent Reinforcement Learning for Single Humanoid Locomotion) основывается на кооперативно-гетерогенной многоагентной системе. Робот рассматривается как система, где каждая его нога и рука является отдельным агентом. Эти агенты взаимодействуют в рамках глобального системного критика, обучающегося с помощью многоагентного метода deep reinforcement learning (MARL). Отдельные агенты проводят формирование действий в своих пространствах, а критик обеспечивает коллективную оптимизацию. Данная архитектура позволяет увеличить степень взаимодействия между телом и его частями, что значительно улучшает локомоционные возможности. #### Результаты Работа проводилась на симуляционных моделях человеческих роботов, где были разработаны эксперименты для сравнения MASH с традиционными методами. Наблюдалось ускорение времени обучения и значительное улучшение глобальных локомоционных показателей, таких как стабильность и корректность движений. Данные результаты подтвердили, что MASH не только ускоряет обучение, но и повышает целостность локомоционной системы по сравнению с одноагентными системами. #### Значимость Полученные результаты открывают новые возможности применения многоагентных методов в решении задач локомоции для человеческих роботов. Этот подход может быть задействован в разработке более эффективных алгоритмов для роботов, которые оперируют в сложных трехмерных средах. Применение MASH может способствовать развитию робототехнических систем, увеличивая их скорость реакции и степень координации движений. #### Выводы MASH доказал свою эффективность в решении задач локомоции человеческого робота через кооперативно-гетерогенную многоагентную систему. Он ускоряет обучение и улучшает логичность движений по сравнению с традиционными методами. В будущем, этот подход может быть расширен для решения задач в других областях робототехники, где требуется мобильность и координация.

Annotation:

This paper proposes a novel method to enhance locomotion for a single humanoid robot through cooperative-heterogeneous multi-agent deep reinforcement learning (MARL). While most existing methods typically employ single-agent reinforcement learning algorithms for a single humanoid robot or MARL algorithms for multi-robot system tasks, we propose a distinct paradigm: applying cooperative-heterogeneous MARL to optimize locomotion for a single humanoid robot. The proposed method, multi-agent reinfor...

ID: 2508.10423v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Model Predictive Control for Crowd Navigation via Learning-Based Trajectory Prediction

2025-08-13

Авторы:

Mohamed Parvez Aslam, Bojan Derajic, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Jan Oliver Ringert

## Контекст Самостоятельная навигация во время перемещения в условиях городских местностей, где существует высокое число пеших движущихся субъектов, является важной задачей для автономных роботов. Особенностью данной области является необходимость обеспечить безопасность поведения робота, а также максимальную эффективность в действиях. Однако возникает проблема оптимального предсказания движения пешеходов, которая может вызывать неточности в движении автономных систем. Из-за этого, развитие систем, основанных на моделировании и контроле, взаимодействующих с глубокой нейронной сетью, является ключевым направлением для решения этой проблемы. ## Метод В работе представлена интеграция модели Model Predictive Control (MPC) с предсказанием траекторий на основе глубокого обучения. Используется Social-Implicit (SI) model для оценки поведения пешеходов в различных условиях плотности. Таким образом, предыдущие технологии, например, Constant Velocity Model (CVM), используются как базовый метод для сравнения. Архитектура SI-MPC базируется на совместном применении нейронных сетей и MPC, чтобы отражать социальные особенности пешеходов в процессе планирования движения. Эта модель позволяет снизить неточности в предсказании движения и улучшить безопасность в условиях высокой плотности. ## Результаты Использовались данные с реальных тестов на физическом роботе Continental Corriere в различных условиях плотности. Результаты показали, что SI-MPC модель существенно улучшает точность предсказания траекторий пешеходов по сравнению с CVM в условиях низкой плотности - снижая ошибки на 76%. В условиях высокой плотности, SI-MPC демонстрирует более широкие и осторожные предсказания, что приводит к улучшению безопасности и гладкости движения. Эти результаты подтверждают преимущества данной модели в реальной среде. ## Значимость Модель SI-MPC может быть применена в различных сферах, включая поддержку автономных транспортных средств в городах, системы поддержки принятия решений в зонах пешеходного движения, а также в развитии безопасных протоколов для роботов в целом. Она обеспечивает более точное и безопасное предсказание траекторий, что может иметь важное значение в условиях сложных динамических сред. ## Выводы Результаты эксперимента показали, что SI-MPC модель является эффективным инструментом для безопасного и эффективного движения в условиях высокой плотности. На основе данных результатов, будущие работы будут сфокусированы на улучшении моделей предсказания и их интеграции с другими системами для достижения более высокой эффективности и надежности в автономной навигаци

Annotation:

Safe navigation in pedestrian-rich environments remains a key challenge for autonomous robots. This work evaluates the integration of a deep learning-based Social-Implicit (SI) pedestrian trajectory predictor within a Model Predictive Control (MPC) framework on the physical Continental Corriere robot. Tested across varied pedestrian densities, the SI-MPC system is compared to a traditional Constant Velocity (CV) model in both open-loop prediction and closed-loop navigation. Results show that SI ...

ID: 2508.07079v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 COMponent-Aware Pruning for Accelerated Control Tasks in Latent Space Models

2025-08-13

Авторы:

Ganesh Sundaram, Jonas Ulmen, Amjad Haider, Daniel Görges

## Контекст Современные вычислительные системы, включая мобильные платформы, мобильные роботы, интернет-девайсы и подключенные устройства, становятся все более запрограммированными и автоматизированными. Это приводит к необходимости использовать компьютерные алгоритмы, оптимизированные под ресурсы, которые доступны в этих устройствах. Тем не менее, нейросетевые контроллеры (NNC), широко используемые для моделирования и управления динамическими системами, часто превышают допустимые требования к производительности и памяти. Это делает их выгрузку на практических устройствах сложной. Данная работа фокусируется на методах, которые позволяют сделать нейросетевые контроллеры более эффективными в плане ресурсов, при этом сохраняя качество управления. ## Метод В этой работе предлагается методология, основанная на компонентно-ориентированной структурной усечении (component-aware structured pruning), которая позволяет определять оптимальную степень усечения для каждого раздела модели. Это сделано с целью балансировки между надежностью управления и эффективностью ресурсов. Метод был интегрирован в Temporal Difference Model Predictive Control (TD-MPC), современный алгоритм моделирования и контроля с использованием научных методов. Также в работе используются математические критерии стабильности, такие как Lyapunov-критерии, для гарантии устойчивости управления. Эта структурная усечение модели постоянно отслеживает критерии устойчивости, чтобы не допустить ухудшения управления. ## Результаты Эксперименты проводились на реальных данных с использованием TD-MPC. Метод был протестирован на различных наборах данных, включая имитационные симуляции и реальные тестовые установки. Результаты показали, что процедура структурного усечения не только уменьшает требования к памяти и вычислениям, но и сохраняет показатели управления на уровне, достаточном для безопасного и эффективного использования в реальных устройствах. Также был определен теоретический предел, на котором модель может быть сжата, не нарушая стабильности управления. ## Значимость Результаты этой работы могут быть применены в различных приложениях, включая мобильные роботы, интернет-девайсы и транспортные системы. Особым преимуществом является возможность изменения модели, обеспечивая оптимальную стабильность и производительность при минимальных требованиях к ресурсам. Это улучшает возможности создания эффективных систем управления, которые могут быть использованы в реальных устройствах. Это может привести к более широкому использованию нейросетевых моделей в практических приложениях, которые раньше были недо

Annotation:

The rapid growth of resource-constrained mobile platforms, including mobile robots, wearable systems, and Internet-of-Things devices, has increased the demand for computationally efficient neural network controllers (NNCs) that can operate within strict hardware limitations. While deep neural networks (DNNs) demonstrate superior performance in control applications, their substantial computational complexity and memory requirements present significant barriers to practical deployment on edge devi...

ID: 2508.08144v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

Показано 11 - 15 из 15 записей