📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Integrating Legal and Logical Specifications in Perception, Prediction, and Planning for Automated Driving: A Survey of Methods

2025-10-31

Авторы:

Kumar Manas, Mert Keser, Alois Knoll

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This survey provides an analysis of current methodologies integrating legal and logical specifications into the perception, prediction, and planning modules of automated driving systems. We systematically explore techniques ranging from logic-based frameworks to computational legal reasoning approaches, emphasizing their capability to ensure regulatory compliance and interpretability in dynamic and uncertain driving environments. A central finding is that significant challenges arise at the inte...

ID: 2510.25386v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Aircraft Collision Avoidance Systems: Technological Challenges and Solutions on the Path to Regulatory Acceptance

2025-10-28

Авторы:

Sydney M. Katz, Robert J. Moss, Dylan M. Asmar, Wesley A. Olson, James K. Kuchar, Mykel J. Kochenderfer

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Aircraft collision avoidance systems is critical to modern aviation. These systems are designed to predict potential collisions between aircraft and recommend appropriate avoidance actions. Creating effective collision avoidance systems requires solutions to a variety of technical challenges related to surveillance, decision making, and validation. These challenges have sparked significant research and development efforts over the past several decades that have resulted in a variety of proposed ...

ID: 2510.20916v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Ego-Vision World Model for Humanoid Contact Planning

2025-10-15

Авторы:

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Enabling humanoid robots to exploit physical contact, rather than simply avoid collisions, is crucial for autonomy in unstructured environments. Traditional optimization-based planners struggle with contact complexity, while on-policy reinforcement learning (RL) is sample-inefficient and has limited multi-task ability. We propose a framework combining a learned world model with sampling-based Model Predictive Control (MPC), trained on a demonstration-free offline dataset to predict future outcom...

ID: 2510.11682v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Reliable and Scalable Robot Policy Evaluation with Imperfect Simulators

2025-10-08

Авторы:

Apurva Badithela, David Snyder, Lihan Zha, Joseph Mikhail, Matthew O'Kelly, Anushri Dixit, Anirudha Majumdar

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Rapid progress in imitation learning, foundation models, and large-scale datasets has led to robot manipulation policies that generalize to a wide-range of tasks and environments. However, rigorous evaluation of these policies remains a challenge. Typically in practice, robot policies are often evaluated on a small number of hardware trials without any statistical assurances. We present SureSim, a framework to augment large-scale simulation with relatively small-scale real-world testing to provi...

ID: 2510.04354v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 PhysiAgent: An Embodied Agent Framework in Physical World

2025-10-01

Авторы:

Zhihao Wang, Jianxiong Li, Jinliang Zheng, Wencong Zhang, Dongxiu Liu, Yinan Zheng, Haoyi Niu, Junzhi Yu, Xianyuan Zhan

## Контекст PhysiAgent: An Embodied Agent Framework in Physical World — это исследование в области Vision-Language-Action (VLA), направленное на решение проблем с относительно низким уровнем общедоступности, с которыми сталкиваются существующие VLA-модели. Несмотря на успех моделей Vision-Language Models (VLMs) в задачах понимания сцены и планирования, их универсальность часто ограничивается, что приводит к неэффективной командировке VLAs. Недостаток гибкости и самостоятельности во взаимодействии между VLMs и VLAs приводит к трудностям в коллаборации и слабым механизмам закрепления в реальных физических средах. Данная работа стремится создать автономную систему, которая способна корректно организовывать действия и интеллектуально взаимодействовать в реальном времени. ## Метод PhysiAgent представляет собой специализированную систему, которая включает в себя несколько ключевых монолитов: монитор, память и саморефлексию. Эти модули интегрируются с офф-столовыми алгоритмами для гибкой командировки VLMs на основе реального времени. Монитор отвечает за динамическое выявление ошибок и проблем в поведении VLMs. Модуль памяти сохраняет информацию о действиях и результатах, которая позволяет VLMs корректировать свой подход. Механизм саморефлексии определяет необходимые модификации в стратегии и позволяет VLMs принимать адаптивные решения. Для работы с физическими средами используются сборки стандартных инструментов, которые обеспечивают конкретную реализацию. Эта архитектура включена в общую систему, которая предоставляет инструмент для обеспечения лучшей координации между VLMs и VLAs в реальных ситуациях. ## Результаты В ходе экспериментов были проведены испытания на комплексных реальных задачах, включающих в себя множество сложных операций. Использованные данные включали видео, текст и данные с сенсоров, которые описывали сцену и выполняемые действия. Результаты показали, что PhysiAgent существенно улучшает производительность в решении задач, повышая точность выполнения действий до 95%. Это продемонстрировано на примерах, где VLMs эффективно координируют VLAs, а сама система адаптируется к изменению условий. Эксперименты показывают, что PhysiAgent предлагает эффективное решение взаимодействия и мониторинга в реальном времени. ## Значимость PhysiAgent имеет широкие области применения в сферах робототехники, умных домов, систем поиска информации и управления. Он предлагает значительные преимущества по сравнению с существующими алгоритмами. В частности, его гибкость и самоорганизационные свойства позволяют существенно повысить эффективность в решении задач, оптимизировать

Annotation:

Vision-Language-Action (VLA) models have achieved notable success but often struggle with limited generalizations. To address this, integrating generalized Vision-Language Models (VLMs) as assistants to VLAs has emerged as a popular solution. However, current approaches often combine these models in rigid, sequential structures: using VLMs primarily for high-level scene understanding and task planning, and VLAs merely as executors of lower-level actions, leading to ineffective collaboration and ...

ID: 2509.24524v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 TranTac: Leveraging Transient Tactile Signals for Contact-Rich Robotic Manipulation

2025-09-25

Авторы:

Yinghao Wu, Shuhong Hou, Haowen Zheng, Yichen Li, Weiyi Lu, Xun Zhou, Yitian Shao

## Контекст Современные роботизированные системы для тонких манипуляций часто сталкиваются с ограничениями в осуществлении точных действий, особенно когда визуальная перцепция не может уловить незначительные изменения в положении объекта. Например, в таких задачах, как вставка ключа в замок или подключение USB-устройства, визуальные системы могут недостаточно чувствительны к вибрациям и контактным сигналам, необходимым для точного контроля. Это приводит к неточностям, необходимости повторных попыток и потере времени. Было предложено использовать объемные сенсоры, но они либо медленны, либо требуют слишком много ресурсов. TranTac предлагает решение этой проблемы, объединяя эффективность, точность и недорогие материалы для решения таких задач. ## Метод TranTac основывается на интеграции 6-осевого инерциального измерительного устройства (IMU) в полимерные части робот-гриппера. Этот сенсор наблюдает динамические изменения в положении объекта в течение десятков микросекунд, что позволяет измерить малые движения, невидимые для визуального сенсора. Модель также включает в себя transformer-based encoders, которые обрабатывают данные IMU, и diffusion policy, позволяющую роботу динамически корректировать положение объекта. Эта модель имитирует человеческие движения при вставке, используя динамические корректировки, основанные на временных сенсорных сигналах. ## Результаты TranTac протестирована на вставке примесей, ключей и USB-устройств. Она достигла высокой успешности во вставке с незначительными ошибками, даже если визуальная система не смогла обнаружить несоответствия. Помимо этого, робот смог правильно распознавать контактные точки и корректировать свое положение при наличии видимых деформаций. Также был проведен тест на общую гибкость: после обучения на одной паре отверстий и объекта, TranTac успешно выполнила задачи на неизвестных объектах с чуть менее 70% успешностью. ## Значимость Наиболее заметные преимущества TranTac заключаются в ее способности использовать минимальное количество данных для точного управления, что делает ее привлекательной для систем с ограниченными ресурсами. Ее можно применять в сфере robot-саунд, где точность и эффективность сенсорных сигналов критичны. Эта модель также может быть применена в реальных ситуациях, таких как туннельные инструменты для медицинских целей или роботы для сборки тонких соединений. Такое решение может существенно улучшить точность и эффективность манипуляций в технических задачах. ## Выводы TranTac достигла значительных успехов в области тонких манипуляций, показав способность корректировать положение объекта с помощью

Annotation:

Robotic manipulation tasks such as inserting a key into a lock or plugging a USB device into a port can fail when visual perception is insufficient to detect misalignment. In these situations, touch sensing is crucial for the robot to monitor the task's states and make precise, timely adjustments. Current touch sensing solutions are either insensitive to detect subtle changes or demand excessive sensor data. Here, we introduce TranTac, a data-efficient and low-cost tactile sensing and control fr...

ID: 2509.16550v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 SMART-3D: Three-Dimensional Self-Morphing Adaptive Replanning Tree

2025-09-24

Авторы:

Priyanshu Agrawal, Shalabh Gupta, Zongyuan Shen

## Контекст ### Область исследования Требования к автономным системам в условиях динамически изменяющейся среды постоянно растут. Особенно актуальным становится решение проблемы пересчета маршрутов в реальном времени при возникновении движущихся препятствий. Наиболее затруднены ситуации в трехмерных средах, таких как морские глубины, аэросфера и астероидные поля. ### Задача В подобных средах проблема репланирования маршрутов становится критично важной. Нужен алгоритм, который может эффективно и быстро построить новый маршрут, гарантируя безопасность и эффективность движения. ### Мотивация Предыдущие алгоритмы, такие как SMART, были разработаны для двумерных сред. Однако в трехмерных средах проблема работы с движущимися препятствиями значительно усложняется. Требуется адаптивный подход, который может эффективно справляться с такими ограничениями. ## Метод ### Описание методологии SMART-3D является расширением SMART-алгоритма, ориентированным на трехмерные среды. Основной идеей является замена трехмерной сетки на более эффективную структуру — **дерево Smart-tree**. ### Архитектура SMART-3D построен на основе дерева, где каждая ветвь представляет потенциальный маршрут. Если препятствие попадает в проходящую часть маршрута, алгоритм находит ближайший **hot-node** — узел, который может быть использован для быстрого реконнекта к другим частям дерева. ### Особенности - **Удаление трехмерной сетки**: Трехмерная сетка, используемая в SMART, заменена на более эффективную структуру. - **Hot-nodes**: Эти узлы играют ключевую роль в поддержании структуры и быстрому нахождению новых маршрутов. - **Реальное время**: Алгоритм работает без необходимости пересчета сетки, что позволяет достичь высокой скорости операций. ## Результаты ### Эксперименты Данные для экспериментов были сгенерированы симулятором, в котором в трехмерной среде двигались динамические препятствия. Алгоритмы были применены для редактирования маршрута в реальном времени. ### Данные Использовались данные с разными скоростями движения препятствий, различными геометрическими структурами среды и разной плотностью препятствий. ### Результаты - **Успешный маршрут**: В 76% случаев SMART-3D смог найти новый безопасный маршрут в течение 200 мс. - **Траектория препятствия**: Обнаружено, что SMART-3D эффективно адаптируется к движущимся препятствиям, уменьшая время перепланирования. ## Значимость ### Области применения SMART-3D может быть применен в следующих сферах: - Автономные

Annotation:

This paper presents SMART-3D, an extension of the SMART algorithm to 3D environments. SMART-3D is a tree-based adaptive replanning algorithm for dynamic environments with fast moving obstacles. SMART-3D morphs the underlying tree to find a new path in real-time whenever the current path is blocked by obstacles. SMART-3D removed the grid decomposition requirement of the SMART algorithm by replacing the concept of hot-spots with that of hot-nodes, thus making it computationally efficient and scala...

ID: 2509.16812v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Explainable AI-Enhanced Supervisory Control for Robust Multi-Agent Robotic Systems

2025-09-23

Авторы:

Reza Pirayeshshirazinezhad, Nima Fathi

#### Контекст Область исследования сосредоточена на развитии методов управления для систем многоагентных роботов, где необходимо обеспечить безопасность, высокую точность и интерпретируемость решений. Традиционные методы часто страдают от неполной транспарентности, что может привести к недоверию и ошибкам в критичных ситуациях. В то же время, существующие решения часто не могут эффективно комбинировать безопасность, точность и энергоэффективность в реальном времени. Это ставит дополнительные требования к разработке фреймворков управления, которые были бы эффективны в условиях строгого требования к точности и гибкости в условиях неопределенности. Мотивация заключается в разработке фреймворка, который обеспечивает транспарентность, эффективность и безопасность в различных многоагентных роботизированных системах. #### Метод Методология фреймворка основывается на трех ключевых компонентах: 1) **Timed-automata supervisor**, который обеспечивает безопасное и аудируемое переключение режимов управления; 2) **Lyapunov-based controller** для решения задач с большими угловыми поворотами; 3) **Sliding-mode controller (SMC) with boundary layers**, обеспечивающий точность и устойчивость при воздействии нарушений. Для обучения использовалась модель Monte Carlo-driven optimization, обеспечивающая набор данных для реального времени. Разработанный фреймворк также включает в себя **explainable predictor**, который предоставляет прозрачный анализ, как миссионные критерии соотносятся с ресурсами и ожидаемой производительностью (например, энергопотреблением и ошибкой). Для валидации были использованы две различные среды: 1) миссии по формованию космических аппаратов; 2) тесты автономных подводных роботов (AUV). #### Результаты В тестах по космическим миссиям, проводимым с использованием роботов-формирователей, SMC-контроллер показал субмиллиметровую точность в алигнменте с 21.7% меньшим потреблением энергии и 81.4% меньшей ошибкой по сравнению с контроллером Proportional-Derivative (PD). В тестах подводных роботов (AUV), которые моделируют условия строгих раступываний и внешних воздействий, SMC удалось сохранить ограниченные ошибки в рамках допустимого диапазона. Эти результаты подтверждают гибкость и надежность фреймворка в различных условиях, в том числе с тесным следованием к динамическим критериям и неопределенностям в миссионном контексте. #### Значимость Разработанный фреймворк может быть применен в различных критичных областях, включая космические операции, подводное воздушное дело, а также в общих многоагентных роботизированных системах. Он обеспечивает повышенную

Annotation:

We present an explainable AI-enhanced supervisory control framework for multi-agent robotics that combines (i) a timed-automata supervisor for safe, auditable mode switching, (ii) robust continuous control (Lyapunov-based controller for large-angle maneuver; sliding-mode controller (SMC) with boundary layers for precision and disturbance rejection), and (iii) an explainable predictor that maps mission context to gains and expected performance (energy, error). Monte Carlo-driven optimization prov...

ID: 2509.15491v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Prompt2Auto: From Motion Prompt to Automated Control via Geometry-Invariant One-Shot Gaussian Process Learning

2025-09-19

Авторы:

Zewen Yang, Xiaobing Dai, Dongfa Zhang, Yu Li, Ziyang Meng, Bingkun Huang, Hamid Sadeghian, Sami Haddadin

## Контекст Управление роботами на основе демонстрации позволяет им приобретать сложные навыки, адаптировався к различным задачам в разных средах. Однако, существующие подходы часто требуют больших наборов данных и не в состоянии обобщаться на новые координатные преобразования. Эти ограничения затрудняют их применение в реальных условиях, где необходимо быстрое понимание и адаптация к изменениям. Мотивация заключается в развитии метода, который может извлекать полезные навыки из небольших демонстраций и обеспечивать высокую гибкость при работе в разных условиях. ## Метод Мы предлагаем Prompt2Auto — новую рамочную методику, основанную на геометрически инвариантном подходе one-shot Gaussian process learning. Основной идеей является возможность извлечения знаний о движении в любой точке пространства из одного моментального пробного знака (motion prompt). Для обеспечения геометрической инвариантности мы предлагаем стратегию построения данных, которая учитывает преобразования по трансляции, вращению и масштабированию. Это позволяет модели GeoGP не только мгновенно понять движение, но и предсказывать несколько шагов вперёд. Также, модель обладает высокой стойкостью к разнообразию в поведении пользователя, что формирует базу для многоспособной автономной системы. ## Результаты Мы проверили Prompt2Auto в рамках двух реальных экспериментов, используя дизайн пользовательского интерфейса для графического ввода движений. Результаты показали, что модель может эффективно извлекать навыки в одном примере, преобразовывать их в конкретное поведение робота, а также адаптироваться к новым условиям. Это продемонстрировано в сценариях, в которых робот выполнял сложные ритмичные движения, включая колебания точки в пространстве и другие задачи, где требуется точное управление. Модель GeoGP также показала способность учитывать несколько навыков одновременно, что позволяет роботу одновременно решать разные задачи. ## Значимость Предлагаемый подход может быть применен в различных областях, где необходимо автоматизировать управление роботами на основе набора сложных движений, таких как ассистирование в хирургии, точные технологии или системы для транспорта. Одним из основных преимуществ является высокая гибкость и способность обучаться из небольших демонстраций, что значительно сокращает время обучения. Это может привести к увеличению эффективности и безопасности в работе с роботами в технологических процессах. ## Выводы Результаты проведенных экспериментов показывают, что Prompt2Auto является эффективным инструментом для обучения роботов с использованием одного моментального примера. Метод не только обеспечивает высокую

Annotation:

Learning from demonstration allows robots to acquire complex skills from human demonstrations, but conventional approaches often require large datasets and fail to generalize across coordinate transformations. In this paper, we propose Prompt2Auto, a geometry-invariant one-shot Gaussian process (GeoGP) learning framework that enables robots to perform human-guided automated control from a single motion prompt. A dataset-construction strategy based on coordinate transformations is introduced that...

ID: 2509.14040v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 FMT$^{x}$: An Efficient and Asymptotically Optimal Extension of the Fast Marching Tree for Dynamic Replanning

2025-09-12

Авторы:

Soheil Espahbodini Nia

#### Контекст Планирование маршрутов в динамических средах является одной из основных проблем в робототехнике, особенно при развертывании автономных систем в непредсказуемых пространствах, таких как склады и дороги. Алгоритмы, такие как Fast Marching Tree (FMT$^{*}$), обеспечивают асимптотически оптимальные решения в статических средах. Однако их однопроходная структура не позволяет изменять маршруты во время выполнения, что необходимо для реакции на изменения среды в реальном времени. Другой подход — полное перепланирование — требует больших вычислительных ресурсов. Данная работа предлагает FMT$^{x}$, расширение FMT$^{*}$, которое позволяет эффективно и консистентно проводить перепланирование в динамических средах. #### Метод Авторы пересмотрели правило выбора соседей в FMT$^{*}$, продемонстрировав, что минимальные изменения этого правила позволяют перейти от однопроходного подхода к многопроходному. Теперь алгоритм может обновлять значения cost-to-come при обнаружении лучших путей без потери асимптотической оптимальности и высокой вычислительной эффективности. Используется комбинация общего приоритетного очереди с выбранным условием обновления, которое использует расширяющийся сосед для определения и переоценки любого узла с потенциально субоптимальным путем. Этот метод позволяет эффективно исправлять субоптимальные маршруты в процессе изменения среды, сохраняя эффективность FMT$^{*}$. #### Результаты Эксперименты показали, что FMT$^{x}$ быстрее реагирует на изменения в среде по сравнению с RRT$^{x}$, при этом потребляя меньшие вычислительные ресурсы. Алгоритм обеспечивает высокую скорость реакции и эффективное использование ресурсов, что делает его оптимальным выбором для реального времени в планировании маршрутов в непредсказуемых средах. #### Значимость Предлагаемый подход может быть применен в различных робототехнических системах, включая роботы-помощники, автомобили-роботы, а также в системы-сироты в складских системах. Он обеспечивает быструю реакцию на изменения и низкое потребление ресурсов, что делает его привлекательным для реального времени. Будущие исследования будут ориентированы на улучшение метода FMT$^{x}$ для более сложных сред и увеличения скорости их выполнения. #### Выводы FMT$^{x}$ является эффективным и асимптотически оптимальным решением для планирования маршрутов в динамических средах. Он позволяет эффективно исправлять маршруты при изменении среды, сохраняя высокую эффективность и асимптотическую оптимальность. Дальнейшие исследования будут нацелены на улучшение производительности и расширение применений этого подхода.

Annotation:

Path planning in dynamic environments remains a core challenge in robotics, especially as autonomous systems are deployed in unpredictable spaces such as warehouses and public roads. While algorithms like Fast Marching Tree (FMT$^{*}$) offer asymptotically optimal solutions in static settings, their single-pass design prevents path revisions which are essential for real-time adaptation. On the other hand, full replanning is often too computationally expensive. This paper introduces FMT$^{x}$, an...

ID: 2509.08521v1 cs.RO, cs.AI, cs.SY, eess.SY, I.2.9; I.2.8

arXiv PDF

Показано 1 - 10 из 15 записей