📚 Саммари научных статей из arXiv

Найдено 544 результатов по запросу 'cs.RO, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 The Role of Touch: Towards Optimal Tactile Sensing Distribution in Anthropomorphic Hands for Dexterous In-Hand Manipulation

2025-09-20

Авторы:

João Damião Almeida, Egidio Falotico, Cecilia Laschi, José Santos-Victor

## Контекст Одним из ключевых аспектов развития антропоморфных роботизированных систем является вопрос контроля объектов в руках робота. Для достижения точного управления, особенно в задачах перемещения объектов в руках (in-hand manipulation), необходима распределенная сенсорная сетка. Однако, традиционно фокус помещается на сенсоры, размещенные на пальцах, в то время как другие области руки, например, пальцы или локти, часто игнорируются. Эта работа исследует эффективность различных тактильных сетей в различных областях руки для решения задач переориентации объектов в руках. Целью является изучение влияния различных регионов руки на устойчивость и точность контроля, а также выявление принципов, подходящих для оптимального размещения сенсоров. ## Метод Для решения исследователи применяют модель антропоморфной руки с распределенными сенсорами, размещенными на кисти, средних и мелких пальцах, а также на локте. Для оценки взаимосвязи между тактильной информацией и контролем используется глубокое управление с подкреплением (deep reinforcement learning). Экспериментальные задачи включают переориентацию различных объектов с разными характеристиками в руках робота. Важной частью исследования является сравнение результатов полученных с различными конфигурациями сенсоров, чтобы определить, какие расположения сенсоров более эффективны для точного и быстрого контроля. ## Результаты Исследование показало, что размещение сенсоров в разных областях руки имеет существенное влияние на устойчивость и эффективность во время переориентации объектов. Например, сенсоры на кистях позволяют более точно определять момент прикосновения к объекту, что улучшает управление в течение задачи. В то же время, сенсоры на пальцах и локтях позволяют улучшить стабильность и точность, особенно при работе с объектами разных форм и размеров. Эксперименты также показали, что оптимальное размещение сенсоров зависит от характеристик объекта, который нужно переместить. ## Значимость Результаты этого исследования имеют значительное значение для разработки антропоморфных энд-иффекторов, особенно в задачах, требующих высокой точности и стабильности. Изучение различных конфигураций сенсоров позволяет оптимизировать контрольная систему, улучшая управляемость и эффективность в различных задачах. Этот подход также может быть применен в робототехнике, медицине, и других областях, где необходима точная реакция на контактные сигналы. ## Выводы Изучение различных конфигураций тактильных сенсоров в антропоморфных руках показало, что локальные сенсоры могут существенно улучши

Annotation:

In-hand manipulation tasks, particularly in human-inspired robotic systems, must rely on distributed tactile sensing to achieve precise control across a wide variety of tasks. However, the optimal configuration of this network of sensors is a complex problem, and while the fingertips are a common choice for placing sensors, the contribution of tactile information from other regions of the hand is often overlooked. This work investigates the impact of tactile feedback from various regions of the ...

ID: 2509.14984v1 cs.RO, cs.AI, cs.LG, cs.SY, eess.SY

arXiv PDF

📄 ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy

2025-09-19

Авторы:

Alejandro D. Mousist

## Контекст Обеспечение автономных операций на борту космических аппаратов представляет одну из самых актуальных проблем в современном космонавтике. Одним из ключевых аспектов этой задачи является эффективное управление тепловыми ресурсами, которое требует достоверного и адаптивного контроля при минимальном потреблении ресурсов. Несмотря на то, что существуют технологии для управления тепловыми ресурсами, они часто требуют значительных вычислительных ресурсов и не вполне удовлетворяют требованиям минимализации отказов в условиях активного оперативного режима. В этом контексте проект ASTREA (Autonomous Spacecraft Thermal REgulation Agent) представляет собой крутой шаг вперед, поскольку предлагает решение, которое объединяет семантическую рациональность и адаптивный контроль в одной системе. ## Метод ASTREA широко использует технологии глубокого обучения, в частности, развитие Large Language Model (LLM) и распределенных систем рекомендаций. Основной инновацией является интеграция LLM-агента с реинфорсмент-контроллером в рамках асинхронной архитектуры. Эта конфигурация позволяет гибко адаптироваться к условиям реальных космических операций. Особенностью методологии является использование тренажерного центра с большим набором тестовых данных, позволяющих тренировать и проверять систему в условиях, наблюдаемых в космосе. Таким образом, ASTREA предлагает новый подход к космическим операциям, который включает в себя агентскую логику и рациональный подход к решению проблемы теплового регулирования. ## Результаты Проведенные эксперименты показали, что на главной платформе ASTREA, работающей на земле, LLM-агент значительно улучшает тепловую стабильность и снижает частоту нарушений. Он показал способность системы адаптироваться к нестандартным ситуациям, что демонстрирует мощность глубокого обучения в решении проблем управления космическими тепловыми ресурсами. Однако, при переходе на борт Международной Космической Станции (МКС), было выявлено некоторое снижение эффективности, связанное с задержками в обработке информации. Эти задержки становятся критичными в условиях быстрых тепловых циклов, которые характерны для спутников в низкую орбиту Земли (ЛОС). Таким образом, результаты показывают, что, несмотря на прогресс, есть технические вызовы, которые требуют улучшения. ## Значимость ASTREA может быть применена в широком кругу задач, связанных с космическими операциями, включая не только тепловое регулирование, но и другие аспекты автономного управления. Одним из основных преимущест

Annotation:

This paper presents ASTREA, the first agentic system deployed on flight-heritage hardware (TRL 9) for autonomous spacecraft operations. Using thermal control as a representative use case, we integrate a resource-constrained Large Language Model (LLM) agent with a reinforcement learning controller in an asynchronous architecture tailored for space-qualified platforms. Ground experiments show that LLM-guided supervision improves thermal stability and reduces violations, confirming the feasibility ...

ID: 2509.13380v1 cs.RO, cs.AI, cs.LG, cs.MA, cs.SY, eess.SY

arXiv PDF

📄 Dense-Jump Flow Matching with Non-Uniform Time Scheduling for Robotic Policies: Mitigating Multi-Step Inference Degradation

2025-09-19

Авторы:

Zidong Chen, Zihao Guo, Peng Wang, ThankGod Itua Egbe, Yan Lyu, Chenghao Qian

## Контекст Обучение политик для роботизированных систем является ключевым заданием в робототехнике, с целью повысить качество интерпретации данных и улучшить реакцию на новые ситуации. Одна из выдающихся технологий — **Flow Matching** — уже доказала свою эффективность в обучении политик, но существуют проблемы, ограничивающие ее развитие. Например, возникают проблемы с общественностью, когда обучение приемлимо выполняется только на коротких промежутках времени, но не работает на более длинных. Также существуют проблемы с устойчивостью интегрирования в процессе обучения, что может привести к неожиданному падению качества. Наша мотивация заключается в решении этих проблем и создании более стабильной и высокопроизводительной политики. ## Метод Мы предлагаем **Dense-Jump Flow Matching**, новая архитектура, которая устраняет проблемы стандартных подходов. На этапе обучения мы используем **несимметричное временное расписание** (например, "У-образное распределение"), чтобы сосредоточиться на обучении в краткосрочных и долгосрочных сценариях. На этапе инференса мы вводим **длинные прыжки (Dense-Jump)**: вместо нескольких шагов интегрирования, применяется единственный, что позволяет избежать устойчивости в неблагоприятных областях. Данная структура обеспечивает более точное и устойчивое обучение, увеличивая производительность на робототехнических задачах. ## Результаты Мы провели эксперименты на различных робототехнических задачах, включая планирование траекторий и управление движениями. Данные для экспериментов были получены из реальных и симулированных систем. Наши тесты показали, что **Dense-Jump Flow Matching** повышает производительность на 23,7% в сравнении с текущими лидерами в области Flow Matching. Мы также отметили улучшение устойчивости и общей оценки качества, что делает нашу модель более надежной в различных сценариях. ## Значимость Наша модель может применяться в широком кругу робототехнических задач, включая планирование роботов, автономное вождение, интегрированные системы для индустрии и медицины. Она предоставляет более высокое качество интерпретации данных, более эффективное обучение и устойчивость в любых условиях. Это делает ее полезной для разработчиков роботов, которые ищут максимальную производительность и надежность. ## Выводы Мы успешно решаем проблему общественности и устойчивости в обучении политик Flow Matching, используя несимметричное временное расписание и длинные прыжки в интегрировании. Наш подход устанавливает новый стандарт в области робототехнических политик и открывает путь для будущих исследований в области интеллектуальных си

Annotation:

Flow matching has emerged as a competitive framework for learning high-quality generative policies in robotics; however, we find that generalisation arises and saturates early along the flow trajectory, in accordance with recent findings in the literature. We further observe that increasing the number of Euler integration steps during inference counter-intuitively and universally degrades policy performance. We attribute this to (i) additional, uniformly spaced integration steps oversample the l...

ID: 2509.13574v1 cs.RO, cs.AI

arXiv PDF

📄 TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning

2025-09-19

Авторы:

Momchil S. Tomov, Sang Uk Lee, Hansford Hendrago, Jinwook Huh, Teawon Han, Forbes Howington, Rafael da Silva, Gianmarco Bernasconi, Marc Heim, Samuel Findler, Xiaonan Ji, Alexander Boule, Michael Napoli, Kuo Chen, Jesse Miller, Boaz Floor, Yunqing Hu

#### Контекст На протяжении последних десятилетий, автоматизированные системы управления транспортом, такие как autopilots или планировщики для автономного вождения, являются центральной областью исследований в технике и искусственном интеллекте. Однако столкнуться с проблемами, такими как эффективность, безопасность и природность поведения, остается сложным заданием. Эти проблемы возникают в ситуациях, когда алгоритмы должны осуществлять рациональные решения в сложных и часто непредсказуемых условиях, таких как городский транспорт. TreeIRL предлагает решение этой проблемы, объединяя две мощные методологии: Monte Carlo tree search (MCTS) и inverse reinforcement learning (IRL). Это позволяет обеспечить безопасность, прогресс и комфорт вождения, а также естественность поведения в различных ситуациях. #### Метод TreeIRL сочетает в себе MCTS и IRL для выбора наиболее приемлемого плана движения. Алгоритм MCTS осуществляет поиск безопасных кандидатов траекторий движения, а IRL используется для оценки этих траекторий, нацеленной на то, чтобы выбрать самую "человеческую". В процессе работы, MCTS построит дерево возможных действий, а IRL оценит каждую траекторию на основе множества функций оценки. Этот подход позволяет TreeIRL генерировать планы движения, которые близки к человеческим в течение различных ситуаций на дорогах. Архитектура TreeIRL включает в себя не только эти два основных компонента, но и модели расширенного IRL, которые учитывают тонкие особенности поведения водителя. #### Результаты Планировщик TreeIRL был оценен в широком спектре ситуаций на дорогах. Набор экспериментов включал в себя городскую среду с тяжелым трафиком, сценарии с адаптивным управлением скоростью (adaptive cruise control), сценарии с нарушениями полосы (cut-ins) и ситуации с работой светофора. В симуляционных экспериментах, TreeIRL показал лучший результат в безопасности, прогрессе и комфорте. В реальных условиях, он был протестирован на более чем 500 миль в метрополии Лас-Вегаса. Эксперименты показали, что TreeIRL избегает ошибок, которые часто допускаются другими планировщиками, и обеспечивает удовлетворительные результаты в плане human-likeness. #### Значимость Технология TreeIRL может быть применена в различных сценариях, включая вождение в городах, а также в задачах, требующих быстрого и эффективного решения. Одним из основных преимуществ является его безопасность и естественность поведения. Потенциал TreeIRL заключается в том, что он может использоваться в сочетании с другими методами, такими как reinforcement learning и imitation learning, для расширения возможностей в области планирования автономного вождения.

Annotation:

We present TreeIRL, a novel planner for autonomous driving that combines Monte Carlo tree search (MCTS) and inverse reinforcement learning (IRL) to achieve state-of-the-art performance in simulation and in real-world driving. The core idea is to use MCTS to find a promising set of safe candidate trajectories and a deep IRL scoring function to select the most human-like among them. We evaluate TreeIRL against both classical and state-of-the-art planners in large-scale simulations and on 500+ mile...

ID: 2509.13579v1 cs.RO, cs.AI, cs.LG

arXiv PDF

📄 DREAM: Domain-aware Reasoning for Efficient Autonomous Underwater Monitoring

2025-09-19

Авторы:

Zhenqi Wu, Abhinav Modi, Angelos Mavrogiannis, Kaustubh Joshi, Nikhil Chopra, Yiannis Aloimonos, Nare Karapetyan, Ioannis Rekleitis, Xiaomin Lin

## Контекст Мир океанов стал горячей темой в изучении климатических изменений. Угнетающее тепло и кислотность воды возбуждают опасения по поводу массовых потерь термосенситивных моллюсками, такими как устрицы. Эти феномены обнадёживают развитие системы продолжительного мониторинга. Однако человеческая работа в этих условиях не только дорогостояща, но и опасна, что делает роботизированные решения более привлекательными как более безопасные и эффективные альтернативы. Чтобы превратить автономных роботов в полноценных исследователей подводных ландшафтов, необходимо иметь умный "мозг", который обеспечивает решения в реальном времени и позволяет эффективно эксплуатировать средам. Это подчеркивает нужду в системах, которые обеспечивают продолжительное, широкомасштабное и стоимостно эффективное мониторинге подводных бентосных сред. Для этого мы предлагаем DREAM — рамформу для развития интеллектуальной автономности на основе Vision Language Model (VLM), которая позволяет обеспечивать долгосрочное подводное исследование и мониторинг окружающих сред. ## Метод DREAM — это инновационная архитектура, объединяющая подходы Vision Language Model (VLM) с интеллектуальным рисованием траекторий. Она включает в себя несколько ключевых компонентов: 1. **Сенсорно-роботическая система** — устройство, оснащённое видеокамерой и сенсорами, которое может изучать подводную среду. 2. **Обученная модель VLM** — это модель, которая пропагруит роботу информацией о объектах, исследуемых в среде. 3. **Компонент рисования траекторий** — алгоритм, который оптимизирует маршрут для эффективного и безопасного поиска и мониторинга объектов. 4. **Обработка естественного языка (NLP)** — система, которая позволяет роботу понимать и реагировать на команды пользователей в естественном языке. DREAM использует эти компоненты для решения задач, таких как эффективный поиск моллюсков, обнаружение и изучение судовых крушений, без предварительного знания их местоположения. ## Результаты Мы проводили эксперименты в условиях реального океана и подводных имитационных симуляторов. Наши результаты показывают, что DREAM выполняет мониторинг бентосных объектов (например, устриц) в 31,5% меньше времени по сравнению с существующими базовыми моделями, при этом не теряя точности. Он также уменьшает количество потребного шагов на 23%, увеличивая объём мониторинга на 8,88%. В сценариях с изучением гибитации подводных крушений, DREAM демонстрирует 100% покрытия области, при этом требуя 27,5% меньше шагов в сравнении с базовой модель

Annotation:

The ocean is warming and acidifying, increasing the risk of mass mortality events for temperature-sensitive shellfish such as oysters. This motivates the development of long-term monitoring systems. However, human labor is costly and long-duration underwater work is highly hazardous, thus favoring robotic solutions as a safer and more efficient option. To enable underwater robots to make real-time, environment-aware decisions without human intervention, we must equip them with an intelligent "br...

ID: 2509.13666v1 cs.RO, cs.AI

arXiv PDF

📄 MAP: End-to-End Autonomous Driving with Map-Assisted Planning

2025-09-19

Авторы:

Huilin Yin, Yiming Kan, Daniel Watzenig

#### Контекст Исследования в области автономного вождения стремятся решить проблему моделирования пространственных задач с помощью современных алгоритмов машинного обучения. Однако существующие подходы часто недостаточно используют семантические данные, доступные в реальном времени. Это приводит к ограниченной эффективности планирования траекторий, особенно в условиях сложности окружающей среды. MAP (Map-Assisted Planning) — это инновационный подход, который ставит перед собой цель использовать карты для оптимизации траекторий в реальном времени, повышая безопасность и точность движения. #### Метод MAP — это комплексный фреймворк, интегрирующий несколько модулей: **Plan-enhancing Online Mapping**, **Ego-status-guided Planning** и **Weight Adapter**. **Plan-enhancing Online Mapping** использует данные о текущем состоянии автомобиля и семантические признаки карты для тонкой настройки плана. **Ego-status-guided Planning** гарантирует соответствие плана органичности движению. **Weight Adapter** адаптирует веса модели в зависимости от текущего состояния автомобиля. Это сочетание модулей обеспечивает рациональное использование семантических данных карт в планировании траекторий. #### Результаты Эксперименты проводились на датасете DAIR-V2X-seq-SPD. MAP показал следующие результаты: **16.6% уменьшение L2-ошибки дисплейции**, **56.2% снижение показателя выезда с дороги** и **44.5% повышение общего результата** по сравнению с базовым подходом UniV2X. Особенно заметный улучшение стабильности и точности планирования. MAP также занял первое место на Track 2 Международного Чемпионата End-to-End Autonomous Driving through V2X Cooperation Challenge @CVPR2025, побив второе место на 39.5%. Эти результаты подтверждают эффективность MAP в использовании карт для улучшения траекторий. #### Значимость MAP может быть применен в различных сценариях автономного вождения, включая городские условия, автоматизированные парковки и системы V2X-совместимости. Он предлагает высокую точность планирования, уменьшает риски аварий и увеличивает эффективность движения. Использование семантических данных карт открывает новые горизонты для развития методологии планирования в автономных системах. #### Выводы MAP доказал свою эффективность в использовании карт для улучшения планирования траекторий. Будущие исследования будут нацелены на расширение модулей, улучшение точности и устойчивости, а также исследование многоканальных сигналов V2X-совместимости для экспансивного использования в реальных условиях.

Annotation:

In recent years, end-to-end autonomous driving has attracted increasing attention for its ability to jointly model perception, prediction, and planning within a unified framework. However, most existing approaches underutilize the online mapping module, leaving its potential to enhance trajectory planning largely untapped. This paper proposes MAP (Map-Assisted Planning), a novel map-assisted end-to-end trajectory planning framework. MAP explicitly integrates segmentation-based map features and t...

ID: 2509.13926v1 cs.RO, cs.AI, cs.CV, I.2.9; I.2.10

arXiv PDF

📄 Prompt2Auto: From Motion Prompt to Automated Control via Geometry-Invariant One-Shot Gaussian Process Learning

2025-09-19

Авторы:

Zewen Yang, Xiaobing Dai, Dongfa Zhang, Yu Li, Ziyang Meng, Bingkun Huang, Hamid Sadeghian, Sami Haddadin

## Контекст Управление роботами на основе демонстрации позволяет им приобретать сложные навыки, адаптировався к различным задачам в разных средах. Однако, существующие подходы часто требуют больших наборов данных и не в состоянии обобщаться на новые координатные преобразования. Эти ограничения затрудняют их применение в реальных условиях, где необходимо быстрое понимание и адаптация к изменениям. Мотивация заключается в развитии метода, который может извлекать полезные навыки из небольших демонстраций и обеспечивать высокую гибкость при работе в разных условиях. ## Метод Мы предлагаем Prompt2Auto — новую рамочную методику, основанную на геометрически инвариантном подходе one-shot Gaussian process learning. Основной идеей является возможность извлечения знаний о движении в любой точке пространства из одного моментального пробного знака (motion prompt). Для обеспечения геометрической инвариантности мы предлагаем стратегию построения данных, которая учитывает преобразования по трансляции, вращению и масштабированию. Это позволяет модели GeoGP не только мгновенно понять движение, но и предсказывать несколько шагов вперёд. Также, модель обладает высокой стойкостью к разнообразию в поведении пользователя, что формирует базу для многоспособной автономной системы. ## Результаты Мы проверили Prompt2Auto в рамках двух реальных экспериментов, используя дизайн пользовательского интерфейса для графического ввода движений. Результаты показали, что модель может эффективно извлекать навыки в одном примере, преобразовывать их в конкретное поведение робота, а также адаптироваться к новым условиям. Это продемонстрировано в сценариях, в которых робот выполнял сложные ритмичные движения, включая колебания точки в пространстве и другие задачи, где требуется точное управление. Модель GeoGP также показала способность учитывать несколько навыков одновременно, что позволяет роботу одновременно решать разные задачи. ## Значимость Предлагаемый подход может быть применен в различных областях, где необходимо автоматизировать управление роботами на основе набора сложных движений, таких как ассистирование в хирургии, точные технологии или системы для транспорта. Одним из основных преимуществ является высокая гибкость и способность обучаться из небольших демонстраций, что значительно сокращает время обучения. Это может привести к увеличению эффективности и безопасности в работе с роботами в технологических процессах. ## Выводы Результаты проведенных экспериментов показывают, что Prompt2Auto является эффективным инструментом для обучения роботов с использованием одного моментального примера. Метод не только обеспечивает высокую

Annotation:

Learning from demonstration allows robots to acquire complex skills from human demonstrations, but conventional approaches often require large datasets and fail to generalize across coordinate transformations. In this paper, we propose Prompt2Auto, a geometry-invariant one-shot Gaussian process (GeoGP) learning framework that enables robots to perform human-guided automated control from a single motion prompt. A dataset-construction strategy based on coordinate transformations is introduced that...

ID: 2509.14040v1 cs.RO, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Enhancing Generalization in Vision-Language-Action Models by Preserving Pretrained Representations

2025-09-18

Авторы:

Shresth Grover, Akshay Gopalkrishnan, Bo Ai, Henrik I. Christensen, Hao Su, Xuanlin Li

## Контекст Vision-language-action (VLA) модели, порожденные из vision-language models (VLMs), предлагают возможность использования богатых предобученных представлений для создания генерализованных роботов, способных выполнять различные задачи в различных средах. Однако прямое оточечение таких моделей на данные из реального мира часто приводит к искажению предобученных представлений, что существенно ограничивает их общеупотребимость. Наличие этой проблемы вызывает нужды в разработке методов, позволяющих лучше сохранить предобученные представления в процессе оточечения на конкретные задачи. ## Метод Методология предложенного подхода основывается на трех ключевых компонентах. Во-первых, используется дизайн двухмасштабной энкодерной системы: один энкодер (для визуальных данных) остается неизменным, чтобы сохранить предобученные представления, а другой энкодер (для задач) тренируется для адаптации к конкретной задаче. Во-вторых, введена структура порождения действий на основе строк текста, которая преобразует непрерывные действия в последовательности символов, соответствующие предобученной модели. В-третьих, предлагается стратегия совместного обучения (co-training), которая объединяет данные от демонстраций робота и визуально-языковых данных, с фокусом на спатсальном рассуждении и навыках удобства действий. ## Результаты Эксперименты проводились как в симуляционной среде, так и на реальных роботах. Модель демонстрировала значительное улучшение в области устойчивости к визуальным нарушениям, общеупотребимости в новых инструкциях и средах, а также общей эффективности в выполнении задач. Эти результаты сравнивались с базовыми моделями, подтверждая значительную выгоду от применения предложенного подхода. ## Значимость Продемонстрированный подход может быть применен в различных областях, включая робототехнику, автоматизацию производственных процессов и визуальных систем управления. Он обеспечивает значительное увеличение общеупотребимости роботов в различных средах и задачах, предоставляя роботам возможность лучшего понимания инструкций и реагирования на новые условия. Это, в свою очередь, может привести к значительным преимуществам в производительности и удобстве использования в различных приложениях. ## Выводы Предложенная модель продемонстрировала улучшение в области общеупотребимости VLA-моделей, сохранив предобученные представления и при этом адаптируя модель к конкретным задачам. Будущие исследования будут сосредоточены на улучшении эффективности обучения, отказе от тренировочных данных, а также рассмотрении более сложных искусственных и настоящих с

Annotation:

Vision-language-action (VLA) models finetuned from vision-language models (VLMs) hold the promise of leveraging rich pretrained representations to build generalist robots across diverse tasks and environments. However, direct fine-tuning on robot data often disrupts these representations and limits generalization. We present a framework that better preserves pretrained features while adapting them for robot manipulation. Our approach introduces three components: (i) a dual-encoder design with on...

ID: 2509.11417v2 cs.RO, cs.AI, cs.CV, cs.LG

arXiv PDF

📄 An integrated process for design and control of lunar robotics using AI and simulation

2025-09-18

Авторы:

Daniel Lindmark, Jonas Andersson, Kenneth Bodin, Tora Bodin, Hugo Börjesson, Fredrik Nordfeldth, Martin Servin

## Контекст Исследование фокусируется на разработке интегрированного процесса для проектирования и управления лунными роботами с использованием искусственного интеллекта (AI) и симуляции. В настоящее время проектирование лунных роботов требует значительных усилий и времени, так как традиционные методы ограничивают возможности экспериментирования и тестирования. Существующая проблема заключается в том, что разработка роботов для луны требует дорогостоящей инфраструктуры, такой как лабазы, земные тесты и космические миссии, что затрудняет эффективное тестирование и подтверждение новых решений. Данная работа предлагает новое решение, основанное на искусственном интеллекте и симуляции, что позволяет эффективно разрабатывать и тестировать лунные роботы в симуляционной среде перед физическим развертыванием. ## Метод Технический фреймворк, разработанный в рамках данного исследования, основывается на OpenPLX — разностороннем, читаемом и записываемым декларативном языке, который соединяет модели CAD с автономными системами. Он также подключает эти системы к высокоточным, реальному времени симуляциям трёхмерных моделей с контактом многотел, взаимодействия регулита с машинными элементами и неидеальными сенсорами. Эта система позволяет моделировать и анализировать работу лунных роботов в условиях луны или подобных местности. Для демонстрации функционала предлагается два случая использования, включающие автономный лунный робот, объединяющий модель видения и языка для навигации с политикой управления, основанной на увеличении степени свободы (reinforcement learning-based control policy for locomotion). ## Результаты Эксперименты проводились с использованием двух сценариев: 1) робот-рука, который может обрабатывать регулит; и 2) лунный робот, который может перемещаться по луне с использованием визуальной модели и решений управления. Результаты показали, что использование OpenPLX и симуляционной среды позволяет эффективно протестировать и измерить работу роботов в симуляционной среде, прежде чем их применение на луне. Это позволяет ускорять процесс разработки, снижать затраты и уменьшать риски, связанные с тестированием на реальной луне. ## Значимость Интегрированный процесс разработки лунных роботов, описанный в данной статье, может применяться в различных областях, включая космические исследования, робототехнику и искусственный интеллект. Он обеспечивает более эффективную разработку и тестирование роботов, что уменьшает затраты и улучшает безопасность. Этот подход также может способствовать ускорению инноваций в области лунных миссий и помоч

Annotation:

We envision an integrated process for developing lunar construction equipment, where physical design and control are explored in parallel. In this paper, we describe a technical framework that supports this process. It relies on OpenPLX, a readable/writable declarative language that links CAD-models and autonomous systems to high-fidelity, real-time 3D simulations of contacting multibody dynamics, machine regolith interaction forces, and non-ideal sensors. To demonstrate its capabilities, we pre...

ID: 2509.12367v1 cs.RO, cs.AI

arXiv PDF

📄 Geometric Red-Teaming for Robotic Manipulation

2025-09-18

Авторы:

Divyam Goel, Yufei Wang, Tiancheng Wu, Guixiu Qiao, Pavel Piliptchak, David Held, Zackory Erickson

## Контекст Роботизированные манипуляторы широко используются в различных сферах, от промышленных цехов до медицинских устройств. Однако стандартные протоколы оценки политик манипуляций часто ограничиваются оценкой поведения систем на тестовых наборах данных, которые являются входными в рамки распространенных аспектов задач. Это способствует тому, что системы могут оказаться уязвимыми к нестандартным условиям, недооценивая их устойчивость. Определение и оценка таких возможных уязвимостей являются важным аспектом создания надежных роботизированных систем. Мы предлагаем Geometric Red-Teaming (GRT), новый фреймворк, который автоматически генерирует геометрические переменные, нацеленных на отклонение результатов манипуляции, чтобы открыть новые аспекты роботизированных систем. ## Метод Мы представляем Geometric Red-Teaming (GRT), что является подходом к оценке уязвимостей роботизированных политик манипуляций через геометрические переменные. Наша методология включает в себя градиентный метод, основанный на оптимизации, и использует технологии, которые автоматически генерируют "CrashShapes" - структурно валидные деформации 3D-моделей, которые могут вызвать падение политики манипуляций. Метод интегрирует объемный полевой подход с градиентным симулятором в цикле, чтобы найти деформации, максимально влияющие на поведение системы. Мы применяем GRT к задачам вставки, артикуляции и хватания, где он постоянно открывает уязвимости, которые могут быть пропущены статическими методами. Это позволяет улучшить устойчивость политик манипуляций. ## Результаты Мы проверили GRT на широком спектре задач, включая вставку, артикуляцию и хватание предметов. Наши результаты показывают, что GRT постоянно выявляет уязвимости в политиках манипуляций, которые могут вызвать серьезные неудачи. Мы успешно генерируем CrashShapes, которые приводят к падению поведения системы. Также, мы продемонстрировали, что целевая оптимизация CrashShapes, которую мы назвали "blue-teaming", позволяет улучшить устойчивость политик манипуляций до 60% на этих деформациях. Мы также провели реальные эксперименты с использованием робота, подтвердив, что GRT может создавать значительные обнаружения в реальных условиях. ## Значимость GRT может применяться в различных областях, включая повышение устойчивости роботов в промышленных приложениях, мобильных роботах, а также в сферах, где устойчивость к нестандартным условиям критична. Этот подход может помочь создавать более надежные системы манипуляций, улучшая их поведение в нестандартных ситуациях. Это прод

Annotation:

Standard evaluation protocols in robotic manipulation typically assess policy performance over curated, in-distribution test sets, offering limited insight into how systems fail under plausible variation. We introduce Geometric Red-Teaming (GRT), a red-teaming framework that probes robustness through object-centric geometric perturbations, automatically generating CrashShapes -- structurally valid, user-constrained mesh deformations that trigger catastrophic failures in pre-trained manipulation ...

ID: 2509.12379v1 cs.RO, cs.AI, cs.LG

arXiv PDF

1
2
35
36
37
38
39
54
55

Показано 361 - 370 из 544 записей