📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Agile Tradespace Exploration for Space Rendezvous Mission Design via Transformers

2025-10-08

Авторы:

Yuji Takubo, Daniele Gammelli, Marco Pavone, Simone D'Amico

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Spacecraft rendezvous enables on-orbit servicing, debris removal, and crewed docking, forming the foundation for a scalable space economy. Designing such missions requires rapid exploration of the tradespace between control cost and flight time across multiple candidate targets. However, multi-objective optimization in this setting is challenging, as the underlying constraints are often highly nonconvex, and mission designers must balance accuracy (e.g., solving the full problem) with efficiency...

ID: 2510.03544v1 math.OC, cs.AI, cs.RO

arXiv PDF

📄 A KL-regularization framework for learning to plan with adaptive priors

2025-10-08

Авторы:

Álvaro Serra-Gomez, Daniel Jarne Ornia, Dhruva Tirumala, Thomas Moerland

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Effective exploration remains a central challenge in model-based reinforcement learning (MBRL), particularly in high-dimensional continuous control tasks where sample efficiency is crucial. A prominent line of recent work leverages learned policies as proposal distributions for Model-Predictive Path Integral (MPPI) planning. Initial approaches update the sampling policy independently of the planner distribution, typically maximizing a learned value function with deterministic policy gradient and...

ID: 2510.04280v1 cs.LG, cs.AI, cs.RO

arXiv PDF

📄 A Hierarchical Agentic Framework for Autonomous Drone-Based Visual Inspection

2025-10-05

Авторы:

Ethan Herron, Xian Yeow Lee, Gregory Sin, Teresa Gonzalez Diaz, Ahmed Farahat, Chetan Gupta

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Autonomous inspection systems are essential for ensuring the performance and longevity of industrial assets. Recently, agentic frameworks have demonstrated significant potential for automating inspection workflows but have been limited to digital tasks. Their application to physical assets in real-world environments, however, remains underexplored. In this work, our contributions are two-fold: first, we propose a hierarchical agentic framework for autonomous drone control, and second, a reasonin...

ID: 2510.00259v1 cs.MA, cs.AI, cs.RO, cs.SY, eess.SY

arXiv PDF

📄 EgoTraj-Bench: Towards Robust Trajectory Prediction Under Ego-view Noisy Observations

2025-10-04

Авторы:

Jiayi Liu, Jiaming Zhou, Ke Ye, Kun-Yu Lin, Allan Wang, Junwei Liang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Reliable trajectory prediction from an ego-centric perspective is crucial for robotic navigation in human-centric environments. However, existing methods typically assume idealized observation histories, failing to account for the perceptual artifacts inherent in first-person vision, such as occlusions, ID switches, and tracking drift. This discrepancy between training assumptions and deployment reality severely limits model robustness. To bridge this gap, we introduce EgoTraj-Bench, the first r...

ID: 2510.00405v1 cs.CV, cs.AI, cs.RO

arXiv PDF

📄 Predictive Preference Learning from Human Interventions

2025-10-04

Авторы:

Haoyuan Cai, Zhenghao Peng, Bolei Zhou

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Learning from human involvement aims to incorporate the human subject to monitor and correct agent behavior errors. Although most interactive imitation learning methods focus on correcting the agent's action at the current state, they do not adjust its actions in future states, which may be potentially more hazardous. To address this, we introduce Predictive Preference Learning from Human Interventions (PPL), which leverages the implicit preference signals contained in human interventions to inf...

ID: 2510.01545v1 cs.LG, cs.AI, cs.RO

arXiv PDF

📄 LLM-RG: Referential Grounding in Outdoor Scenarios using Large Language Models

2025-10-02

Авторы:

Pranav Saxena, Avigyan Bhattacharya, Ji Zhang, Wenshan Wang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Referential grounding in outdoor driving scenes is challenging due to large scene variability, many visually similar objects, and dynamic elements that complicate resolving natural-language references (e.g., "the black car on the right"). We propose LLM-RG, a hybrid pipeline that combines off-the-shelf vision-language models for fine-grained attribute extraction with large language models for symbolic reasoning. LLM-RG processes an image and a free-form referring expression by using an LLM to ex...

ID: 2509.25528v1 cs.CV, cs.AI, cs.RO

arXiv PDF

📄 Boundary-to-Region Supervision for Offline Safe Reinforcement Learning

2025-10-02

Авторы:

Huikang Su, Dengyun Peng, Zifeng Zhuang, YuHan Liu, Qiguang Chen, Donglin Wang, Qinghe Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Offline safe reinforcement learning aims to learn policies that satisfy predefined safety constraints from static datasets. Existing sequence-model-based methods condition action generation on symmetric input tokens for return-to-go and cost-to-go, neglecting their intrinsic asymmetry: return-to-go (RTG) serves as a flexible performance target, while cost-to-go (CTG) should represent a rigid safety boundary. This symmetric conditioning leads to unreliable constraint satisfaction, especially when...

ID: 2509.25727v1 cs.LG, cs.AI, cs.RO

arXiv PDF

📄 ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

2025-10-01

Авторы:

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu

## Контекст Тактическое задание с участием нескольких агентов (таких как роботы и грузовики) является ключевым задачей в различных областях, включая логистику, производство и исследования. Эти задачи требуют эффективного совместного действия многих агентов для достижения заданных целей. Однако существующие подходы сталкиваются с несколькими проблемами. Декларативные методы, хотя и могут быть гибкими, часто недостаточно адаптируются к динамически меняющимся условиям. Итеративные методы, в свою очередь, требуют очень высоких вычислительных ресурсов, что становится нежелательным при увеличении количества агентов и сложности задач. Мотивация для разработки новых подходов заключается в найдении баланса между эффективностью и эффективностью, обеспечивая возможность решения задач с большим горизонтом времени при ограниченных ресурсах. ## Метод ELHPlan предлагает подход, основанный на концепции Action Chains—серий действий, которые связаны с подстановочными целями. Циклическая структура процесса состоит из четырех этапов: 1) структурирование действий, привязанных к подстановочным целям; 2) проверка на наличие конфликтов и допустимость; 3) корректировка проблем через целевые механизмы; 4) выполнение утвержденных действий. Эта архитектура позволяет достичь эффективности, не прибегая к полному перепланированию. Для эффективного оценивания мульти-агентных систем были разработаны метрики, например, потребление токенов и время планирования. Эти инструменты позволяют лучше определять баланс между эффективностью и производительностью. ## Результаты Исследования проводились на бенчмарке TDW-MAT и C-WAH. Результаты показали, что ELHPlan достигает того же уровня успеха в выполнении задач, но использует лишь 24% токенов, требуемых современными методами. Эти результаты указывают на значительное сокращение вычислительных затрат, не допуская уменьшения качества выполнения задач. Были также проанализированы влияния различных метрик на эффективность планирования, что дало понимание особенностей работы системы в различных условиях. ## Значимость Разработанный подход может быть применен в областях, где необходимо эффективное совместное действие многих агентов, таких как логистические системы, индустрия робототехники и исследования космоса. Особым преимуществом является экономия ресурсов, позволяющая работать с большим числом агентов и сложными задачами без заметного ухудшения качества. Этот подход может повлиять на развитие робототехники, улучшая ее способность решать задачи в

Annotation:

Large Language Models (LLMs) enable intelligent multi-robot collaboration but face fundamental trade-offs: declarative methods lack adaptability in dynamic environments, while iterative methods incur prohibitive computational costs that scale poorly with team size and task complexity. In this paper, we propose ELHPlan, a novel framework that introduces Action Chains--sequences of actions explicitly bound to sub-goal intentions--as the fundamental planning primitive. ELHPlan operates via a cyclic...

ID: 2509.24230v1 cs.AI, cs.RO

arXiv PDF

📄 Discrete Variational Autoencoding via Policy Search

2025-10-01

Авторы:

Michael Drolet, Firas Al-Hafez, Aditya Bhatt, Jan Peters, Oleg Arenz

#### Контекст Область исследований в области развития методов обработки и анализа данных чрезвычайно значима в современном мире. Одним из ключевых направлений является развитие методов вариационных автоэнкодеров (VAEs), которые используются для эффективной реконструкции высокого разрешения данных. Одна из проблем в этой области заключается в том, что при использовании дискретных буттленков в VAEs невозможно точно задать параметры автоматически, что приводит к ограничению в дальнейшей интерпретации данных. Мотивацией для данного исследования является развитие метода, который позволит эффективно решать задачи реконструкции данных в высоком разрешении, используя дискретные VAEs. #### Метод Для развития дискретных VAEs была применена методология нормального градиента, позволяющая обновлять параметры непараметрического кодировщика с помощью естественного градиента. Для эффективного адаптирования шага обучения была использована автоматическая система адаптации шага. Архитектура основывается на использовании трансформера в качестве кодировщика, что позволяет обрабатывать высокомерные данные. Общая методика состоит в том, чтобы обучать модель так, чтобы она эффективно реконструировала высокомерные данные в низкомерный скрытый пространственный вариант, чтобы уменьшить ошибку восстановления. #### Результаты На основе использованных данных, включая высокомерные данные из набора ImageNet, проводились эксперименты. Метод, основанный на нормальном градиенте, показал более высокую эффективность в реконструкции данных по сравнению с другими методами, такими как Gumbel-Softmax и REINFORCE. На многоклассовой задаче реконструкции изображений ImageNet 256 метод показал 20% лучшую оценку FID (Fréchet Inception Distance), чем другие дискретные квантованные автоэнкодеры. #### Значимость Предлагаемый метод является перспективным для применения в многочисленных областях, включая обработку изображений, видео и аудио. Он предоставляет высокую точность в реконструкции данных и позволяет эффективно использовать дискретные модели для решения задач многомодального поиска. Этот подход также имеет потенциал для улучшения производительности в системах анализа и визуализации данных, что может иметь значимый вклад в развитие ИИ. #### Выводы Предлагаемый подход расширяет возможности дискретных VAEs, позволяя их эффективно применять в задачах реконструкции высокомерных данных. Он показал значительные позитивные результаты в сравнении с другими методами, в частности, лучшую оценку FID в реконструкции изображений ImageNet 256. Будущие исследования будут направлены на улучшение методов обучения, в том числе использование более

Annotation:

Discrete latent bottlenecks in variational autoencoders (VAEs) offer high bit efficiency and can be modeled with autoregressive discrete distributions, enabling parameter-efficient multimodal search with transformers. However, discrete random variables do not allow for exact differentiable parameterization; therefore, discrete VAEs typically rely on approximations, such as Gumbel-Softmax reparameterization or straight-through gradient estimates, or employ high-variance gradient-free methods such...

ID: 2509.24716v1 cs.LG, cs.AI, cs.RO

arXiv PDF

📄 When Autonomous Vehicle Meets V2X Cooperative Perception: How Far Are We?

2025-10-01

Авторы:

An Guo, Shuoxiao Zhang, Enyi Tang, Xinyu Gao, Haomin Pang, Haoxiang Tian, Yanzhou Mu, Wu Wen, Chunrong Fang, Zhenyu Chen

## Контекст В последние годы прогресс в области глубокого обучения и телекоммуникаций открыл возможности для развития систем кооперативного взаимодействия между автомобилями и их окружающей средой (Vehicle-to-Everything, V2X). Эти системы предназначены для улучшения ограниченного полезного поля обнаружения (Field of View, FoV) и расширения возможностей одиночных систем зрительного восприятия, особенно в условиях видимости кругов или при объектах, уехавших за пределы диапазона дальности датчиков. Однако существуют серьезные проблемы: недостаточное понимание структуры ошибок в кооперативных системах и недостаточное исследование особенностей их работы в реальных условиях. Наше исследование направлено на изучение этих проблем и на поиск решений для их устранения. ## Метод Мы провели подробный анализ работы кооперативных систем восприятия, используя разнообразные данные и варианты симуляции. Основной архитектурой исследования является методология системной оценки, включающая в себя эмпирическую оценку различных компонентов системы, включая разные сети связи, типы датчиков и варианты комбинаций данных. Мы определили шесть типов ошибок, встречающихся в системах кооперативного восприятия, и проанализировали их причины. Также была проведена систематическая оценка производительности разных схем объединения данных и связей между агентами. ## Результаты Наши эксперименты показали, что системы, основанные на LiDAR, обеспечивают наивысшую производительность восприятия. Мы также обнаружили, что разные схемы объединения данных (например, Vehicle-to-Infrastructure (V2I) и Vehicle-to-Vehicle (V2V)) дают разные результаты в разных условиях связи. Было обнаружено, что увеличение количества ошибок в кооперативных системах приводит к большему числу нарушений правил дорожного движения. Были также выявлены уязвимости в системах, которые остаются незаметными в условиях лабораторных испытаний, но становятся очевидными при использовании в реальных условиях. ## Значимость Наши результаты могут быть использованы для улучшения разработки и оптимизации систем кооперативного восприятия. Они открывают пути для более точного понимания ошибок и возможностей для их устранения. Эти результаты имеют большое значение для развития безопасного и надежного транспортного системы, особенно в условиях современных городов, где необходимо обеспечить высокую точность и стабильность восприятия. ## Выводы Мы сделали первые шаги в изучении ошибок в кооперативных системах восприятия. Наши находки подтверждают ценность разных типов датчиков и схем объединения данных, а

Annotation:

With the tremendous advancement of deep learning and communication technology, Vehicle-to-Everything (V2X) cooperative perception has the potential to address limitations in sensing distant objects and occlusion for a single-agent perception system. V2X cooperative perception systems are software systems characterized by diverse sensor types and cooperative agents, varying fusion schemes, and operation under different communication conditions. Therefore, their complex composition gives rise to n...

ID: 2509.24927v1 cs.AI, cs.RO, cs.SE

arXiv PDF

Показано 71 - 80 из 126 записей