Multimodal Data Storage and Retrieval for Embodied AI: A Survey

2508.13901v1 cs.RO, cs.CV 2025-08-21
Авторы:

Yihao Lu, Hao Tang

Резюме на русском

## Контекст Современные Embodied AI (EAI) системы взаимодействуют с физическим миром, создавая огромные многомодальные потоки данных. Эти данные характеризуются своей вариативностью и связанностью, что создает вызовы для их эффективного хранения и поиска. Традиционные методы управления данными не могут удовлетворить требования EAI, включая физическое углубление, низкую задержку доступа и динамическую масштабируемость. Эти проблемы поднимают вопросы о прочности и эффективности текущих систем, а также о необходимости развития новых подходов для удовлетворения потребностей EAI. ## Метод Данная статья основывается на систематическом обзоре более чем 180 исследований, направленных на разработку новых методов управления многомодальными данными. Она разбивается на два основных аспекта: 1. **Хранилище данных**: Анализируются пять архитектур хранилища (Graph Databases, Multi-Model Databases, Data Lakes, Vector Databases, Time-Series Databases), сравнивая их с требованиями EAI. Особое внимание уделено таким аспектам, как поддержка физического углубления, высокая скорость доступа и масштабируемость. 2. **Поиск данных**: Описываются пять парадигм поиска (Fusion Strategy-Based Retrieval, Representation Alignment-Based Retrieval, Graph-Structure-Based Retrieval, Generation Model-Based Retrieval, Efficient Retrieval-Based Optimization), которые исследуются на примере различных сценариев, включая семантическую целостность и реальном времени. ## Результаты Исследование проводит предварительные эксперименты с использованием различных архитектур и методов поиска, чтобы оценить их эффективность в решении задач EAI. Эксперименты показали, что: - Архитектуры, такие как Vector Databases и Time-Series Databases, эффективно поддерживают физическое углубление и низкую задержку. - Методы, такие как Graph-Structure-Based Retrieval и Fusion Strategy-Based Retrieval, показали лучшие результаты в обеспечении семантической целостности. - Однако, существуют системные проблемы, такие как коллизии между реального времени и семантической связью, а также отклонения от нормальных распределений. ## Значимость Результаты этой статьи могут быть применены в области развития EAI-систем, включая искусственный зрение, робототехнику и системы управления. Они предлагают более эффективные способы хранения и поиска данных, что может существенно повысить производительность и надежность EAI-систем. Более того, внедрение этих подходов может привести к развитию новых технологий, таких как адаптивные системы управления и стандартизированные бенчмарки для EAI. ## Выводы Наша статья делает следующие главные выводы: - Необходимо развитие новых физически обоснованных моделей данных для решения проблем физического углубления. -

Abstract

Embodied AI (EAI) agents continuously interact with the physical world, generating vast, heterogeneous multimodal data streams that traditional management systems are ill-equipped to handle. In this survey, we first systematically evaluate five storage architectures (Graph Databases, Multi-Model Databases, Data Lakes, Vector Databases, and Time-Series Databases), focusing on their suitability for addressing EAI's core requirements, including physical grounding, low-latency access, and dynamic scalability. We then analyze five retrieval paradigms (Fusion Strategy-Based Retrieval, Representation Alignment-Based Retrieval, Graph-Structure-Based Retrieval, Generation Model-Based Retrieval, and Efficient Retrieval-Based Optimization), revealing a fundamental tension between achieving long-term semantic coherence and maintaining real-time responsiveness. Based on this comprehensive analysis, we identify key bottlenecks, spanning from the foundational Physical Grounding Gap to systemic challenges in cross-modal integration, dynamic adaptation, and open-world generalization. Finally, we outline a forward-looking research agenda encompassing physics-aware data models, adaptive storage-retrieval co-optimization, and standardized benchmarking, to guide future research toward principled data management solutions for EAI. Our survey is based on a comprehensive review of more than 180 related studies, providing a rigorous roadmap for designing the robust, high-performance data management frameworks essential for the next generation of autonomous embodied systems.

Ссылки и действия