NeuralMeshing: Complete Object Mesh Extraction from Casual Captures

2508.16026v1 cs.CV, cs.RO 2025-08-26

Авторы:

Floris Erich, Naoya Chiba, Abdullah Mustafa, Ryo Hanai, Noriaki Ando, Yusuke Yoshiyasu, Yukiyasu Domae

Резюме на русском

#### Контекст Создание точных геометрических моделей объектов, обнаруженных в повседневной жизни, представляется сложным, особенно в отсутствии доступа к специализированным сканерам. Эта проблема становится острой, когда требуется получить полную модель объекта с минимальными усилиями и сохранением точности. Текущие методы часто требуют дорогостоящего оборудования или работы с ограниченными фрагментами данных, что приводит к потерям в качестве или точности. Цель этого исследования заключается в создании системы, которая могла бы автоматически извлекать полные трехмерные модели объектов из нескольких видеороликов, собранных с помощью смартфона или другого устройства. #### Метод Система NeuralMeshing основывается на многовидеосистемной информации, которая позволяет извлекать полные модели объектов из нескольких видео, записанных с разных углов. Основной этап заключается в использовании технологии Structure-from-Motion (SfM) для позиционирования кадров по относительным ориентациям. Специальные маркеры, такие как checkerboard или Augmented Reality (AR) маркеры, позволяют определить один известный точный пункт в каждом видео. Этот маркер используется для точного размещения кадров в пространстве. Остальные кадры автоматически выравниваются, а их результаты объединяются в единую модель. Таким образом, система может создавать геометрическую модель объекта без необходимости дополнительной работы над заполнением "дыр". #### Результаты Используя несколько видеороликов, полученных с разных углов, система NeuralMeshing могла автоматически извлечь полные модели объектов, включая те, что имели сложные формы или были покрыты материалом. Отдельные эксперименты показали, что система обеспечивает высокую точность в расположении кадров и моделировании трехмерной модели. Использование маркеров позволяет обеспечить точность, которая отсутствует в методах, основанных только на структуре кадров. Однако, в некоторых случаях, нехватка кадров может привести к неточностям в экстремальных углах. #### Значимость Система NeuralMeshing может применяться во многих областях, включая архитектуру, конструирование, медицину и творческие проекты. Она предлагает преимущество в том, что требует гораздо меньшего количества времени и ресурсов, чем традиционные сканирования. Благодаря этому, пользователи могут легко и быстро получить геометрические модели объектов в реальном мире без доступа к дорогостоящему оборудованию. Это имеет потенциал для упрощения процесса моделирования и внедрения в широкомасштабные приложения, такие как виртуальная и аugmented реальность. #### Выводы Выполненные исследования показали, что NeuralMeshing может эффективно ра

Abstract

How can we extract complete geometric models of objects that we encounter in our daily life, without having access to commercial 3D scanners? In this paper we present an automated system for generating geometric models of objects from two or more videos. Our system requires the specification of one known point in at least one frame of each video, which can be automatically determined using a fiducial marker such as a checkerboard or Augmented Reality (AR) marker. The remaining frames are automatically positioned in world space by using Structure-from-Motion techniques. By using multiple videos and merging results, a complete object mesh can be generated, without having to rely on hole filling. Code for our system is available from https://github.com/FlorisE/NeuralMeshing.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

NeuralMeshing: Complete Object Mesh Extraction from Casual Captures

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

FASTer: Toward Efficient Autoregressive Vision Language Action Modeling via neur...

Object Reconstruction under Occlusion with Generative Priors and Contact-induced...

Image Generation as a Visual Planner for Robotic Manipulation

TrajDiff: End-to-end Autonomous Driving without Perception Annotation

SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minima...

Навигация