Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

2509.20681v1 cs.RO, cs.AI, cs.CV 2025-09-26
Авторы:

Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi

Резюме на русском

## Контекст Искусственные нейронные нейтральные поля (Neural Implicit Surfaces, NIS) широко применяются в области робототехники для таких задач, как обход препятствий и планирование маршрутов. Однако существующие методы для построения этих полей зачастую требуют большого количества многопросмточных изображений в качестве входных данных, что приводит к долгому времени обучения и высоким ресурсам вычислительных мощностей. Более того, эти методы часто не подходят для применения в реальном времени или для задач, где доступен только небольшой набор изображений. В этой работе мы сосредоточиваемся на проблеме построения нейронных нейтральных полей на основе единственного или малого набора изображений, чтобы упростить и ускорить процесс, а также сделать его более эффективным. ## Метод Мы предлагаем новую систему построения нейронных нейтральных полей, которая основывается на методе Fast Image-to-Neural Surface (FINS). Эта система использует несколько ключевых инноваций. Во-первых, FINS использует мультирезольвентный хеш-гридный кодировщик, который позволяет эффективно обрабатывать как геометрические, так и цветовые данные. Во-вторых, мы используем легковесное геометрическое и цветовое оболочки, которые обеспечивают высокую скорость обучения и точность результатов. Третьим важным аспектом является использование предварительно обученных фундаментальных моделей для оценки геометрических особенностей изображения, что позволяет FINS устанавливать нейронные нейтральные поля на основе одного изображения. Это упрощает процесс и увеличивает скорость конвергенции. ## Результаты Мы провести эксперименты сравнивая нашу систему с трёх современных методами построения нейронных нейтральных полей. Наши эксперименты проводились на нескольких датасетах, включая как синтетические, так и реальные данные. Мы измерили скорость конвергенции, точность построения модели и потребление ресурсов. Наши результаты показали, что FINS не только быстрее других методов в процессе обучения, но и показала более высокую точность в сравнении с состоянием технологий. Мы также продемонстрировали, что FINS может использоваться для задач по следованию по поверхности роботами, а также оказалась легко масштабируемой для работы с различными датасетов. ## Значимость Наша работа имеет значительное значение для области робототехники, так как она обеспечивает более эффективную и быструю структурированность нейронных нейтральных полей на основе небольшого набора изображений. Это упрощает применение этих методов в реальном времени, таких как обход препятствий и планирование путей. Благодаря тому, что FINS использует мало ресурсов и мало времени для обучения, она может быть применена

Abstract

Implicit representations have been widely applied in robotics for obstacle avoidance and path planning. In this paper, we explore the problem of constructing an implicit distance representation from a single image. Past methods for implicit surface reconstruction, such as \emph{NeuS} and its variants generally require a large set of multi-view images as input, and require long training times. In this work, we propose Fast Image-to-Neural Surface (FINS), a lightweight framework that can reconstruct high-fidelity surfaces and SDF fields based on a single or a small set of images. FINS integrates a multi-resolution hash grid encoder with lightweight geometry and color heads, making the training via an approximate second-order optimizer highly efficient and capable of converging within a few seconds. Additionally, we achieve the construction of a neural surface requiring only a single RGB image, by leveraging pre-trained foundation models to estimate the geometry inherent in the image. Our experiments demonstrate that under the same conditions, our method outperforms state-of-the-art baselines in both convergence speed and accuracy on surface reconstruction and SDF field estimation. Moreover, we demonstrate the applicability of FINS for robot surface following tasks and show its scalability to a variety of benchmark datasets.

Ссылки и действия