Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation
2509.20681v1
cs.RO, cs.AI, cs.CV
2025-09-26
Авторы:
Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi
Резюме на русском
## Контекст
Искусственные нейронные нейтральные поля (Neural Implicit Surfaces, NIS) широко применяются в области робототехники для таких задач, как обход препятствий и планирование маршрутов. Однако существующие методы для построения этих полей зачастую требуют большого количества многопросмточных изображений в качестве входных данных, что приводит к долгому времени обучения и высоким ресурсам вычислительных мощностей. Более того, эти методы часто не подходят для применения в реальном времени или для задач, где доступен только небольшой набор изображений. В этой работе мы сосредоточиваемся на проблеме построения нейронных нейтральных полей на основе единственного или малого набора изображений, чтобы упростить и ускорить процесс, а также сделать его более эффективным.
## Метод
Мы предлагаем новую систему построения нейронных нейтральных полей, которая основывается на методе Fast Image-to-Neural Surface (FINS). Эта система использует несколько ключевых инноваций. Во-первых, FINS использует мультирезольвентный хеш-гридный кодировщик, который позволяет эффективно обрабатывать как геометрические, так и цветовые данные. Во-вторых, мы используем легковесное геометрическое и цветовое оболочки, которые обеспечивают высокую скорость обучения и точность результатов. Третьим важным аспектом является использование предварительно обученных фундаментальных моделей для оценки геометрических особенностей изображения, что позволяет FINS устанавливать нейронные нейтральные поля на основе одного изображения. Это упрощает процесс и увеличивает скорость конвергенции.
## Результаты
Мы провести эксперименты сравнивая нашу систему с трёх современных методами построения нейронных нейтральных полей. Наши эксперименты проводились на нескольких датасетах, включая как синтетические, так и реальные данные. Мы измерили скорость конвергенции, точность построения модели и потребление ресурсов. Наши результаты показали, что FINS не только быстрее других методов в процессе обучения, но и показала более высокую точность в сравнении с состоянием технологий. Мы также продемонстрировали, что FINS может использоваться для задач по следованию по поверхности роботами, а также оказалась легко масштабируемой для работы с различными датасетов.
## Значимость
Наша работа имеет значительное значение для области робототехники, так как она обеспечивает более эффективную и быструю структурированность нейронных нейтральных полей на основе небольшого набора изображений. Это упрощает применение этих методов в реальном времени, таких как обход препятствий и планирование путей. Благодаря тому, что FINS использует мало ресурсов и мало времени для обучения, она может быть применена
Abstract
Implicit representations have been widely applied in robotics for obstacle
avoidance and path planning. In this paper, we explore the problem of
constructing an implicit distance representation from a single image. Past
methods for implicit surface reconstruction, such as \emph{NeuS} and its
variants generally require a large set of multi-view images as input, and
require long training times. In this work, we propose Fast Image-to-Neural
Surface (FINS), a lightweight framework that can reconstruct high-fidelity
surfaces and SDF fields based on a single or a small set of images. FINS
integrates a multi-resolution hash grid encoder with lightweight geometry and
color heads, making the training via an approximate second-order optimizer
highly efficient and capable of converging within a few seconds. Additionally,
we achieve the construction of a neural surface requiring only a single RGB
image, by leveraging pre-trained foundation models to estimate the geometry
inherent in the image. Our experiments demonstrate that under the same
conditions, our method outperforms state-of-the-art baselines in both
convergence speed and accuracy on surface reconstruction and SDF field
estimation. Moreover, we demonstrate the applicability of FINS for robot
surface following tasks and show its scalability to a variety of benchmark
datasets.
Ссылки и действия
Дополнительные ресурсы: