Plane Detection and Ranking via Model Information Optimization
2508.09625v1
cs.CV, cs.RO
2025-08-15
Авторы:
Daoxin Zhong, Jun Li, Meng Yee Michael Chuah
Резюме на русском
## Контекст
Анализ среды и поиск объектов являются ключевыми задачами в робототехнике, в том числе для обнаружения плоскостей в трехмерных пространствах. Эти плоскости могут представлять собой различные поверхности, например, стены, половую доску или даже неровности пола. Обнаружение плоскостей не только помогает в ориентации в пространстве, но и в улучшении взаимодействия с объектами. Однако существуют значительные проблемы, связанные с обнаружением плоскостей, особенно в сложных реальных сценах, где несколько плоскостей могут пересекаться, и глубинные данные могут содержать шум. Эти факторы приводят к ошибкам в распознавании плоскостей и менее точному ранжированию их важности. Для решения этих проблем необходимо развитие более надежных методов, основанных на оптимизации моделей и учете шума датчиков.
## Метод
Метод, предложенный в статье, основывается на оптимизации моделей плоскостей с использованием случайного выбора (RANSAC) в качестве основы. Однако в отличие от стандартного RANSAC, данный подход трактует данные глубины как дискретные случайные величины, сгенерированные гауссовской случайной величиной. Затем, используя повторные выборки, авторы строят модели, описывающие различные плоскости, которые могут объяснить наблюдаемые данные. Для каждой модели создается модель шума с учетом физических характеристик датчика глубины. Оптимизация проводится путем выбора модели с наименьшим количеством информации, что означает, что эта модель наиболее вероятно представляет собой настоящую плоскость. Для каждой детектированной плоскости можно рассчитать ее качество, определяемое суммой влияний всех точек, которые входят в эту плоскость.
## Результаты
Исследования проводились с использованием синтетических данных, а также данных в реальных условиях. Результаты показывают, что этот метод дает более точные результаты в оценке плоскостей по сравнению с другими подходами. Например, алгоритм показал лучшие результаты в обнаружении и ранжировании плоскостей в сложных сценах. Была также проведена экспериментальная оценка скорости работы, что подтвердила то, что эталонный RANSAC метод может быть ускорен с помощью разбиения данных с помощью нейронных сетей. Это улучшает качество распознавания и ускоряет процесс.
## Значимость
Предложенный подход имеет широкие приложения в робототехнике, включая системы визуальной навигации, системы помощи в планировании движений и системы управления. Одним из основных преимуществ является улучшение точности распознавания плоскостей в сложных средах. Важное дополнительное преимущество —
Abstract
Plane detection from depth images is a crucial subtask with broad robotic
applications, often accomplished by iterative methods such as Random Sample
Consensus (RANSAC). While RANSAC is a robust strategy with strong probabilistic
guarantees, the ambiguity of its inlier threshold criterion makes it
susceptible to false positive plane detections. This issue is particularly
prevalent in complex real-world scenes, where the true number of planes is
unknown and multiple planes coexist. In this paper, we aim to address this
limitation by proposing a generalised framework for plane detection based on
model information optimization. Building on previous works, we treat the
observed depth readings as discrete random variables, with their probability
distributions constrained by the ground truth planes. Various models containing
different candidate plane constraints are then generated through repeated
random sub-sampling to explain our observations. By incorporating the physics
and noise model of the depth sensor, we can calculate the information for each
model, and the model with the least information is accepted as the most likely
ground truth. This information optimization process serves as an objective
mechanism for determining the true number of planes and preventing false
positive detections. Additionally, the quality of each detected plane can be
ranked by summing the information reduction of inlier points for each plane. We
validate these properties through experiments with synthetic data and find that
our algorithm estimates plane parameters more accurately compared to the
default Open3D RANSAC plane segmentation. Furthermore, we accelerate our
algorithm by partitioning the depth map using neural network segmentation,
which enhances its ability to generate more realistic plane parameters in
real-world data.
Ссылки и действия
Дополнительные ресурсы: