Plane Detection and Ranking via Model Information Optimization

2508.09625v1 cs.CV, cs.RO 2025-08-15
Авторы:

Daoxin Zhong, Jun Li, Meng Yee Michael Chuah

Резюме на русском

## Контекст Анализ среды и поиск объектов являются ключевыми задачами в робототехнике, в том числе для обнаружения плоскостей в трехмерных пространствах. Эти плоскости могут представлять собой различные поверхности, например, стены, половую доску или даже неровности пола. Обнаружение плоскостей не только помогает в ориентации в пространстве, но и в улучшении взаимодействия с объектами. Однако существуют значительные проблемы, связанные с обнаружением плоскостей, особенно в сложных реальных сценах, где несколько плоскостей могут пересекаться, и глубинные данные могут содержать шум. Эти факторы приводят к ошибкам в распознавании плоскостей и менее точному ранжированию их важности. Для решения этих проблем необходимо развитие более надежных методов, основанных на оптимизации моделей и учете шума датчиков. ## Метод Метод, предложенный в статье, основывается на оптимизации моделей плоскостей с использованием случайного выбора (RANSAC) в качестве основы. Однако в отличие от стандартного RANSAC, данный подход трактует данные глубины как дискретные случайные величины, сгенерированные гауссовской случайной величиной. Затем, используя повторные выборки, авторы строят модели, описывающие различные плоскости, которые могут объяснить наблюдаемые данные. Для каждой модели создается модель шума с учетом физических характеристик датчика глубины. Оптимизация проводится путем выбора модели с наименьшим количеством информации, что означает, что эта модель наиболее вероятно представляет собой настоящую плоскость. Для каждой детектированной плоскости можно рассчитать ее качество, определяемое суммой влияний всех точек, которые входят в эту плоскость. ## Результаты Исследования проводились с использованием синтетических данных, а также данных в реальных условиях. Результаты показывают, что этот метод дает более точные результаты в оценке плоскостей по сравнению с другими подходами. Например, алгоритм показал лучшие результаты в обнаружении и ранжировании плоскостей в сложных сценах. Была также проведена экспериментальная оценка скорости работы, что подтвердила то, что эталонный RANSAC метод может быть ускорен с помощью разбиения данных с помощью нейронных сетей. Это улучшает качество распознавания и ускоряет процесс. ## Значимость Предложенный подход имеет широкие приложения в робототехнике, включая системы визуальной навигации, системы помощи в планировании движений и системы управления. Одним из основных преимуществ является улучшение точности распознавания плоскостей в сложных средах. Важное дополнительное преимущество —

Abstract

Plane detection from depth images is a crucial subtask with broad robotic applications, often accomplished by iterative methods such as Random Sample Consensus (RANSAC). While RANSAC is a robust strategy with strong probabilistic guarantees, the ambiguity of its inlier threshold criterion makes it susceptible to false positive plane detections. This issue is particularly prevalent in complex real-world scenes, where the true number of planes is unknown and multiple planes coexist. In this paper, we aim to address this limitation by proposing a generalised framework for plane detection based on model information optimization. Building on previous works, we treat the observed depth readings as discrete random variables, with their probability distributions constrained by the ground truth planes. Various models containing different candidate plane constraints are then generated through repeated random sub-sampling to explain our observations. By incorporating the physics and noise model of the depth sensor, we can calculate the information for each model, and the model with the least information is accepted as the most likely ground truth. This information optimization process serves as an objective mechanism for determining the true number of planes and preventing false positive detections. Additionally, the quality of each detected plane can be ranked by summing the information reduction of inlier points for each plane. We validate these properties through experiments with synthetic data and find that our algorithm estimates plane parameters more accurately compared to the default Open3D RANSAC plane segmentation. Furthermore, we accelerate our algorithm by partitioning the depth map using neural network segmentation, which enhances its ability to generate more realistic plane parameters in real-world data.

Ссылки и действия