Point-Plane Projections for Accurate LiDAR Semantic Segmentation in Small Data Scenarios

2509.10841v1 cs.CV, cs.RO 2025-09-17
Авторы:

Simone Mosco, Daniel Fusaro, Wanmeng Li, Emanuele Menegatti, Alberto Pretto

Резюме на русском

#### Контекст Внедрение LiDAR (Light Detection and Ranging) в области автоматизированных систем, таких как автомобили с автоориентацией и роботы, требует эффективных методов для понимания окружающей среды. Одной из ключевых задач является семантическая сегментация точечных облаков LiDAR, которая позволяет интерпретировать трехмерные среды. Несмотря на продвижение технологий, многие существующие подходы сталкиваются с проблемами высокой вычислительной сложности и большим потреблением данных для тренировки. Эти ограничения становятся заметными в ситуациях, когда доступны только небольшие объемы данных для обучения. Целью данной работы является развитие метода, который не только улучшит точность сегментации в сценариях малого количества данных, но и стабильно справится с задачей на более крупных выборках. #### Метод Метод, предлагаемый в данной работе, основывается на структуре point-plane projections (точка-плоскость), которая позволяет извлекать дополнительные информационные признаки с использованием 2D-представлений точечных облаков. Был разработан новый геометрический подход для аугментации данных, который учитывает свойства LiDAR-сенсора и помогает уменьшить проблему несбалансированности классов. Реализация метода включает несколько проекций 2D из различных плоскостей, чтобы извлечь многогранные компоненты из точечного облака. Была разработана архитектура, которая интегрирует эти проекции для повышения точности семантической сегментации. Метод был оценен на нескольких источниках данных, включая SemanticKITTI и PandaSet. #### Результаты Проведенные эксперименты показали, что предлагаемый подход обеспечивает существенное повышение точности семантической сегментации в сценариях малого количества данных. Эксперименты проводились на двух стандартных датасетах, SemanticKITTI и PandaSet, где показано, что метод достигает результатов, сопоставимых с лучшими существующими инструментами. Особое внимание было уделено проверке накладных работ на вычислительной сложности и времени обучения. Результаты показали, что метод эффективен как в быстром обучении, так и в эффективном использовании ресурсов во время выполнения. #### Значимость Предлагаемый подход может быть применен в различных задачах, включая автоматизированное управление транспортом, робототехнику, интеллектуальные системы для дома и офиса. Одним из основных преимуществ является улучшение производительности в условиях нехватки данных, что позволяет использовать метод в сценариях, где обучающие данные ограничены. Благодаря геометрической аугментации данных, метод эффективно справляется с проблемой несбалансированности классов

Abstract

LiDAR point cloud semantic segmentation is essential for interpreting 3D environments in applications such as autonomous driving and robotics. Recent methods achieve strong performance by exploiting different point cloud representations or incorporating data from other sensors, such as cameras or external datasets. However, these approaches often suffer from high computational complexity and require large amounts of training data, limiting their generalization in data-scarce scenarios. In this paper, we improve the performance of point-based methods by effectively learning features from 2D representations through point-plane projections, enabling the extraction of complementary information while relying solely on LiDAR data. Additionally, we introduce a geometry-aware technique for data augmentation that aligns with LiDAR sensor properties and mitigates class imbalance. We implemented and evaluated our method that applies point-plane projections onto multiple informative 2D representations of the point cloud. Experiments demonstrate that this approach leads to significant improvements in limited-data scenarios, while also achieving competitive results on two publicly available standard datasets, as SemanticKITTI and PandaSet. The code of our method is available at https://github.com/SiMoM0/3PNet

Ссылки и действия