Domain Adaptation for Different Sensor Configurations in 3D Object Detection

2509.04711v1 cs.CV, cs.RO 2025-09-09
Авторы:

Satoshi Tanaka, Kok Seang Tan, Isamu Yamashita

Резюме на русском

#### Контекст Одним из ключевых аспектов развития автономного движения является точное 3D-обнаружение объектов. Центральной ролью в этом процессе играют LiDAR-сенсоры, известные своей надежностью при различных условиях видимости. Однако разные автомобильные платформы часто используют разные конфигурации сенсоров, что приводит к снижению производительности моделей, когда они обучаются на одной конфигурации и применяются к другой. Это связано с тем, что данные, поступающие с разных конфигураций LiDAR, имеют разные распределения точек, что требует адаптации моделей. До сих пор многие исследования сосредоточились на решении изменений в ландшафте или плотности точек в рамках одного LiDAR. Более того, дефицит исследований в области адаптации моделей к различным конфигурациям сенсоров является очевидным. В нашем исследовании мы стремимся развить методы, которые позволяют достичь эффективной адаптации моделей к различным конфигурациям LiDAR-сенсоров. #### Метод Мы предлагаем два основных подхода для решения проблемы адаптации моделей 3D-обнаружения объектов к различным конфигурациям LiDAR. **Downstream Fine-tuning** предполагает совершенствование модели на конкретной конфигурации LiDAR после многодатсетного обучения. **Partial Layer Fine-tuning** заключается в обновлении только части слоев модели, чтобы повысить генерализацию между различными конфигурациями. Мы также использовали парные наборы данных, собранные в одном географическом регионе, но с различными конфигурациями LiDAR. Эти подходы позволяют улучшить производительность моделей, обеспечивая более точное и универсальное 3D-обнаружение объектов, независимо от конфигурации сенсоров. #### Результаты Мы провели эксперименты с парными наборами данных, собранными в одном регионе, но с различными конфигурациями LiDAR. Мы сравнивали результаты модели, обученной с использованием Downstream Fine-tuning и Partial Layer Fine-tuning, с результатами модели, обученной с помощью обычного многодатсетного обучения. Наши результаты показали, что оба подхода позволяют повысить производительность модели в сравнении с обычным подходом. Более того, Partial Layer Fine-tuning позволяет более эффективно адаптировать модель к различным конфигурациям, уменьшая необходимость в тщательном переобучении всех слоёв модели. #### Значимость Наша работа имеет значимые практические применения в области автономного мобильного обслуживания, где различные автомобили могут использовать различные конфигурации LiDAR-сенсоров. Мы предлагаем новый подход, который может быть применен для эффективного переноса моделей 3D-обнаружения объектов между различными конфи

Abstract

Recent advances in autonomous driving have underscored the importance of accurate 3D object detection, with LiDAR playing a central role due to its robustness under diverse visibility conditions. However, different vehicle platforms often deploy distinct sensor configurations, causing performance degradation when models trained on one configuration are applied to another because of shifts in the point cloud distribution. Prior work on multi-dataset training and domain adaptation for 3D object detection has largely addressed environmental domain gaps and density variation within a single LiDAR; in contrast, the domain gap for different sensor configurations remains largely unexplored. In this work, we address domain adaptation across different sensor configurations in 3D object detection. We propose two techniques: Downstream Fine-tuning (dataset-specific fine-tuning after multi-dataset training) and Partial Layer Fine-tuning (updating only a subset of layers to improve cross-configuration generalization). Using paired datasets collected in the same geographic region with multiple sensor configurations, we show that joint training with Downstream Fine-tuning and Partial Layer Fine-tuning consistently outperforms naive joint training for each configuration. Our findings provide a practical and scalable solution for adapting 3D object detection models to the diverse vehicle platforms.

Ссылки и действия