Domain Adaptation for Different Sensor Configurations in 3D Object Detection
2509.04711v1
cs.CV, cs.RO
2025-09-09
Авторы:
Satoshi Tanaka, Kok Seang Tan, Isamu Yamashita
Резюме на русском
#### Контекст
Одним из ключевых аспектов развития автономного движения является точное 3D-обнаружение объектов. Центральной ролью в этом процессе играют LiDAR-сенсоры, известные своей надежностью при различных условиях видимости. Однако разные автомобильные платформы часто используют разные конфигурации сенсоров, что приводит к снижению производительности моделей, когда они обучаются на одной конфигурации и применяются к другой. Это связано с тем, что данные, поступающие с разных конфигураций LiDAR, имеют разные распределения точек, что требует адаптации моделей. До сих пор многие исследования сосредоточились на решении изменений в ландшафте или плотности точек в рамках одного LiDAR. Более того, дефицит исследований в области адаптации моделей к различным конфигурациям сенсоров является очевидным. В нашем исследовании мы стремимся развить методы, которые позволяют достичь эффективной адаптации моделей к различным конфигурациям LiDAR-сенсоров.
#### Метод
Мы предлагаем два основных подхода для решения проблемы адаптации моделей 3D-обнаружения объектов к различным конфигурациям LiDAR. **Downstream Fine-tuning** предполагает совершенствование модели на конкретной конфигурации LiDAR после многодатсетного обучения. **Partial Layer Fine-tuning** заключается в обновлении только части слоев модели, чтобы повысить генерализацию между различными конфигурациями. Мы также использовали парные наборы данных, собранные в одном географическом регионе, но с различными конфигурациями LiDAR. Эти подходы позволяют улучшить производительность моделей, обеспечивая более точное и универсальное 3D-обнаружение объектов, независимо от конфигурации сенсоров.
#### Результаты
Мы провели эксперименты с парными наборами данных, собранными в одном регионе, но с различными конфигурациями LiDAR. Мы сравнивали результаты модели, обученной с использованием Downstream Fine-tuning и Partial Layer Fine-tuning, с результатами модели, обученной с помощью обычного многодатсетного обучения. Наши результаты показали, что оба подхода позволяют повысить производительность модели в сравнении с обычным подходом. Более того, Partial Layer Fine-tuning позволяет более эффективно адаптировать модель к различным конфигурациям, уменьшая необходимость в тщательном переобучении всех слоёв модели.
#### Значимость
Наша работа имеет значимые практические применения в области автономного мобильного обслуживания, где различные автомобили могут использовать различные конфигурации LiDAR-сенсоров. Мы предлагаем новый подход, который может быть применен для эффективного переноса моделей 3D-обнаружения объектов между различными конфи
Abstract
Recent advances in autonomous driving have underscored the importance of
accurate 3D object detection, with LiDAR playing a central role due to its
robustness under diverse visibility conditions. However, different vehicle
platforms often deploy distinct sensor configurations, causing performance
degradation when models trained on one configuration are applied to another
because of shifts in the point cloud distribution. Prior work on multi-dataset
training and domain adaptation for 3D object detection has largely addressed
environmental domain gaps and density variation within a single LiDAR; in
contrast, the domain gap for different sensor configurations remains largely
unexplored. In this work, we address domain adaptation across different sensor
configurations in 3D object detection. We propose two techniques: Downstream
Fine-tuning (dataset-specific fine-tuning after multi-dataset training) and
Partial Layer Fine-tuning (updating only a subset of layers to improve
cross-configuration generalization). Using paired datasets collected in the
same geographic region with multiple sensor configurations, we show that joint
training with Downstream Fine-tuning and Partial Layer Fine-tuning consistently
outperforms naive joint training for each configuration. Our findings provide a
practical and scalable solution for adapting 3D object detection models to the
diverse vehicle platforms.
Ссылки и действия
Дополнительные ресурсы: