Neural Tangent Knowledge Distillation for Optical Convolutional Networks
2508.08421v1
cs.CV, cs.AI, cs.LG
2025-08-14
Авторы:
Jinlin Xiang, Minho Choi, Yubo Zhang, Zhihao Zhou, Arka Majumdar, Eli Shlizerman
Резюме на русском
## Контекст
Оптические нейронные сети (Optical Neural Networks, ONN) представляют собой системы, объединяющие оптический фронтенд и цифровой бэкэнд. Они являются энергоэффективным аналогом полностью цифровых нейронных сетей для реального времени и систем с ограниченным питанием. Однако их распространение сталкивается с двумя основными проблемами. Во-первых, их производительность во время обучения часто ниже, чем у больших цифровых сетей. Во-вторых, существуют различия между симуляционными моделями и фактическими фабрикациями, что также снижает точность. Несмотря на предыдущие исследования, сфокусированные на конкретных датасетах (например, MNIST) и оптических системах, эти подходы часто не подходят для широкого применения в различных задачах и аппаратных конфигурациях. Наша цель заключается в разработке общедоступного и применяемого в различных ситуациях подхода для улучшения ONN.
## Метод
Мы предлагаем общедоступную пайплайн, которая поддерживает обучение и оценку ONN для нескольких задач, включая классификацию и сегментацию изображений. Для оценки того, что может быть достигнуто до обучения, мы предложили модель для прогнозирования достижимой точности на основе физических ограничений системы и характеристик датасета. Для улучшения точности во время обучения мы предложили Neural Tangent Knowledge Distillation (NTKD). NTKD использует электронную "учительскую" сеть для точного расчета на отдельных образцах, предоставляя указания для оптической сети. Это позволяет существенно уменьшить точностный диапазон между цифровыми и оптическими сетями. После фабрикации мы используем NTKD для тонкой настройки цифрового бэкэнда, которая компенсирует ошибки в фабрикации.
## Результаты
Мы проверили нашу методику на нескольких датасетах, включая MNIST, CIFAR и Carvana Masking. Мы использовали различные оптические системы для экспериментов. Наши эксперименты показали, что NTKD существенно повышает точность обученных оптических сетей, даже при ограничениях в физическом размере или других конфигурациях. Мы также показали, что наш подход эффективен как для симуляционной работы, так и для физических измерений, что демонстрирует гибкость и реальную применимость нашей системы.
## Значимость
Разработанная пайплайн имеет широкие потенциальные применения в области оптических нейронных сетей. Она может помочь в создании более точных оптических систем, улучшить процессы оценки моделей до их фабрикации и обеспечить эффективный цифровой бэкэнд для тонкой настройки после изготовления. Этот подход может существенно снизить трудности связанные с ограничениями пи
Abstract
Hybrid Optical Neural Networks (ONNs, typically consisting of an optical
frontend and a digital backend) offer an energy-efficient alternative to fully
digital deep networks for real-time, power-constrained systems. However, their
adoption is limited by two main challenges: the accuracy gap compared to
large-scale networks during training, and discrepancies between simulated and
fabricated systems that further degrade accuracy. While previous work has
proposed end-to-end optimizations for specific datasets (e.g., MNIST) and
optical systems, these approaches typically lack generalization across tasks
and hardware designs. To address these limitations, we propose a task-agnostic
and hardware-agnostic pipeline that supports image classification and
segmentation across diverse optical systems. To assist optical system design
before training, we estimate achievable model accuracy based on user-specified
constraints such as physical size and the dataset. For training, we introduce
Neural Tangent Knowledge Distillation (NTKD), which aligns optical models with
electronic teacher networks, thereby narrowing the accuracy gap. After
fabrication, NTKD also guides fine-tuning of the digital backend to compensate
for implementation errors. Experiments on multiple datasets (e.g., MNIST,
CIFAR, Carvana Masking) and hardware configurations show that our pipeline
consistently improves ONN performance and enables practical deployment in both
pre-fabrication simulations and physical implementations.
Ссылки и действия
Дополнительные ресурсы: