Improving Accuracy and Efficiency of Implicit Neural Representations: Making SIREN a WINNER

2509.12980v1 cs.CV, cs.LG 2025-09-18

Авторы:

Hemanth Chandravamsi, Dhanush V. Shenoy, Steven H. Frankel

Резюме на русском

## Контекст Импровизация нейронных представлений (Implicit Neural Representations, INRs) представляют собой возможность представлять сложные сигналы, такие как звуки, изображения и 3D-формы, в виде нейросетевых моделей. Одним из первых и ключевых подходов в этой области является Sinusoidal Representation Networks (SIRENs). Несмотря на их перспективы, SIRENs сталкиваются с значимым ограничением: они могут сталкиваться с трудностями при интерпретации сигналов, которые выходят за пределы их частотной поддержки. Это приводит к проблеме "спектрального буфера", когда модель производит почти нулевые выходы и не может восстановить даже те частотные компоненты, которые входят в ее представимость. Этот вопрос требует решения, чтобы повысить точность и производительность SIRENs в обширных прикладных задачах. ## Метод WINNER (Weight Initialization with Noise for Neural Representations) — это новый подход к инициализации весов в SIRENs. Он использует гауссовую случайную вариацию весов с определенным распределением, которое определяется спектральным центром целевого сигнала. Этот метод эмулирует рандомные Фурье-образующие функции, но не добавляет дополнительных параметров для обучения. Эта методика позволяет повысить точность модели, особенно при работе с сигналами, которые выходят за частотную поддержку SIREN. Использованная архитектура WINNER ускоряет обучение и повышает точность воспроизведения сложных сигналов в сравнении с оригинальной SIREN. ## Результаты Чтобы проверить эффективность WINNER, его реализация проверена на различных данных, включая звуковые сигналы, изображения и 3D-формы. Эксперименты показали, что WINNER достигает значительного повышения точности воспроизведения в сравнении с базовым SIREN. Использование гауссового шума в инициализации весов увеличивает точность в десятки процентов в задачах воспроизведения звука, а также сокращает время обучения без влияния на структуру сети. Эти результаты показывают, что WINNER может значительно повысить производительность SIRENs в различных прикладных задачах. ## Значимость WINNER предлагает универсальный подход к инициализации весов, который может быть применен в различных задачах, включая синтез изображений, звуковых сигналов и 3D-моделей. Он позволяет устранить "спектральный буфер" и подстраивается под разные типы сигналов, что улучшает качество и точность модели. Этот подход также может быть применен в других глубоких нейронных сетях для оптимизации инициализации параметров. Эти достижения открывают новые пути для развития INR-технологий в интеллектуальных системах. ## Выводы WINNER (Weight Initialization with Noise for Neural Representations) является эффективным ре

Abstract

We identify and address a fundamental limitation of sinusoidal representation networks (SIRENs), a class of implicit neural representations. SIRENs Sitzmann et al. (2020), when not initialized appropriately, can struggle at fitting signals that fall outside their frequency support. In extreme cases, when the network's frequency support misaligns with the target spectrum, a 'spectral bottleneck' phenomenon is observed, where the model yields to a near-zero output and fails to recover even the frequency components that are within its representational capacity. To overcome this, we propose WINNER - Weight Initialization with Noise for Neural Representations. WINNER perturbs uniformly initialized weights of base SIREN with Gaussian noise - whose noise scales are adaptively determined by the spectral centroid of the target signal. Similar to random Fourier embeddings, this mitigates 'spectral bias' but without introducing additional trainable parameters. Our method achieves state-of-the-art audio fitting and significant gains in image and 3D shape fitting tasks over base SIREN. Beyond signal fitting, WINNER suggests new avenues in adaptive, target-aware initialization strategies for optimizing deep neural network training. For code and data visit cfdlabtechnion.github.io/siren_square/.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Improving Accuracy and Efficiency of Implicit Neural Representations: Making SIREN a WINNER

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Curvature-Regularized Variational Autoencoder for 3D Scene Reconstruction from S...

NICE: Neural Implicit Craniofacial Model for Orthognathic Surgery Prediction

Plug-and-Play Image Restoration with Flow Matching: A Continuous Viewpoint

Inference-time Stochastic Refinement of GRU-Normalizing Flow for Real-time Video...

Rethinking the Use of Vision Transformers for AI-Generated Image Detection

Навигация