Improving Accuracy and Efficiency of Implicit Neural Representations: Making SIREN a WINNER
2509.12980v1
cs.CV, cs.LG
2025-09-18
Авторы:
Hemanth Chandravamsi, Dhanush V. Shenoy, Steven H. Frankel
Резюме на русском
## Контекст
Импровизация нейронных представлений (Implicit Neural Representations, INRs) представляют собой возможность представлять сложные сигналы, такие как звуки, изображения и 3D-формы, в виде нейросетевых моделей. Одним из первых и ключевых подходов в этой области является Sinusoidal Representation Networks (SIRENs). Несмотря на их перспективы, SIRENs сталкиваются с значимым ограничением: они могут сталкиваться с трудностями при интерпретации сигналов, которые выходят за пределы их частотной поддержки. Это приводит к проблеме "спектрального буфера", когда модель производит почти нулевые выходы и не может восстановить даже те частотные компоненты, которые входят в ее представимость. Этот вопрос требует решения, чтобы повысить точность и производительность SIRENs в обширных прикладных задачах.
## Метод
WINNER (Weight Initialization with Noise for Neural Representations) — это новый подход к инициализации весов в SIRENs. Он использует гауссовую случайную вариацию весов с определенным распределением, которое определяется спектральным центром целевого сигнала. Этот метод эмулирует рандомные Фурье-образующие функции, но не добавляет дополнительных параметров для обучения. Эта методика позволяет повысить точность модели, особенно при работе с сигналами, которые выходят за частотную поддержку SIREN. Использованная архитектура WINNER ускоряет обучение и повышает точность воспроизведения сложных сигналов в сравнении с оригинальной SIREN.
## Результаты
Чтобы проверить эффективность WINNER, его реализация проверена на различных данных, включая звуковые сигналы, изображения и 3D-формы. Эксперименты показали, что WINNER достигает значительного повышения точности воспроизведения в сравнении с базовым SIREN. Использование гауссового шума в инициализации весов увеличивает точность в десятки процентов в задачах воспроизведения звука, а также сокращает время обучения без влияния на структуру сети. Эти результаты показывают, что WINNER может значительно повысить производительность SIRENs в различных прикладных задачах.
## Значимость
WINNER предлагает универсальный подход к инициализации весов, который может быть применен в различных задачах, включая синтез изображений, звуковых сигналов и 3D-моделей. Он позволяет устранить "спектральный буфер" и подстраивается под разные типы сигналов, что улучшает качество и точность модели. Этот подход также может быть применен в других глубоких нейронных сетях для оптимизации инициализации параметров. Эти достижения открывают новые пути для развития INR-технологий в интеллектуальных системах.
## Выводы
WINNER (Weight Initialization with Noise for Neural Representations) является эффективным ре
Abstract
We identify and address a fundamental limitation of sinusoidal representation
networks (SIRENs), a class of implicit neural representations. SIRENs Sitzmann
et al. (2020), when not initialized appropriately, can struggle at fitting
signals that fall outside their frequency support. In extreme cases, when the
network's frequency support misaligns with the target spectrum, a 'spectral
bottleneck' phenomenon is observed, where the model yields to a near-zero
output and fails to recover even the frequency components that are within its
representational capacity. To overcome this, we propose WINNER - Weight
Initialization with Noise for Neural Representations. WINNER perturbs uniformly
initialized weights of base SIREN with Gaussian noise - whose noise scales are
adaptively determined by the spectral centroid of the target signal. Similar to
random Fourier embeddings, this mitigates 'spectral bias' but without
introducing additional trainable parameters. Our method achieves
state-of-the-art audio fitting and significant gains in image and 3D shape
fitting tasks over base SIREN. Beyond signal fitting, WINNER suggests new
avenues in adaptive, target-aware initialization strategies for optimizing deep
neural network training. For code and data visit
cfdlabtechnion.github.io/siren_square/.
Ссылки и действия
Дополнительные ресурсы: