SNAP-UQ: Self-supervised Next-Activation Prediction for Single-Pass Uncertainty in TinyML

2508.12907v1 cs.LG, cs.CL 2025-08-20

Авторы:

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh

Резюме на русском

## Контекст Современные приложения с малым объемом памяти (TinyML) требуют эффективных методов оценки неуверенности (uncertainty quantification, UQ), которые не требуют большого объема вычислительных ресурсов и памяти. Оценка неуверенности в реальном времени позволяет обеспечить надежность и безопасность систем, применяемых в критических условиях, таких как автоматизация промышленных процессов и системы безопасности. Однако существующие подходы часто требуют многопроходных предсказаний, дополнительных буферов или сложных архитектур, что не подходит для систем с ограниченными ресурсами. Мотивирует разработку эффективных, легких и простых в использовании методов оценки неуверенности в реальном времени для TinyML. ## Метод "SNAP-UQ" (Self-supervised Next-Activation Prediction for Uncertainty in TinyML) — метод, основанный на самостоятельном обучении, который предсказывает следующую активацию (next-activation) в модели сжатого объема (tiny int8). Метод работает в одном проходе (single-pass) и не требует дополнительных входных данных, таких как метки или кэшированные выходы слоев. В нем две основные компоненты: (1) **Depth-wise Next-Activation Prediction (D-NAP)** — нейронные сетки сжатого формата (tiny int8) предсказывают статистику следующего слоя на основе сжатого представления предыдущего слоя, и (2) **Lightweight Monotone Mapper (LMM)** — векторные мапперы, которые преобразуют результаты предсказания в сокращенный, но действительный счетчик неуверенности. Метод SNAP-UQ не требует временных буферов, выходных точек или многопроходных предсказаний, что делает его особенно подходящим для реализации на микроконтроллерах (MCU). ## Результаты Результаты экспериментов показывают, что SNAP-UQ существенно сокращает размер моделей (flash) и задержки (latency) по сравнению с другими методами, например, с методами early-exit и deep ensembles. Например, SNAP-UQ уменьшает размер моделей на 40-60% и ускоряет выполнение на 25-35% при сохранении той же точности. Были проверены модели на задачах визуального и аудио-представления, и в большинстве случаев SNAP-UQ показал лучшие результаты. Он также демонстрирует улучшение обнаружения дефектов в потоках данных в реальном времени, особенно в условиях помех и раз Noise. Этот подход демонстрирует надежную работу с малыми ресурсами, обеспечивая критически важную оценку неуверенности в реальном времени для микроконтроллеров. ## Значимость Подход SNAP-UQ имеет широкое применение в реальном времени для оценки неуверенности в микроконтроллерах (TinyML). Он может применяться в таких областях, как мониторинг операций, безопасность систем, диагностика аппаратуры и системы управления. Основные преимущества SNAP-UQ за

Abstract

We introduce \textbf{SNAP-UQ}, a single-pass, label-free uncertainty method for TinyML that estimates risk from \emph{depth-wise next-activation prediction}: tiny int8 heads forecast the statistics of the next layer from a compressed view of the previous one, and a lightweight monotone mapper turns the resulting surprisal into an actionable score. The design requires no temporal buffers, auxiliary exits, or repeated forward passes, and adds only a few tens of kilobytes to MCU deployments. Across vision and audio backbones, SNAP-UQ consistently reduces flash and latency relative to early-exit and deep ensembles (typically $\sim$40--60\% smaller and $\sim$25--35\% faster), with competing methods of similar accuracy often exceeding memory limits. In corrupted streams it improves accuracy-drop detection by several AUPRC points and maintains strong failure detection (AUROC $\approx$0.9) in a single pass. Grounding uncertainty in layer-to-layer dynamics yields a practical, resource-efficient basis for on-device monitoring in TinyML.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

SNAP-UQ: Self-supervised Next-Activation Prediction for Single-Pass Uncertainty in TinyML

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space

Towards Active Synthetic Data Generation for Finetuning Language Models

AlignSAE: Concept-Aligned Sparse Autoencoders

Measuring What LLMs Think They Do: SHAP Faithfulness and Deployability on Financ...

BanglaSentNet: An Explainable Hybrid Deep Learning Framework for Multi-Aspect Se...

Навигация