Real-Time Performance Benchmarking of TinyML Models in Embedded Systems (PICO: Performance of Inference, CPU, and Operations)
2509.04721v1
cs.SE, cs.LG
2025-09-09
Авторы:
Abhishek Dey, Saurabh Srivastava, Gaurav Singh, Robert G. Pettit
Резюме на русском
## Контекст
Объединение микроконтроллеров и нейронных сетей в области Edge AI позволяет решать сложные задачи компьютерного зрения и звукового анализа на устройствах с ограниченными ресурсами. Эти модели, известные как TinyML, обеспечивают реального времени обработку данных в условиях ограниченного количества памяти, пропускной способности и энергопотребления. Однако важно понимать, как эти модели работают на различных железных платформах, так как реальное время процесса инференса, использование CPU и эффективность памяти могут сильно отличаться. Недостаток инструментов для реального времени мониторинга и оценки таких моделей затрудняет оптимальный выбор платформы и настройку моделей. Для устранения этой проблемы разработан PICO-TINYML-BENCHMARK, который предлагает модульное и платформонезависимое решение для оценки реального времени TinyML-моделей.
## Метод
PICO-TINYML-BENCHMARK представляет собой модульную архитектуру, которая включает в себя модели, платформы и метрики для эффективного мониторинга реального времени. Он поддерживает различные платформы, такие как BeagleBone AI-64 и Raspberry Pi 4, и оценивает три ключевые метрики: латентность вывода, использование CPU и эффективность памяти. Модели, оцениваемые в рамках данного исследования, включают Gesture Classification, Keyword Spotting и MobileNet V2. Данные для экспериментов были получены из реального мира, чтобы обеспечить актуальность и релевантность результатов. Такая разработанная система предоставляет пользователю возможность оптимизировать модели и выбирать платформу с учетом конкретных требований.
## Результаты
Оценивая три TinyML-модели, расширенные бенчмарки показали различия в производительности на BeagleBone AI-64 и Raspberry Pi 4. Gesture Classification и Keyword Spotting показали лучшую эффективность на BeagleBone AI-64, где инференс выполняется с меньшей латентностью. Однако Raspberry Pi 4 демонстрирует выигрыш в памяти и энергоэффективности, который может быть критичен для приложений с ограниченным бюджетом. Например, в Keyword Spotting Raspberry Pi 4 показывает лучшую эффективность памяти, что может привести к более экономичной реализации. Такие результаты помогают понять ситуацию и сделать оптимальный выбор платформы и модели согласно требованиям приложения.
## Значимость
Фреймворк PICO-TINYML-BENCHMARK имеет широкие возможности для применения в сферах, где реальное время и эффективность ключевые факторы. Это может быть особенно полезно для IoT-приложений, где сжатые ресурсы необходимы для эффективной работы. Данный подход также может быть использован для разработки моделей с меньшим расходом ресурсов и улучшения энергоэффективности. Эти резуль
Abstract
This paper presents PICO-TINYML-BENCHMARK, a modular and platform-agnostic
framework for benchmarking the real-time performance of TinyML models on
resource-constrained embedded systems. Evaluating key metrics such as inference
latency, CPU utilization, memory efficiency, and prediction stability, the
framework provides insights into computational trade-offs and platform-specific
optimizations. We benchmark three representative TinyML models -- Gesture
Classification, Keyword Spotting, and MobileNet V2 -- on two widely adopted
platforms, BeagleBone AI64 and Raspberry Pi 4, using real-world datasets.
Results reveal critical trade-offs: the BeagleBone AI64 demonstrates consistent
inference latency for AI-specific tasks, while the Raspberry Pi 4 excels in
resource efficiency and cost-effectiveness. These findings offer actionable
guidance for optimizing TinyML deployments, bridging the gap between
theoretical advancements and practical applications in embedded systems.
Ссылки и действия
Дополнительные ресурсы: