An Improved Template for Approximate Computing

2509.06162v1 cs.LG, cs.AR, B.2.1; B.6.3 2025-09-12

Авторы:

M. Rezaalipour, F. Costa, M. Biasion, R. Otoni, G. A. Constantinides, L. Pozzi

Резюме на русском

## Контекст В последние годы интеграция нейронных сетей с решениями для edge devices стала ключевым направлением развития информационных технологий. Однако эта интеграция связана с серьезными затруднениями, связанными с оптимизацией ресурсов, в частности, с требованиями к энергопотреблению и точности. Отсюда возникает необходимость использования близкого к точному вычислению с уменьшением оперативного вклада, чтобы создать более эффективные решения. **Approximate computing**, в частности, стало популярным для решения этой задачи. Оно позволяет снизить энергопотребление, уменьшая точность вычислений в малых арифметических операторах. Улучшение методологии для такой оптимизации является мотивацией для данной работы, так как существующие методы часто имеют ограниченную мощь по нахождению оптимальных решений. ## Метод Данная работа развивает и совершенствует методологию **XPAT**, которая использует шаблон для преобразования логических схем с учетом того, что при решении задачи необходимо стремиться к минимизации объема логической схемы. Шаблон расширен для использования **parametrisable product sharing**, что позволяет лучше адаптироваться к задаче оптимизации объема. Метод предлагает подход, где шаблонные параметры действуют как промежуточные метрики, близки к реальной синтезированной плотности схемы. Это означает, что алгоритм может более точно направляться на решения с меньшим объемом, сравниваясь с оригинальным XPAT и другими современными алгоритмами. ## Результаты В ходе экспериментов были проверены алгоритмы на нескольких нейронных сетях, включая ResNet-18 и MobileNet. На основе синтезированных результатов показано, что предлагаемый подход не только снижает объем схемы, но и показывает лучшие результаты по сравнению с оригинальным XPAT и двумя другими современными подходами. Например, при оптимизации точности классификации ResNet-18 на edge-устройстве, проведенной с помощью предложенного метода, были получены результаты, показавшие меньшую суммарную потерю точности при достижении лучшего соотношения между энергопотреблением и точностью. Все это указывает на эффективность и эффектность предлагаемой методологии. ## Значимость Предложенный подход может быть применен в различных областях, включая компьютерного зрения, ИИ использующие нейронные сети на edge-устройствах. Он предоставляет преимущества в области энергоэффективности и мощности устройств, что является критически важным для применения нейронных сетей в реальном времени. Этот подход позволяет улучшить производительность без существенных потерь точности, что сделает его привлекательным для будущих решений в этой области.

Abstract

Deploying neural networks on edge devices entails a careful balance between the energy required for inference and the accuracy of the resulting classification. One technique for navigating this tradeoff is approximate computing: the process of reducing energy consumption by slightly reducing the accuracy of arithmetic operators. In this context, we propose a methodology to reduce the area of the small arithmetic operators used in neural networks - i.e., adders and multipliers - via a small loss in accuracy, and show that we improve area savings for the same accuracy loss w.r.t. the state of the art. To achieve our goal, we improve on a boolean rewriting technique recently proposed, called XPAT, where the use of a parametrisable template to rewrite circuits has proved to be highly beneficial. In particular, XPAT was able to produce smaller circuits than comparable approaches while utilising a naive sum of products template structure. In this work, we show that template parameters can act as proxies for chosen metrics and we propose a novel template based on parametrisable product sharing that acts as a close proxy to synthesised area. We demonstrate experimentally that our methodology converges better to low-area solutions and that it can find better approximations than both the original XPAT and two other state-of-the-art approaches.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация