An Improved Template for Approximate Computing
2509.06162v1
cs.LG, cs.AR, B.2.1; B.6.3
2025-09-12
Авторы:
M. Rezaalipour, F. Costa, M. Biasion, R. Otoni, G. A. Constantinides, L. Pozzi
Резюме на русском
## Контекст
В последние годы интеграция нейронных сетей с решениями для edge devices стала ключевым направлением развития информационных технологий. Однако эта интеграция связана с серьезными затруднениями, связанными с оптимизацией ресурсов, в частности, с требованиями к энергопотреблению и точности. Отсюда возникает необходимость использования близкого к точному вычислению с уменьшением оперативного вклада, чтобы создать более эффективные решения. **Approximate computing**, в частности, стало популярным для решения этой задачи. Оно позволяет снизить энергопотребление, уменьшая точность вычислений в малых арифметических операторах. Улучшение методологии для такой оптимизации является мотивацией для данной работы, так как существующие методы часто имеют ограниченную мощь по нахождению оптимальных решений.
## Метод
Данная работа развивает и совершенствует методологию **XPAT**, которая использует шаблон для преобразования логических схем с учетом того, что при решении задачи необходимо стремиться к минимизации объема логической схемы. Шаблон расширен для использования **parametrisable product sharing**, что позволяет лучше адаптироваться к задаче оптимизации объема. Метод предлагает подход, где шаблонные параметры действуют как промежуточные метрики, близки к реальной синтезированной плотности схемы. Это означает, что алгоритм может более точно направляться на решения с меньшим объемом, сравниваясь с оригинальным XPAT и другими современными алгоритмами.
## Результаты
В ходе экспериментов были проверены алгоритмы на нескольких нейронных сетях, включая ResNet-18 и MobileNet. На основе синтезированных результатов показано, что предлагаемый подход не только снижает объем схемы, но и показывает лучшие результаты по сравнению с оригинальным XPAT и двумя другими современными подходами. Например, при оптимизации точности классификации ResNet-18 на edge-устройстве, проведенной с помощью предложенного метода, были получены результаты, показавшие меньшую суммарную потерю точности при достижении лучшего соотношения между энергопотреблением и точностью. Все это указывает на эффективность и эффектность предлагаемой методологии.
## Значимость
Предложенный подход может быть применен в различных областях, включая компьютерного зрения, ИИ использующие нейронные сети на edge-устройствах. Он предоставляет преимущества в области энергоэффективности и мощности устройств, что является критически важным для применения нейронных сетей в реальном времени. Этот подход позволяет улучшить производительность без существенных потерь точности, что сделает его привлекательным для будущих решений в этой области.
Abstract
Deploying neural networks on edge devices entails a careful balance between
the energy required for inference and the accuracy of the resulting
classification. One technique for navigating this tradeoff is approximate
computing: the process of reducing energy consumption by slightly reducing the
accuracy of arithmetic operators. In this context, we propose a methodology to
reduce the area of the small arithmetic operators used in neural networks -
i.e., adders and multipliers - via a small loss in accuracy, and show that we
improve area savings for the same accuracy loss w.r.t. the state of the art. To
achieve our goal, we improve on a boolean rewriting technique recently
proposed, called XPAT, where the use of a parametrisable template to rewrite
circuits has proved to be highly beneficial. In particular, XPAT was able to
produce smaller circuits than comparable approaches while utilising a naive sum
of products template structure. In this work, we show that template parameters
can act as proxies for chosen metrics and we propose a novel template based on
parametrisable product sharing that acts as a close proxy to synthesised area.
We demonstrate experimentally that our methodology converges better to low-area
solutions and that it can find better approximations than both the original
XPAT and two other state-of-the-art approaches.