FMCE-Net++: Feature Map Convergence Evaluation and Training
2508.06109v1
cs.CV, cs.AI
2025-08-12
Авторы:
Zhibo Zhu, Renyu Huang, Lei He
Резюме на русском
#### Контекст
Текущие глубокие нейронные сети (DNNs) сталкиваются с трудностями в интерпретируемости их внутренних представлений. Хотя Feature Map Convergence Evaluation (FMCE) предлагает метод для оценки модулярного уровня сходимости через Feature Map Convergence Scores (FMCS), он недостаточно проверен экспериментально и не интегрирован с обучением. Этот недостаток приводит к уменьшенной точности и неэффективности моделей в задачах классификации. Для устранения этой проблемы мы предлагаем FMCE-Net++, новую структуру, которая интегрирует замороженную FMCE-Net в качестве вспомогательного модуля для оценки FMCS и динамического оптимизации основной модели.
#### Метод
FMCE-Net++ включает в себя замороженный FMCE-Net в качестве вспомогательного заголовка, который вычисляет FMCS для каждого модуля сети. Эти оценки, вместе с метками задачи, подаются в Representation Auxiliary Loss (RAL), который динамически регулирует баланс между основной задачей классификации и оптимизацией сходимости функций. Регулятор Representation Abstraction Factor (RAF) позволяет динамически адаптировать силу вклада вспомогательного модуля в обучение. Это гибкое решение интегрирует FMCE в обучение, не требуя изменений архитектуры или дополнительных данных.
#### Результаты
Мы провели исследования на MNIST, CIFAR-10, FashionMNIST и CIFAR-100, используя модели ResNet-50, ShuffleNet v2 и другие. Результаты показали значительные улучшения в точности: $+1.16$ pp для ResNet-50 на CIFAR-10 и $+1.08$ pp для ShuffleNet v2 на CIFAR-100. Эти результаты демонстрируют, что FMCE-Net++ может повысить эффективность сетей без изменений архитектуры или дополнительных данных, повысив их моделируемую точность.
#### Значимость
Предлагаемый подход может быть применен в различных областях, где требуется улучшение точности без увеличения сложности модели или доступа к большому количеству данных. FMCE-Net++ демонстрирует выгоду в скейлируемости и универсальности, может быть использован в задачах классификации изображений и даже в задачах с более сложными входными данными. Этот подход также открывает пути для дальнейшего исследования в области интерпретируемости и оптимизации DNNs.
#### Выводы
FMCE-Net++ достигает значительных выгод в точности без дополнительных изменений архитектуры или дополнительных данных. Он показывает, что интеграция FMCE в обучение может быть эффективным инструментом для повышения моделируемой точности. Будущие исследования будут сфокусированы на расширении применения FMCE-Net++ к более сложным задачам и развитии его вариантов для других видов DNNs.
Abstract
Deep Neural Networks (DNNs) face interpretability challenges due to their
opaque internal representations. While Feature Map Convergence Evaluation
(FMCE) quantifies module-level convergence via Feature Map Convergence Scores
(FMCS), it lacks experimental validation and closed-loop integration. To
address this limitation, we propose FMCE-Net++, a novel training framework that
integrates a pretrained, frozen FMCE-Net as an auxiliary head. This module
generates FMCS predictions, which, combined with task labels, jointly supervise
backbone optimization through a Representation Auxiliary Loss. The RAL
dynamically balances the primary classification loss and feature convergence
optimization via a tunable \Representation Abstraction Factor. Extensive
experiments conducted on MNIST, CIFAR-10, FashionMNIST, and CIFAR-100
demonstrate that FMCE-Net++ consistently enhances model performance without
architectural modifications or additional data. Key experimental outcomes
include accuracy gains of $+1.16$ pp (ResNet-50/CIFAR-10) and $+1.08$ pp
(ShuffleNet v2/CIFAR-100), validating that FMCE-Net++ can effectively elevate
state-of-the-art performance ceilings.
Ссылки и действия
Дополнительные ресурсы: