FMCE-Net++: Feature Map Convergence Evaluation and Training

2508.06109v1 cs.CV, cs.AI 2025-08-12

Авторы:

Zhibo Zhu, Renyu Huang, Lei He

Резюме на русском

#### Контекст Текущие глубокие нейронные сети (DNNs) сталкиваются с трудностями в интерпретируемости их внутренних представлений. Хотя Feature Map Convergence Evaluation (FMCE) предлагает метод для оценки модулярного уровня сходимости через Feature Map Convergence Scores (FMCS), он недостаточно проверен экспериментально и не интегрирован с обучением. Этот недостаток приводит к уменьшенной точности и неэффективности моделей в задачах классификации. Для устранения этой проблемы мы предлагаем FMCE-Net++, новую структуру, которая интегрирует замороженную FMCE-Net в качестве вспомогательного модуля для оценки FMCS и динамического оптимизации основной модели. #### Метод FMCE-Net++ включает в себя замороженный FMCE-Net в качестве вспомогательного заголовка, который вычисляет FMCS для каждого модуля сети. Эти оценки, вместе с метками задачи, подаются в Representation Auxiliary Loss (RAL), который динамически регулирует баланс между основной задачей классификации и оптимизацией сходимости функций. Регулятор Representation Abstraction Factor (RAF) позволяет динамически адаптировать силу вклада вспомогательного модуля в обучение. Это гибкое решение интегрирует FMCE в обучение, не требуя изменений архитектуры или дополнительных данных. #### Результаты Мы провели исследования на MNIST, CIFAR-10, FashionMNIST и CIFAR-100, используя модели ResNet-50, ShuffleNet v2 и другие. Результаты показали значительные улучшения в точности: $+1.16$ pp для ResNet-50 на CIFAR-10 и $+1.08$ pp для ShuffleNet v2 на CIFAR-100. Эти результаты демонстрируют, что FMCE-Net++ может повысить эффективность сетей без изменений архитектуры или дополнительных данных, повысив их моделируемую точность. #### Значимость Предлагаемый подход может быть применен в различных областях, где требуется улучшение точности без увеличения сложности модели или доступа к большому количеству данных. FMCE-Net++ демонстрирует выгоду в скейлируемости и универсальности, может быть использован в задачах классификации изображений и даже в задачах с более сложными входными данными. Этот подход также открывает пути для дальнейшего исследования в области интерпретируемости и оптимизации DNNs. #### Выводы FMCE-Net++ достигает значительных выгод в точности без дополнительных изменений архитектуры или дополнительных данных. Он показывает, что интеграция FMCE в обучение может быть эффективным инструментом для повышения моделируемой точности. Будущие исследования будут сфокусированы на расширении применения FMCE-Net++ к более сложным задачам и развитии его вариантов для других видов DNNs.

Abstract

Deep Neural Networks (DNNs) face interpretability challenges due to their opaque internal representations. While Feature Map Convergence Evaluation (FMCE) quantifies module-level convergence via Feature Map Convergence Scores (FMCS), it lacks experimental validation and closed-loop integration. To address this limitation, we propose FMCE-Net++, a novel training framework that integrates a pretrained, frozen FMCE-Net as an auxiliary head. This module generates FMCS predictions, which, combined with task labels, jointly supervise backbone optimization through a Representation Auxiliary Loss. The RAL dynamically balances the primary classification loss and feature convergence optimization via a tunable \Representation Abstraction Factor. Extensive experiments conducted on MNIST, CIFAR-10, FashionMNIST, and CIFAR-100 demonstrate that FMCE-Net++ consistently enhances model performance without architectural modifications or additional data. Key experimental outcomes include accuracy gains of $+1.16$ pp (ResNet-50/CIFAR-10) and $+1.08$ pp (ShuffleNet v2/CIFAR-100), validating that FMCE-Net++ can effectively elevate state-of-the-art performance ceilings.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

FMCE-Net++: Feature Map Convergence Evaluation and Training

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection

Explainable Parkinsons Disease Gait Recognition Using Multimodal RGB-D Fusion an...

GuidNoise: Single-Pair Guided Diffusion for Generalized Noise Synthesis

PhyVLLM: Physics-Guided Video Language Model with Motion-Appearance Disentanglem...

Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent...

Навигация