Task complexity shapes internal representations and robustness in neural networks
2508.05463v1
cs.LG, cs.AI
2025-08-08
Авторы:
Robert Jankowski, Filippo Radicchi, M. Ángeles Serrano, Marián Boguñá, Santo Fortunato
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Современные нейросети демонстрируют выдающиеся результаты в задачах машинного обучения, однако остаются "черными ящиками" с неясной внутренней организацией. Ключевым вызовом является понимание того, как сложность входных данных и решаемых задач формирует внутренние представления моделей. Эта проблема имеет фундаментальное значение для теории глубокого обучения и практических приложений, включая интерпретируемость, сжатие моделей и оценку надёжности.
Существующие подходы к анализу внутренних представлений ограничены спецификой данных или архитектур моделей, что препятствует созданию универсальных методов оценки сложности задач. Традиционные метрики сложности, основанные на размере данных или количестве параметров, не учитывают топологические особенности сформированных представлений. Более того, неясно, как различные уровни сложности задач влияют на устойчивость моделей к различным возмущениям, таким как бинаризация весов или шумовые вмешательства.
Авторы работы предлагают новый подход, рассматривая многослойные перцептроны (MLP) как двудольные графы со знаковыми весами из перспективы сетевой науки. Это позволяет применить методы анализа сложных сетей для изучения внутренней структуры моделей. Рабочая гипотеза заключается в том, что сложность задачи определяет не только количество необходимых параметров, но и топологические характеристики сформированных представлений, что должно проявляться в различной устойчивости к структурным возмущениям между моделями, обученными на простых и сложных задачах.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Исследователи разработали комплекс из пяти методов-зондов для анализа внутренних представлений нейросетей, не зависящих от типа данных:
1. **Прунинг (Pruning)** - систематическое удаление рёбер с наименьшими весами в графовом представлении модели для изучения её чувствительности к разрежению связей. Это позволяет оценить, какая доля параметров критична для сохранения производительности.
2. **Бинаризация (Binarization)** - преобразование всех весов в бинарные значения (+1 или -1) для исследования роли точности весов в формировании представлений. Это экстремальный случай квантования, позволяющий оценить, насколько важны точные значения весов.
3. **Внедрение шума (Noise injection)** - добавление гауссовского шума к весам для изучения устойчивости представлений к возмущениям. Особый акцент сделан на режим стохастического резонанса, где умеренный уровень шума может улучшить производительность.
4. **Инверсия знаков (Sign flipping)** - случайное изменение знаков весов для анализа важности знаковой структуры относительно величин весов. Это позволяет отделить топологические свойства от метрических.
5. **Рандомизация двудольных сетей (Bipartite network randomization)** - сохранение только знаковой структуры связей при полной рандомизации величин весов и топологии связей между слоями.
MLP представляются как знаковые взвешенные двудольные графы, где вершины соответствуют нейронам, а рёбра - весам между слоями. Для контраста эффектов исследовались простые (лёгкие) и сложные (трудные) задачи классификации на датасетах MNIST и Fashion-MNIST. Сложность задач определялась через манипуляции с метками классов, создавая варианты с различным уровнем разделимости классов в пространстве признаков.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Эксперименты проводились на трёх архитектурах MLP с различной глубиной (2, 3 и 4 скрытых слоя) и шириной (256, 512 и 1024 нейрона на слой). Для каждой задачи создавались пары "лёгкая-сложная" через систематическое усложнение разметки, обеспечивая контролируемое различие в сложности при фиксированных данных.
Ключевые экспериментальные находки:
1. **Бинаризация весов** приводит к катастрофическому падению точности (до уровня случайного угадывания) в моделях, обученных на сложных задачах, тогда как модели простых задач сохраняют высокую производительность (снижение менее 5%).
2. **Фазовый переход при прунинге**: при бинаризации последующее удаление рёбер с наименьшими весами в моделях сложных задач вызывает резкий
Abstract
Neural networks excel across a wide range of tasks, yet remain black boxes.
In particular, how their internal representations are shaped by the complexity
of the input data and the problems they solve remains obscure. In this work, we
introduce a suite of five data-agnostic probes-pruning, binarization, noise
injection, sign flipping, and bipartite network randomization-to quantify how
task difficulty influences the topology and robustness of representations in
multilayer perceptrons (MLPs). MLPs are represented as signed, weighted
bipartite graphs from a network science perspective. We contrast easy and hard
classification tasks on the MNIST and Fashion-MNIST datasets. We show that
binarizing weights in hard-task models collapses accuracy to chance, whereas
easy-task models remain robust. We also find that pruning low-magnitude edges
in binarized hard-task models reveals a sharp phase-transition in performance.
Moreover, moderate noise injection can enhance accuracy, resembling a
stochastic-resonance effect linked to optimal sign flips of small-magnitude
weights. Finally, preserving only the sign structure-instead of precise weight
magnitudes-through bipartite network randomizations suffices to maintain high
accuracy. These phenomena define a model- and modality-agnostic measure of task
complexity: the performance gap between full-precision and binarized or
shuffled neural network performance. Our findings highlight the crucial role of
signed bipartite topology in learned representations and suggest practical
strategies for model compression and interpretability that align with task
complexity.
Ссылки и действия
Дополнительные ресурсы: