Measuring the Measures: Discriminative Capacity of Representational Similarity Metrics Across Model Families

2509.04622v1 cs.LG, cs.AI, cs.NE 2025-09-09
Авторы:

Jialin Wu, Shreya Saha, Yiqing Bo, Meenakshi Khosla

Резюме на русском

## Контекст Репрезентационные сходством метрики являются основными инструментами в науке о разуме и искусственном интеллекте. Они позволяют оценивать схожесть представлений внутри и между моделями, обнаруживая структуры и отношения между данными. Однако не существует систематических сравнений их дискриминативной силы по отношению к разным семействам моделей. Это сделало необходимым развитие методологии, позволяющей оценивать, насколько эффективно разные метрики отличают модели по их внутренним представлениям. Такой подход не только будет способствовать пониманию особенностей моделей, но и поможет выбору правильной метрики для конкретной задачи, когда сравниваются модели разных архитектур или обученные разными способами. ## Метод Мы предложили фреймворк, основанный на мере дискриминативности, которая измеряется с помощью трех разных критериев. В качестве базовых метрик использовались RSA (Representational Similarity Analysis), линейная прогностичность, метод Прокурстеса и мягкое сравнение. Мы применили эти метрики для сравнения моделей с различными архитектурами, такими как CNN (Convolutional Neural Networks), Vision Transformers, Swin Transformers и ConvNeXt. Также мы рассмотрели различные режимы обучения, включая супервизированное и самостоятельное обучение. Для оценки дискриминативности мы использовали три методы: d-prime (из сигнальной детекции), коэффициенты шейлов и ROC-AUC. Это позволило нам проанализировать, насколько эффективно разные метрики отличают модели в зависимости от их архитектуры и обучения. ## Результаты Мы провели подробные эксперименты, сравнив дискриминативность различных метрик на выборке данных, представляющей собой представления моделей с разными архитектурами и режимами обучения. Мы отметили, что дискриминативность растет с увеличением строгости внутренних ограничений, которые накладываются метриками. Например, метод "мягкое сравнение" показал самую высокую дискриминативность среди маппинг-метрик, а за ним следовали Procrustes и линейная прогностичность. Также мы отметили, что некоторые метрики, не использующие явное сравнение внутренних представлений (например, RSA), также демонстрировали высокую дискриминативность, хотя с точки зрения структуры они работают по-другому. ## Значимость Наши результаты имеют практическое значение для нескольких областей. В первую очередь, они помогают выбирать наиболее подходящую метрику для сравнения моделей и мозга, что важно для исследований в области глубокого обучения и мозговой динамики. Также, наш фреймворк позволяет выявлять слабые места в метриках, что может привести к развитию более эффективных методов. Э

Abstract

Representational similarity metrics are fundamental tools in neuroscience and AI, yet we lack systematic comparisons of their discriminative power across model families. We introduce a quantitative framework to evaluate representational similarity measures based on their ability to separate model families-across architectures (CNNs, Vision Transformers, Swin Transformers, ConvNeXt) and training regimes (supervised vs. self-supervised). Using three complementary separability measures-dprime from signal detection theory, silhouette coefficients and ROC-AUC, we systematically assess the discriminative capacity of commonly used metrics including RSA, linear predictivity, Procrustes, and soft matching. We show that separability systematically increases as metrics impose more stringent alignment constraints. Among mapping-based approaches, soft-matching achieves the highest separability, followed by Procrustes alignment and linear predictivity. Non-fitting methods such as RSA also yield strong separability across families. These results provide the first systematic comparison of similarity metrics through a separability lens, clarifying their relative sensitivity and guiding metric choice for large-scale model and brain comparisons.

Ссылки и действия