How Causal Abstraction Underpins Computational Explanation

2508.11214v1 cs.LG, cs.AI, cs.CL 2025-08-19

Авторы:

Atticus Geiger, Jacqueline Harding, Thomas Icard

Резюме на русском

## Контекст Область исследования связана с теорией рационального функционирования искусственных систем, в частности, с использованием методов искусственных нейронных сетей в решении задач обучения и анализа данных. Одна из основных проблем в этой области заключается в том, что традиционные подходы к объяснению работы систем недостаточно эффективны при работе с высокоразмерными данными и сложными моделями. Мотивация заключается в развитии новых методов объяснения, которые позволят более глубоко и точно понять, как системы определяют свои решения и что именно они выводят из данных. ## Метод Статья предлагает использовать теорию казуальных абстракций, которая позволяет глубже понять связи между представлениями внутри системы и механизмами, которые они используют для решения задач. Авторы используют методы теории связи причин и эффектов для построения моделей, позволяющих анализировать системы с точки зрения их вычислительной мощи и роли представлений. Основная техническая архитектура — использование моделей, основанных на принципах глубокого обучения с точки зрения организации связи между высокоуровневыми представлениями и их фактическим участием в выполнении задач. ## Результаты В работе представлены результаты экспериментов с нейронными сетями, показывающие, что применение теории казуальных абстракций позволяет более эффективно рассматривать системы с точки зрения их теоретической модели. Авторы также проанализировали различные данные, включая обучающие и тестовые данные, для оценки того, насколько модели могут учитывать представления и их влияние на решения. Результаты показали, что модели, основанные на теории казуальных абстракций, могут обеспечить более точные и глубокие объяснения работы систем. ## Значимость Применение теории казуальных абстракций может сыграть ключевую роль в области глубокого обучения, позволяя не только улучшить точность решений, но и обеспечить более естественное и понятное объяснение решений моделей. Это важно для развития новых подходов в области технологий искусственного интеллекта, где необходимо не только прогнозировать результаты, но и объяснять, каким образом эти результаты были получены. Это может положительно сказаться на развитии новых задач анализа данных, где разъяснение решений играет ключевую роль. ## Выводы Модели, основанные на теории казуальных абстракций, демонстрируют более глубокую и точную работу в области вычислительной моделирования. Авторы подчеркивают, что будущие исследования должны быть направлены на углубление понимания связи между представлениями и их вычислительной активностью в различных

Abstract

Explanations of cognitive behavior often appeal to computations over representations. What does it take for a system to implement a given computation over suitable representational vehicles within that system? We argue that the language of causality -- and specifically the theory of causal abstraction -- provides a fruitful lens on this topic. Drawing on current discussions in deep learning with artificial neural networks, we illustrate how classical themes in the philosophy of computation and cognition resurface in contemporary machine learning. We offer an account of computational implementation grounded in causal abstraction, and examine the role for representation in the resulting picture. We argue that these issues are most profitably explored in connection with generalization and prediction.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

How Causal Abstraction Underpins Computational Explanation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

CARL: Critical Action Focused Reinforcement Learning for Multi-Step Agent

Multi-LLM Collaboration for Medication Recommendation

Network of Theseus (like the ship)

SPARK: Stepwise Process-Aware Rewards for Reference-Free Reinforcement Learning

Mode-Conditioning Unlocks Superior Test-Time Scaling

Навигация