A Shift in Perspective on Causality in Domain Generalization
2508.12798v1
cs.LG, cs.AI, cs.CV
2025-08-20
Авторы:
Damian Machlanski, Stephanie Riley, Edward Moroshko, Kurt Butler, Panagiotis Dimitrakopoulos, Thomas Melistas, Akchunya Chanchal, Steven McDonagh, Ricardo Silva, Sotirios A. Tsaftaris
Резюме на русском
## Контекст
Область исследования доменной общеприменимости (Domain Generalization, DG) направлена на развитие моделей, которые могут обучаться на одном домене и справляться с неизвестными доменами. Однако современные модели часто не могут обеспечить стабильную интерпретацию и выносливость в подобных ситуациях. Этот феномен становится еще более актуальным в контексте распространенных теорий о том, что выборка признаков, связанных с причинным подходом, может дополнить обучение и улучшить предсказательную мощь моделей. Несмотря на это, теории логического связывания причин и следствий вызывают вопросы относительно их эффективности в стабильной общеприменимости. Мотивацией для данного исследования является проблема неоднозначной роли причинных моделей в обеспечении выносливости и интерпретируемости результатов, что приводит к необходимости предложить более четкую модель.
## Метод
Для достижения целей исследования была применена интерактивная научная методология, которая включала: (1) анализ и реконструкцию теоретических предпосылок, связанных с причинными моделями в DG; (2) разработка и тестирование алгоритмов для оценки различных моделей причинно-следственных связей в контексте многодоменных задач; (3) эмпирический анализ результатов, основанный на расширенном наборе данных, включающих как стандартные, так и новые бенчмарки DG. Это позволило проверить гипотезу о том, как различные причинные модели влияют на общеприменимость.
## Результаты
Исследование показало, что причинные модели могут способствовать общеприменимости, но не всегда стабильно. Эксперименты проведены на нескольких DG-бенчмарках, включая CIFAR-10-C и VLCS. Было обнаружено, что некоторые модели причинно-следственных связей могут улучшать предсказания в некоторых случаях, но при этом могут вызывать ложные срабатывания или нестабильность при переходе между доменами. Результаты также показали, что другие модели, ориентированные исключительно на признаки без причинных моделей, могут быть эффективнее в некоторых случаях.
## Значимость
Результаты данного исследования могут быть применены в различных сферах, где существуют проблемы с общеприменимостью моделей, например, в медицине, робототехнике, интернет-технологиях, а также в других областях, где модели должны устойчиво работать в различных условиях. Преимущества нового подхода заключаются в том, что он предлагает более гибкую и точную модель для выбора причинных моделей в зависимости от конкретной задачи и домена. Это может привести к более высокому уровню интерпретируемости и устойчивости моделей в задачах многодоменной общеприменимости.
## Выводы
Abstract
The promise that causal modelling can lead to robust AI generalization has
been challenged in recent work on domain generalization (DG) benchmarks. We
revisit the claims of the causality and DG literature, reconciling apparent
contradictions and advocating for a more nuanced theory of the role of
causality in generalization. We also provide an interactive demo at
https://chai-uk.github.io/ukairs25-causal-predictors/.
Ссылки и действия
Дополнительные ресурсы: