Can Multitask Learning Enhance Model Explainability?

2508.06966v1 cs.LG, cs.AI 2025-08-13
Авторы:

Hiba Najjar, Bushra Alshbib, Andreas Dengel

Резюме на русском

## Контекст Область применения геоинформационных технологий, в том числе спутниковой разведки, стремительно развивается, благодаря появлению богатого спектра типов данных, от сегментации и классификации до регрессии. Однако, несмотря на высокую точность современных многомодальных моделей, их транспарентность и интерпретируемость остаются серьезными проблемами. Эти проблемы вносят значительные трудности в проверку моделей и их применение в решении реальных задач. Многозадачное обучение (multitask learning) предлагается как потенциальное решение, позволяя моделям не только выполнять целевую задачу, но также проводить дополнительные задачи, обеспечивая естественный механизм объяснения своего поведения. ## Метод Методология основывается на использовании дополнительных модалей не только как исходных входов, но и как дополнительных целей для одновременного обучения модели. Например, при многомодальном классификационном задании может быть добавлена задача регрессии, оценивающая определенный аспект данных. Такая модель не только разделяет классы, но и делает прогнозы на основе вторичной модальности, точностью которой можно оценивать производительность. Архитектура заключается в модификации обычных моделей, добавив дополнительные выходы, которые отвечают за подзадачи, чтобы повысить интерпретируемость. ## Результаты Эксперименты проводились на трех различных датасетах: для сегментации, классификации и регрессии. Многозадачная модель показала сходные или лучшие результаты по сравнению с базовыми многомодальными моделями, не требуя дополнительных входных данных для работы. Более того, ошибки в основной задаче (например, классификации) объяснялись с помощью задач-подмасштабов, что улучшило понимание модели. Например, в сегментации, модель выполняла классическую задачу, при этом проводила прогнозы о размере объектов, способствуя пониманию результатов. ## Значимость Результаты имеют значительное значение для развития интерпретируемых моделей в задачах, требующих особый акцент на точности и полноте. Многозадачное обучение позволяет не только повысить производительность, но и обеспечивать наглядные объяснения, что важно для принятия решений в сферах, таких как средства сохранения окружающей среды, геодезия и мониторинг патологий на карты. Этот подход также снижает зависимость от дополнительных данных для моделирования, что экономично и удобно в реальных условиях. ## Выводы Данная работа демонстрирует, что многозадачное обучение может значительно повысить интерпретируемость моделей, оставив производительность на базовом уровне. Будущие исследования будут уделять внимание расширению этого подхода на б

Abstract

Remote sensing provides satellite data in diverse types and formats. The usage of multimodal learning networks exploits this diversity to improve model performance, except that the complexity of such networks comes at the expense of their interpretability. In this study, we explore how modalities can be leveraged through multitask learning to intrinsically explain model behavior. In particular, instead of additional inputs, we use certain modalities as additional targets to be predicted along with the main task. The success of this approach relies on the rich information content of satellite data, which remains as input modalities. We show how this modeling context provides numerous benefits: (1) in case of data scarcity, the additional modalities do not need to be collected for model inference at deployment, (2) the model performance remains comparable to the multimodal baseline performance, and in some cases achieves better scores, (3) prediction errors in the main task can be explained via the model behavior in the auxiliary task(s). We demonstrate the efficiency of our approach on three datasets, including segmentation, classification, and regression tasks. Code available at git.opendfki.de/hiba.najjar/mtl_explainability/.

Ссылки и действия