Causal Machine Learning for Surgical Interventions

2509.19705v1 cs.LG, cs.AI, stat.AP, stat.ME 2025-09-26
Авторы:

J. Ben Tamo, Nishant S. Chouhan, Micky C. Nnamdi, Yining Yuan, Shreya S. Chivilkar, Wenqi Shi, Steven W. Hwang, B. Randall Brenn, May D. Wang

Резюме на русском

#### Контекст Surgical decision-making является сложной и требует глубокого понимания взаимосвязей между характеристиками пациента, методами лечения и полученными результатами. Особенно в критичных ситуациях, таких как стоингальная вмешательство или лечение сколиоза, точная оценка отдельных воздействий лечения (individualized treatment effects, ITEs) остается затрудненной. Традиционные статистические методы, опирающиеся на аппроксимации или линейные модели, часто сталкиваются с ограничениями при работе с сложными и гетерогенными данными. Данный исследование адресовано развитию методов, которые могут улучшить оценки ITEs, обеспечивая более точный анализ и поддержку в сфере хирургического вмешательства. #### Метод Для решения сформулированных задач в данном исследовании предложен многозадачный параметрический мета-прием машинного обучения, X-MultiTask. Он моделирует каждое хирургическое вмешательство (например, передняя к тыловой позвоночной колонне или операция против безоперационного подхода) как отдельную задачу, при этом гармонизируя общие представления между задачами. На основе механизмов мета-обучения, X-MultiTask учится выделять общие структуры и особенности в данных. Для усиления каузальной целесообразности включен метод inverse probability weighting (IPW) в целевую функцию. Это позволяет учитывать неоднородность данных и уменьшить влияние потенциальных факторов внедрения. Архитектура модели подразумевает использование нейросетевых моделей для учитывания сложности и хаотичности данных. #### Результаты В ходе экспериментов были использованы две датасета. Первая, публичная, включала 1017 пациентов с стоингальным вмешательством, проанализировавших эффект различных позвоночных подходов на серию осложнений. Вторая датасета, закрытая, включала 368 пациентов с сколиозом и исследовала воздействие PSF (протезации позвоночной колонны) и безоперационного способа на результаты клинических исследований. X-MultiTask демонстрирует высокую точность, оценя значение AUC в 0.84 для первой группы и 0.77 для второй. Он превосходит основные методы в оценке эффекта лечения, суммируясь в значение $\epsilon_{\text{NN-PEHE}} = 0.2778$ и $\epsilon_{\text{ATE}} = 0.0763$. На задаче прогнозирования клинических результатов в сколиозе X-MultiTask показывает значительное превосходство с $\epsilon_{\text{NN-PEHE}} = 0.2551$ и $\epsilon_{\text{ATE}} = 0.0902$. #### Значимость Предложенная модель X-MultiTask может использоваться в различных областях хирургии, где требуется точная оценка индивидуальных воздействий лечения. Она может помогать в персонализации терапии, улучшении результатов

Abstract

Surgical decision-making is complex and requires understanding causal relationships between patient characteristics, interventions, and outcomes. In high-stakes settings like spinal fusion or scoliosis correction, accurate estimation of individualized treatment effects (ITEs) remains limited due to the reliance on traditional statistical methods that struggle with complex, heterogeneous data. In this study, we develop a multi-task meta-learning framework, X-MultiTask, for ITE estimation that models each surgical decision (e.g., anterior vs. posterior approach, surgery vs. no surgery) as a distinct task while learning shared representations across tasks. To strengthen causal validity, we incorporate the inverse probability weighting (IPW) into the training objective. We evaluate our approach on two datasets: (1) a public spinal fusion dataset (1,017 patients) to assess the effect of anterior vs. posterior approaches on complication severity; and (2) a private AIS dataset (368 patients) to analyze the impact of posterior spinal fusion (PSF) vs. non-surgical management on patient-reported outcomes (PROs). Our model achieves the highest average AUC (0.84) in the anterior group and maintains competitive performance in the posterior group (0.77). It outperforms baselines in treatment effect estimation with the lowest overall $\epsilon_{\text{NN-PEHE}}$ (0.2778) and $\epsilon_{\text{ATE}}$ (0.0763). Similarly, when predicting PROs in AIS, X-MultiTask consistently shows superior performance across all domains, with $\epsilon_{\text{NN-PEHE}}$ = 0.2551 and $\epsilon_{\text{ATE}}$ = 0.0902. By providing robust, patient-specific causal estimates, X-MultiTask offers a powerful tool to advance personalized surgical care and improve patient outcomes. The code is available at https://github.com/Wizaaard/X-MultiTask.

Ссылки и действия