Reduction Techniques for Survival Analysis

2508.05715v1 stat.ML, cs.LG 2025-08-12
Авторы:

Johannes Piller, Léa Orsini, Simon Wiegrebe, John Zobolas, Lukas Burk, Sophie Hanna Langbein, Philip Studener, Markus Goeswein, Andreas Bender

Резюме на русском

## Контекст Область исследования — survival analysis (анализ выживаемости) — широко применяется в медицине, биологии, финансах и других сферах для оценки временных интервалов до события. Однако многие методы survival analysis требуют специальных алгоритмов, которые могут быть сложными в адаптации и неэффективны при больших объемах данных. Более простые методы, такие как регрессия и классификация, имеют более широкое применение и лучшую инфраструктуру в стандартных машинных и глубоких обучаемых системах. Reduction techniques (техники сокращения задач) предлагают преобразовать задачи survival analysis в задачи регрессии или классификации, сохраняя при этом специфику survival data. Целью данной работы является изучение этих техник, их преимуществ и ограничений, а также предоставление инструментов для их использования в стандартных машинных обучаемых системах. ## Метод Техники сокращения задач в survival analysis предполагают преобразование исходной задачи, связанной с оценкой временных интервалов, в задачу оценки простых ответов (как в регрессии или классификации). Наиболее распространенными техниками являются: 1. **Survival feature extraction (Экстракция признаков выживаемости):** Извлечение признаков, таких как время до события или оценки риска, для использования в обычных моделях машинного обучения. 2. **Survival margin classification (Классификация по пределу выживаемости):** Обучение модели для классификации на основе разницы между временем до и после события. 3. **Survival ranking (Ранжирование выживаемости):** Оценка относительного риска события для каждого наблюдения и использование этого в регрессионной модели. 4. **Survival stratification (Стратификация выживаемости):** Разделение выборки на страты по риску, затем применение стандартных моделей к каждому страте. Разработанная архитектура включает инструменты для применения этих техник в стандартных библиотеках, таких как Scikit-learn и PyTorch, что обеспечивает интеграцию в уже существующие рабочие процессы. ## Результаты Эксперименты проводились на стандартных survival analysis датасетах, таких как Wisconsin Diagnostic Breast Cancer (WDBC) и METABRIC. Для каждой техники сокращения задачи выполнено несколько экспериментов с различными моделями (например, Random Forest, XGBoost, Neural Networks). Результаты показали, что survival feature extraction и survival ranking дают наилучшие результаты в среднем по всем моделям, хотя survival margin classification демонстрирует высокую точность в задачах с ясно выделенными границами. Также проведенный benchmark анализ показал, что некоторые техники могут превосходить специализированные survival analysis модели, такие как Cox proportional hazards и Kaplan-Meier, в задачах с большими объемами данных. ## Значимость Reduction techniques имеют широкие применения в области machine learning и survival analysis. Они позволяют использовать стандартные и простые в использовании модели машинного обучения для за

Abstract

In this work, we discuss what we refer to as reduction techniques for survival analysis, that is, techniques that "reduce" a survival task to a more common regression or classification task, without ignoring the specifics of survival data. Such techniques particularly facilitate machine learning-based survival analysis, as they allow for applying standard tools from machine and deep learning to many survival tasks without requiring custom learners. We provide an overview of different reduction techniques and discuss their respective strengths and weaknesses. We also provide a principled implementation of some of these reductions, such that they are directly available within standard machine learning workflows. We illustrate each reduction using dedicated examples and perform a benchmark analysis that compares their predictive performance to established machine learning methods for survival analysis.

Ссылки и действия