Reduction Techniques for Survival Analysis
2508.05715v1
stat.ML, cs.LG
2025-08-12
Авторы:
Johannes Piller, Léa Orsini, Simon Wiegrebe, John Zobolas, Lukas Burk, Sophie Hanna Langbein, Philip Studener, Markus Goeswein, Andreas Bender
Резюме на русском
## Контекст
Область исследования — survival analysis (анализ выживаемости) — широко применяется в медицине, биологии, финансах и других сферах для оценки временных интервалов до события. Однако многие методы survival analysis требуют специальных алгоритмов, которые могут быть сложными в адаптации и неэффективны при больших объемах данных. Более простые методы, такие как регрессия и классификация, имеют более широкое применение и лучшую инфраструктуру в стандартных машинных и глубоких обучаемых системах. Reduction techniques (техники сокращения задач) предлагают преобразовать задачи survival analysis в задачи регрессии или классификации, сохраняя при этом специфику survival data. Целью данной работы является изучение этих техник, их преимуществ и ограничений, а также предоставление инструментов для их использования в стандартных машинных обучаемых системах.
## Метод
Техники сокращения задач в survival analysis предполагают преобразование исходной задачи, связанной с оценкой временных интервалов, в задачу оценки простых ответов (как в регрессии или классификации). Наиболее распространенными техниками являются:
1. **Survival feature extraction (Экстракция признаков выживаемости):** Извлечение признаков, таких как время до события или оценки риска, для использования в обычных моделях машинного обучения.
2. **Survival margin classification (Классификация по пределу выживаемости):** Обучение модели для классификации на основе разницы между временем до и после события.
3. **Survival ranking (Ранжирование выживаемости):** Оценка относительного риска события для каждого наблюдения и использование этого в регрессионной модели.
4. **Survival stratification (Стратификация выживаемости):** Разделение выборки на страты по риску, затем применение стандартных моделей к каждому страте.
Разработанная архитектура включает инструменты для применения этих техник в стандартных библиотеках, таких как Scikit-learn и PyTorch, что обеспечивает интеграцию в уже существующие рабочие процессы.
## Результаты
Эксперименты проводились на стандартных survival analysis датасетах, таких как Wisconsin Diagnostic Breast Cancer (WDBC) и METABRIC. Для каждой техники сокращения задачи выполнено несколько экспериментов с различными моделями (например, Random Forest, XGBoost, Neural Networks). Результаты показали, что survival feature extraction и survival ranking дают наилучшие результаты в среднем по всем моделям, хотя survival margin classification демонстрирует высокую точность в задачах с ясно выделенными границами. Также проведенный benchmark анализ показал, что некоторые техники могут превосходить специализированные survival analysis модели, такие как Cox proportional hazards и Kaplan-Meier, в задачах с большими объемами данных.
## Значимость
Reduction techniques имеют широкие применения в области machine learning и survival analysis. Они позволяют использовать стандартные и простые в использовании модели машинного обучения для за
Abstract
In this work, we discuss what we refer to as reduction techniques for
survival analysis, that is, techniques that "reduce" a survival task to a more
common regression or classification task, without ignoring the specifics of
survival data. Such techniques particularly facilitate machine learning-based
survival analysis, as they allow for applying standard tools from machine and
deep learning to many survival tasks without requiring custom learners. We
provide an overview of different reduction techniques and discuss their
respective strengths and weaknesses. We also provide a principled
implementation of some of these reductions, such that they are directly
available within standard machine learning workflows. We illustrate each
reduction using dedicated examples and perform a benchmark analysis that
compares their predictive performance to established machine learning methods
for survival analysis.
Ссылки и действия
Дополнительные ресурсы: