TF-DWGNet: A Directed Weighted Graph Neural Network with Tensor Fusion for Multi-Omics Cancer Subtype Classification
2509.16301v1
q-bio.QM, cs.LG, 62R07
2025-09-24
Авторы:
Tiantian Yang, Zhiqian Chen
Резюме на русском
#### Контекст
Интеграция и анализ мульти-омиковских данных являются ключевыми задачами в области раннего выявления и классификации рака. Однако эти данные часто являются высокомерностными, сложными и неструктурированными. Ранее развитые методы не могут полностью учесть структуру и связи внутри и между модальностями данных. Это приводит к ограниченной точности классификации и пониженной толерантности к искажениям в данных. Модели, основанные на графах, оказались эффективными для моделирования таких зависимостей. Однако, существующие графические модели либо не учитывают направленность и веса ребер, либо не эффективны в учете взаимосвязей между модальностями. Задача классификации подтипов рака требует методов, которые могут лучше учитывать направленность, связи и важность входных модальностей.
#### Метод
Мы предлагаем TF-DWGNet — метод, который сочетает графовую модель с направленными весами и тензорной функцией для объединения модальностей данных. Узлы графа представляют модальности данных, а ребра соответствуют взаимосвязям. TF-DWGNet построен на двух ключевых компонентах:
1. **Дерево-ориентированное построение графа**: это подход, который позволяет создавать направленные и взвешенные графы, учитывая направленность и силу связей между модальностями данных.
2. **Тензорная функция**: это механизм, который позволяет объединять информацию от отдельных модальностей, а также взаимодействий между ними, используя методы низкоранговой декомпозиции тензора.
Этот подход позволяет TF-DWGNet эффективно обрабатывать высокомерные и нелинейные зависимости в мульти-омиковских данных, учитывая направленность и важность каждой модальности.
#### Результаты
TF-DWGNet протестирован на нескольких реальных датасетах рака. Для экспериментов мы использовали данные о выражении генов, микроаррай-данные и данные о метастазах. Метод показал высокую точность классификации подтипов рака по сравнению с состоянием искусственного интеллекта. Мы также провели эксперименты для оценки влияния каждой модальности и отдельных функций. Таким образом, TF-DWGNet демонстрирует более высокую точность классификации и позволяет понять, как именно каждая модальность вкладывается в решение.
#### Значимость
TF-DWGNet имеет широкое применение в области медицины, особенно для классификации рака и других заболеваний. Он позволяет выделить сильные и слабые модальности, что может помочь в выявлении новых биологических механизмов в раке. Этот подход также может быть применен для развития новых фармакологических средств, основанных на точных классификационных моделях
Abstract
Integration and analysis of multi-omics data provide valuable insights for
cancer subtype classification. However, such data are inherently heterogeneous,
high-dimensional, and exhibit complex intra- and inter-modality dependencies.
Recent advances in graph neural networks (GNNs) offer powerful tools for
modeling such structure. Yet, most existing methods rely on prior knowledge or
predefined similarity networks to construct graphs, which are often undirected
or unweighted, failing to capture the directionality and strength of biological
interactions. Interpretability at both the modality and feature levels also
remains limited. To address these challenges, we propose TF-DWGNet, a novel
Graph Neural Network framework that combines tree-based Directed Weighted graph
construction with Tensor Fusion for multiclass cancer subtype classification.
TF-DWGNet introduces two key innovations: a supervised tree-based approach for
constructing directed, weighted graphs tailored to each omics modality, and a
tensor fusion mechanism that captures unimodal, bimodal, and trimodal
interactions using low-rank decomposition for efficiency. TF-DWGNet enables
modality-specific representation learning, joint embedding fusion, and
interpretable subtype prediction. Experiments on real-world cancer datasets
show that TF-DWGNet consistently outperforms state-of-the-art baselines across
multiple metrics and statistical tests. Moreover, it provides biologically
meaningful insights by ranking influential features and modalities. These
results highlight TF-DWGNet's potential for effective and interpretable
multi-omics integration in cancer research.
Ссылки и действия
Дополнительные ресурсы: