Neural Proteomics Fields for Super-resolved Spatial Proteomics Prediction
2508.17389v1
q-bio.QM, cs.AI, cs.CV
2025-08-27
Авторы:
Bokai Zhao, Weiyang Shi, Hanqing Chao, Zijiang Yang, Yiyang Zhang, Ming Song, Tianzi Jiang
Резюме на русском
## Контекст
Спектральная протеомика является важной областью исследований, предоставляющей преобразующие знания в области жизненных наук, особенно в части изучения распределения белков в тканях. Однако существующие технологии, основанные на последовательном последовательном секвенировании, обладают низкой спектральной разрешающей способностью. Это приводит к ограниченной точности в определении расположения белков внутри ткани. Более того, выражение белков в различных тканях может значительно отличаться, что далее усложняет прогнозирование распределения белков с использованием существующих методов. Наша мотивация заключается в разработке модели, которая могла бы улучшить разрешающую способность существующих секвенирований-подобных методов и учесть индивидуальные особенности распределения белков в различных тканях.
## Метод
Мы предлагаем **Neural Proteomics Fields (NPF)**, первую модель глубокого обучения, призванную решать задачу супер-разрешения в последовательном секвенировании протеомики. Модель состоит из двух основных модулей: **Spatial Modeling Module** и **Morphology Modeling Module**. **Spatial Modeling Module** обучается на задаче изучения и предсказания свойств распределения белков внутри каждой отдельной ткани. **Morphology Modeling Module** извлекает специфичные для каждой ткани морфологические признаки, которые также включаются в процесс предсказания. Для каждой ткани разрабатывается отдельная модель, что позволяет учитывать индивидуальные особенности распределения белков в разной тканевой среде. Мы также определили новую задачу — **Pseudo-Visium SP** — и создали открытый бенчмарк для этой задачи, чтобы обеспечить тщательную оценку моделей.
## Результаты
Мы проводили эксперименты на нашем открытом датасете Pseudo-Visium SP, который позволил нам сравнить NPF с другими методами. Результаты показали, что NPF не только достигает лучшей точности в предсказании распределения белков, но и делает это с меньшим числом параметров для обучения. Это не только снижает нагрузку на вычислительные ресурсы, но и позволяет более эффективно использовать модель для различных типов тканей. Наши результаты подтверждают, что NPF — это подход, который может значительно улучшить текущие подходы к предсказанию распределения белков в тканях.
## Значимость
NPF имеет широкое применение в различных областях жизненных наук, включая биомедицинские исследований, разработку новых лекарств, а также исследования особенностей развития раковых тканей. Высокая точность и специфичность модели делают ее ценным инструментом для повышения точности прогнозов в спектральной протеомике. Благодаря своей способности работать с
Abstract
Spatial proteomics maps protein distributions in tissues, providing
transformative insights for life sciences. However, current sequencing-based
technologies suffer from low spatial resolution, and substantial inter-tissue
variability in protein expression further compromises the performance of
existing molecular data prediction methods. In this work, we introduce the
novel task of spatial super-resolution for sequencing-based spatial proteomics
(seq-SP) and, to the best of our knowledge, propose the first deep learning
model for this task--Neural Proteomics Fields (NPF). NPF formulates seq-SP as a
protein reconstruction problem in continuous space by training a dedicated
network for each tissue. The model comprises a Spatial Modeling Module, which
learns tissue-specific protein spatial distributions, and a Morphology Modeling
Module, which extracts tissue-specific morphological features. Furthermore, to
facilitate rigorous evaluation, we establish an open-source benchmark dataset,
Pseudo-Visium SP, for this task. Experimental results demonstrate that NPF
achieves state-of-the-art performance with fewer learnable parameters,
underscoring its potential for advancing spatial proteomics research. Our code
and dataset are publicly available at https://github.com/Bokai-Zhao/NPF.
Ссылки и действия
Дополнительные ресурсы: