Neural Proteomics Fields for Super-resolved Spatial Proteomics Prediction

2508.17389v1 q-bio.QM, cs.AI, cs.CV 2025-08-27
Авторы:

Bokai Zhao, Weiyang Shi, Hanqing Chao, Zijiang Yang, Yiyang Zhang, Ming Song, Tianzi Jiang

Резюме на русском

## Контекст Спектральная протеомика является важной областью исследований, предоставляющей преобразующие знания в области жизненных наук, особенно в части изучения распределения белков в тканях. Однако существующие технологии, основанные на последовательном последовательном секвенировании, обладают низкой спектральной разрешающей способностью. Это приводит к ограниченной точности в определении расположения белков внутри ткани. Более того, выражение белков в различных тканях может значительно отличаться, что далее усложняет прогнозирование распределения белков с использованием существующих методов. Наша мотивация заключается в разработке модели, которая могла бы улучшить разрешающую способность существующих секвенирований-подобных методов и учесть индивидуальные особенности распределения белков в различных тканях. ## Метод Мы предлагаем **Neural Proteomics Fields (NPF)**, первую модель глубокого обучения, призванную решать задачу супер-разрешения в последовательном секвенировании протеомики. Модель состоит из двух основных модулей: **Spatial Modeling Module** и **Morphology Modeling Module**. **Spatial Modeling Module** обучается на задаче изучения и предсказания свойств распределения белков внутри каждой отдельной ткани. **Morphology Modeling Module** извлекает специфичные для каждой ткани морфологические признаки, которые также включаются в процесс предсказания. Для каждой ткани разрабатывается отдельная модель, что позволяет учитывать индивидуальные особенности распределения белков в разной тканевой среде. Мы также определили новую задачу — **Pseudo-Visium SP** — и создали открытый бенчмарк для этой задачи, чтобы обеспечить тщательную оценку моделей. ## Результаты Мы проводили эксперименты на нашем открытом датасете Pseudo-Visium SP, который позволил нам сравнить NPF с другими методами. Результаты показали, что NPF не только достигает лучшей точности в предсказании распределения белков, но и делает это с меньшим числом параметров для обучения. Это не только снижает нагрузку на вычислительные ресурсы, но и позволяет более эффективно использовать модель для различных типов тканей. Наши результаты подтверждают, что NPF — это подход, который может значительно улучшить текущие подходы к предсказанию распределения белков в тканях. ## Значимость NPF имеет широкое применение в различных областях жизненных наук, включая биомедицинские исследований, разработку новых лекарств, а также исследования особенностей развития раковых тканей. Высокая точность и специфичность модели делают ее ценным инструментом для повышения точности прогнозов в спектральной протеомике. Благодаря своей способности работать с

Abstract

Spatial proteomics maps protein distributions in tissues, providing transformative insights for life sciences. However, current sequencing-based technologies suffer from low spatial resolution, and substantial inter-tissue variability in protein expression further compromises the performance of existing molecular data prediction methods. In this work, we introduce the novel task of spatial super-resolution for sequencing-based spatial proteomics (seq-SP) and, to the best of our knowledge, propose the first deep learning model for this task--Neural Proteomics Fields (NPF). NPF formulates seq-SP as a protein reconstruction problem in continuous space by training a dedicated network for each tissue. The model comprises a Spatial Modeling Module, which learns tissue-specific protein spatial distributions, and a Morphology Modeling Module, which extracts tissue-specific morphological features. Furthermore, to facilitate rigorous evaluation, we establish an open-source benchmark dataset, Pseudo-Visium SP, for this task. Experimental results demonstrate that NPF achieves state-of-the-art performance with fewer learnable parameters, underscoring its potential for advancing spatial proteomics research. Our code and dataset are publicly available at https://github.com/Bokai-Zhao/NPF.

Ссылки и действия