Deep Learning-Driven Peptide Classification in Biological Nanopores
2509.14029v1
cs.LG, eess.SP, physics.comp-ph, q-bio.BM
2025-09-19
Авторы:
Samuel Tovey, Julian Hoßbach, Sandro Kuppel, Tobias Ensslen, Jan C. Behrends, Christian Holm
Резюме на русском
## Контекст
Определение химической структуры белков и пептидов является ключевым элементом в диагностике и лечении многих заболеваний. Несмотря на то, что существуют традиционные методы, такие как масс-спектрометрия, они часто требуют дорогостоящих оборудований и продолжительного времени для получения результатов. Более того, эти методы трудно осуществить в реальном времени во внешней среде. Было предложено использовать микронные и наноскопические поры для динамического мониторинга структуры и функции белков и пептидов. Нанопоры могут обнаруживать электрические сигналы, которые изменяются при взаимодействии белков или пептидов с полостью поры. Однако интерпретация этих сигналов остается сложной. Наша мотивация заключается в использовании глубоких нейронных сетей для решения этой проблемы, превратив электрические сигналы в изображения, которые легко анализируются с помощью машинного обучения.
## Метод
Для решения проблемы классификации пептидов мы преобразовали электрические сигналы, полученные при прохождении пептидов через нанопоры, в изображения (scaleograms) с помощью техники wavelet transform. Этот преобразование позволяет хранить в изображении важные сведения о частотах, амплитудах и временных отсчетах сигнала. Мы применяем глубокую нейронную сеть для классификации изображений, которая может обучаться идентифицировать химическую структуру пептидов. Основная техническая архитектура включает в себя несколько слоёв свёрточных нейронов, предназначенных для извлечения признаков из изображений, а также полносвязные слои для классификации. Мы также разработали методы модели-трансфера, чтобы гарантировать эффективную работу модели на реальном оборудовании.
## Результаты
Мы тестировали нашу модель на 42 различных пептидах. Модель показала высокую точность классификации, достигший примерно 81%. Это значительно превосходит уровень точности предыдущих методов. Мы также проверяли модель на новых данных, доказав хорошую работу вне тренировочного набора. Наши результаты установили новый стандарт в области классификации пептидов с помощью нанопор. Кроме того, мы продемонстрировали на практике, как модель может быть перенесена на реальное оборудование, что обеспечивает возможность её применения в реальных условиях.
## Значимость
Предложенная модель имеет большое значение для реального времени диагностики заболеваний. Она может быть использована для быстрого и дешёвого анализа белков и пептидов вне лаборатории, например, в клинических условиях. Это открывает новую перспективу для нейронаучных приложений в м
Abstract
A device capable of performing real time classification of proteins in a
clinical setting would allow for inexpensive and rapid disease diagnosis. One
such candidate for this technology are nanopore devices. These devices work by
measuring a current signal that arises when a protein or peptide enters a
nanometer-length-scale pore. Should this current be uniquely related to the
structure of the peptide and its interactions with the pore, the signals can be
used to perform identification. While such a method would allow for real time
identification of peptides and proteins in a clinical setting, to date, the
complexities of these signals limit their accuracy. In this work, we tackle the
issue of classification by converting the current signals into scaleogram
images via wavelet transforms, capturing amplitude, frequency, and time
information in a modality well-suited to machine learning algorithms. When
tested on 42 peptides, our method achieved a classification accuracy of
~$81\,\%$, setting a new state-of-the-art in the field and taking a step toward
practical peptide/protein diagnostics at the point of care. In addition, we
demonstrate model transfer techniques that will be critical when deploying
these models into real hardware, paving the way to a new method for real-time
disease diagnosis.