Авторы:
Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
#### Контекст
Большая часть человеческих белков остается недофармакологичными, и более 96% из них не используются в составе утвержденных лекарственных средств. Методики структурного виртуального скрининга предлагают повышенные возможности для расширения палитры лекарственных целей. Однако существующие подходы скрывают ограничения в атомарной точности и не учитывают фитнес-фактор биндинга, что существенно снижает их переносимость в терапевтическое применение.
В этой статье предлагается AuroBind — масштабируемая система виртуального скрининга, основанная на методах машинного обучения. Она построена на тонкой настройке пользовательской модели структурных подробностей для обработки данных в миллионном масштабе. Метод AuroBind интегрирует несколько ключевых компонентов, включая оптимизацию предпочтений, само-дистилляцию из высоконадежных комплексов и ускорение на основе стратегии ролей "учитель-ученик". Эти компоненты обеспечивают как точное предсказание структур лиганда, так и оценку их фитнеса.
#### Метод
AuroBind основывается на новом подходе к структурному моделированию, который включает в себя:
1. **Настройка на миллионном масштабе.** Модель обучается на больших наборах данных, что позволяет улучшить точность и объем данных для виртуального скрининга.
2. **Оптимизация предпочтений.** Используется само-дистилляция, чтобы улучшить точность предсказания структуры лиганда и фитнеса.
3. **Ускорение стратегией ролей.** Алгоритм использует роль "учителя-ученика" для эффективного обучения и ускорения процесса.
4. **Интеграция фитнес-фактора.** Модель предсказывает не только структуру, но и фитнес биндинга, что позволяет оценивать потенцию лекарственных средств.
Предлагаемая модель легко масштабируется и может обрабатывать ультрабольшие библиотеки лекарственных средств.
#### Результаты
AuroBind проверен на множестве биологических целей, включая орфанные GPCRы, такие как GPR151 и GPR160. Результаты показывают высокую точность:
- Лекарственные средства, выявленные AuroBind, показали высокую эффективность и достигли потенции от субнаномолярной до пикомолярной.
- На проспективных целях с диапазоном заболеваний, AuroBind достиг среднего успеха в 16-69% для выявления лекарственных средств.
- Для GPR160, модель продемонстрировала успех в 16-30% для выявления агонистов и антагонистов, с подтверждением функциональными испытаниями в моделях раков печени и простаты.
В противопоставлении с другими предложенными методами, AuroBind проявил значительную выгоду по скорости и точ
Annotation:
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optim...
ID: 2508.02137v1
cs.LG, cs.AI