LARC: Towards Human-level Constrained Retrosynthesis Planning through an Agentic Framework

2508.11860v1 cs.AI, cs.CL 2025-08-19
Авторы:

Frazier N. Baker, Daniel Adu-Ampratwum, Reza Averly, Botao Yu, Huan Sun, Xia Ning

Резюме на русском

## Контекст Область химических исследований часто сталкивается с задачей определения синтезных путей для получения целевых молекул из доступных начальных реагентов. Эта задача, известная как констрейнтед ретросинтез, является важной, но сложной. Она требует учета практических ограничений, таких как доступность реагентов и безопасность процессов. Несмотря на развитие технологий, в том числе в области машинного обучения, создание эффективных систем, которые могут успешно справляться с такими задачами, остается нерешенной проблемой. Исследователи сталкиваются с ограничениями в точности и скорости, связанными с традиционными подходами. Было предложено использовать large language models (LLM) для улучшения эффективности и точности таких задач, но их полное воздействие в этой области до сих пор не было раскрыто. ## Метод LARC (Large Language Model Agentic Framework for Retrosynthesis Planning under Constraints) представляет собой инновационную методологию, которая комбинирует мощь боLarger Language Models (LLMs) с агентным подходом для надёжного выполнения задач констрейнтед ретросинтеза. Основной идеей является использование LLM в качестве основного распознавателя шаблонов ретросинтеза, а также Agent-as-a-Judge для оценки соответствия каждого шага реакции заданым ограничениям. Этот подход включает в себя не только определение шагов синтеза, но также и контроль полученных результатов в соответствии с практическими потребностями. LARC использует оркестрованные инструменты для осуществления оптимальных решений, а обучение проводится на ограниченных, но представительных, данных, чтобы обеспечить его эффективность в реальных условиях. ## Результаты Задачи ретросинтеза были протестированы на высококачественной выборке, содержащей 48 задач различных ограничений. LARC показал успешность 72.9%, что существенно превосходит лучшие LLM-базированные базовые модели. Это результат приближается к уровню экспертов-химиков, но выполняется в меньшем времени. Лабораторные эксперименты показали, что LARC не только повышает точность, но и уменьшает время работы над задачами. Этот подход также доказал свою эффективность в различных условиях, таких как различные типы ограничений и типы реакций. ## Значимость Результаты LARC открывают новые возможности в химических исследованиях. Он может применяться в предметных областях, где требуется высокая точность и быстрота решений в условиях строгих ограничений, таких как разработка новых лекарств, экологически безопасные процессы и улучшение производственных процессов. Преимущества LARC заключаются в своей доступности, точности и скорости, что делает его подходящим для использования в современных лаборатори

Abstract

Large language model (LLM) agent evaluators leverage specialized tools to ground the rational decision-making of LLMs, making them well-suited to aid in scientific discoveries, such as constrained retrosynthesis planning. Constrained retrosynthesis planning is an essential, yet challenging, process within chemistry for identifying synthetic routes from commercially available starting materials to desired target molecules, subject to practical constraints. Here, we present LARC, the first LLM-based Agentic framework for Retrosynthesis planning under Constraints. LARC incorporates agentic constraint evaluation, through an Agent-as-a-Judge, directly into the retrosynthesis planning process, using agentic feedback grounded in tool-based reasoning to guide and constrain route generation. We rigorously evaluate LARC on a carefully curated set of 48 constrained retrosynthesis planning tasks across 3 constraint types. LARC achieves a 72.9% success rate on these tasks, vastly outperforming LLM baselines and approaching human expert-level success in substantially less time. The LARC framework is extensible, and serves as a first step towards an effective agentic tool or a co-scientist to human experts for constrained retrosynthesis.

Ссылки и действия