## Контекст
Кристаллические материалы широко используются в различных областях, включая электронику, оптику, биомедицину и энергоснабжение. Однако нахождение новых кристаллических материалов для этих приложений требует значительных затрат на время и ресурсы. Традиционные методы исследований, такие как симуляции и эксперименты, требуют многократного повторения тестов, что увеличивает затраты. Большая часть работы выполняется вручную, что ограничивает скорость и эффективность открытия новых материалов.
В этой ситуации искусственные нейронные сети, особенно широкомасштабные модели языкового моделирования (LLMs), формируются как мощные инструменты для ускорения процесса открытия материалов. Они могут обрабатывать огромные объемы данных, включая литературу и базы данных, для точечного поиска возможных кандидатов на материалы и выявления новых структур. Наряду с ними, технологии генерируемого восстановления (Retrieval-Augmented Generation, RAG) объединяют МЛМ с доменной информацией, позволяя выполнять более точные и контекстуальные поиски. Целью данного исследования является изучение использования LLMs и RAG в области кристаллической материаловедения, а также определение их потенциала для ускорения процесса открытия материалов.
## Метод
Для изучения возможностей LLMs и RAG в кристаллической материаловедении выбрана систематическая методология. Было проведено поисковое исследование по всему миру в базах данных и литературе с использованием ключевых слов, таких как "Large Language Models", "Retrieval-Augmented Generation", "Crystalline Material Discovery", "Materials Science", "Artificial Intelligence in Material Science". Было проанализировано множество работ, включая теоретические работы, экспериментальные исследования и системы, которые использовали МЛМ и RAG для решения проблем кристаллического материаловедения.
Был изучен поток работы, включая сбор данных, обучение моделей, интеграцию доменной информации, а также оценку результатов. Была рассмотрена широкая палитра задач, включая кристаллическую структуру, дефекты, открытие материалов, майнинг литературных источников и интеграцию баз данных. Еще одним ключом к изучению было исследование возможностей и ограничений технологий LLM и RAG, а также их сочетания с источниками внешнего знания для повышения эффективности.
## Результаты
Исследование выявило несколько направлений, в которых LLMs и RAG достигли удачного результата. Например, в области кристаллической структуры, LLMs показали способность предсказать и анализировать структуры кристаллов, а также выявлять потенциальные дефекты. В области дефектов, LLMs могут определять и прогноз