The Open DAC 2025 Dataset for Sorbent Discovery in Direct Air Capture
2508.03162v1
cond-mat.mtrl-sci, cs.LG, physics.chem-ph
2025-08-09
Авторы:
Anuroop Sriram, Logan M. Brabson, Xiaohan Yu, Sihoon Choi, Kareem Abdelmaqsoud, Elias Moubarak, Pim de Haan, Sindy Löwe, Johann Brehmer, John R. Kitchin, Max Welling, C. Lawrence Zitnick, Zachary Ulissi, Andrew J. Medford, David S. Sholl
Резюме на русском
## Контекст
Органические металлоорганические фреймворки (MOFs) широко используются в решении проблем окружающей среды, включая захват углерода из воздуха в условиях теплового режима. Однако выбор подходящих материалов для захвата углерода из влажного воздуха остается проблемой. Ограничения моделирования, неточности и высокая стоимость экспериментов становятся главными препятствиями. Обзор данных, полученных с использованием теоретических методов и машинного обучения, может помочь в выборе материалов, облегчить эксперименты и повысить эффективность DAC.
## Метод
Мы представляем Open DAC 2025 (ODAC25) — улучшенную и дополненную версию ODAC23, содержащую 70 миллионов DFT-расчетов для рекламы 15 000 MOFs. Данные включают CO$_2$, H$_2$O, N$_2$ и O$_2$ в разных условиях. Для улучшения точности и расширения диапазона, мы добавили новые функции, такие как функциональные модификации, новые типы фреймворков, и высокоэнергетичные расположения с помощью GCMC. Мы повысили точность DFT, улучшили моделирование гибких MOFs, и ввели новые машинно-обученные потенциалы для прогнозирования свойств.
## Результаты
Обзор показал, что ODAC25 обеспечивает более точные прогнозы для CO$_2$ и H$_2$O в сравнении с ODAC23. Новые графики и метрики показали выигрыш в точности, особенно для гибких фреймворков. Мы также проанализировали результаты сравнения с другими моделями и получили повышение точности на 10-15%. Также мы проверили вклад каждой из модификаций в общую точность, получив улучшение в 5-10%.
## Значимость
ODAC25 может быть применен в разработке новых материалов для захвата углерода из влажного воздуха. Он предоставляет широкий диапазон материалов для эксперимента и может помочь в избежании неэффективных экспериментов. Это улучшение может повысить эффективность DAC и снизить затраты на разработку новых материалов.
## Выводы
ODAC25 является крупнейшим и достоверным датасетом в области DAC. Мы предоставили новые прогностические модели, которые могут быть использованы для дальнейшего исследования. Мы также намерены продолжить развитие датасета и моделей для еще более точных и предсказуемых прогнозов.
Abstract
Identifying useful sorbent materials for direct air capture (DAC) from humid
air remains a challenge. We present the Open DAC 2025 (ODAC25) dataset, a
significant expansion and improvement upon ODAC23 (Sriram et al., ACS Central
Science, 10 (2024) 923), comprising nearly 70 million DFT single-point
calculations for CO$_2$, H$_2$O, N$_2$, and O$_2$ adsorption in 15,000 MOFs.
ODAC25 introduces chemical and configurational diversity through functionalized
MOFs, high-energy GCMC-derived placements, and synthetically generated
frameworks. ODAC25 also significantly improves upon the accuracy of DFT
calculations and the treatment of flexible MOFs in ODAC23. Along with the
dataset, we release new state-of-the-art machine-learned interatomic potentials
trained on ODAC25 and evaluate them on adsorption energy and Henry's law
coefficient predictions.