📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 The Future of Artificial Intelligence and the Mathematical and Physical Sciences (AI+MPS)

2025-09-05

Авторы:

Andrew Ferguson, Marisa LaFleur, Lars Ruthotto, Jesse Thaler, Yuan-Sen Ting, Pratyush Tiwary, Soledad Villar, E. Paulo Alves, Jeremy Avigad, Simon Billinge, Camille Bilodeau, Keith Brown, Emmanuel Candes, Arghya Chattopadhyay, Bingqing Cheng, Jonathan Clausen, Connor Coley, Andrew Connolly, Fred Daum, Sijia Dong, Chrisy Xiyu Du, Cora Dvorkin, Cristiano Fanelli, Eric B. Ford, Luis Manuel Frutos, Nicolás García Trillos, Cecilia Garraffo, Robert Ghrist, Rafael Gomez-Bombarelli, Gianluca Guadagni, Sreelekha Guggilam, Sergei Gukov, Juan B. Gutiérrez, Salman Habib, Johannes Hachmann, Boris Hanin, Philip Harris, Murray Holland, Elizabeth Holm, Hsin-Yuan Huang, Shih-Chieh Hsu, Nick Jackson, Olexandr Isayev, Heng Ji, Aggelos Katsaggelos, Jeremy Kepner, Yannis Kevrekidis, Michelle Kuchera, J. Nathan Kutz, Branislava Lalic, Ann Lee, Matt LeBlanc, Josiah Lim, Rebecca Lindsey, Yongmin Liu, Peter Y. Lu, Sudhir Malik, Vuk Mandic, Vidya Manian, Emeka P. Mazi, Pankaj Mehta, Peter Melchior, Brice Ménard, Jennifer Ngadiuba, Stella Offner, Elsa Olivetti, Shyue Ping Ong, Christopher Rackauckas, Philippe Rigollet, Chad Risko, Philip Romero, Grant Rotskoff, Brett Savoie, Uros Seljak, David Shih, Gary Shiu, Dima Shlyakhtenko, Eva Silverstein, Taylor Sparks, Thomas Strohmer, Christopher Stubbs, Stephen Thomas, Suriyanarayanan Vaikuntanathan, Rene Vidal, Francisco Villaescusa-Navarro, Gregory Voth, Benjamin Wandelt, Rachel Ward, Melanie Weber, Risa Wechsler, Stephen Whitelam, Olaf Wiest, Mike Williams, Zhuoran Yang, Yaroslava G. Yingling, Bin Yu, Shuwen Yue, Ann Zabludoff, Huimin Zhao, Tong Zhang

## Контекст Исследование области взаимодействия между искусственным интеллектом (AI) и математическими, физическими и прикладными науками (MPS) приобретает огромное значение в современном научном мире. Области MPS, включающие астрономию, химию, исследования материалов, математические науки и физику, тесно связаны с развитием и применением AI. Однако существуют проблемы, связанные с недостаточным интегрированным подходом к использованию AI в этих областях. Например, в химии и материалознании часто применяются традиционные методы, недостаточно эффективные для обработки больших данных. Физика, в свою очередь, сталкивается с проблемами в моделировании сложных систем. Эти проблемы могут быть решены с помощью AI, но требуются стратегические инновации в области обучения, стандартизации и организации научных исследований. Таким образом, целью данной работы является изложение перспектив использования AI в MPS и предложение стратегий для укрепления данного взаимодействива. ## Метод Для изучения взаимодействия AI и MPS разработана многоуровневая методология. Во-первых, проведен анализ нынешних тенденций и проблем в каждой из MPS-областей, используя литературные источники и доклады участников. Во-вторых, разработаны рекомендации по интеграции AI в эти области, включая разработку машинного обучения, глубокого обучения и автоматического построения моделей. В-третьих, предложены стратегии для создания интерактивных платформ, позволяющих ученым из разных областей обмениваться опытом и результатами. Наконец, был проведен обзор существующих ресурсов, включая симуляторы, инструменты для машинного обучения и базы данных, чтобы определить их потенциал для MPS. ## Результаты Исследования показали, что AI может значительно улучшить процессы в MPS. Например, в астрономии AI использован для анализа больших наборов данных из радаров и телескопов, что привело к более точной моделированию космических объектов. В химии AI применяется для моделирования композиции материалов и прогнозирования их свойств. В области физики AI позволил моделировать сложные системы, например, квантовые системы. Однако недостаточная интеграция и нехватка специалистов в области AI в MPS являются основными проблемами. Результаты также показали, что существуют узколинейные технологии, которые могут быть оптимизированы с помощью AI, включая моделирование, симуляцию и оптимизацию. ## Значимость Полученные результаты могут быть применены в различных областях, включая астрономию, химию, физику и материалознание. AI может повысить точность моделей, ускори

Annotation:

This community paper developed out of the NSF Workshop on the Future of Artificial Intelligence (AI) and the Mathematical and Physics Sciences (MPS), which was held in March 2025 with the goal of understanding how the MPS domains (Astronomy, Chemistry, Materials Research, Mathematical Sciences, and Physics) can best capitalize on, and contribute to, the future of AI. We present here a summary and snapshot of the MPS community's perspective, as of Spring/Summer 2025, in a rapidly developing field...

ID: 2509.02661v1 cs.AI, astro-ph.IM, cond-mat.mtrl-sci, cs.LG, physics.data-an

arXiv PDF

📄 Short-Term Forecasting of Energy Production and Consumption Using Extreme Learning Machine: A Comprehensive MIMO based ELM Approach

2025-08-20

Авторы:

Cyril Voyant, Milan Despotovic, Luis Garcia-Gutierrez, Mohammed Asloune, Yves-Marie Saint-Drenan, Jean-Laurent Duchaud, hjuvan Antone Faggianelli, Elena Magliaro

## Контекст В последние десятилетия широко распространены исследования по моделированию и прогнозированию энергопотребления и производства в рамках систем, основанных на возобновляемых источниках энергии. Это связано с необходимостью повысить точность прогнозов для оптимизации эксплуатации сетей и снижения затрат. Существуют сложности, связанные с нестационарностью и сезонным характером потребления и производства энергии, которые требуется адресовать с помощью надежных и эффективных методов прогнозирования. ## Метод Методология, предложенная в данной работе, основывается на использовании Extreme Learning Machine ($\mathtt{ELM}$) в качестве главного инструмента прогнозирования. Реализуется многовозбужденная архитектура с входами и выходами ($\mathtt{MIMO}$) для моделирования связей между различными источниками энергии (солнечная, ветряная, водная, тепловая, биоэнергетика и импортированная электричность). Для компенсации нестационарности используются скользящие окна и циклическая временная экспоненциальная кодировка. Моделирование включает в себя не только прогнозирование отдельных источников, но и общего энергопотребления, что дает более полное представление о системе. ## Результаты Используя данные из Corsica за шесть лет, проведено сравнение прогнозов с помощью $\mathtt{ELM}$ и персистентного метода. Для прогноза на один час вперед показатели $\mathtt{nRMSE}$ составили $17.9\%$ для солнечной энергии и $5.1\%$ для тепловой, при $\mathtt{R^2} > 0.98$. Аналогичные хорошие результаты сохраняются на протяжении первых пяти часов. Однако после этого, в связи с отклонениями возобновляемых источников, стабильность прогноза снижается. Архитектура $\mathtt{MIMO}$ демонстрирует лишь незначительные преимущества по сравнению с $\mathtt{SISO}$, но показывает выигрыш в производительности по сравнению с глубокой нейронной сетью $\mathtt{LSTM}$ и другими подобными методами. ## Значимость Предложенный подход может использоваться в различных ситуациях, включая оптимизацию работы сетей энергопроизводства, снижение издержек и повышение эффективности. Он привлекателен благодаря низкой вычислительной нагрузке и может быть применен в режиме реального времени, включая возможность онлайн-обучения и адаптации к локальным условиям. Это открывает возможности для реализации в различных местах и сетях, от корсики до других регионов. ## Выводы Предложенный метод $\mathtt{ELM}$ с архитектурой $\mathtt{MIMO}$ дает высокую точность прогноза энергопотребления и производства на короткие сроки, особенно для солнечной и тепловой энергии. Он важен для оптимизации энергетических систем

Annotation:

A novel methodology for short-term energy forecasting using an Extreme Learning Machine ($\mathtt{ELM}$) is proposed. Using six years of hourly data collected in Corsica (France) from multiple energy sources (solar, wind, hydro, thermal, bioenergy, and imported electricity), our approach predicts both individual energy outputs and total production (\cyr{including imports, which closely follow energy demand, modulo losses)} through a Multi-Input Multi-Output ($\mathtt{MIMO}$) architecture. To add...

ID: 2508.12764v1 cs.LG, physics.data-an

arXiv PDF

📄 Approximating the universal thermal climate index using sparse regression with orthogonal polynomials

2025-08-19

Авторы:

Sabin Roman, Gregor Skok, Ljupco Todorovski, Saso Dzeroski

## Контекст Регулирование температурного удобства человека в различных условиях климата является ключевым аспектом улучшения здоровья и качества жизни в мегаполисах. Одним из важных инструментов для оценки температурного удобства является Universal Thermal Climate Index (UTCI), который интегрирует несколько атмосферных переменных, таких как температура, влажность, ветер и солнечное излучение. Однако UTCI характеризуется сложной нелинейной структурой, что создает трудности для его эффективного моделирования и анализа. Исследователи сталкиваются с проблемами связанными с необходимостью понимания индивидуальных вкладов каждой переменной в общий индекс, а также с необходимостью использовать простые и наглядные аппараты моделирования. Наша мотивация заключается в создании модели, которая бы осуществляла точную интерпретируемую аппроксимацию UTCI, основываясь на минимальном объеме данных и требуя минимальных вычислительных ресурсов. ## Метод Мы применяем подходы символьного и спарсе регрессии, основанные на ортогональных полиномах, для аппроксимации UTCI. Особое внимание уделяется использованию ортогональных полиномов Легендра, которые обеспечивают более стабильную и эффективную построение моделей. Модели задаются в виде разложения в спарсе полиномиальные базисы, что дает возможность эффективно воспроизводить инварианты UTCI в различных условиях окружающей среды. Мы используем символьные регрессии для выявления взаимосвязей между переменными исходных данных и UTCI. Для повышения точности и уменьшения модельной сложности, мы применяем методы спарсинга, которые позволяют удалять ненужные компоненты из модели. ## Результаты Мы провели эксперименты на данных, собранных в различных географических регионах. Наши модели показали значительно нижую ошибку в прогнозировании UTCI по сравнению с широко применяемыми полиномиальными моделями. Например, наша модель подходит к теоретическому оптимуму в L2-метрике (по квадрату отклонений), в то время как полиномиальная модель шестой степени, использующая одинаковое количество параметров, дает существенно более высокую ошибку. Мы также проверили устойчивость моделей к отложенной выборке и показали, что они успешно работают даже при использовании лишь 20% данных для тренировки. Мы также отметили, что наши модели эффективно интерпретируются, поскольку каждый слагаемый в разложении имеет явную физическую интерпретацию. ## Значимость Предложенные модели имеют широкие перспективы в приложениях, связанных с моделированием климата и окружающей среды. Они могут применяться для моделирования температ

Annotation:

This article explores novel data-driven modeling approaches for analyzing and approximating the Universal Thermal Climate Index (UTCI), a physiologically-based metric integrating multiple atmospheric variables to assess thermal comfort. Given the nonlinear, multivariate structure of UTCI, we investigate symbolic and sparse regression techniques as tools for interpretable and efficient function approximation. In particular, we highlight the benefits of using orthogonal polynomial bases-such as Le...

ID: 2508.11307v1 physics.ao-ph, cs.LG, physics.data-an

arXiv PDF

📄 Benchmarking Self-Driving Labs

2025-08-13

Авторы:

Adedire D. Adesiji, Jiashuo Wang, Cheng-Shu Kuo, Keith A. Brown

## Контекст Современные материаловедческие исследования стремятся к ускорению процесса открытия новых материалов. Одним из вариантов решения этой задачи являются self-driving labs (SDL) — системы, которые применяют машинное обучение для выбора экспериментов и автоматизации их проведения. Такие системы позволяют осуществлять эксперименты быстрее, надежнее, интеллектуальнее и с более полной метаданной, чем при использовании традиционных методов. Однако, существуют недостатки в понимании того, насколько эффективны SDL в ускорении понимания материалов. Эта статья предлагает обзор современного понимания эффективности SDL, основываясь на показателях, таких как Acceleration Factor (AF) и Enhancement Factor (EF), которые помогают оценить, на сколько SDL ускоряют процесс открытия материалов в сравнении с другими стратегиями. ## Метод SDL основываются на комбинации машинного обучения и автоматизированных технологий. Методы оценки эффективности SDL основываются на двух основных метриках: Acceleration Factor (AF) и Enhancement Factor (EF). AF определяет, на сколько быстрее SDL выполняют эксперименты в сравнении с другими методами, а EF показывает, на сколько эффективнее система получает желаемые результаты. Эти метрики позволяют графически отобразить отношение SDL к традиционным методам. Моделирование экспериментов, выполняемых SDL, позволяет понять, как эти метрики зависят от сложности и статистических свойств пространства параметров. ## Результаты Из статистических данных опубликованных работ выясняется, что средний AF около 6, что указывает на значительное ускорение. Однако, значения AF могут отличаться в зависимости от сложности пространства параметров. Методы оценки EF показывают, что он варьируется в пределах широкого диапазона, но среднее значение составляет 10-20 экспериментов на одну измерительную размерность. Этот результат подтверждает, что SDL эффективны в широком диапазоне ситуаций, особенно когда пространство параметров имеет высокую размерность. ## Значимость SDL могут применяться в различных областях, где требуется ускорение и улучшение процессов открытия материалов. Основные преимущества SDL заключаются в быстродействии, надежности и точности в выполнении экспериментов, а также в получении богатых метаданных. Эти преимущества могут привести к быстрому прогрессу в материаловедческих исследованиях и к перелому в технологиях, где высокая скорость откровений и их качество играют ключевую роль. ## Выводы SDL демонстрируют сильное потенциальное влияние на ускорение открытия материалов. Однако, их эффективность зависит от свойств пространства параметров и

Annotation:

A key goal of modern materials science is accelerating the pace of materials discovery. Self-driving labs, or systems that select experiments using machine learning and then execute them using automation, are designed to fulfil this promise by performing experiments faster, more intelligently, more reliably, and with richer metadata than conventional means. This review summarizes progress in understanding the degree to which SDLs accelerate learning by quantifying how much they reduce the number...

ID: 2508.06642v1 physics.comp-ph, cond-mat.mtrl-sci, cs.LG, physics.data-an

arXiv PDF

📄 Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures

2025-08-13

Авторы:

Fotis I. Giasemis

## Контекст Область работы связана с проблемами обработки и анализа неструктурированных данных в рамках партикл-физики. Эта область требует высокой точности для проверки текущих моделей субатомного мира. Благодаря планамумуградуации детекторов коллайдирующихся лучей в мировых центрах, таких как Ларже Хадрон Коллайдер (LHC), производство данных выросло в разы. Это приводит к увеличению требований к вычислительным ресурсам. Ученые и инженеры должны оптимизировать процессы фильтрации и реального времени, чтобы обрабатывать большие объемы данных с помощью машинного обучения (ML), а также эффективно использовать архитектуры процессоров, включая графические процессоры (GPU) и поляризованные логические массивы (FPGA). ## Метод Методология работы основывается на разработке и оптимизации ML-процессов для ускоренных архитектур. Отдельное внимание уделено графовым нейронным сетям (GNN) и их применению в реактивной отслеживаемости частиц в LHCb. Архитектура включает GPU в качестве основного вычислительного ресурса и FPGA в качестве дополнительного ускорителя. Эта конфигурация используется для реализации конечного цепочки анализа данных, ориентированной на реальное время. Его эффективность измеряется по критериям пропускной способности и энергопотребления. ## Результаты Эксперименты проводились на данных, собираемых в LHC. Модель GNN прошла реактивное отслеживание частиц в реальном времени на GPU, показав высокую точность и скорость. Результаты были сравнены с классическими алгоритмами, используемыми в LHCb. Далее, модель была ускорена на FPGA, показывая точность и энергоэффективность, которые близки к результатам GPU. Результаты подтверждают, что GNN может эффективно использоваться для реактивного отслеживания в первом уровне триггера LHCb. ## Значимость Результаты демонстрируют перспективу использования ML в партикл-физике, особенно для решения задач в реальном времени. Это может повысить точность и уменьшить энергопотребление, что важно для сложных систем, таких как LHC. Направления для будущих исследований включают улучшение моделей GNN и их интеграцию с новыми архитектурами ускорителей для достижения еще высокой эффективности. ## Выводы Разработанная GNN-процедура показала высокую эффективность в реактивном отслеживании частиц в реальном времени, когда применяется в LHCb. Это достигнуто благодаря оптимизации методологии и эффективному использованию GPU и FPGA. Будущие исследования будут фокусироваться на улучшении моделей и их интеграции с развивающимися технологиями архите

Annotation:

As the particle physics community needs higher and higher precisions in order to test our current model of the subatomic world, larger and larger datasets are necessary. With upgrades scheduled for the detectors of colliding-beam experiments around the world, and specifically at the Large Hadron Collider at CERN, more collisions and more complex interactions are expected. This directly implies an increase in data produced and consequently in the computational resources needed to process them. At...

ID: 2508.07423v1 hep-ex, cs.AI, cs.DC, cs.LG, physics.data-an

arXiv PDF

📄 A Graph Neural Network Approach for Mapping the Conceptual Structure and Inter-Branch Connectivity of Physics

2025-08-12

Авторы:

Massimiliano Romiti

## Контекст Физика, как широкая и сложная область науки, часто требует объединения различных подходов для понимания и анализа физических законов и принципов. Одной из проблем является необходимость структурирования и анализа пространства физических законов, чтобы обнаружить связи, аналогии и центральные взаимосвязи между различными физическими подсистемами. Существуют методы, такие как классические графы и графовые модели, однако они часто имеют ограниченную способность адаптироваться к сложным структурам и недостаточно эффективно отображают взаимосвязи в физике. Это привело к поиску новых, более точных и гибких подходов к рассмотрению физических законов. ## Метод Для решения этой проблемы был разработан новый фреймворк, основанный на графе, который представляет физические законы в виде значимости весовых связей между физическими уравнениями. База данных была создана на основе 659 уравнений, которые были подвергнуты тщательной очистке семантических данных для устранения несоответствий и неоднозначностей. В результате было получено 400 уравнений, которые были представлены в виде графа, где каждое уравнение является узлом, а связи между уравнениями определяются весами, определяемыми метриками, такими как пересечение переменных, библиографические данные и физически обоснованные оценки. Для обучения и анализа использовался граф-сеть с вниманием (Graph Attention Network, GAT), который был обучен для прогнозирования связей между уравнениями. ## Результаты После обучения модели был выполнен ряд экспериментов, включая сравнение с другими методами, такими как GraphSAGE и классические графовые алгоритмы. Модель GAT показала самые высокие результаты на тестовых данных, достигнув AUC 0.9742 ± 0.0018, что значительно выше результатов других методов (например, GraphSAGE достиг AUC 0.9504, p = 0.029). Эксперименты также показали, что модель способна естественно восстановить известные структуры физики, такие как связь между электромагнетизмом и статистической механикой. Более того, модель обнаружила центральные узлы, которые являются ключевыми связями между различными физическими областями, и сгенерировала множество новых гипотез о взаимосвязях между различными физическими подсистемами. ## Значимость Разработанная модель имеет большое значение в области представления и анализа физических законов. Она может быть применена в различных областях, таких как образование, исследования, научная коммуникация и разработка новых теорий. Наиболее применима для определения взаимосвязей ме

Annotation:

This work introduces a novel framework for representing and analyzing physical laws as a weighted knowledge graph. We constructed a database of 659 distinct physical equations, subjected to rigorous semantic cleaning to resolve notational ambiguities, resulting in a corpus of 400 advanced physics equations. We developed an enhanced graph representation where both physical concepts and equations are nodes, connected by weighted inter-equation bridges. These weights are objectively defined using n...

ID: 2508.05724v1 cs.LG, physics.data-an, 68T07, 81-08, 05C90, I.2.6; G.2.2; I.5.1

arXiv PDF

📄 Supervised Machine Learning Methods with Uncertainty Quantification for Exoplanet Atmospheric Retrievals from Transmission Spectroscopy

2025-08-09

Авторы:

Roy T. Forestano, Konstantin T. Matchev, Katia Matcheva, Eyup B. Unlu

**Резюме** Поиск и изучение экзопланет становится возможным благодаря развитию технологий, таких как JWST, которые позволяют анализировать транзитные спектры экзопланет. Однако стандартные байесовские методы для восстановления параметров экзопланетных атмосфер требуют больших вычислительных ресурсов. В статье предлагается исследовать возможность замены этих методов машинным обучением, которое обеспечивает эффективность без потери точности. Авторы проанализировали различные методы регрессии машинного обучения, включая PLS, SVM, KNN, DT, RF, VOTE, STACK и XGB, и оценили их точность, прецизию и скорость на реальных данных. Также исследовались различные методы предобработки данных и их влияние на модели. Наконец, авторы провели студию случая на примере WASP-39b, подтвердив высокую эффективность выбранной модели. Эти результаты открывают путь к более быстрому и точному восстановлению параметров экзопланетных атмосфер с меньшими вычислительными затратами.

Annotation:

Standard Bayesian retrievals for exoplanet atmospheric parameters from transmission spectroscopy, while well understood and widely used, are generally computationally expensive. In the era of the JWST and other upcoming observatories, machine learning approaches have emerged as viable alternatives that are both efficient and robust. In this paper we present a systematic study of several existing machine learning regression techniques and compare their performance for retrieving exoplanet atmosph...

ID: 2508.04982v1 astro-ph.EP, astro-ph.IM, cs.LG, physics.data-an

arXiv PDF

Показано 21 - 27 из 27 записей