AI for Scientific Discovery is a Social Problem

2509.06580v1 cs.LG, cs.CY 2025-09-10
Авторы:

Georgia Channing, Avijit Ghosh

Резюме на русском

## Контекст Искусственный интеллект (ИИ) представляет собой мощный инструмент, способный ускорить научные открытия и решать сложные проблемы в различных областях. Однако польза ИИ в науке остается неодинаково распределенной. Несмотря на технические вызовы, такие как нехватка данных, разрозненные стандарты и неравенство в доступе к вычислительным ресурсам, эти проблемы становятся вторичными по сравнению со своей социальной и институциональной стороной. Авторы статьи считают, что причиной неэффективности ИИ в науке является не только технический аспект, но и существующие социальные и институциональные практики. Они отмечают существующие проблемы, такие как распространение негативных мифов о необходимости использования "искусственного интеллекта" для преодоления трудностей, недооценка значимости работы по подготовке данных и инфраструктуры, несоответствие мотиваций между членами сообщества и между доменными экспертами и специалистами в области машинного обучения. Эти проблемы существенно ограничивают возможности ИИ в науке. ## Метод Для решения этих проблем, авторы предлагают рефреймить роль ИИ в научных открытиях, сконцентрировавшись на социальных и институциональных подходах. Они выделяют два ключевых направления: 1. **Создание сообщества** - Создавать пространство для дискуссии и сотрудничества между разными специалистами. Это может включать в себя создание рабочих групп, публикацию отчетов и поддержку раннего карьерного профессионала. 2. **Организация спирального процесса обучения** - Разработка кросс-дисциплинарных курсов, которые позволят экспертам в области науки и машинного обучения практически сотрудничать и обмениваться знаниями. Это позволит сделать инфраструктуру более доступной и эффективной. 3. **Создание стандартизированных бенчмарков** - Разработка совместных индикаторов производительности и оценки, чтобы установить единый стандарт для отчетов и прогнозирования. 4. **Создание доступной инфраструктуры** - Развитие доступных фреймворков и ресурсов, позволяющих всем участникам научных исследований равноправно принимать участие. ## Результаты Авторы рассматривают данные, полученные из различных источников, включая литературу, интервью с экспертами и анализ социальных тенденций. Они показывают, что данные, подготовленные с учетом социальных факторов, дают более точные результаты. Также они устанавливают, что создание открытого доступа к информации и совместному обучению может значительно повысить эффективность работы. Эти выводы основываются на представлении ИИ как социально

Abstract

Artificial intelligence promises to accelerate scientific discovery, yet its benefits remain unevenly distributed. While technical obstacles such as scarce data, fragmented standards, and unequal access to computation are significant, we argue that the primary barriers are social and institutional. Narratives that defer progress to speculative "AI scientists," the undervaluing of data and infrastructure contributions, misaligned incentives, and gaps between domain experts and machine learning researchers all constrain impact. We highlight four interconnected challenges: community dysfunction, research priorities misaligned with upstream needs, data fragmentation, and infrastructure inequities. We argue that their roots lie in cultural and organizational practices. Addressing them requires not only technical innovation but also intentional community-building, cross-disciplinary education, shared benchmarks, and accessible infrastructure. We call for reframing AI for science as a collective social project, where sustainable collaboration and equitable participation are treated as prerequisites for technical progress.

Ссылки и действия