Spacer: Towards Engineered Scientific Inspiration
2508.17661v1
cs.AI, cs.LG, cs.NE
2025-08-27
Авторы:
Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, Geonho Nah, Donghyun Koh, Youngjun Cho, Johyun Park, Hojin Yoo, Jiho Park, Haneul Choi, Sungbin Moon, Taehoon Hwang, Seungwon Kim, Jaeyeong Kim, Seongjun Kim, Juneau Jung
Резюме на русском
## Контекст
Настоящие предложения основываются на научной статье с названием "Spacer: Towards Engineered Scientific Inspiration", которая адресует сложные задачи, связанные со системами учебного искусственного интеллекта, а также требованиями к инновационности и творчеству в научных исследованиях. На данный момент, существующие системы, основанные на широко известных л LLM (Large Language Models), либо ограничены в своих возможностях, либо не могут достичь самостоятельного творчества в научных идеях. Такие ограждения приводят к необходимости в развитии новых методов, которые могут обеспечить более высокий уровень творчества и фактической грандиозности в научных исследованиях. Целью Spacer является развитие системы, которая может самостоятельно генерировать оригинальные и фактически сбалансированные научные идеи, полностью на основе нейроконцепций.
## Метод
Spacer - это система, косвенно связанная с искусственным интеллектом, основанная на современных технологиях графов и творческих методов. Методология Spacer заключается в подходе, называемом "deliberate decontextualization". Данный подход заключается в разделении концепций на небольшие модули, или "ключевые слова", и поиск неожиданных связей между ними. Базируясь на этих запутанных связях, Spacer генерирует неповторимые научные направления. Механизмы Spacer включают два основных компонента: (i) Nuri, штурмовая система, которая строит и оценивает ключевые слова для статей на основе 180,000 публикаций в области биологии, и (ii) Manifesting Pipeline, которая превращает эти ключевые слова в полноценные научные концепции. Оба механизма работают вместе, чтобы приступить к генерации новых научных тезисов, которые могут быть экспериментально проверены.
## Результаты
В рамках экспериментов, проведенных с Spacer, выяснилось, что Nuri, в качестве штурмовой системы, показала отличные результаты в классификации высокоимпактных статей с AUROC-метрикой в 0.737. Более того, она удачно распознает и выделяет те статьи, которые могут быть заложниками будущего учебного искусственного интеллекта. Также, Manifesting Pipeline удалось успешно реконструировать главные концепции из новых статей, генерируемых в топ-журналах, только на основе ключевых слов. Этот процесс эмпирически подтвердил, что Spacer в состоянии выполнять творческий анализ на базе лишь структуры ключей. Этот результат был подтвержден с помощью лингвистического моделирования, которая показала, что 85% случаев реконструкции концепций были успешными. Наконец, Spacer показал свою эффективность в сравнении с текущими лучшими резу
Abstract
Recent advances in LLMs have made automated scientific research the next
frontline in the path to artificial superintelligence. However, these systems
are bound either to tasks of narrow scope or the limited creative capabilities
of LLMs. We propose Spacer, a scientific discovery system that develops
creative and factually grounded concepts without external intervention. Spacer
attempts to achieve this via 'deliberate decontextualization,' an approach that
disassembles information into atomic units - keywords - and draws creativity
from unexplored connections between them. Spacer consists of (i) Nuri, an
inspiration engine that builds keyword sets, and (ii) the Manifesting Pipeline
that refines these sets into elaborate scientific statements. Nuri extracts
novel, high-potential keyword sets from a keyword graph built with 180,000
academic publications in biological fields. The Manifesting Pipeline finds
links between keywords, analyzes their logical structure, validates their
plausibility, and ultimately drafts original scientific concepts. According to
our experiments, the evaluation metric of Nuri accurately classifies
high-impact publications with an AUROC score of 0.737. Our Manifesting Pipeline
also successfully reconstructs core concepts from the latest top-journal
articles solely from their keyword sets. An LLM-based scoring system estimates
that this reconstruction was sound for over 85% of the cases. Finally, our
embedding space analysis shows that outputs from Spacer are significantly more
similar to leading publications compared with those from SOTA LLMs.
Ссылки и действия
Дополнительные ресурсы: