Application Of Large Language Models For The Extraction Of Information From Particle Accelerator Technical Documentation

2509.02227v1 cs.IR, cs.AI, physics.acc-ph 2025-09-05
Авторы:

Qing Dai, Rasmus Ischebeck, Maruisz Sapinski, Adam Grycner

Резюме на русском

## Контекст Область исследования прикладных языковых моделей (LLMs) в области прикладных наук признана как ключевая технология для решения проблем с управлением информацией в широком количестве сфер. Одним из актуальных направлений является извлечение информации из документации, связанной с технической областью, в частности, с партиклярными ускорителями. Такие документы содержат критически важную информацию, которая подвергается угрозе потери в связи с отставкой опытных специалистов. Извлечение информации из технических документов в этой области требует повышения эффективности, чтобы помочь сохранить экспертное знание и уменьшить риск его потери. Наша мотивация заключается в использовании LLMs для автоматизации и оптимизации этого процесса. ## Метод Мы применяем LLMs, тренированные на больших данных, для анализа и извлечения структурированной информации из технической документации. Методология включает предобработку текста (такую как предобучение и очистка), использование модели для предсказания значений, а также оценку полученных результатов. Мы работаем с определенными техническими документами, которые содержат специфические термины и концепции, относящиеся к партиклярным ускорителям. Наша архитектура включает в себя нейронные сети, основанные на предыдущих моделях, с добавленными модификациями для работы в специализированной области. ## Результаты Мы провели эксперименты с техническими документами, применяя предварительно обученную LLM для извлечения информации. Мы измеряли эффективность модели по таким показателям, как точность извлечения, время обработки и качество сгенерированного текста. Наши результаты показали, что применение LLMs способствует повышению точности извлечения информации, уменьшению времени работы с документами и повышению качества выдачи. Мы также обнаружили, что модель способна успешно определять и извлекать ключевые сведения, такие как параметры оборудования, описания процессов и спецификации. ## Значимость Полученные результаты имеют значительное значение для многих областей, в том числе технического обслуживания, хранения информации и передачи знаний в сфере частных и государственных организаций. Мы видим свое применение в технических сферах, где необходимо сохранение и анализ специальной документации, например, в области атомной энергетики, связи и прочих технических областях. Преимущества включают в себя эффективность, уменьшение времени труда и уменьшение возможности потери критической информации. ## Выводы Мы доказали, что LLMs могут эффективно применяться для извлечения информации из техничес

Abstract

The large set of technical documentation of legacy accelerator systems, coupled with the retirement of experienced personnel, underscores the urgent need for efficient methods to preserve and transfer specialized knowledge. This paper explores the application of large language models (LLMs), to automate and enhance the extraction of information from particle accelerator technical documents. By exploiting LLMs, we aim to address the challenges of knowledge retention, enabling the retrieval of domain expertise embedded in legacy documentation. We present initial results of adapting LLMs to this specialized domain. Our evaluation demonstrates the effectiveness of LLMs in extracting, summarizing, and organizing knowledge, significantly reducing the risk of losing valuable insights as personnel retire. Furthermore, we discuss the limitations of current LLMs, such as interpretability and handling of rare domain-specific terms, and propose strategies for improvement. This work highlights the potential of LLMs to play a pivotal role in preserving institutional knowledge and ensuring continuity in highly specialized fields.

Ссылки и действия