Application Of Large Language Models For The Extraction Of Information From Particle Accelerator Technical Documentation
2509.02227v1
cs.IR, cs.AI, physics.acc-ph
2025-09-05
Авторы:
Qing Dai, Rasmus Ischebeck, Maruisz Sapinski, Adam Grycner
Резюме на русском
## Контекст
Область исследования прикладных языковых моделей (LLMs) в области прикладных наук признана как ключевая технология для решения проблем с управлением информацией в широком количестве сфер. Одним из актуальных направлений является извлечение информации из документации, связанной с технической областью, в частности, с партиклярными ускорителями. Такие документы содержат критически важную информацию, которая подвергается угрозе потери в связи с отставкой опытных специалистов. Извлечение информации из технических документов в этой области требует повышения эффективности, чтобы помочь сохранить экспертное знание и уменьшить риск его потери. Наша мотивация заключается в использовании LLMs для автоматизации и оптимизации этого процесса.
## Метод
Мы применяем LLMs, тренированные на больших данных, для анализа и извлечения структурированной информации из технической документации. Методология включает предобработку текста (такую как предобучение и очистка), использование модели для предсказания значений, а также оценку полученных результатов. Мы работаем с определенными техническими документами, которые содержат специфические термины и концепции, относящиеся к партиклярным ускорителям. Наша архитектура включает в себя нейронные сети, основанные на предыдущих моделях, с добавленными модификациями для работы в специализированной области.
## Результаты
Мы провели эксперименты с техническими документами, применяя предварительно обученную LLM для извлечения информации. Мы измеряли эффективность модели по таким показателям, как точность извлечения, время обработки и качество сгенерированного текста. Наши результаты показали, что применение LLMs способствует повышению точности извлечения информации, уменьшению времени работы с документами и повышению качества выдачи. Мы также обнаружили, что модель способна успешно определять и извлекать ключевые сведения, такие как параметры оборудования, описания процессов и спецификации.
## Значимость
Полученные результаты имеют значительное значение для многих областей, в том числе технического обслуживания, хранения информации и передачи знаний в сфере частных и государственных организаций. Мы видим свое применение в технических сферах, где необходимо сохранение и анализ специальной документации, например, в области атомной энергетики, связи и прочих технических областях. Преимущества включают в себя эффективность, уменьшение времени труда и уменьшение возможности потери критической информации.
## Выводы
Мы доказали, что LLMs могут эффективно применяться для извлечения информации из техничес
Abstract
The large set of technical documentation of legacy accelerator systems,
coupled with the retirement of experienced personnel, underscores the urgent
need for efficient methods to preserve and transfer specialized knowledge. This
paper explores the application of large language models (LLMs), to automate and
enhance the extraction of information from particle accelerator technical
documents. By exploiting LLMs, we aim to address the challenges of knowledge
retention, enabling the retrieval of domain expertise embedded in legacy
documentation. We present initial results of adapting LLMs to this specialized
domain. Our evaluation demonstrates the effectiveness of LLMs in extracting,
summarizing, and organizing knowledge, significantly reducing the risk of
losing valuable insights as personnel retire. Furthermore, we discuss the
limitations of current LLMs, such as interpretability and handling of rare
domain-specific terms, and propose strategies for improvement. This work
highlights the potential of LLMs to play a pivotal role in preserving
institutional knowledge and ensuring continuity in highly specialized fields.