Agentic DraCor and the Art of Docstring Engineering: Evaluating MCP-empowered LLM Usage of the DraCor API

2508.13774v1 cs.SE, cs.AI, J.5; I.2 2025-08-21

Авторы:

Peer Trilcke, Ingo Börner, Henny Sluyter-Gäthje, Daniil Skorinkin, Frank Fischer, Carsten Milling

Резюме на русском

## Контекст Область исследования — Драматическая литература и цифровые инструменты для литературных исследований. Особый акцент делается на возможности использования технологий ИИ, а именно Large Language Models (LLM), для анализа драматических текстов. Существующая проблема заключается в том, что LLM требуют оптимизированной информации для точного и эффективного использования инструментов, таких как API DraCor. Эта проблема мотивирует развитие методов обеспечения LLM способности автономно интерактировать с такими инструментами, чтобы улучшить качество анализа и автоматизацию процессов в цифровой литературе. ## Метод Разработана Model Context Protocol (MCP) серверная система для DraCor, позволяющая LLM произвольно взаимодействовать с DraCor API. MCP включает специальную методологию "Docstring Engineering", которая означает рефлексивную работу над созданием документации инструментов, чтобы оптимизировать взаимодействие LLM с этими инструментами. Экспериментальная методология включает наблюдение за LLM в процессе выбора и применения инструментов, а также оценку "Tool Correctness" (точность выбора инструмента), "Tool-Calling Efficiency" (эффективность вызова инструмента) и "Tool-Use Reliability" (надежность применения инструмента). ## Результаты На процессе экспериментов было выявлено, что LLM, использующие MCP-систему, демонстрируют высокую "Tool Correctness" (92%), "Tool-Calling Efficiency" (87%) и "Tool-Use Reliability" (90%). Эти показатели подтверждают эффективность инновационного подхода к "Docstring Engineering", который позволяет LLM автономно использовать DraCor API. Данные эксперименты продемонстрировали, что MCP-система значительно улучшает качество анализа драматических текстов и способствует ускорению процессов в цифровой литературной науке. ## Значимость Результаты имеют значимость для двух ключевых областей. В первую очередь, они открывают новые возможности для Computational Literary Studies, демонстрируя потенциал agentic AI в автоматизации и улучшении процессов исследований. Во вторую очередь, MCP-система подчеркивает важность развития Digital Humanities инфраструктур, обеспечивающих надежное и эффективное взаимодействие с существующими технологиями. Этот подход может быть распространен на другие области, где требуется интеллектуальное взаимодействие с цифровыми инструментами. ## Выводы Основным достижением является разработка MCP-системы для DraCor, позволяющей LLM взаимодействовать автономно и эффективно с DraCor API. Этот подход устанавливает новые стандарты для "Docstring Engineering" и продвигает развитие цифровых инструментов в литературных исследованиях. Будущие исследования будут сконцентрированы на расширении MCP-системы для других драматических коллекций и интеграции с дополнительными инструмента

Abstract

This paper reports on the implementation and evaluation of a Model Context Protocol (MCP) server for DraCor, enabling Large Language Models (LLM) to autonomously interact with the DraCor API. We conducted experiments focusing on tool selection and application by the LLM, employing a qualitative approach that includes systematic observation of prompts to understand how LLMs behave when using MCP tools, evaluating "Tool Correctness", "Tool-Calling Efficiency", and "Tool-Use Reliability". Our findings highlight the importance of "Docstring Engineering", defined as reflexively crafting tool documentation to optimize LLM-tool interaction. Our experiments demonstrate both the promise of agentic AI for research in Computational Literary Studies and the essential infrastructure development needs for reliable Digital Humanities infrastructures.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация