📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Orion Li, Vinayak Agarwal, Summer Zhou, Ashwin Gopinath, Timothy Kassis
## Контекст
Современные исследования в области биоинформатики становятся все более сложными, возникает критическая проблема: отсутствие эффективных средств для перехода от простых вычислений к устойчивой научной интерпретации данных. Несмотря на то, что большие языковые модели (LLMs) демонстрируют удивительные возможности в области научного логического моделирования, они всё ещё сталкиваются с ограничениями при работе с реальном мире, где требуется не только вычисление, но и комплексный подход: итеративные вычисления, интеграция множества специфических инструментов и критическое тестирование. Эта трудность приводит к пробелу между высокоуровневыми научными целями и низкоуровневыми вычислительными задачами. Мы представляем K-Dense Analyst, новый подход к решению этой проблемы, основанный на архитектуре с двумя уровнями планирования и выполнения, который может полностью автоматизировать выполнение сложных научных анализов.
## Метод
K-Dense Analyst, разработанный в рамках шире развивающейся платформы K-Dense, является системой из множества специализированных агентов, которые работают в составе виртуальной среды с двойным уровнем. Основной принцип - предоставление более высокого уровня автоматизации за счет декомпозиции сложных научных задач в исполнимые модули, которые могут быть проверены на соответствие высоким стандартам. Мы использовали BixBench, комплексный биоинформатический бенчмарк для тестирования открытых задач анализа. K-Dense Analyst выполняет модельный анализ, совершенно отличающийся от подходов, применяемых в других моделях, таких как GPT-5. Мы использовали Gemini 2.5 Pro, чтобы продемонстрировать, что наши архитектурные решения увеличивают производительность готовых моделей значительно, даже если эти модели, в теории, не отвечают требованиям. Ключевым моментом является использование проверенных вычислительных сред, что позволяет достичь повышенной точности и надежности результатов.
## Результаты
Выполняя сложные задачи биоинформатики на BixBench, K-Dense Analyst достиг 29.2% точности, что является на 6.3% выше уровня GPT-5 (22.9%) и почти 27% выше чем лучший вариант в данной области. Эти результаты демонстрируют не только значительное улучшение производительности, но и сильное расхождение с базовыми моделями, если они используются в одиночку. Например, Gemini 2.5 Pro, если использоваться непосредственно, демонстрирует только 18.3% точности. Этот результат подтверждает, что наша система K-Dense Analyst не только улучшает стандартные модели, но и добивается значительных прорывов в автоматизации научного анализа за счет интеграции планирования и выполнения на разных уровнях
Annotation:
The complexity of modern bioinformatics analysis has created a critical gap
between data generation and developing scientific insights. While large
language models (LLMs) have shown promise in scientific reasoning, they remain
fundamentally limited when dealing with real-world analytical workflows that
demand iterative computation, tool integration and rigorous validation. We
introduce K-Dense Analyst, a hierarchical multi-agent system that achieves
autonomous bioinformatics analysis through a d...