📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 K-Dense Analyst: Towards Fully Automated Scientific Analysis

2025-08-14

Авторы:

Orion Li, Vinayak Agarwal, Summer Zhou, Ashwin Gopinath, Timothy Kassis

## Контекст Современные исследования в области биоинформатики становятся все более сложными, возникает критическая проблема: отсутствие эффективных средств для перехода от простых вычислений к устойчивой научной интерпретации данных. Несмотря на то, что большие языковые модели (LLMs) демонстрируют удивительные возможности в области научного логического моделирования, они всё ещё сталкиваются с ограничениями при работе с реальном мире, где требуется не только вычисление, но и комплексный подход: итеративные вычисления, интеграция множества специфических инструментов и критическое тестирование. Эта трудность приводит к пробелу между высокоуровневыми научными целями и низкоуровневыми вычислительными задачами. Мы представляем K-Dense Analyst, новый подход к решению этой проблемы, основанный на архитектуре с двумя уровнями планирования и выполнения, который может полностью автоматизировать выполнение сложных научных анализов. ## Метод K-Dense Analyst, разработанный в рамках шире развивающейся платформы K-Dense, является системой из множества специализированных агентов, которые работают в составе виртуальной среды с двойным уровнем. Основной принцип - предоставление более высокого уровня автоматизации за счет декомпозиции сложных научных задач в исполнимые модули, которые могут быть проверены на соответствие высоким стандартам. Мы использовали BixBench, комплексный биоинформатический бенчмарк для тестирования открытых задач анализа. K-Dense Analyst выполняет модельный анализ, совершенно отличающийся от подходов, применяемых в других моделях, таких как GPT-5. Мы использовали Gemini 2.5 Pro, чтобы продемонстрировать, что наши архитектурные решения увеличивают производительность готовых моделей значительно, даже если эти модели, в теории, не отвечают требованиям. Ключевым моментом является использование проверенных вычислительных сред, что позволяет достичь повышенной точности и надежности результатов. ## Результаты Выполняя сложные задачи биоинформатики на BixBench, K-Dense Analyst достиг 29.2% точности, что является на 6.3% выше уровня GPT-5 (22.9%) и почти 27% выше чем лучший вариант в данной области. Эти результаты демонстрируют не только значительное улучшение производительности, но и сильное расхождение с базовыми моделями, если они используются в одиночку. Например, Gemini 2.5 Pro, если использоваться непосредственно, демонстрирует только 18.3% точности. Этот результат подтверждает, что наша система K-Dense Analyst не только улучшает стандартные модели, но и добивается значительных прорывов в автоматизации научного анализа за счет интеграции планирования и выполнения на разных уровнях

Annotation:

The complexity of modern bioinformatics analysis has created a critical gap between data generation and developing scientific insights. While large language models (LLMs) have shown promise in scientific reasoning, they remain fundamentally limited when dealing with real-world analytical workflows that demand iterative computation, tool integration and rigorous validation. We introduce K-Dense Analyst, a hierarchical multi-agent system that achieves autonomous bioinformatics analysis through a d...

ID: 2508.07043v1 cs.AI, cs.MA, q-bio.GN, q-bio.QM

arXiv PDF