PASS: Probabilistic Agentic Supernet Sampling for Interpretable and Adaptive Chest X-Ray Reasoning

2508.10501v1 cs.AI, cs.LG 2025-08-16

Авторы:

Yushi Feng, Junye Du, Yingying Hong, Qifan Wang, Lequan Yu

Резюме на русском

## Контекст Существующие системы-агенты, подключающиеся к инструментам для работы с радиологическими изображениями, сталкиваются с рядом проблем, которые ограничивают их применение в реальной практике. Эти проблемы включают в себя непрозрачность процесса принятия решений (черные ящики), что снижает доверие к системе и создает безопасностные риски. Кроме того, эти системы часто имеют низкую эффективность и сложность в интеграции многомодальных данных, которая критична для задач в области медицины. Целью нашей работы является разработка прозрачной, эффективной и адаптивной системы для обоснованного радиологического мониторинга, которая сможет адаптироваться к конкретным потребностям и предоставить понятные для конечного пользователя решения. ## Метод Мы предлагаем PASS (Probabilistic Agentic Supernet Sampling), первую мультимодальную систему, которая адаптирует работу агентных процессов над супернет-графом с несколькими средствами. PASS выбирает наиболее подходящий инструмент на каждом этапе работы, а также обеспечивает прозрачность решений, добавляя вероятности к каждому шагу. Эта система также использует развивающуюся персонализированную память для сжатия ключевых выводов и оптимизирует работу, используя трёхступенчатую процедуру обучения, включающую: начальное обогащение экспертными знаниями, сравнительный анализ путей и учёт экономического показателя работы. ## Результаты Мы оценили PASS на высокоинтерпретируемой задаче радиологического мониторинга, используя различные бенчмарки. Результаты показали, что PASS выделяется высокой точностью (accuracy), AUC, а также метриками, оценивающими качество работы системы в целом, такими как LLM-J. Кроме того, PASS отличается эффективностью, требуя меньше ресурсов для выполнения тяжёлых расчётов, чем многие современные алгоритмы. Это позволяет системе легко адаптироваться к различным медицинским задачам, предоставляя надежные и интеллектуальные решения. ## Значимость PASS может быть применён в различных областях, где необходимо обеспечить прозрачность и эффективность работы систем-агентов. Особенно важно его применение в медицине, где прозрачность решений так же важно, как и точность. Эта система может существенно повысить безопасность и эффективность работы с радиологическими данными, обеспечивая прозрачность и надежность решений. ## Выводы PASS представляет собой прорыв в области мультимодальных систем-агентов для радиологического мониторинга. Мы показали, что PASS не только превосходит существующие методы во многих аспектах, но и открывает новые возможности для развития безопасных, прозрачных и адаптив

Abstract

Existing tool-augmented agentic systems are limited in the real world by (i) black-box reasoning steps that undermine trust of decision-making and pose safety risks, (ii) poor multimodal integration, which is inherently critical for healthcare tasks, and (iii) rigid and computationally inefficient agentic pipelines. We introduce PASS (Probabilistic Agentic Supernet Sampling), the first multimodal framework to address these challenges in the context of Chest X-Ray (CXR) reasoning. PASS adaptively samples agentic workflows over a multi-tool graph, yielding decision paths annotated with interpretable probabilities. Given the complex CXR reasoning task with multimodal medical data, PASS leverages its learned task-conditioned distribution over the agentic supernet. Thus, it adaptively selects the most suitable tool at each supernet layer, offering probability-annotated trajectories for post-hoc audits and directly enhancing medical AI safety. PASS also continuously compresses salient findings into an evolving personalized memory, while dynamically deciding whether to deepen its reasoning path or invoke an early exit for efficiency. To optimize a Pareto frontier balancing performance and cost, we design a novel three-stage training procedure, including expert knowledge warm-up, contrastive path-ranking, and cost-aware reinforcement learning. To facilitate rigorous evaluation, we introduce CAB-E, a comprehensive benchmark for multi-step, safety-critical, free-form CXR reasoning. Experiments across various benchmarks validate that PASS significantly outperforms strong baselines in multiple metrics (e.g., accuracy, AUC, LLM-J.) while balancing computational costs, pushing a new paradigm shift towards interpretable, adaptive, and multimodal medical agentic systems.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

PASS: Probabilistic Agentic Supernet Sampling for Interpretable and Adaptive Chest X-Ray Reasoning

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Mathematical Framing for Different Agent Strategies

Sequential Enumeration in Large Language Models

Educational Cone Model in Embedding Vector Spaces

A Benchmark of Causal vs Correlation AI for Predictive Maintenance

fMRI2GES: Co-speech Gesture Reconstruction from fMRI Signal with Dual Brain Deco...

Навигация