PASS: Probabilistic Agentic Supernet Sampling for Interpretable and Adaptive Chest X-Ray Reasoning
2508.10501v1
cs.AI, cs.LG
2025-08-16
Авторы:
Yushi Feng, Junye Du, Yingying Hong, Qifan Wang, Lequan Yu
Резюме на русском
## Контекст
Существующие системы-агенты, подключающиеся к инструментам для работы с радиологическими изображениями, сталкиваются с рядом проблем, которые ограничивают их применение в реальной практике. Эти проблемы включают в себя непрозрачность процесса принятия решений (черные ящики), что снижает доверие к системе и создает безопасностные риски. Кроме того, эти системы часто имеют низкую эффективность и сложность в интеграции многомодальных данных, которая критична для задач в области медицины. Целью нашей работы является разработка прозрачной, эффективной и адаптивной системы для обоснованного радиологического мониторинга, которая сможет адаптироваться к конкретным потребностям и предоставить понятные для конечного пользователя решения.
## Метод
Мы предлагаем PASS (Probabilistic Agentic Supernet Sampling), первую мультимодальную систему, которая адаптирует работу агентных процессов над супернет-графом с несколькими средствами. PASS выбирает наиболее подходящий инструмент на каждом этапе работы, а также обеспечивает прозрачность решений, добавляя вероятности к каждому шагу. Эта система также использует развивающуюся персонализированную память для сжатия ключевых выводов и оптимизирует работу, используя трёхступенчатую процедуру обучения, включающую: начальное обогащение экспертными знаниями, сравнительный анализ путей и учёт экономического показателя работы.
## Результаты
Мы оценили PASS на высокоинтерпретируемой задаче радиологического мониторинга, используя различные бенчмарки. Результаты показали, что PASS выделяется высокой точностью (accuracy), AUC, а также метриками, оценивающими качество работы системы в целом, такими как LLM-J. Кроме того, PASS отличается эффективностью, требуя меньше ресурсов для выполнения тяжёлых расчётов, чем многие современные алгоритмы. Это позволяет системе легко адаптироваться к различным медицинским задачам, предоставляя надежные и интеллектуальные решения.
## Значимость
PASS может быть применён в различных областях, где необходимо обеспечить прозрачность и эффективность работы систем-агентов. Особенно важно его применение в медицине, где прозрачность решений так же важно, как и точность. Эта система может существенно повысить безопасность и эффективность работы с радиологическими данными, обеспечивая прозрачность и надежность решений.
## Выводы
PASS представляет собой прорыв в области мультимодальных систем-агентов для радиологического мониторинга. Мы показали, что PASS не только превосходит существующие методы во многих аспектах, но и открывает новые возможности для развития безопасных, прозрачных и адаптив
Abstract
Existing tool-augmented agentic systems are limited in the real world by (i)
black-box reasoning steps that undermine trust of decision-making and pose
safety risks, (ii) poor multimodal integration, which is inherently critical
for healthcare tasks, and (iii) rigid and computationally inefficient agentic
pipelines. We introduce PASS (Probabilistic Agentic Supernet Sampling), the
first multimodal framework to address these challenges in the context of Chest
X-Ray (CXR) reasoning. PASS adaptively samples agentic workflows over a
multi-tool graph, yielding decision paths annotated with interpretable
probabilities. Given the complex CXR reasoning task with multimodal medical
data, PASS leverages its learned task-conditioned distribution over the agentic
supernet. Thus, it adaptively selects the most suitable tool at each supernet
layer, offering probability-annotated trajectories for post-hoc audits and
directly enhancing medical AI safety. PASS also continuously compresses salient
findings into an evolving personalized memory, while dynamically deciding
whether to deepen its reasoning path or invoke an early exit for efficiency. To
optimize a Pareto frontier balancing performance and cost, we design a novel
three-stage training procedure, including expert knowledge warm-up, contrastive
path-ranking, and cost-aware reinforcement learning. To facilitate rigorous
evaluation, we introduce CAB-E, a comprehensive benchmark for multi-step,
safety-critical, free-form CXR reasoning. Experiments across various benchmarks
validate that PASS significantly outperforms strong baselines in multiple
metrics (e.g., accuracy, AUC, LLM-J.) while balancing computational costs,
pushing a new paradigm shift towards interpretable, adaptive, and multimodal
medical agentic systems.
Ссылки и действия
Дополнительные ресурсы: