Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis

2508.11398v1 cs.HC, cs.AI, cs.IR 2025-08-19
Авторы:

Mithat Can Ozgun, Jiahuan Pei, Koen Hindriks, Lucia Donatelli, Qingzhi Liu, Xin Sun, Junxiao Wang

Резюме на русском

## Контекст Область исследования сосредоточена на развитии умных систем, которые могут обеспечивать надежное и эффективное сопровождение в области психотерапии и диагностики психических расстройств. Существуют значительные проблемы, такие как недостаточность прозрачности в диагностике, нехватка профессионального медицинского опыта в системах машинного обучения и сложность в изготовлении данных для тренировки медицинских моделей. Эти проблемы затрудняют достижение должного уровня доверия и точности в системах, предназначенных для помощи в психологическом здравоохранении. Естественной мотивацией является создание систем, которые не только обеспечат высокую точность в диагностике, но и обеспечат транспарентные и обоснованные результаты, чтобы повысить доверие к использованию таких технологий в практических медицинских задачах. ## Метод Методология основывается на использовании технологии бо LLM-агентов, которые могут имитировать профессиональные диалоги между психотерапевтом и клиентом. Для достижения целей используется имитация реальных ситуаций, в которых решаются проблемы, связанные с диагностикой и психотерапевтическим сопровождением. Для обеспечения полноты и ясности результатов разработана система "DSM5AgentFlow", которая способна синтезировать и анализировать DSM-5-уровня диагностических вопросов, а также делать транспарентные пошаговые оценки диагноза. Архитектура системы состоит из нескольких агентов, которые обеспечивают интерактивность и логику диалога, а также использование высокоточных технологий для получения диагностических данных. ## Результаты Набор экспериментов проводился с использованием различных LLM-моделей, включая специализированные модели для диагностики. Эти модели были оценены на таких критериях, как конверсационная реальность, точность диагноза и понятность выводов. Особое внимание было уделено сравнению с другими существующими моделями, что позволило показать высокую эффективность DSM5AgentFlow в выдаче обоснованных и прозрачных результатов диагностики. Также были проведены опыты на конкретных клиентских профилях, что позволило показать шаг за шагом получение диагностических выводов, которые могут быть понятны как для клиентов, так и для клинических специалистов. ## Значимость Разработанное решение имеет широкие применения в отраслях медицины, здравоохранения и психотерапии. Оно обеспечивает высокую точность диагностики, упрощает процесс понимания результатов для медиков и клиентов. Особенно важное преимущество заключается в поддержке прозрачности решений, что улучшает доверие к с

Abstract

LLM-based agents have emerged as transformative tools capable of executing complex tasks through iterative planning and action, achieving significant advancements in understanding and addressing user needs. Yet, their effectiveness remains limited in specialized domains such as mental health diagnosis, where they underperform compared to general applications. Current approaches to integrating diagnostic capabilities into LLMs rely on scarce, highly sensitive mental health datasets, which are challenging to acquire. These methods also fail to emulate clinicians' proactive inquiry skills, lack multi-turn conversational comprehension, and struggle to align outputs with expert clinical reasoning. To address these gaps, we propose DSM5AgentFlow, the first LLM-based agent workflow designed to autonomously generate DSM-5 Level-1 diagnostic questionnaires. By simulating therapist-client dialogues with specific client profiles, the framework delivers transparent, step-by-step disorder predictions, producing explainable and trustworthy results. This workflow serves as a complementary tool for mental health diagnosis, ensuring adherence to ethical and legal standards. Through comprehensive experiments, we evaluate leading LLMs across three critical dimensions: conversational realism, diagnostic accuracy, and explainability. Our datasets and implementations are fully open-sourced.

Ссылки и действия