Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis
2508.11398v1
cs.HC, cs.AI, cs.IR
2025-08-19
Авторы:
Mithat Can Ozgun, Jiahuan Pei, Koen Hindriks, Lucia Donatelli, Qingzhi Liu, Xin Sun, Junxiao Wang
Резюме на русском
## Контекст
Область исследования сосредоточена на развитии умных систем, которые могут обеспечивать надежное и эффективное сопровождение в области психотерапии и диагностики психических расстройств. Существуют значительные проблемы, такие как недостаточность прозрачности в диагностике, нехватка профессионального медицинского опыта в системах машинного обучения и сложность в изготовлении данных для тренировки медицинских моделей. Эти проблемы затрудняют достижение должного уровня доверия и точности в системах, предназначенных для помощи в психологическом здравоохранении. Естественной мотивацией является создание систем, которые не только обеспечат высокую точность в диагностике, но и обеспечат транспарентные и обоснованные результаты, чтобы повысить доверие к использованию таких технологий в практических медицинских задачах.
## Метод
Методология основывается на использовании технологии бо LLM-агентов, которые могут имитировать профессиональные диалоги между психотерапевтом и клиентом. Для достижения целей используется имитация реальных ситуаций, в которых решаются проблемы, связанные с диагностикой и психотерапевтическим сопровождением. Для обеспечения полноты и ясности результатов разработана система "DSM5AgentFlow", которая способна синтезировать и анализировать DSM-5-уровня диагностических вопросов, а также делать транспарентные пошаговые оценки диагноза. Архитектура системы состоит из нескольких агентов, которые обеспечивают интерактивность и логику диалога, а также использование высокоточных технологий для получения диагностических данных.
## Результаты
Набор экспериментов проводился с использованием различных LLM-моделей, включая специализированные модели для диагностики. Эти модели были оценены на таких критериях, как конверсационная реальность, точность диагноза и понятность выводов. Особое внимание было уделено сравнению с другими существующими моделями, что позволило показать высокую эффективность DSM5AgentFlow в выдаче обоснованных и прозрачных результатов диагностики. Также были проведены опыты на конкретных клиентских профилях, что позволило показать шаг за шагом получение диагностических выводов, которые могут быть понятны как для клиентов, так и для клинических специалистов.
## Значимость
Разработанное решение имеет широкие применения в отраслях медицины, здравоохранения и психотерапии. Оно обеспечивает высокую точность диагностики, упрощает процесс понимания результатов для медиков и клиентов. Особенно важное преимущество заключается в поддержке прозрачности решений, что улучшает доверие к с
Abstract
LLM-based agents have emerged as transformative tools capable of executing
complex tasks through iterative planning and action, achieving significant
advancements in understanding and addressing user needs. Yet, their
effectiveness remains limited in specialized domains such as mental health
diagnosis, where they underperform compared to general applications. Current
approaches to integrating diagnostic capabilities into LLMs rely on scarce,
highly sensitive mental health datasets, which are challenging to acquire.
These methods also fail to emulate clinicians' proactive inquiry skills, lack
multi-turn conversational comprehension, and struggle to align outputs with
expert clinical reasoning. To address these gaps, we propose DSM5AgentFlow, the
first LLM-based agent workflow designed to autonomously generate DSM-5 Level-1
diagnostic questionnaires. By simulating therapist-client dialogues with
specific client profiles, the framework delivers transparent, step-by-step
disorder predictions, producing explainable and trustworthy results. This
workflow serves as a complementary tool for mental health diagnosis, ensuring
adherence to ethical and legal standards. Through comprehensive experiments, we
evaluate leading LLMs across three critical dimensions: conversational realism,
diagnostic accuracy, and explainability. Our datasets and implementations are
fully open-sourced.
Ссылки и действия
Дополнительные ресурсы: