Hallucinations in medical devices

2508.14118v1 eess.IV, cs.CV 2025-08-22
Авторы:

Jason Granstedt, Prabhat Kc, Rucha Deshpande, Victor Garcia, Aldo Badano

Резюме на русском

## Контекст Компьютерные методы в медицинских устройствах, особенно те, что основаны на глубоком обучении, широко используются в клинических задачах, включая диагностику, мониторинг и терапию. Однако эти методы не являются идеальными и часто совершают ошибки, которые могут быть критичными для пациентов. Ошибки, вызванные глубоким обучением, часто описываются как "гиперболические" или "бессмысленные" искажения данных, но нет единого понимания того, что именно они означают. Эта неопределенность затрудняет оценку эффективности и безопасности медицинского оборудования. "Hallucination" — это понятие, которое появилось в контексте вычислительных методов в медицине. Оно описывается как ошибка, которая может быть вызвана данными, алгоритмом или системой в целом, и может привести к потенциально повреждающим или бесполезным результатам. Без четкого понимания этой проблемы сложно оценивать уровень безопасности и точности медицинских устройств. ## Метод Для создания универсального подхода к определению и оценке "гиперболических" ошибок в медицинских устройствах было предложено использовать термин "гипербола" ("hallucination"). Методология основывается на эмпирической анализе данных и результатов работы различных медицинских устройств. Определение "гиперболы" включает в себя следующие аспекты: 1. **Реальность и возможность ошибки**: Ошибка должна быть реальной и возможной в ситуации, но не обязательно должна привести к повреждению. 2. **Потенциальная полезность или вредность**: Гипербола может быть приемлемой или неприемлемой в зависимости от контекста. 3. **Повторяемость и оценка**: Необходимо разработать методы для повторяемой и универсальной оценки гипербол в различных ситуациях. Эта методология была применена к различным сценариям, включая изображения и неизображающие данные, для изучения различных аспектов создания гипербол в медицинских устройствах. ## Результаты Исследования проводились на основе реальных данных, полученных из различных медицинских устройств. Эксперименты показали, что гиперболы могут возникать по разным причинам, включая неточности в данных, ошибки моделей или несоответствия между требованиями и реальностью. На основе этих результатов были разработаны критерии для определения и оценки гипербол, которые могут быть использованы для различных типов устройств и задач. Также были показаны технические решения, направленные на сокращение частоты гипербол. Например, были разработаны методы внимательного мониторинга процесса обучения моделей, а также использованы методы, способные корре

Abstract

Computer methods in medical devices are frequently imperfect and are known to produce errors in clinical or diagnostic tasks. However, when deep learning and data-based approaches yield output that exhibit errors, the devices are frequently said to hallucinate. Drawing from theoretical developments and empirical studies in multiple medical device areas, we introduce a practical and universal definition that denotes hallucinations as a type of error that is plausible and can be either impactful or benign to the task at hand. The definition aims at facilitating the evaluation of medical devices that suffer from hallucinations across product areas. Using examples from imaging and non-imaging applications, we explore how the proposed definition relates to evaluation methodologies and discuss existing approaches for minimizing the prevalence of hallucinations.

Ссылки и действия