Leveraging AI to Accelerate Clinical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods

2508.05519v1 cs.CV 2025-08-09
Авторы:

Matthew Purri, Amit Patel, Erik Deurrell

Резюме на русском

Увеличивая объем данных в клинических испытаниях, сборка и очистка клинических данных становятся все более трудоемкими и требуют серьезных вложений времени и ресурсов. Данная работа представляет **Octozi**, платформу, использующую большие языковые модели и доменные знания, для ускорения процесса очистки клинических данных. В эксперименте с клиническими рецензентами (n=10), AI-пропускная способность очистки данных увеличилась в 6,03 раза, при этом снизилось количество ошибок с 54,67% до 8,48% (6,44-кратно). Также был снижен объем ложных срабатываний на 15,48 раза, уменьшив нагрузку на клинические центры. Результаты показали значительные выигрыши в повышении производительности и качества рецензирования, независимо от опыта рецензентов. Работа доказывает, что AI-поддерживаемые подходы могут устранить основные неэффективности в клинических процессах, повысив эффективность и скорость разработки лекарств, при этом соблюдая регуляторные требования. Она устанавливает новый фреймворк для интеграции AI в критически важные процессы клинических испытаний.

Abstract

Clinical trial data cleaning represents a critical bottleneck in drug development, with manual review processes struggling to manage exponentially increasing data volumes and complexity. This paper presents Octozi, an artificial intelligence-assisted platform that combines large language models with domain-specific heuristics to transform clinical data review. In a controlled experimental study with experienced clinical reviewers (n=10), we demonstrate that AI assistance increased data cleaning throughput by 6.03-fold while simultaneously decreasing cleaning errors from 54.67% to 8.48% (a 6.44-fold improvement). Crucially, the system reduced false positive queries by 15.48-fold, minimizing unnecessary site burden. These improvements were consistent across reviewers regardless of experience level, suggesting broad applicability. Our findings indicate that AI-assisted approaches can address fundamental inefficiencies in clinical trial operations, potentially accelerating drug development timelines and reducing costs while maintaining regulatory compliance. This work establishes a framework for integrating AI into safety-critical clinical workflows and demonstrates the transformative potential of human-AI collaboration in pharmaceutical clinical trials.

Ссылки и действия