A Defect Classification Framework for AI-Based Software Systems (AI-ODC)

2508.17900v1 cs.SE, cs.AI 2025-08-27
Авторы:

Mohammed O. Alannsary

Резюме на русском

## Контекст Современные технологии искусственного интеллекта (ИИ) применяются во многих областях, от повседневных задач, таких как ответы на электронные письма и планирование, до промышленности и автоматизации производственных процессов. Однако использование ИИ связано с риском возникновения ошибок и дефектов в программном обеспечении, что может привести к серьезным последствиям. Дефектный анализ является ключевым элементом обеспечения качества программного обеспечения, но существующие модели дефектного анализа не учитывают уникальные характеристики AI-систем. Это приводит к ограниченной эффективности дефектного анализа в AI-системах. Целью данного исследования является разработка фреймворка для дефектного анализа AI-систем, который учитывает их особенности. ## Метод Фреймворк AI-ODC основывается на парадигме Orthogonal Defect Classification (ODC), но адаптирован для AI-систем. Он включает новые классификационные размерности: "Data", "Learning" и "Thinking", которые отражают особенности ИИ. Для каждой размерности были введены дополнительные атрибуты и уровни серьезности. Также были пересмотрены "impact areas", заменены на понятия, характерные для AI-систем. Фреймворк был реализован и проверен на открытом датасете с дефектами в машинном обучении. Эксперименты включали один- и двухмерные анализы результатов. ## Результаты Исследование показало, что большая часть дефектов возникает во время "Learning" фазы и часто имеют высокий уровень серьезности. Дефекты во время "Thinking" фазы, хотя и менее часты, имеют большое влияние на надежность и точность. Эти результаты помогают выявить самые рискованные категории дефектов и ориентировать качественные меры на их устранение. ## Значимость Фреймворк AI-ODC может быть использован в различных областях, где применяются AI-системы, включая промышленность, здравоохранение и финансы. Он обеспечивает более точный дефектный анализ, учитывая уникальные черты AI-систем. Использование этого фреймворка может снизить риск ошибок, увеличить надежность и улучшить качество AI-систем, что вносит полезный вклад в развитие ИИ. ## Выводы AI-ODC доказал свою эффективность в классификации дефектов AI-систем, учитывая их особенности. Будущие исследования будут сфокусированы на расширении фреймворка для других типов AI-систем и интеграции с методами управления качеством программного обеспечения.

Abstract

Artificial Intelligence has gained a lot of attention recently, it has been utilized in several fields ranging from daily life activities, such as responding to emails and scheduling appointments, to manufacturing and automating work activities. Artificial Intelligence systems are mainly implemented as software solutions, and it is essential to discover and remove software defects to assure its quality using defect analysis which is one of the major activities that contribute to software quality. Despite the proliferation of AI-based systems, current defect analysis models fail to capture their unique attributes. This paper proposes a framework inspired by the Orthogonal Defect Classification (ODC) paradigm and enables defect analysis of Artificial Intelligence systems while recognizing its special attributes and characteristics. This study demonstrated the feasibility of modifying ODC for AI systems to classify its defects. The ODC was adjusted to accommodate the Data, Learning, and Thinking aspects of AI systems which are newly introduced classification dimensions. This adjustment involved the introduction of an additional attribute to the ODC attributes, the incorporation of a new severity level, and the substitution of impact areas with characteristics pertinent to AI systems. The framework was showcased by applying it to a publicly available Machine Learning bug dataset, with results analyzed through one-way and two-way analysis. The case study indicated that defects occurring during the Learning phase were the most prevalent and were significantly linked to high-severity classifications. In contrast, defects identified in the Thinking phase had a disproportionate effect on trustworthiness and accuracy. These findings illustrate AIODC's capability to identify high-risk defect categories and inform focused quality assurance measures.

Ссылки и действия