CORTEX: Composite Overlay for Risk Tiering and Exposure in Operational AI Systems
2508.19281v1
cs.CR, cs.AI
2025-08-29
Авторы:
Aoun E Muhammad, Kin Choong Yow, Jamel Baili, Yongwon Cho, Yunyoung Nam
Резюме на русском
## Контекст
В последние годы роль искусственного интеллекта (AI) в высокорисковых секторах, таких как здравоохранение, финансы, образование, правосудие и инфраструктура, существенно выросла. Это привело к повышению потенциала и воздействия неполадок этих систем. От искажений данных до серьезных ошибок, включая смертные последствия, неполадки AI стали практическими, регулярными и системными рисками. Из этого вытекает необходимость в систематической оценке и управлении рисками AI. Несмотря на развитие методов мониторинга и оценки, полномочия ответственных за риски часто ограничиваются внутренними моделями или отчетами, не удовлетворяющими потребностям в масштабируемом и четко определенном подходе к оценке рисков. Чтобы удовлетворить эту потребность, предлагается CORTEX (Composite Overlay for Risk Tiering and Exposure), открытое решение для сбора и оценки рисков в AI-системах.
## Метод
CORTEX представляет собой многоуровневую систему оценки рисков, основанную на анализе более 1200 инцидентов AI, задокументированных в AI Incident Database (AIID). Основная методология включает в себя:
1. **Категоризацию рисков**: 29 технических групп возможных неполадок, таких как детектируемость, воспроизводимость и адверсальный риск.
2. **Воздействие и шанс возникновения**: каждая группа оценивается с помощью формулы utility-adjusted Likelihood x Impact, чтобы соотнести риски с контекстом и пользовательским воздействием.
3. **Государственные и контекстуальные модификаторы**: оценка соответствия регулирующим требованиям, таким как EU AI Act, NIST RMF и OECD-принципы.
4. **Технические метрики**: оценка поверхностных рисков, таких как детектируемость, трассировка и адверсальный риск.
5. **Контекстуальные модификаторы**: учет дополнительных рисков, связанных с окружающей средой и резидентными факторами.
6. **Агрегация рисков**: шаг заключительный — моделирование волатильности и долгохвостаных рисков с помощью Байесовской оценки и монотехновых симуляций.
## Результаты
На основе тестовых экспериментов, проведенных с использованием CORTEX, были оценены риски в различных сценариях, включая системы медицинского мониторинга, финансовых прогнозов и систем управления трафиком. Результаты показали, что CORTEX эффективно локализует рисковые группы, сочетая технические и контекстуальные факторы. Очень важно, что гибкая архитектура CORTEX дает возможность адаптации к разным секторам и регуляторным требованиям, что увеличивает его ценность в реальных условиях.
## Значимость
CORTEX может применяться во многих областях, включая мониторинг риско
Abstract
As the deployment of Artificial Intelligence (AI) systems in high-stakes
sectors - like healthcare, finance, education, justice, and infrastructure has
increased - the possibility and impact of failures of these systems have
significantly evolved from being a theoretical possibility to practical
recurring, systemic risk. This paper introduces CORTEX (Composite Overlay for
Risk Tiering and Exposure), a multi-layered risk scoring framework proposed to
assess and score AI system vulnerabilities, developed on empirical analysis of
over 1,200 incidents documented in the AI Incident Database (AIID), CORTEX
categorizes failure modes into 29 technical vulnerability groups. Each
vulnerability is scored through a five-tier architecture that combines: (1)
utility-adjusted Likelihood x Impact calculations; (2) governance + contextual
overlays aligned with regulatory frameworks, such as the EU AI Act, NIST RMF,
OECD principles; (3) technical surface scores, covering exposure vectors like
drift, traceability, and adversarial risk; (4) environmental and residual
modifiers tailored to context of where these systems are being deployed to use;
and (5) a final layered assessment via Bayesian risk aggregation and Monte
Carlo simulation to model volatility and long-tail risks. The resulting
composite score can be operationalized across AI risk registers, model audits,
conformity checks, and dynamic governance dashboards.
Ссылки и действия
Дополнительные ресурсы: