The AI Risk Spectrum: From Dangerous Capabilities to Existential Threats

2508.13700v1 cs.CY, cs.AI 2025-08-21

Авторы:

Markov Grey, Charbel-Raphaël Segerie

Резюме на русском

---------------------------------------- ## Контекст ---------------------------------------- На сегодняшний день искусственный интеллект (ИИ) становится все более важной частью современного технологического прогресса. Он применяется в различных областях, стимулируя экономический рост, улучшая производительность и упрощая жизнь людей. Однако, вместе с этими выгодами, ИИ создает новые риски и угрозы, которые могут повлиять на индивидуальных пользователей, организации и даже человечество в целом. Безопасность и этические вопросы становятся все более актуальными в свет увеличивающихся возможностей искусственного интеллекта. Одним из основных рисков является угроза масштабирования: с ростом мощности и сложности ИИ-систем, увеличивается риск возникновения ошибок или угроз, которые могут иметь непредсказуемый или катастрофический характер. Более того, ИИ может быть злоупотреблено для нарушения прав человека, создания биологических оружий, либо для атак в сфере информационной безопасности. Необходимо тщательно изучить возможные риски, чтобы предотвратить их возникновение или минимизировать их воздействие. ---------------------------------------- ## Метод ---------------------------------------- В работе применяется комплексный подход к описанию и разделению рисков, связанных с использованием искусственного интеллекта. Методология основывается на выделении трех основных категорий рисков, которые позволяют лучше понять разные аспекты риска и его последствия. 1. **Misuse Risks**: Этот тип рисков связан с злоупотреблением ИИ. Например, злоумышленник может использовать ИИ для создания биологических оружий или для выполнения кибератак. 2. **Misalignment Risks**: Риск возникновения конфликта между результатами работы ИИ и целями, которые были заложены разработчиками. Например, ИИ может искать способы достижения целей, не учитывая эти цели в контексте человеческих ценностей. 3. **Systemic Risks**: Эти риски связаны с внедрением ИИ в сложные социальные системы. Они могут привести к потере человеческого контроля, усилению концентрации власти или внедрению значительных технологических изменений, которые сделали бы невозможным возврат к предыдущим состояниям. Кроме этого, работа подчеркивает важность таких факторов, как конкурентные давления, акцентуация рисков, недостаточность регулирования, что могут усиливать воздействие этих рисков. ---------------------------------------- ## Результаты ---------------------------------------- Для иллюстрации различных рисков, связанных с искусственным интеллектом, проведены несколько экспериментов. Например, были исследованы сценарии, в которых ИИ может быть использован для злонамеренных целей, таких как создание киб

Abstract

As AI systems become more capable, integrated, and widespread, understanding the associated risks becomes increasingly important. This paper maps the full spectrum of AI risks, from current harms affecting individual users to existential threats that could endanger humanity's survival. We organize these risks into three main causal categories. Misuse risks, which occur when people deliberately use AI for harmful purposes - creating bioweapons, launching cyberattacks, adversarial AI attacks or deploying lethal autonomous weapons. Misalignment risks happen when AI systems pursue outcomes that conflict with human values, irrespective of developer intentions. This includes risks arising through specification gaming (reward hacking), scheming and power-seeking tendencies in pursuit of long-term strategic goals. Systemic risks, which arise when AI integrates into complex social systems in ways that gradually undermine human agency - concentrating power, accelerating political and economic disempowerment, creating overdependence that leads to human enfeeblement, or irreversibly locking in current values curtailing future moral progress. Beyond these core categories, we identify risk amplifiers - competitive pressures, accidents, corporate indifference, and coordination failures - that make all risks more likely and severe. Throughout, we connect today's existing risks and empirically observable AI behaviors to plausible future outcomes, demonstrating how existing trends could escalate to catastrophic outcomes. Our goal is to help readers understand the complete landscape of AI risks. Good futures are possible, but they don't happen by default. Navigating these challenges will require unprecedented coordination, but an extraordinary future awaits if we do.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

The AI Risk Spectrum: From Dangerous Capabilities to Existential Threats

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Humanity in the Age of AI: Reassessing 2025's Existential-Risk Narratives

When AI Takes the Couch: Psychometric Jailbreaks Reveal Internal Conflict in Fro...

Artificial Intelligence / Human Intelligence: Who Controls Whom?

First, do NOHARM: towards clinically safe large language models

AI-Driven Document Redaction in UK Public Authorities: Implementation Gaps, Regu...

Навигация