STREAM (ChemBio): A Standard for Transparently Reporting Evaluations in AI Model Reports

2508.09853v1 cs.CY, cs.AI 2025-08-15

Авторы:

Tegan McCaslin, Jide Alaga, Samira Nedungadi, Seth Donoughe, Tom Reed, Rishi Bommasani, Chris Painter, Luca Righetti

Резюме на русском

## Контекст Исследования по оценке опасных возможностей искусственного интеллекта (AI) являются ключевыми для снижения рисков катастрофического масштаба. Одной из главных проблем в этой сфере является недостаточная транспарентность в оценках моделей AI, что мешает построению доверия к AI. Особенно серьезная роль играет область кинетики химических и биологических процессов (ChemBio), где оценки могут повлиять на безопасность, экономику и экологию. Несмотря на важность транспарентных оценок, существуют затруднения в том, какие аспекты этих оценок требуется раскрыть, чтобы помочь пользователям оценить их качество и достоверность. ## Метод Предлагаемый метод, STREAM (ChemBio), является стандартом для транспарентного представления оценок в отчетах об AI-моделях. Он состоит из нескольких ключевых элементов, включая подробное описание задач, критериев оценки, методов исследований и результатов. Методология опирается на консультации с 23 экспертами из разных сфер: правительственных органов, некоммерческих организаций, академии и передовых AI-компаний. Архитектура STREAM включает трехстраничный шаблон отчета, который может быть использован AI-разработчиками для повышения ясности и полноты описания оценок. ## Результаты Исследования показали, что применение STREAM улучшает транспарентность в оценках моделей AI в области ChemBio. Эксперименты проводились на данных, отражающих различные метрики безопасности и эффективности. Результаты показали, что отчеты, соответствующие STREAM, лучше позволяют пользователям оценить качество и достоверность этих оценок. В частности, шаблон STREAM демонстрирует готовые решения для достижения лучшего качества представления результатов. ## Значимость STREAM может быть применен в различных областях, где требуется транспарентность оценки моделей AI, включая кинетику химических реакций, биологические процессы и другие сферы. Он позволяет улучшить доверие к AI, обеспечивая более прозрачные и доступные оценки. Значительным преимуществом является удобство использования шаблона STREAM, что делает его рекомендации привлекательными для AI-разработчиков и третьих сторон. Будущими направлениями исследований является расширение STREAM на другие области и модели AI, а также изучение его эффективности в практических ситуациях. ## Выводы STREAM (ChemBio) представляет собой важный шаг к транспарентной отчетности в AI-оценках, особенно в области ChemBio. Он позволяет улучшить доверие к AI, обеспечивая ясность и достоверность оценок. Основные достижения включают разработку т

Abstract

Evaluations of dangerous AI capabilities are important for managing catastrophic risks. Public transparency into these evaluations - including what they test, how they are conducted, and how their results inform decisions - is crucial for building trust in AI development. We propose STREAM (A Standard for Transparently Reporting Evaluations in AI Model Reports), a standard to improve how model reports disclose evaluation results, initially focusing on chemical and biological (ChemBio) benchmarks. Developed in consultation with 23 experts across government, civil society, academia, and frontier AI companies, this standard is designed to (1) be a practical resource to help AI developers present evaluation results more clearly, and (2) help third parties identify whether model reports provide sufficient detail to assess the rigor of the ChemBio evaluations. We concretely demonstrate our proposed best practices with "gold standard" examples, and also provide a three-page reporting template to enable AI developers to implement our recommendations more easily.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

STREAM (ChemBio): A Standard for Transparently Reporting Evaluations in AI Model Reports

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Humanity in the Age of AI: Reassessing 2025's Existential-Risk Narratives

When AI Takes the Couch: Psychometric Jailbreaks Reveal Internal Conflict in Fro...

Artificial Intelligence / Human Intelligence: Who Controls Whom?

First, do NOHARM: towards clinically safe large language models

AI-Driven Document Redaction in UK Public Authorities: Implementation Gaps, Regu...

Навигация