PolicyPad: Collaborative Prototyping of LLM Policies

2509.19680v1 cs.HC, cs.AI 2025-09-26

Авторы:

K. J. Kevin Feng, Tzu-Sheng Kuo, Quan Ze, Chen, Inyoung Cheong, Kenneth Holstein, Amy X. Zhang

Резюме на русском

## Контекст Политическое управление языковыми моделями (LLM), особенно в высокорисковых областях, становится ключевым вопросом для обеспечения безопасности и эффективности. Во время взаимодействия с этими моделями, знатоки высказывают необходимость быстрого экспериментирования, взаимодействия и итерации в процессе формирования политик. Однако существующие методы порой ограничиваются статичными инструментами и недостаточно подходят для коллективного политического прототипирования. Это подчеркивает необходимость развития инструментов, которые бы поддерживали коллективную работу, эффективность и интерактивность в процессе формирования политик. ## Метод PolicyPad — это интерактивная система, разработанная для поддержки коллективного прототипирования политик для языковых моделей. Основанна на принципах UX-прототипирования, таких как херастический анализ и создание сценариев, она позволяет группам сотрудников совместно работать над прототипами политики в режиме реального времени. Инструмент позволяет пользователям проводить эксперименты с поведением моделей, используя кейсы использования, и мгновенно оценивать их эффективность. Архитектура PolicyPad включает интерактивное окружение, где пользователи могут создавать, редактировать и тестировать политики в симуляционных условиях, что обеспечивает эффективное взаимодействие и быстрое возвращение результатов. ## Результаты Чтобы оценить эффективность PolicyPad, проведены 8 совместных сессий с 22 участниками из областей психологии и права. Участники смогли эффективно создавать и дорабатывать политики, вовлекать в процесс нескольких экспертов и быстро проверять их взаимодействие с моделями. Эксперименты показали, что использование PolicyPad улучшило коллективные динамики в процессе формирования политик, обеспечил быстрые обратные ходы и позволил разработать новые подходы к политическому управлению языковыми моделями. ## Значимость PolicyPad открывает новые возможности для улучшения участия экспертов в процессе формирования политик. Его можно применять в сферах, где требуется высокая точность и безопасность, таких как здравоохранение, право и финансы. Инструмент поддерживает коллективное взаимодействие, обеспечивая туннельные обратные связи и позволяя экспертам быстро адаптироваться к изменениям. Это может способствовать развитию новых подходов к управлению рисками и безопасности в работе с языковыми моделями. ## Выводы PolicyPad — это первый инструмент, который эффективно поддерживает коллективное политическое прототипирование языковых моделей. Он обеспечивает удобные условия для экспериментов, быстрого в

Abstract

As LLMs gain adoption in high-stakes domains like mental health, domain experts are increasingly consulted to provide input into policies governing their behavior. From an observation of 19 policymaking workshops with 9 experts over 15 weeks, we identified opportunities to better support rapid experimentation, feedback, and iteration for collaborative policy design processes. We present PolicyPad, an interactive system that facilitates the emerging practice of LLM policy prototyping by drawing from established UX prototyping practices, including heuristic evaluation and storyboarding. Using PolicyPad, policy designers can collaborate on drafting a policy in real time while independently testing policy-informed model behavior with usage scenarios. We evaluate PolicyPad through workshops with 8 groups of 22 domain experts in mental health and law, finding that PolicyPad enhanced collaborative dynamics during policy design, enabled tight feedback loops, and led to novel policy contributions. Overall, our work paves participatory paths for advancing AI alignment and safety.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

PolicyPad: Collaborative Prototyping of LLM Policies

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

From Symptoms to Systems: An Expert-Guided Approach to Understanding Risks of Ge...

Proactive Agentic Whiteboards: Enhancing Diagrammatic Learning

Young children's anthropomorphism of an AI chatbot: Brain activation and the rol...

In Silico Development of Psychometric Scales: Feasibility of Representative Popu...

Significant Other AI: Identity, Memory, and Emotional Regulation as Long-Term Re...

Навигация