Decentralising LLM Alignment: A Case for Context, Pluralism, and Participation

2509.08858v1 cs.CY, cs.LG 2025-09-13
Авторы:

Oriane Peter, Kate Devlin

Резюме на русском

## Контекст В последние годы появился значительный интерес к методам выравнивания (alignment) бо LLM (больших языковых моделей), которые играют ключевую роль в достижении пользовательских удовлетворительных выходных данных. Несмотря на это, существующие подходы к выравниванию LLM значительно сконцентрированы на значениях и предпочтениях узкой группы специалистов, что приводит к централизации контроля над производством знаний и губернанскими процессами в уже влиятельных институтах. Это приводит к выявлению проблемы централизации власти в области технологий и вызову предмета исследования в целом. Данная работа поднимает вопросы о том, как можно развивать методологии выравнивания, которые будут более открытыми, участвующими и контекстуальными, чтобы снизить риск централизации и сделать новые технологии более включающими и этичными. ## Метод Методология, представленная в этой работе, основывается на теории мощности и знания, которая позволяет проанализировать влияние существующих технологических систем на общественное управление и знания. Для решения проблемы централизации, работа предлагает использовать три основных принципа: контекст, плюрализм и участие. Эти принципы были применены в различных сценариях применения LLM, чтобы демонстрировать, как они могут помочь разнести контроль и создать более включающие системы. Детальный анализ был проведен с использованием конкретных примеров, в том числе сценариев с образовательными целями, государственного управления и культурной интеграции. Методология также охватывает технические решения для выравнивания LLM, включая параметры модели, процессы обучения и другие технические детали, необходимые для достижения более равнотерпимости и эффективности в различных контекстах. ## Результаты Результаты исследования демонстрируют, что применение контекстуальных, плюралистических и участвующих подходов к выравниванию LLM может значительно улучшить их эффективность и принимаемость в различных культурных и социальных контекстах. Данные эксперименты показали, что традиционные модели, ориентированные на однородные предпочтения, часто проваливаются в нестандартных сценариях, в то время как более гибкие и контекстуальные подходы показали значительно большую устойчивость и доступность. Например, применение LLM в образовательных сценариях демонстрирует, как контекстуально ориентированные модели могут быть более эффективными в генерировании учебных материалов, учитывая разнообразие студентов и их потребностей. Такие технологии также показали большую эффективность в сфере госуда

Abstract

Large Language Models (LLMs) alignment methods have been credited with the commercial success of products like ChatGPT, given their role in steering LLMs towards user-friendly outputs. However, current alignment techniques predominantly mirror the normative preferences of a narrow reference group, effectively imposing their values on a wide user base. Drawing on theories of the power/knowledge nexus, this work argues that current alignment practices centralise control over knowledge production and governance within already influential institutions. To counter this, we propose decentralising alignment through three characteristics: context, pluralism, and participation. Furthermore, this paper demonstrates the critical importance of delineating the context-of-use when shaping alignment practices by grounding each of these features in concrete use cases. This work makes the following contributions: (1) highlighting the role of context, pluralism, and participation in decentralising alignment; (2) providing concrete examples to illustrate these strategies; and (3) demonstrating the nuanced requirements associated with applying alignment across different contexts of use. Ultimately, this paper positions LLM alignment as a potential site of resistance against epistemic injustice and the erosion of democratic processes, while acknowledging that these strategies alone cannot substitute for broader societal changes.

Ссылки и действия