Decentralising LLM Alignment: A Case for Context, Pluralism, and Participation
2509.08858v1
cs.CY, cs.LG
2025-09-13
Авторы:
Oriane Peter, Kate Devlin
Резюме на русском
## Контекст
В последние годы появился значительный интерес к методам выравнивания (alignment) бо LLM (больших языковых моделей), которые играют ключевую роль в достижении пользовательских удовлетворительных выходных данных. Несмотря на это, существующие подходы к выравниванию LLM значительно сконцентрированы на значениях и предпочтениях узкой группы специалистов, что приводит к централизации контроля над производством знаний и губернанскими процессами в уже влиятельных институтах. Это приводит к выявлению проблемы централизации власти в области технологий и вызову предмета исследования в целом. Данная работа поднимает вопросы о том, как можно развивать методологии выравнивания, которые будут более открытыми, участвующими и контекстуальными, чтобы снизить риск централизации и сделать новые технологии более включающими и этичными.
## Метод
Методология, представленная в этой работе, основывается на теории мощности и знания, которая позволяет проанализировать влияние существующих технологических систем на общественное управление и знания. Для решения проблемы централизации, работа предлагает использовать три основных принципа: контекст, плюрализм и участие. Эти принципы были применены в различных сценариях применения LLM, чтобы демонстрировать, как они могут помочь разнести контроль и создать более включающие системы. Детальный анализ был проведен с использованием конкретных примеров, в том числе сценариев с образовательными целями, государственного управления и культурной интеграции. Методология также охватывает технические решения для выравнивания LLM, включая параметры модели, процессы обучения и другие технические детали, необходимые для достижения более равнотерпимости и эффективности в различных контекстах.
## Результаты
Результаты исследования демонстрируют, что применение контекстуальных, плюралистических и участвующих подходов к выравниванию LLM может значительно улучшить их эффективность и принимаемость в различных культурных и социальных контекстах. Данные эксперименты показали, что традиционные модели, ориентированные на однородные предпочтения, часто проваливаются в нестандартных сценариях, в то время как более гибкие и контекстуальные подходы показали значительно большую устойчивость и доступность. Например, применение LLM в образовательных сценариях демонстрирует, как контекстуально ориентированные модели могут быть более эффективными в генерировании учебных материалов, учитывая разнообразие студентов и их потребностей. Такие технологии также показали большую эффективность в сфере госуда
Abstract
Large Language Models (LLMs) alignment methods have been credited with the
commercial success of products like ChatGPT, given their role in steering LLMs
towards user-friendly outputs. However, current alignment techniques
predominantly mirror the normative preferences of a narrow reference group,
effectively imposing their values on a wide user base. Drawing on theories of
the power/knowledge nexus, this work argues that current alignment practices
centralise control over knowledge production and governance within already
influential institutions. To counter this, we propose decentralising alignment
through three characteristics: context, pluralism, and participation.
Furthermore, this paper demonstrates the critical importance of delineating the
context-of-use when shaping alignment practices by grounding each of these
features in concrete use cases. This work makes the following contributions:
(1) highlighting the role of context, pluralism, and participation in
decentralising alignment; (2) providing concrete examples to illustrate these
strategies; and (3) demonstrating the nuanced requirements associated with
applying alignment across different contexts of use. Ultimately, this paper
positions LLM alignment as a potential site of resistance against epistemic
injustice and the erosion of democratic processes, while acknowledging that
these strategies alone cannot substitute for broader societal changes.
Ссылки и действия
Дополнительные ресурсы: