FaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Data
2508.04698v1
cs.CL
2025-08-09
Авторы:
Thibaut Thonet, Germán Kruszewski, Jos Rozen, Pierre Erbacher, Marc Dymetman
Резюме на русском
**Резюме**
Личность и предпочтения пользователя часто не учитываются при развертывании широкомасштабных технологий генерирующих текст, что приводит к стандартизированному пользовательскому опыту. Данная работа фокусируется на задаче Персонализации Предпочтений с Ограниченными Данными (PPALLI), при которой доступно мало заметок о пользовательских предпочтениях. Основная идея — извлекать и использовать высокоуровневые признаки данных для эффективного адаптации моделей.
Мы предлагаем FaST (Feature-aware Sampling and Tuning) — простая и эффективная методика, которая автоматически выявляет и использует основные признаки в данных. Выполнен бенчмарк с использованием двух новых датасетов (DnD и ELIP), подтвердив высокую эффективность FaST в решении задачи PPALLI. Наша работа открывает путь к более личной настройке LLМ-помощников, улучшая пользовательский опыт в ситуациях, где данных ограничено.
Abstract
LLM-powered conversational assistants are often deployed in a
one-size-fits-all manner, which fails to accommodate individual user
preferences. Recently, LLM personalization -- tailoring models to align with
specific user preferences -- has gained increasing attention as a way to bridge
this gap. In this work, we specifically focus on a practical yet challenging
setting where only a small set of preference annotations can be collected per
user -- a problem we define as Personalized Preference Alignment with Limited
Data (PPALLI). To support research in this area, we introduce two datasets --
DnD and ELIP -- and benchmark a variety of alignment techniques on them. We
further propose FaST, a highly parameter-efficient approach that leverages
high-level features automatically discovered from the data, achieving the best
overall performance.
Ссылки и действия
Дополнительные ресурсы: