FaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Data

2508.04698v1 cs.CL 2025-08-09
Авторы:

Thibaut Thonet, Germán Kruszewski, Jos Rozen, Pierre Erbacher, Marc Dymetman

Резюме на русском

**Резюме** Личность и предпочтения пользователя часто не учитываются при развертывании широкомасштабных технологий генерирующих текст, что приводит к стандартизированному пользовательскому опыту. Данная работа фокусируется на задаче Персонализации Предпочтений с Ограниченными Данными (PPALLI), при которой доступно мало заметок о пользовательских предпочтениях. Основная идея — извлекать и использовать высокоуровневые признаки данных для эффективного адаптации моделей. Мы предлагаем FaST (Feature-aware Sampling and Tuning) — простая и эффективная методика, которая автоматически выявляет и использует основные признаки в данных. Выполнен бенчмарк с использованием двух новых датасетов (DnD и ELIP), подтвердив высокую эффективность FaST в решении задачи PPALLI. Наша работа открывает путь к более личной настройке LLМ-помощников, улучшая пользовательский опыт в ситуациях, где данных ограничено.

Abstract

LLM-powered conversational assistants are often deployed in a one-size-fits-all manner, which fails to accommodate individual user preferences. Recently, LLM personalization -- tailoring models to align with specific user preferences -- has gained increasing attention as a way to bridge this gap. In this work, we specifically focus on a practical yet challenging setting where only a small set of preference annotations can be collected per user -- a problem we define as Personalized Preference Alignment with Limited Data (PPALLI). To support research in this area, we introduce two datasets -- DnD and ELIP -- and benchmark a variety of alignment techniques on them. We further propose FaST, a highly parameter-efficient approach that leverages high-level features automatically discovered from the data, achieving the best overall performance.

Ссылки и действия