Balancing Accuracy and Novelty with Sub-Item Popularity
2508.05198v1
cs.IR, cs.AI
2025-08-09
Авторы:
Chiara Mallamaci, Aleksandr Vladimirovich Petrov, Alberto Carlo Maria Mancino, Vito Walter Anelli, Tommaso Di Noia, Craig Macdonald
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Современные системы рекомендаций музыки сталкиваются с фундаментальной дилеммой между точностью предсказаний и способностью предлагать пользователям новый контент. В музыкальной сфере характерной особенностью является повторное прослушивание - пользователи регулярно возвращаются к уже знакомым композициям, что создает сложности для традиционных рекомендательных систем. Это поведение отражает глубоко укоренившиеся музыкальные предпочтения и эмоциональные связи с конкретными треками.
Недавние исследования ввели концепцию Персонализированных Оценок Популярности (Personalised Popularity Scores - PPS), которые количественно измеряют индивидуальные предпочтения пользователей на основе исторической частоты прослушиваний. Хотя PPS значительно улучшает релевантность рекомендаций, метод имеет критический недостаток: он склонен усиливать эффект "фильтрационного пузыря", систематически предлагая пользователям только уже знакомый контент. Это ограничивает способность системы представлять новые или неожиданные музыкальные произведения, которые являются ключевыми факторами долгосрочной вовлеченности пользователя и удовлетворенности от сервиса.
Проблема усугубляется масштабом современных музыкальных каталогов, содержащих миллионы треков. Традиционные подходы, работающие на уровне отдельных музыкальных композиций, неэффективно используют скрытые структурные паттерны, присутствующие в музыкальных данных. Например, разные треки могут разделять общие музыкальные элементы - мелодические фразы, ритмические паттерны или характеристики тембра - которые остаются невидимыми при анализе на уровне целых композиций. Это приводит к потере потенциально ценной информации о повторяющихся паттернах предпочтений, которые могли бы быть использованы для более тонкой балансировки между точностью и новизной рекомендаций.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Авторы предлагают инновационный подход к решению описанной проблемы через переосмысление и адаптацию существующей архитектуры RecJPQ - трансформер-ориентированного фреймворка, первоначально разработанного для улучшения масштабируемости рекомендаций в каталогах с большим количеством элементов через декомпозицию на суб-элементы. Ключевая идея состоит в переносе концепции персонализированной популярности с уровня целых музыкальных композиций на более тонкий уровень суб-идентификаторов (sub-IDs), представляющих латентные структурные компоненты музыкальных треков.
Методология строится на гипотезе, что повторяющиеся паттерны предпочтений пользователей проявляются не только на уровне целых композиций, но и на уровне более примитивных музыкальных характеристик, закодированных в суб-эмбеддингах. Это позволяет выявлять скрытые связи между различными треками, которые могут быть неочевидны при традиционном анализе, но разделяют общие музыкальные элементы, вызывающие повторное прослушивание.
Техническая реализация включает модификацию механизма внимания в архитектуре RecJPQ для учета суб-ID уровневых персонализированных оценок популярности. Это достигается через внедрение специализированного слоя, который динамически корректирует веса внимания на основе исторических паттернов использования суб-элементов. Такой подход обеспечивает явный контроль баланса между точностью рекомендаций и внедрением персонализированной новизны, позволяя систематически регулировать степень эксплорации нового контента в зависимости от контекста и предпочтений конкретного пользователя.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Экспериментальная валидация проводилась на обширных наборах данных, включающих миллионы взаимодействий пользователей с музыкальным контентом из реальных стриминговых платформ. Исследование использовало стандартные метрики оценки качества рекомендаций, включая Precision@K, Recall@K, NDCG@K для измерения точности, а также специализированные метрики для оценки новизны и серендипитности рекомендаций.
Ключевым результатом стало стабильное превосходство предложенного метода sPPS (sub-ID level Personalised Popularity Scores) над традиционным подходом PPS на уровне целых композиций. Конкретно, sPPS продемонстрировал статистически значимое улучшение по метрикам персонализированной нов
Abstract
In the realm of music recommendation, sequential recommenders have shown
promise in capturing the dynamic nature of music consumption. A key
characteristic of this domain is repetitive listening, where users frequently
replay familiar tracks. To capture these repetition patterns, recent research
has introduced Personalised Popularity Scores (PPS), which quantify
user-specific preferences based on historical frequency. While PPS enhances
relevance in recommendation, it often reinforces already-known content,
limiting the system's ability to surface novel or serendipitous items - key
elements for fostering long-term user engagement and satisfaction. To address
this limitation, we build upon RecJPQ, a Transformer-based framework initially
developed to improve scalability in large-item catalogues through sub-item
decomposition. We repurpose RecJPQ's sub-item architecture to model
personalised popularity at a finer granularity. This allows us to capture
shared repetition patterns across sub-embeddings - latent structures not
accessible through item-level popularity alone. We propose a novel integration
of sub-ID-level personalised popularity within the RecJPQ framework, enabling
explicit control over the trade-off between accuracy and personalised novelty.
Our sub-ID-level PPS method (sPPS) consistently outperforms item-level PPS by
achieving significantly higher personalised novelty without compromising
recommendation accuracy. Code and experiments are publicly available at
https://github.com/sisinflab/Sub-id-Popularity.
Ссылки и действия
Дополнительные ресурсы: