📚 Саммари научных статей из arXiv

Найдено 211 результатов по запросу 'cs.IR, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 CFDA & CLIP at TREC iKAT 2025: Enhancing Personalized Conversational Search via Query Reformulation and Rank Fusion

2025-09-23

Авторы:

Yu-Cheng Chang, Guan-Wei Yeo, Quah Eugene, Fan-Jie Shih, Yuan-Ching Kuo, Tsung-En Yu, Hung-Chun Hsu, Ming-Feng Tsai, Chuan-Ju Wang

## Контекст Современное интеллектуальное помощничество в сфере поиска информации стремится к более естественным и эффективным способам взаимодействия с пользователями. Одним из ключевых вызовов является улучшение личных поисковых рекомендаций, которые должны учитывать предпочтения пользователя, предыдущие запросы и контекстный контент. Несмотря на прогресс в области контентной лингвистики и моделей естественного языка, требования к реальному времени и эффективности часто ограничивают возможности полного использования этих моделей в реальных системах поиска. Таким образом, важно разработать стратегии, которые обеспечивают адекватное балансирование между точностью, эффективностью и надежностью. В этом контексте проводится рассмотрение проблемы в TREC Interactive Knowledge Assistance Track (iKAT) 2025, которая призвана расширить знания о конвергенции технических решений для повышения качества пользовательских взаимодействий с поисковой системой. ## Метод Задача разработки системы для поддержки пользовательского поиска решается с помощью комбинированных подходов к реформулировке запросов и стратегиям фюзирования рейтингов. Алгоритмы CFDA и CLIP используются для реформулировки запросов, чтобы улучшить их точность и релевантность. Для обеспечения эффективности в работе с большими объемами данных применяется Reciprocal Rank Fusion (RRF) для интеграции результатов из разных источников. Также используется Best-of-$N$ стратегия для выбора наиболее подходящих результатов в рамках ограничений реального времени. Архитектура системы представляет собой комбинацию этих компонентов, что позволяет выполнить операции как в реальном времени, так и в условиях определенных экспериментов с фиксированными данными. ## Результаты Проведены эксперименты с использованием данных из TREC iKAT 2025, включая задачи интерактивного и оффлайнного поиска. Результаты показали, что стратегия реформулирования запросов CFDA & CLIP способна улучшить точность и соответствие пользовательским запросам. Фюзирование рейтингов RRF и стратегия Best-of-$N$ позволяют достичь более устойчивых и эффективных результатов в разных условиях. Однако были выявлены торможения, связанные с увеличением времени обработки при повышении степени детализации и комплексности запросов. Эти результаты подтверждают значимость стратегий, но также указывают на необходимость дальнейших исследований для повышения производительности. ## Значимость Разработанная система имеет потенциал для применения в различных сферах, включая поисковые системы, медицинский поиск, юридический поиск и другие области, где точность и эффективность важны

Annotation:

The 2025 TREC Interactive Knowledge Assistance Track (iKAT) featured both interactive and offline submission tasks. The former requires systems to operate under real-time constraints, making robustness and efficiency as important as accuracy, while the latter enables controlled evaluation of passage ranking and response generation with pre-defined datasets. To address this, we explored query rewriting and retrieval fusion as core strategies. We built our pipelines around Best-of-$N$ selection an...

ID: 2509.15588v1 cs.IR, cs.AI

arXiv PDF

📄 Chunk Knowledge Generation Model for Enhanced Information Retrieval: A Multi-task Learning Approach

2025-09-23

Авторы:

Jisu Kim, Jinhee Park, Changhyun Jeon, Jungwoo Choi, Keonwoo Kim, Minji Hong, Sehyun Kim

## Контекст Информационная система, основанная на запросах, широко используется в различных областях, от поисковых систем до библиотек. Однако традиционные методы для расширения запросов и документов, например, Doc2Query, имеют определенные ограничения, такие как высокая стоимость препроцессинга, увеличение размера индекса и недостаточная надежность генерируемого контента. Эти проблемы приводят к ухудшению точности поиска и эффективности взаимодействия пользователя с системой. Для решения этих задач необходимо разработать более эффективный и точный подход к расширению документов и запросов. ## Метод Предлагаемый подход, **Chunk Knowledge Generation Model (CKGM)**, разбивает документы на отдельные чанки (сегменты) и генерирует текстовую информацию для каждого чанка. Это подходят для расширения как документов, так и запросов. Модель основывается на T5 с использованием мультизадачного обучения, которая одновременно генерирует заголовки и вопросы к каждому чанку, а также извлекает ключевые слова из пользовательских запросов. Такая структура позволяет эффективно использовать ресурсы, так как данные генерируются и извлекаются параллельно в рамках одного кодирования и двух декодирований. ## Результаты Оценка модели производилась с помощью GPT-алгоритма на основе 305 пар "запрос-документ". Модель CKGM показала 95.41% точность в Top@10, что значительно превышает достижения традиционных методов. Эта модель не только улучшает точность поиска, но и экономит ресурсы за счет уменьшения размера индекса и уменьшения объема препроцессинга. Эти результаты демонстрируют улучшенную эффективность и надежность в расширении запросов и документов. ## Значимость Улучшенная модель поиска возможности применения в больших системах, таких как библиотеки, электронные библиотеки, интернет-поисковые системы. Решение позволяет улучшить точность, экономить ресурсы и обеспечить более надежную систему. Будущие исследования могут фокусироваться на дополнительных улучшениях модели, включая использование нейросетей с более широкими возможностями и применение этого подхода к различным языкам и специальным областям. ## Выводы Предложенный подход, Chunk Knowledge Generation Model, проявляет существенные преимущества по сравнению с традиционными методами расширения документов и запросов. Он эффективно расширяет данные, улучшает точность поиска и сокращает ресурсоемкость. Эти результаты открывают новые перспективы для улучшения информационных систем и систем поиска, обеспечивая более точный и эффективный поиск. Дальнейшие исследования могут расширить применение этого подхода в различных сферах, включая многоязычный поиск и с

Annotation:

Traditional query expansion techniques for addressing vocabulary mismatch problems in information retrieval are context-sensitive and may lead to performance degradation. As an alternative, document expansion research has gained attention, but existing methods such as Doc2Query have limitations including excessive preprocessing costs, increased index size, and reliability issues with generated content. To mitigate these problems and seek more structured and efficient alternatives, this study pro...

ID: 2509.15658v1 cs.IR, cs.AI

arXiv PDF

📄 Efficient and Versatile Model for Multilingual Information Retrieval of Islamic Text: Development and Deployment in Real-World Scenarios

2025-09-22

Авторы:

Vera Pavlova, Mohammed Makhlouf

#### Контекст Информационное поисковое обращение (Information Retrieval, IR) широко применяется в различных сферах жизнедеятельности, включая литературные исследования, юридическое обслуживание, медицинское обслуживание и многие другие. Однако в области исследований, посвященных многоязычному IR, существует необходимость в более глубоком исследовании, как модели могут применяться в реальном мире. Это главная мотивация для данного исследования. Особенно актуальной является задача разработки модели, которая могла бы быть полезна в уникальных источниках знаний, таких как Коран. Данная работа посвящена поиску и разработке методологии, которая была бы эффективна для многоязычного поиска в контексте Ислама. #### Метод В ходе работы была разработана и протестирована 11 моделей извлечения информации, используя четыре различные методики обучения: монолингвальная, кросс-лингвальная, train-all (обучение на транслированных данных) и смешанная (комбинация монолингвального и кросс-лингвального обучения). На каждой модели был проведен эксперимент по извлечению ответов на вопросы в различных языковых контекстах. Использовались специально подготовленные данные в формате SQuAD, где задания были переведены на несколько языков, чтобы охватить широкий круг пользователей. Архитектура модели основывалась на предварительно обученных моделях для многоязычного текста, адаптированных для поиска в контексте Корана. #### Результаты Проведенные эксперименты показали, что модель, обученная смешанным методом, обеспечивает наиболее эффективные результаты в различных сценариях извлечения информации. Эта модель не только показала высокую точность в извлечении ответов, но и продемонстрировала высокую универсальность для различных языков. Особенно важно, что эта модель может быть развернута в реальных условиях, показывая большую эффективность в сравнении с другими моделями. Был проведен подробный анализ, показывающий, как различные методики обучения влияют на эмбеддинг-пространство и, как следствие, на эффективность поиска. #### Значимость Разработанная модель показала себя как эффективная и универсальная для многоязычного извлечения информации в контексте Ислама. Она может быть применена в различных сферах, включая образовательные ресурсы, учебные курсы, и медицинскую информацию. Особенно ценным является ее мобильность и затраты на развертывание, так как модель является легковесной и может быть развернута в разных средах. Это позволяет снизить затраты и увеличить доступность решения для пользователей. #### Выводы Разработанная модель демонстрирует высокую эффектив

Annotation:

Despite recent advancements in Multilingual Information Retrieval (MLIR), a significant gap remains between research and practical deployment. Many studies assess MLIR performance in isolated settings, limiting their applicability to real-world scenarios. In this work, we leverage the unique characteristics of the Quranic multilingual corpus to examine the optimal strategies to develop an ad-hoc IR system for the Islamic domain that is designed to satisfy users' information needs in multiple lan...

ID: 2509.15380v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 When Content is Goliath and Algorithm is David: The Style and Semantic Effects of Generative Search Engine

2025-09-20

Авторы:

Lijia Ma, Juan Qin, Xingchen Xu, Yong Tan

## Контекст Generative search engines (GEs) используют большие языковые модели (LLMs) для генерирования сводных статей с источниками сайтов. Это создает новые каналы для привлечения пользователей и вносит существенные изменения в ландшафт оптимизации поиска (SEO). Такие поисковые системы преобразуют традиционную модель поиска, где почти вся информация получается из внешних источников, на модель, в которой многое сгенерировано автоматически. Однако GEs всё ещё страдают от недостатка понимания их особенностей и потенциала, что делает анализ их стиля и семантики ключевым для их эффективного развития. ## Метод Мы собираем данные с интеракций с обычными и GEs поисковыми системами. Данные собираются в виде ссылок на сайты, предоставляемых поисковыми системами. Затем мы проводим анализ этих данных с помощью различных методов статистического и аналитического анализа. Особое внимание уделяется моделированию поведения GEs при выборе сайтов и стилевых приоритетов в сгенерированных статьях. Для экспериментов мы используем ретриев-аугментед generation (RAG) APIs, чтобы исследовать влияние LLM на выбор источников и стиль генерирования. ## Результаты Наши результаты показывают, что GEs предпочитают сайты с высокой предсказуемостью для LLMs и семантической близостью между выбранными источниками. Мы также обнаружили, что LLM-полишинг (оптимизация сайтов с использованием LLM) не только увеличивает диверсификацию сгенерированной информации, но и улучшает её качество для разных пользовательских групп. Например, высокообразованные пользователи, проходя экспериментальные задачи, получают выгоду от более быстрого выполнения задач благодаря улучшенному стилю, в то время как менее образованные пользователи приобретают более широкую информационную диверсификацию в своих выполненных задачах. ## Значимость Результаты нашей работы имеют большой потенциал в различных областях, включая оптимизацию сайтов, SEO, информационные системы и генерируемую контентную оптимизацию. Эти возможности могут положительно влиять на развитие интернета, улучшая качество информации и увеличивая доступность ресурсов для разнообразных пользователей. Будущие исследования будут сосредоточены на уточнении моделей LLM для генерирования и оптимизации контента, а также на исследовании дальнейшего влияния GEs на поведение пользователей. ## Выводы Мы проанализировали особенности стиля и семантики в GEs и изучили влияние LLM-полишинга на выбор источников и качество сгенерированной информации. Наши находки подчеркивают важность точного понимания LLM-тенденций для оптимизации сайтов и улучшения пользовательского опыта. Э

Annotation:

Generative search engines (GEs) leverage large language models (LLMs) to deliver AI-generated summaries with website citations, establishing novel traffic acquisition channels while fundamentally altering the search engine optimization landscape. To investigate the distinctive characteristics of GEs, we collect data through interactions with Google's generative and conventional search platforms, compiling a dataset of approximately ten thousand websites across both channels. Our empirical analys...

ID: 2509.14436v1 cs.IR, cs.AI, H.3.3; I.2.7; J.4

arXiv PDF

📄 Modernizing Facebook Scoped Search: Keyword and Embedding Hybrid Retrieval with LLM Evaluation

2025-09-19

Авторы:

Yongye Su, Zeya Zhang, Jane Kou, Cheng Ju, Shubhojeet Sarkar, Yamin Wang, Ji Liu, Shengbo Guo

## Контекст В сети социальных сетей, таких как Facebook, пользователи часто используют поисковые системы для поиска информации и установления контактов в социальном контексте. Однако классические методы поиска, основанные только на ключевых словах, часто ограничиваются связанным с контекстом пониманием пользовательских запросов. Это приводит к неудовлетворительной точности и скверной разнообразию результатов. Другим важным аспектом является то, что существующие системы поиска часто не включают в свою работу семантическое понимание, что снижает эффективность и связанность с контекстом. Мы предлагаем рамыку, которая совмещает классический ключевой поиск с подходом на основе векторов входа (Embedding-Based Retrieval, EBR). Это позволяет улучшить качество и разнообразие поисковых результатов, обеспечивая более контекстуально связанные результаты для пользователей в конкретной группе социальной сети. ## Метод Мы предлагаем рамыку, которая сочетает классический ключевой поиск с подходом на основе векторов входа (Embedding-Based Retrieval, EBR). Наш подход интегрирует семантический поиск в существующую конвейерную систему поиска по ключевым словам. Мы тесно интегрируем EBR в систему, чтобы улучшить релевантность результатов и разнообразие. Метод основывается на непрерывных векторах входа, которые представляют пользователя, поисковые запросы и контент. Эти векторы обучены с помощью трансформеров, чтобы лучше ловить связи между пользователями, группами и содержимым. Наша модель обучается на огромной коллекции данных, включающих поисковые запросы, группы и посты, чтобы оптимизировать релевантность и разнообразие поисковых результатов. Мы также внедрили новую оценочную модель, использующую большие модели языка (LLMs), что позволяет автоматически оценивать релевантность поисковых результатов на основе контекста. ## Результаты Мы провели ряд экспериментов, используя реальные поисковые запросы и данные из групп Facebook. Наши результаты показывают, что интегрированный подход к поиску, который сочетает ключевой поиск и EBR, значительно повышает качество и разнообразие результатов поиска. Мы оценивали наши результаты с помощью онлайн-метрик, таких как количество щелчков, времени на странице и коэффициент возврата пользователей, что показало значительное улучшение пользовательского кредита в сравнении с классическим ключевым поиском. Кроме того, мы использовали LLM-based evaluation, чтобы обеспечить скалируемую и точную оценку релевантности. Это позволило нам измерить качество результатов поиска в более строгом контексте, продемонстри

Annotation:

Beyond general web-scale search, social network search uniquely enables users to retrieve information and discover potential connections within their social context. We introduce a framework of modernized Facebook Group Scoped Search by blending traditional keyword-based retrieval with embedding-based retrieval (EBR) to improve the search relevance and diversity of search results. Our system integrates semantic retrieval into the existing keyword search pipeline, enabling users to discover more ...

ID: 2509.13603v1 cs.IR, cs.AI

arXiv PDF

📄 Mind the Gap: Aligning Knowledge Bases with User Needs to Enhance Mental Health Retrieval

2025-09-19

Авторы:

Amanda Chan, James Jiayu Liu, He Kai, Onno P. Kampman

## Контекст Существуются многочисленные проблемы с доступом к надежной информации в области ментального здоровья, которые затрудняют эффективное взаимодействие систем автоматической поддержки. Одной из основных проблем является недостаточная адаптация знаний в центрах поддержки к потребностям пользователей, что приводит к неэффективному поиску решений и неэффективным использованию систем. Это создает ситуацию, в которой пользователи не могут получить доступ к точной информации в ситуациях, когда они нуждаются в ней. Таким образом, возникает необходимость в развитии методов, которые позволят адаптировать информационные ресурсы к потребностям пользователей, улучшив надежность и эффективность систем поддержки. ## Метод Авторы предлагают алгоритм, основанный на применении методов глубокого обучения, чтобы анализировать и идентифицировать пробелы в знаниях системы. Они используют натуральные данные, такие как сообщения на форумах, чтобы выявить проблемные области, которые не охвачены в достаточном количестве в базах знаний. Таким образом, они могут структурировать информацию, которая будет лучше соответствовать пользовательским запросам. Для идентификации проблемных областей используются принципы графовой модели, которая позволяет выделять пробелы в информации. Алгоритм также применяет методы генеративного моделирования для создания моделей, которые могут генерировать дополнительные данные для заполнения этих пробелов. ## Результаты Результаты экспериментов показали, что использование данных, "натурально" сформированных пользователями, позволяет эффективно "закрывать" пробелы в знаниях. Это приводит к улучшению качества восстановления информации, уменьшению количества ложных срабатываний и увеличению точности. Эксперименты проводились на данных, содержащихся в ряде значительных баз данных, таких как семантические сети и истории пользователей. Использование методов, основанных на графах, позволило выявлять связи между различными проблемными областями, что позволяло детерминировано идентифицировать пробелы в знаниях. Эта методика позволила повысить эффективность систем поддержки с 82% до 94%, что является существенным улучшением. ## Значимость Эта работа имеет важное значение в области поддержки ментального здоровья, так как она позволяет создавать более точные и эффективные системы поддержки. Эта методика может быть применена в различных сферах, включая поддержку здоровья, образования и юридическую помощь. Это не только повышает качество поддержки, но и уменьшает трудоемкость для создания новых знаний, та

Annotation:

Access to reliable mental health information is vital for early help-seeking, yet expanding knowledge bases is resource-intensive and often misaligned with user needs. This results in poor performance of retrieval systems when presented concerns are not covered or expressed in informal or contextualized language. We present an AI-based gap-informed framework for corpus augmentation that authentically identifies underrepresented topics (gaps) by overlaying naturalistic user data such as forum pos...

ID: 2509.13626v1 cs.IR, cs.AI, H.3.3; J.3; I.2.7

arXiv PDF

📄 InfoGain-RAG: Boosting Retrieval-Augmented Generation via Document Information Gain-based Reranking and Filtering

2025-09-18

Авторы:

Zihan Wang, Zihan Liang, Zhou Shao, Yufei Ma, Huangyu Dai, Ben Chen, Lingtao Mao, Chenyi Lei, Yuqing Ding, Han Li

## Контекст Retrieval-Augmented Generation (RAG) является прорывом в области генерируемых бо LLM-системами текстов, способствуя решению трех основных проблем: hallucination, устаревшей информации и отсутствия ссылок. Однако, существующие RAG-фреймворки часто сталкиваются с проблемой оценки значимости полученных документов для генерации точных ответов. Это затрудняет отбор нужных фрагментов и отсеивание ненужных, что влияет на качество ответа. Для решения этой проблемы нужна метрика, которая сможет эффективно оценивать вклад каждого документа в генерацию корректных ответов. ## Метод Мы предлагаем **Document Information Gain (DIG)** — новую метрику для оценки значимости документов. DIG вычисляется как разница между уровнем уверенности LLM в генерации ответов с использованием документа и без него. Мы также предлагаем **InfoGain-RAG** — фреймворк, использующий DIG для построения специальной системы рейтингов. Эта система отбирает документы с наиболее точным соотнесением и отсеивает ненужные, улучшая результат генерации ответов. ## Результаты Мы провели эксперименты на различных моделях и наборах данных. На NaturalQA InfoGain-RAG показал улучшение в exact match accuracy на 17.9%, 4.5% и 12.5% по сравнению с тремя популярными RAG-решениями. На GPT-4o InfoGain-RAG дал среднее увеличение точности ответов на 15.3% по всем датасетам. Эти результаты доказывают, что InfoGain-RAG эффективно отбирает значимые документы и улучшает качество генерируемых ответов в разных сценариях. ## Значимость Предложенный подход может быть применен в различных областях, где требуется высококачественная информация, таких как здравоохранение, юридическое обслуживание и финансы. Он позволяет избегать ошибок, связанных с неточными ответами, и повышает уровень доверия к генерируемым текстам. Этот фреймворк может полностью изменить стандарты в области RAG. ## Выводы Мы представили InfoGain-RAG — систему, которая доказала свою эффективность в локализации и отборе наиболее полезных документов. Наше исследование открывает новые пути для развития RAG, стабилизируя его и улучшая качество генерируемых ответов. Мы также планируем продолжать работу над улучшением DIG и интеграцией с другими моделями.

Annotation:

Retrieval-Augmented Generation (RAG) has emerged as a promising approach to address key limitations of Large Language Models (LLMs), such as hallucination, outdated knowledge, and lacking reference. However, current RAG frameworks often struggle with identifying whether retrieved documents meaningfully contribute to answer generation. This shortcoming makes it difficult to filter out irrelevant or even misleading content, which notably impacts the final performance. In this paper, we propose Doc...

ID: 2509.12765v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 Membership Inference Attacks on Recommender System: A Survey

2025-09-17

Авторы:

Jiajie He, Yuechun Gu, Keke Chen, Xintong Chen

## Контекст **Анализ рекомендательных систем** (Recommender Systems, RecSys) и **членские осуществительные атаки** (Membership Inference Attacks, MIAs) являются ключевыми направлениями в современных искусственных нейронных сетях и программных системах. RecSys широко применяются в электронной коммерции, финансах, здравоохранении, социальных сетях и других областях, которые влияют на поведение и решения пользователей. Однако, недавние исследования показали, что RecSys рискуют **членскими осуществительными атаками** (МИА), которые пытаются определить, был ли использован конкретный запись пользователя в обучении модели рекомендации. Такие атаки могут привести к утечке личных данных и нарушению конфиденциальности. Например, злоумышленник может идентифицировать, что покупка определенного пользователя была использована для обучения модели, что дает им доступ к индивидуальным предпочтениям и характеристикам. Несмотря на то, что МИА широко рассматриваются в других областях машинного обучения, таких как классификационные модели и NLP, на RecSys эти атаки требуют специальных технических решений из-за специфики работы рекомендательных моделей. Несмотря на быстрое развитие этой области, пока не было проведено ни одного систематического исследования, посвященного RecSys MIAs. ## Метод **Методология**, используемая в статье, включает в себя тщательный обзор современных работ по RecSys MIAs. Авторы разработали унифицированную систему категоризации, которая делит RecSys MIAs на категории, основанные на их особенностях, таких как тип модели, способ обучения или вид атаки. Для этого использовались методы теоретического анализа, которые помогли рассмотреть существующие подходы к защите от MIAs, а также их ограничения. Особое внимание было уделено изучению вызовов, связанных с RecSys MIAs, таких как недостаточность данных, сложность моделирования и проблемы переобучения. Этот подход позволил авторам проанализировать текущее состояние исследований и выявить недостатки и перспективы развития. ## Результаты В ходе исследований были проанализированы **для различных RecSys MIAs**, в том числе их моделирование, атаки и защита. Авторы провели эксперименты, используя различные данные, включая рекомендательные системы из сфер E-commerce, финансов и социальных сетей. Затем они оценили эффективность различных методов защиты, таких как гибридные модели, маскирование данных и введение шума. Эксперименты показали, что некоторые методы защиты могут снизить вероятность атак, но при этом снижают точность рекомендаций. Основными результатами являются выявление типов RecSys, которые более уязвимы к МИА, и разработка новых подходов к защите от таких атак, которые

Annotation:

Recommender systems (RecSys) have been widely applied to various applications, including E-commerce, finance, healthcare, social media and have become increasingly influential in shaping user behavior and decision-making, highlighting their growing impact in various domains. However, recent studies have shown that RecSys are vulnerable to membership inference attacks (MIAs), which aim to infer whether user interaction record was used to train a target model or not. MIAs on RecSys models can dire...

ID: 2509.11080v1 cs.IR, cs.AI, cs.CR

arXiv PDF

📄 Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio

2025-09-17

Авторы:

Luca Casini, Laura Cros Vila, David Dalmazzo, Anna-Kaisa Kaila, Bob L. T. Sturm

## Контекст Онлайн-платформы для создания музыки с использованием текстовых подсказок (AI music), такие как Suno и Udio, привлекли сотни тысяч пользователей. Эти платформы находят применение в рекламе и даже в чартах музыкальных хитов в нескольких странах. Насколько эффективно и широко используются эти сервисы? Какие темы вдохновляют их пользователей? Целью данного исследования является осуществить подробный анализ этих вопросов, основываясь на большой коллекции музыки, сгенерированной пользователями Suno и Udio с мая по октябрь 2024 года. Результаты этого анализа должны пролить свет на поведение пользователей, их интересы и стратегии взаимодействия с AI-системами. ## Метод Для получения данных были использованы музыкальные композиции, созданные пользователями Suno и Udio в указанный период. Методология исследования включала сочетание нескольких стандартных методов, включая текстовые модели для эмбеддингов, методы снижения размерности и кластеризацию. Эти техники были применены для анализа текстовых подсказок, тегов и текстов песен. Далее, полученные результаты были автоматически обработаны и представлены в виде интерактивных визуализаций, позволяющих проанализировать и анализировать данные с разных углов. ## Результаты На основе исследования были выявлены основные темы в текстах песен, такие как любовь, жизнь и персональные опыты. Также были выявлены различные стратегии взаимодействия с AI-системами, включая использование мета-тегов для направления вывода моделей. Было выявлено, что пользователи предпочитают определенные языки для создания текстов, что влияет на конечный результат. Еще одним значимым результатом было выявление аномалий в поведении пользователей, в том числе попыток "стейкинга" АИ, чтобы повлиять на результат. ## Значимость Результаты этого исследования имеют значительное значение для музыкальных исследований, особенно в контексте развития AI-технологий в музыкальном производстве. Они позволяют понять, как пользователи взаимодействуют с AI-системами, как они используют текстовые подсказки, а также как эти системы могут быть обмануты. Эти полученные результаты могут быть применены в музыкальной промышленности для улучшения систем AI, для развития новых музыкальных жанров и для изучения культурных явлений, связанных с AI-музыкой. ## Выводы Основные достижения этой работы заключаются в получении подробного анализа текстов и стратегий взаимодействия с AI-системами, создающими музыку. Были выявлены значимые темы и языковые предпочтения, а также выявлены

Annotation:

Online AI platforms for creating music from text prompts (AI music), such as Suno and Udio, are now being used by hundreds of thousands of users. Some AI music is appearing in advertising, and even charting, in multiple countries. How are these platforms being used? What subjects are inspiring their users? This article answers these questions for Suno and Udio using a large collection of songs generated by users of these platforms from May to October 2024. Using a combination of state-of-the-art...

ID: 2509.11824v1 cs.IR, cs.AI, cs.LG, cs.SD

arXiv PDF

📄 Diversified recommendations of cultural activities with personalized determinantal point processes

2025-09-16

Авторы:

Carole Ibrahim, Hiba Bederina, Daniel Cuesta, Laurent Montier, Cyrille Delabre, Jill-Jênn Vie

## Контекст В современном мире, системы рекомендаций становятся важной частью жизнедеятельности людей, особенно в сфере культурных мероприятий. Однако оптимизация этих систем для увеличения количества пользовательских взаимодействий часто приводит к уменьшению разнообразия рекомендаций. Это может привести к убыванию интереса пользователей к предложенным мероприятиям и, как следствие, к потере эффективности системы. Данное исследование адресует эту проблему, стремясь сочетать наилучшую релевантность рекомендаций с их разнообразием. Использование новых методов, таких как Determinantal Point Processes (DPPs), дает возможность придать большее значение пользовательским предпочтениям без потери качества рекомендаций. ## Метод Для решения данной задачи используется **методология персонализированных Determinantal Point Processes (DPPs)**. Эти процессы основываются на матрице схожести между элементами рекомендаций, где каждый элемент оценивается с учетом пользовательских предпочтений. Для повышения релевантности рекомендаций применяется **качественно-разнообразийная декомпозиция**, которая позволяет увеличить вес пользовательских предпочтений в процессе выбора. Архитектура системы включает несколько этапов: сбор пользовательских данных, построение матрицы схожести, оптимизация DPP-модели и формирование рекомендаций. Технические решения включают использование методов машинного обучения и алгоритмов оптимизации для эффективного вычисления рекомендаций. ## Результаты В ходе исследования были проведены эксперименты на реальных данных, полученных из системы рекомендаций культурных мероприятий. Эти данные включали оценки пользователей различных мероприятий, таких как выставки, концерты и театральные представления. Использование DPP-модели позволило повысить разнообразие рекомендаций без существенного снижения их релевантности. **Полученные результаты** показали, что пользователи более довольны рекомендациями, когда они включают разнообразие, но при этом сохраняют значительную релевантность к их предпочтениям. Онлайн-метрики, такие как TAP (time-to-action) и CTR (click-through rate), также показали позитивный эффект от применения персонализированных DPP-моделей. ## Значимость Предлагаемый подход имеет **широкие области применения** в сфере культурной индустрии, онлайн-тренингах, социальных сетях и маркетинге. Основные **преимущества** заключаются в улучшении разнообразия рекомендаций, что приводит к увеличению количества пользовательских взаимодействий, а также к более полному удовлетворению потребностей пользователей. Данный подход может **повлиять** на развитие культуры, повышая доступность различных меропри

Annotation:

While optimizing recommendation systems for user engagement is a well-established practice, effectively diversifying recommendations without negatively impacting core business metrics remains a significant industry challenge. In line with our initiative to broaden our audience's cultural practices, this study investigates using personalized Determinantal Point Processes (DPPs) to sample diverse and relevant recommendations. We rely on a well-known quality-diversity decomposition of the similarit...

ID: 2509.10392v1 cs.IR, cs.AI

arXiv PDF

1
2
11
12
13
14
15
21
22

Показано 121 - 130 из 211 записей