📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

William Walden, Marc Mason, Orion Weller, Laura Dietz, Hannah Recknor, Bryan Li, Gabrielle Kaili-May Liu, Yu Hou, James Mayfield, Eugene Yang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Generation of long-form, citation-backed reports is a primary use case for retrieval augmented generation (RAG) systems. While open-source evaluation tools exist for various RAG tasks, ones tailored to report generation are lacking. Accordingly, we introduce Auto-ARGUE, a robust LLM-based implementation of the recent ARGUE framework for report generation evaluation. We present analysis of Auto-ARGUE on the report generation pilot task from the TREC 2024 NeuCLIR track, showing good system-level c...
ID: 2509.26184v2 cs.IR, cs.AI, cs.CL
Авторы:

Mengchen Zhao, Yifan Gao, Yaqing Hou, Xiangyang Li, Pengjie Gu, Zhenhua Dong, Ruiming Tang, Yi Cai

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Recommendation models are predominantly trained using implicit user feedback, since explicit feedback is often costly to obtain. However, implicit feedback, such as clicks, does not always reflect users' real preferences. For example, a user might click on a news article because of its attractive headline, but end up feeling uncomfortable after reading the content. In the absence of explicit feedback, such erroneous implicit signals may severely mislead recommender systems. In this paper, we pro...
ID: 2509.22807v1 cs.IR, cs.AI
Авторы:

Zishuo Xu, Yuhong Gu, Dezhong Yao

#### Контекст С ростом Web 2.0 и микросервисной архитектуры число Web-API растет в стремительной степени, что усложняет поиск и рекомендацию эффективных API. На сегодняшний день существуют две главные категории методов рекомендации API: тип рекомендации, где каждое API считается отдельной меткой для классификации, и метод поиска, который фокусируется на поиске совпадений в машапах. Однако существует три основных проблемы: 1) семантические неоднозначности при сравнении описаний API и машапов, 2) недостаточность детальных сравнений между отдельным API и машапом при рекомендации, 3) высокая затрата времени при поиске API. Для решения этих проблем мы предлагаем WARBERT, модель на основе BERT с иерархической архитектурой, которая обеспечивает точную семантическую представление API и машапов, а также эффективность в процессе рекомендации. #### Метод WARBERT представляет собой иерархическую модель, использующую функции двойной компонентной особенности и аннотационные сравнения. Она состоит из двух основных компонентов: WARBERT(R) для рекомендации и WARBERT(M) для поиска. WARBERT(R) фильтрует кандидатские API, а WARBERT(M) уточняет результаты с помощью расчета сходства между кандидатами и машапом. Решение о подходящем API определяется с помощью комбинации прогнозов от WARBERT(R) и WARBERT(M). Кроме того, WARBERT(R) включает в себя вспомогательную задачу классификации машапов, что увеличивает его точность в выборе кандидатов. #### Результаты Мы проводили эксперименты с использованием данных ProgrammableWeb, чтобы оценить эффективность WARBERT. Модель показала значительные улучшения по сравнению с предыдущими решениями. Она повысила точность рекомендаций на до 11.7% по сравнению с MTFM (Multi-Task Fusion Model), в то же время сократила время работы задачи рекомендации. Эти результаты подтверждают, что WARBERT эффективно справляется с тремя ключевыми проблемами: решает неоднозначности в сравнении, улучшает сравнение API с машапом и уменьшает время работы. #### Значимость Модель WARBERT может применяться в различных областях, где требуется автоматическая рекомендация Web-API, включая разработку приложений, анализ данных и интеграцию сервисов. Ее особенностью является высокая точность и быстрота работы, что делает ее привлекательной для решения проблем эффективности в микросервисных системах. Благодаря своей иерархической структуре и инновационным подходам к сравнению, WARBERT может стать ключевым инструментом для улучшения качества рекомендаций в будущем. #### Выводы WARBERT достигает высокой точности и эффективности в рекомендации Web-API, устраняя три главных проблемы: семантические неоднозначности, не
Annotation:
With the emergence of Web 2.0 and microservices architecture, the number of Web APIs has increased dramatically, further intensifying the demand for efficient Web API recommendation. Existing solutions typically fall into two categories: recommendation-type methods, which treat each API as a label for classification, and match-type methods, which focus on matching mashups through API retrieval. However, three critical challenges persist: 1) the semantic ambiguities in comparing API and mashup de...
ID: 2509.23175v1 cs.IR, cs.AI
Авторы:

Haiyang Yang, Qinye Xie, Qingheng Zhang, Liyu Chen, Huike Zou, Chengbao Lian, Shuguang Han, Fei Huang, Jufeng Chen, Bo Zheng

#### Контекст В современном электронном коммерции (e-commerce), эффективное понимание продуктовой информации является ключевым фактором успеха бизнеса. Однако существуют проблемы, связанные с организацией продуктовой информации в структурированном виде. Например, многие продукты, особенно в сегменте бытовой техники, селективной и люксовой техники, остаются недостаточно охваченными существующими системами категоризации и атрибутирования. Это приводит к низкой эффективности поиска и рекомендации, а также снижению качества удовлетворения потребностей покупателей. Таким образом, необходимо разработать методы, которые бы способствовали более точному пониманию продуктов и их адекватной организации. #### Метод GSID (Generative Semantic Indexing) представляет собой новую подход к структурированию продуктовой информации с использованием генерируемых семантических кодов. Методология GSID построена на двух основных компонентах: (1) **Предварительная обработка неструктурированной метаинформации продуктов** с помощью глубоких нейронных сетей для извлечения и векторных представлений; (2) **Построение семантических кодов**, которые являются более точными и адаптированными для применения в нишевой торговле. Этот подход способствует повышению точности и понимания продуктов, а также улучшает их отображение в системах поиска и рекомендаций. #### Результаты Проведены многочисленные эксперименты, включающие оценку точности семантического индекса, сравнение с другими подходами и исследования его применимости к реальным задачам. Эксперименты показали, что GSID превосходит существующие методы в задачах, таких как классификация продуктов, поиск и рекомендация. Например, в задаче классификации GSID показал улучшение точности на 15% по сравнению с базовым методом. Также наблюдалось увеличение вероятности того, что пользователи найдут подходящий продукт в первые 10 рекомендаций, что подтверждает эффективность этого подхода в реальных условиях. #### Значимость GSID может быть применен в различных сферах, таких как интернет-магазины, вторичные биржи товаров и услуг, а также в системах рекомендаций. Одним из главных преимуществ является повышение точности восприятия продуктов, что приводит к более эффективной работе систем поиска, рекомендаций и категоризации. Благодаря этому, GSID может способствовать повышению удовлетворения потребностей пользователей, увеличению продаж и увеличению эффективности электронных платформ. #### Выводы GSID достигает заметных улучшений в понимании продуктов и их структурировании, что является ключевым фактором для усп
Annotation:
Structured representation of product information is a major bottleneck for the efficiency of e-commerce platforms, especially in second-hand ecommerce platforms. Currently, most product information are organized based on manually curated product categories and attributes, which often fail to adequately cover long-tail products and do not align well with buyer preference. To address these problems, we propose \textbf{G}enerative \textbf{S}emantic \textbf{I}n\textbf{D}exings (GSID), a data-driven ...
ID: 2509.23860v1 cs.IR, cs.AI
Авторы:

Huike Zou, Haiyang Yang, Yindu Su, Liyu Chen, Chengbao Lian, Qingheng Zhang, Shuguang Han, Jufeng Chen

## Контекст Продуктная атрибутивная идентификация (PAVI) является ключевым заданием для улучшения поиска, рекомендации и бизнес-аналитики на электронных торговых платформах. Однако, существующие методы PAVI сталкиваются с рядом проблем, включая ошибки скрейпления, невозможность обработки значений атрибутов, отсутствующих в обучающих данных, и недостаточную общую универсальность. Эти ограничения приводят к недостаточной точности и нежелательным последствиям в реальных производственных ситуациях. Мы предлагаем Multi-Value-Product Retrieval-Augmented Generation (MVP-RAG) — новый подход, который объединяет принципы реконструкции, генерации текста и классификации для решения этих проблем. ## Метод MVP-RAG предлагает новый подход к PAVI, определяя его как задачу объединения реконструкции и генерации текста. Запрос выполняется с помощью описания продукта, а кандидаты по атрибутам и продуктам формируются на основе внедренной модели вектора. MVP-RAG включает в себя три этапа: (1) хранение результатов рекурсивного поиска с применением запроса к категории и атрибутам, (2) генерацию значений атрибутов с помощью БПЛА с трансформером, (3) классификацию генерируемых значений с помощью простых моделей. Эта структура позволяет обеспечить высокую точность и универсальность, а также уменьшать последствия недостатка тренировочных данных. ## Результаты Мы провели широкий анализ MVP-RAG на основе реальных промышленных данных. Метод был сравнен с другими лучшими базовыми методами, в том числе с подходом, основанным на классических моделях регрессии и классификации. Результаты показали, что MVP-RAG обеспечивает большую точность в идентификации атрибутов, особенно при работе с нестандартными или новыми значениями. Он также демонстрирует высокую стабильность при работе с большими наборами данных и в условиях несовершенства тренировочных данных. ## Значимость Предлагаемый подход применим в многих областях, включая промышленную аналитику, электронную коммерцию и рекомендательные системы. Он предлагает несколько преимуществ, включая уменьшение ошибок скрейпления, улучшение обработки нестандартных значений, а также увеличение общей универсальности модели. Результаты MVP-RAG подтверждают, что он может значительно улучшить производительность в промышленных ситуациях, где точность и универсальность критически важны. ## Выводы MVP-RAG представляет собой новый подход к PAVI, который объединяет принципы реконструкции, генерации и классификации. Он показал себя эффективнее существующих методов в ряде ключевых ас
Annotation:
Identifying attribute values from product profiles is a key task for improving product search, recommendation, and business analytics on e-commerce platforms, which we called Product Attribute Value Identification (PAVI) . However, existing PAVI methods face critical challenges, such as cascading errors, inability to handle out-of-distribution (OOD) attribute values, and lack of generalization capability. To address these limitations, we introduce Multi-Value-Product Retrieval-Augmented Generati...
ID: 2509.23874v1 cs.IR, cs.AI
Авторы:

Mingshi Xu, Haoren Zhu, Wilfred Siu Hung Ng

## Контекст Поиск эффективных методов построения системы рекомендаций последовательностей является важной задачей в области машинного обучения. Одним из ключевых вызовов является нестабильность и шум в пользовательских данных о взаимодействии. Из-за этого, модели, основанные на маскированной активности, часто оказываются слишком чувствительными к этим факторам, что приводит к ухудшению точности прогнозирования. Это ставит перед исследователями задачу разработки более устойчивых и точных моделей для рекомендаций последовательностей. ## Метод Метод, предложенный в статье, основывается на разработке многопутевого механизма активности (MIQ-Attn), который использует несколько разных векторов запроса из пользовательских данных. Этот подход позволяет сократить эффект шума в данных и улучшить стабильность модели. Механизм MIQ-Attn предлагается как дополнение к существующим моделям, легко интегрируемый с ними в качестве замены единичному запросу в алгоритмах. Таким образом, он может быть использован для улучшения любых моделей, основанных на активности. ## Результаты Исследователи проверили свой подход на нескольких бенчмарк-датасетах, сравнивая результаты с традиционными моделями. Эксперименты показали, что MIQ-Attn существенно повышает точность рекомендаций и улучшает устойчивость модели к шуму в данных. На основе этих результатов можно сделать вывод, что MIQ-Attn является эффективным инструментом для решения проблем нестабильности в последовательных рекомендациях. ## Значимость Этот подход может быть применен в различных областях, включая рекомендации покупок, медиа-контента, социальных сетей и других системах, где необходимо предоставить пользователю наиболее актуальные и подходящие рекомендации. Особым преимуществом является увеличение устойчивости модели к внешним факторам и шумам в данных, что может привести к более точным и надежным результатам. ## Выводы Результаты исследования показывают, что MIQ-Attn является эффективным методом для улучшения стабильности и точности моделей последовательных рекомендаций. Будущие исследования могут сосредоточиться на расширении этого подхода для работы с более сложными данными и исследовании его применения в различных прикладных сферах.
Annotation:
The inherent instability and noise in user interaction data challenge sequential recommendation systems. Prevailing masked attention models, relying on a single query from the most recent item, are sensitive to this noise, reducing prediction reliability. We propose the Multi-Item-Query attention mechanism (MIQ-Attn) to enhance model stability and accuracy. MIQ-Attn constructs multiple diverse query vectors from user interactions, effectively mitigating noise and improving consistency. It is des...
ID: 2509.24424v1 cs.IR, cs.AI, cs.LG
Авторы:

Junwei Lan, Jianlyu Chen, Zheng Liu, Chaofan Li, Siqi Bao, Defu Lian

#### Контекст Современные глубоко обученные языковые модели (LLM) позволяют решать сложные задачи, включая документ-регрессию (RAG), где необходимо выявлять информацию из документов для решения задач. Однако возникает проблема точной оценки связи между задачей и кандидатскими документами, особенно когда эта связь не является явной. Это создает серьезные обрестки для существующих методов информационного поиска (IR). Недостаток точности и эффективности в оценке связи приводит к неверным выводам и неэффективности в использовании ресурсов. Таким образом, нужна новая методология, которая бы учитывала тонкую логику при оценивании документов и повышала производительность в целом. #### Метод Мы предлагаем Retro*, новую систему для решения документ-регрессии, основанную на рейтинге согласно четко определенным критериям. Метод включает в себя следующие элементы: 1. **Рубрика-ориентированная оценка релевантности**: Retro* использует формальные критерии для оценки того, насколько документ отвечает требованиям задачи. Это позволяет получить развернутую интерпретируемую оценку релевантности. 2. **Множественные пути рассуждения**: Метод поддерживает тестирование, объединяя несколько логических траекторий в единый балл релевантности, что повышает точность оценки. 3. **Оптимизация через RL**: Мы предлагаем усовершенствованный алгоритм, который использует два композитных признака для оценки каждого образца во время тренировки. Эти черты обеспечивают глубокую работу с логическими задачами и эффективность в применении. #### Результаты Мы проверили Retro* на BRIGHT benchmark, что позволило сравнить его с другими существующими методами. Результаты показали, что Retro* показывает значительное превосходство в долготерминальной точности и эффективности. Таким образом, Retro* демонстрирует новую стандартную систему по работе с документ-регрессией, показывая выдающиеся результаты в сложных сценариях с малой или неявной связью между задачей и документом. #### Значимость Предложенная система может использоваться в различных областях, где требуется точная интерпретация документов, например, в здравоохранении, в системах поддержки решений и в системах управления бизнес-данными. В отличие от существующих подходов, Retro* обеспечивает: - **Точность**: Оценка релевантности с более высоким уровнем точности. - **Производительность**: Высокая скорость и эффективность при работе с большими объемами данных. - **Скейлинг**: Может работать в различных условиях с ресурсоемкими задачами. #### Выводы Retro* представляет собой совершенно новый подход к до
Annotation:
With the growing popularity of LLM agents and RAG, it has become increasingly important to retrieve documents that are essential for solving a task, even when their connection to the task is indirect or implicit. Addressing this problem requires fine-grained reasoning to accurately assess the relevance between the task and each candidate document. This capability, however, poses a significant challenge for existing IR techniques. Despite recent progress in reasoning-enhanced IR, existing approac...
ID: 2509.24869v1 cs.IR, cs.AI, cs.CL
Авторы:

Zhangchi Zhu, Wei Zhang

## Контекст Кросс-Энтропийный (CE) потери широко используется в обучении с учителем в задачах рекомендательных систем, особенно при использовании методов классификации для оценки релевантности предложенных объектов пользователю. Однако при использовании CE в методах классификации возникают проблемы, такие как нехватка сигнала слабых объектов, что может привести к ухудшению качества. Например, в случае рекомендательных систем, когда учитель и ученик работают со смешанными данными, CE может недостаточно учитывать целевые оценки, что приводит к неэффективному обучению. Для решения этой проблемы необходимо разработать эффективный подход, который учитывает особенности работы системы и позволяет достичь лучшей точности в задаче рекомендации. ## Метод Мы предлагаем разработать усовершенствованный подход к классификации, который будет учитывать специфику работы рекомендательных систем. Это может включать в себя развитие модели, которая будет учитывать не только релевантность предложенных объектов, но и сигналы от слабых объектов. Модель должна иметь возможность адаптироваться к разным форматам данных и обеспечивать высокую точность в рекомендации. Также нужно разработать эффективные методы для оценки качества прогнозов, которые будут учитывать не только целевые оценки, но и сигналы от неточных прогнозов. Это позволит добиться более точных рекомендаций и улучшить пользовательский опыт. ## Результаты В нашем исследовании мы проводили эксперименты с различными моделями, в том числе с моделью CE и предлагаемой моделью RCE-KD. Для сравнения использовались различные данные, включая данные из реальных рекомендательных систем. Мы измерили качество рекомендаций с помощью метрик, таких как NDCG и MAP. Результаты показали, что RCE-KD оказалась эффективнее CE в задаче классификации, особенно в случае смешанных данных. Это было достигнуто благодаря тому, что RCE-KD учитывала сигналы от слабых объектов и адаптировалась к разным форматам данных. Таким образом, наши результаты демонстрируют, что предлагаемая модель может быть эффективно использована в реальных рекомендательных системах. ## Значимость Предлагаемый подход может быть применен в различных областях, где необходимо решать задачи классификации и рекомендации. Особенно эффективен он в случаях, когда данные смешанны, и необходимо учитывать не только целевые оценки, но и сигналы от слабых объектов. Наш подход обеспечивает более точные рекомендации и может привести к улучшению качества работы рекомендательных систем. Благодаря этому можно повысить удовлетворенность пользователей и увеличить эффективность рекомендательных систем. ## Выводы Мы доказали
Annotation:
This paper analyzes Cross-Entropy (CE) loss in knowledge distillation (KD) for recommender systems. KD for recommender systems targets at distilling rankings, especially among items most likely to be preferred, and can only be computed on a small subset of items. Considering these features, we reveal the connection between CE loss and NDCG in the field of KD. We prove that when performing KD on an item subset, minimizing CE loss maximizes the lower bound of NDCG, only if an assumption of closure...
ID: 2509.20989v1 cs.IR, cs.AI
Авторы:

Cem Ashbaugh, Leon Baumgärtner, Tim Gress, Nikita Sidorov, Daniel Werner

#### Контекст В условиях повсеместного использования социальных сетей в качестве источников информации возникает критически важная проблема — точного сопоставления неявных утверждений, сделанных в социальных медиа, с их источниками в научной литературе. Это необходимо для эффективного доказательства фактов, ноу-хау-создания и развития научных дискуссий. Однако это задача сложная из-за lexical sparsity (ограниченности лексического варианта), очень коротких запросов и доменно-ориентированной лексикографии, которые существенно затрудняют обнаружение соответствий. На CLEF-2025 CheckThat! LAB в рамках Subtask 4b, посвященном этому вопросу, команда AIRwaves стала второй, предложив мощный и эффективный подход к решению данной проблемы. #### Метод Выполнение этой задачи предлагается в двух этапах. На первом этапе применяется алгоритм sparse retrieval, оптимизированный с использованием BM25. На втором этапе вводится новая архитектура, основанная на dual encoder и neural re-ranking. Dual encoder тренируется на большом датасете с использованием in-batch и mined hard negatives, а также чанкированием токенов и добавлением дополнительной метаинформации в документы. Для дополнительной оценки релевантности используется SciBERT cross-encoder для neural re-ranking. Этот подход позволяет сильно повысить качество сравнения запросов и документов, превратив лишь lexical matching в размерность нейронных представлений. #### Результаты Проведенные эксперименты показали высокую эффективность предложенного подхода. На gold label blind test set, стандартный sparse retrieval (BM25) показал MRR@5 = 0.5025. Однако использование dual encoder способствовало повышению результатов до MRR@5 = 0.6174, а полностью модель, включающую neural re-ranking, показала совершенно новый результат — MRR@5 = 0.6828. Это значительно превосходит остальные конкуренты и демонстрирует эффективность комбинации dense retrieval с neural re-ranking в решении задачи tweet-to-study matching. #### Значимость Предложенный подход имеет широкие применения в области evidence-based fact-checking, scientific discourse и academic research. Он обеспечивает более точное и эффективное сопоставление неявных утверждений со своими источниками, что повышает качество контента и помогает улучшить трансформационные процессы в науке. Решение также демонстрирует возможности neural re-rankers в улучшении sparse retrieval, что может быть применено в других областях, где требуется высокоточное соотнесение коротких запросов с документами. #### Выводы Проведенные исследования демонстрируют, что модель AIRwaves представляет собой эффективное и надежное решение для tweet-to-study matching. Она улучшает значительно качество сравнения запросов и документов, используя dual encoder и neural re-ranking. Будущие исследования будут фокусироваться на расширении датасетов, улучшении cross-encoder и исследовании других моделей, по
Annotation:
Linking implicit scientific claims made on social media to their original publications is crucial for evidence-based fact-checking and scholarly discourse, yet it is hindered by lexical sparsity, very short queries, and domain-specific language. Team AIRwaves ranked second in Subtask 4b of the CLEF-2025 CheckThat! Lab with an evidence-retrieval approach that markedly outperforms the competition baseline. The optimized sparse-retrieval baseline(BM25) achieves MRR@5 = 0.5025 on the gold label blin...
ID: 2509.19509v1 cs.IR, cs.AI, cs.LG
Авторы:

Tuo Zhang, Yuechun Sun, Ruiliang Liu

Опубликовано: 13 января 2025 г. ## Контекст ### Область исследования Проблематика происхождения археологических объектов, или провенанс, является ключевым аспектом вступательного анализа в археологии. Однако традиционные методы анализа часто требуют значительных поправок, введения ручных коррекций и наличия специализированных знаний. Это значительно снижает эффективность и доступность этого процесса для менее опытных исследователей. ### Мотивация Существует необходимость в развитии методов, которые могут автоматически обрабатывать большие корпусы данных, обеспечивая точные и интерпретируемые выводы. Такой подход может существенно сократить время и труд, необходимый для проведения раннего анализа. ## Метод ### Описание методологии Предложенная система основывается на технологии Retrieval-Augmented Generation (RAG) и использует значительные модели зрения и языка (VLMs). Она создает двухрежимную знанийную базу, которая объединяет текстовые справочные материалы и изображения. ### Технические решения Система поддерживает три типа визуального поиска: 1. **Raw Visual Retrieval** — поиск по RAW-изображениям. 2. **Edge-Enhanced Retrieval** — поиск по усиленным контурам. 3. **Semantic Retrieval** — поиск по семантичному содержимому. Выводимое содержимое включает: - Хронологические, географические и культурные принадлежности. - Интерпретируемые выводы с объяснениями. ## Результаты ### Используемые данные Оценка системы проводилась на корпусе из Восточно-Евразийских знаменательных объектов Древней Западной Эры, содержащихся в Британском Музее. ### Результаты экспериментов Система предоставила точные и значимые выводы, включая хронологические и географические характеристики, а также стилистические сходства. Эксперты отметили, что выводы системы значительно облегчают начальный анализ и снижают когнитивную нагрузку. ## Значимость ### Области применения Система может быть применена в археологии, истории искусств и обработке изображений для анализа объектов культурного наследия. ### Преимущества Она обеспечивает точные выводы, снижает когнитивный напряжение исследователей и может быть интегрирована в более широкие инструментальные пакеты для обработки артефактов. ### Потенциальное влияние В будущем это может привести к новым возможностям в цифровой археологии, в том числе автоматического классификации и сравнения объектов. ## Выводы ### Основные достижения Предложенная система демонстрирует высокую эффективность в выводе информации о происхождени
Annotation:
In this work, we present a retrieval-augmented generation (RAG)-based system for provenance analysis of archaeological artifacts, designed to support expert reasoning by integrating multimodal retrieval and large vision-language models (VLMs). The system constructs a dual-modal knowledge base from reference texts and images, enabling raw visual, edge-enhanced, and semantic retrieval to identify stylistically similar objects. Retrieved candidates are synthesized by the VLM to generate structured ...
ID: 2509.20769v1 cs.IR, cs.AI, cs.CV
Показано 101 - 110 из 211 записей