📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 FusedANN: Convexified Hybrid ANN via Attribute-Vector Fusion

2025-09-26

Авторы:

Alireza Heidari, Wei Zhang, Ying Xiong

#### Контекст Современные технологии, основанные на трансформерах, способны эффективно обрабатывать векторные запросы, но реальной практике часто требуются запросы, комбинирующие векторную схожесть с атрибутивными фильтрами. Например, поиск "лучшего документа в категории X, от 2023 года". Текущие решения часто требуют сбалансированного компромисса между выявлением (recall), скоростью и гибкостью. Они опираются на усложненные структуры индексов, которые не справляются с масштабированием. Мы предлагаем FusedANN (Fused Attribute-Vector Nearest Neighbor) — новую геометрическую модель, которая интегрирует фильтрацию в оптимизационные ограничения для АНН (ближайших соседей по векторам), используя релаксацию Лагранжа. Наш подход объединяет атрибуты и векторы в единую модель, превращая жесткие фильтры в непрерывные, взвешенные пенальти, сохраняя при этом топ-k семантику и эффективность поиска. #### Метод Мы предлагаем новую архитектуру FusedANN, основанную на трансформерах, которая соединяет векторные и атрибутивные пространства в единое пространство через ковексная формализация. Это позволяет превратить жесткие атрибутивные фильтры в непрерывные взвешенные задачи, которые могут быть эффективно разрешены с помощью оптимизационных методов. Фильтры воспринимаются как постоянные критерии, но с весами, которые могут быть урезаны в случае невозможности точного соответствия. Эта гибкость позволяет гарантировать top-k результаты, даже при неполном соответствии. Мы также доказываем, что FusedANN сохраняет гарантии аппроксимации АНН и может быть легко адаптирован для различных задач. #### Результаты Мы провели эксперименты с FusedANN на стандартных бенчмарках для систем гибридного поиска. Наши результаты показывают, что FusedANN превосходит текущие системы гибридного и графового поиска, достигая до 3 раз вышей пропускной способности и более высокой точности. Мы также проверили FusedANN на реальных задачах, в которых требовалась как точность, так и быстрота. Наши результаты показали, что FusedANN не только обеспечивает высокую производительность, но и позволяет удалить ненужные слои фильтрации, что упрощает инфраструктуру и повышает надежность. #### Значимость FusedANN может быть применен в различных областях, включая модели естественного языка, модели машинного обучения и другие приложения, требующие быстрого и точного поиска. Он предлагает новый подход к решению задач связывания векторных данных с атрибутивными фильтрами, который является более эффективным и гибким по сравнению с существующими техно

Annotation:

Vector search powers transformers technology, but real-world use demands hybrid queries that combine vector similarity with attribute filters (e.g., "top document in category X, from 2023"). Current solutions trade off recall, speed, and flexibility, relying on fragile index hacks that don't scale. We introduce FusedANN (Fused Attribute-Vector Nearest Neighbor), a geometric framework that elevates filtering to ANN optimization constraints and introduces a convex fused space via a Lagrangian-like...

ID: 2509.19767v1 cs.IR, cs.AI, cs.DB, math.OC

arXiv PDF

📄 Multimodal Representation-disentangled Information Bottleneck for Multimodal Recommendation

2025-09-26

Авторы:

Hui Wang, Jinghui Qin, Wushao Wen, Qingling Li, Shanshan Zhong, Zhongzhan Huang

#### Контекст Рекомендательные системы становятся важной частью современных цифровых платформ, помогая пользователям выбирать товары, услуги или контент. Использование многомодальных данных, таких как текст, изображения и метаданные, стало ключевым подходом для улучшения точности рекомендаций. Однако эти системы часто сталкиваются с проблемами, такими как наличие ненужной или дублирующейся информации, которая может снижать качество рекомендаций. Большинство существующих подходов либо неэффективно объединяют множество модальностей, либо прибегают к строгому разделению архитектур, недостаточно эффективно отфильтровывая ненужные сигналы. Этот факт побудил авторов разработать новую модель, которая бы аккуратно отделяла полезную информацию от шума и моделировала сложное взаимодействие между модальностями. #### Метод Предлагаемая модель, Multimodal Representation-disentangled Information Bottleneck (MRdIB), основывается на идее информационного бутцелла. Она использует подходы для сжатия многомодальных представлений, эффективно отфильтровывая ненужные сигналы. Для дальнейшей декомплексации многомодальной информации, MRdIB разделяет ее на три субъективных компоненты: уникальную, дублирующуюся и синергетическую. Для этого применяются специальные ограничения: цель уникальной информации, снижающаяся по отношению к дублирующейся, и цель синергетической, которая позволяет выделить взаимодействия. Эта трехступенчатая стратегия позволяет модели лучше ориентироваться на целевую задачу рекомендаций, оставив за собой только самую полезную информацию. #### Результаты Разработчики проверили эффективность MRdIB на нескольких современных моделях и трех различных рекомендательных базах данных. Использовались различные метрики качества рекомендаций, такие как NDCG и Recall. Результаты показали, что MRdIB превосходит имеющиеся методы в сравнительных экспериментах, улучшая качество рекомендаций благодаря более точной и декомплексной обработке мультимодальных данных. Модель доказала свою мощь в различных контекстах, включая видеорекомендации и товары в интернет-магазинах. #### Значимость Предложенный подход может быть применен в различных областях, где требуется качественный вариант рекомендаций, включая электронную коммерцию, социальные сети и медиа. Основное преимущество MRdIB заключается в его универсальности и точности, особенно в ситуациях с большим объемом многомодальных данных. Будущие исследования могут сосредоточиться на дальнейшем усовершенствовании этой модели, а также его применении в сложных сценариях, таких как работа с видео и музы

Annotation:

Multimodal data has significantly advanced recommendation systems by integrating diverse information sources to model user preferences and item characteristics. However, these systems often struggle with redundant and irrelevant information, which can degrade performance. Most existing methods either fuse multimodal information directly or use rigid architectural separation for disentanglement, failing to adequately filter noise and model the complex interplay between modalities. To address thes...

ID: 2509.20225v1 cs.IR, cs.AI

arXiv PDF

📄 Equip Pre-ranking with Target Attention by Residual Quantization

2025-09-25

Авторы:

Yutong Li, Yu Zhu, Yichen Qiao, Ziyu Guan, Lv Shao, Tong Liu, Bo Zheng

## Контекст Одна из основных задач промышленных систем рекомендаций — достичь баланса между эффективностью и эффективностью в стадии предварительного ранжирования (pre-ranking). Эффективные модели, такие как Target Attention (TA), обладают высокой мощностью по взаимодействию признаков, но их высокая сложность вычислений делает их неприменимыми для использования в предварительном ранжировании, где требуется максимальная эффективность. Традиционно, в этой стадии применяются простые модели на основе векторного произведения, что приводит к ухудшению качества рекомендаций. Эта проблема является значимой более-менее всеми промышленными системами рекомендаций, которым необходимо обеспечить высокую скорость работы, не ущербив качеству рекомендаций. Целью нашей работы является разработка метода, который сможет эффективно применяться в предварительном ранжировании, сочетая высокую точность с низкой сложностью. ## Метод Мы предлагаем TARQ (Target Attention with Residual Quantization) — новую архитектуру для предварительного ранжирования, которая призвана приблизить модель предварительного ранжирования к Target Attention. Так как TARQ основан на квантовании резидентного признака (residual quantization), он позволяет уменьшить вычислительные затраты, не теряя в качестве. Идея архитектуры заключается в следующем: мы используем компоненты Target Attention в качестве основной модели, но заменяем части ее вычислений на эффективные методы квантования, чтобы оптимизировать производительность. Эта техника позволяет ускорить процесс ранжирования без ущерба для точности рекомендаций. ## Результаты Мы провели ряд экспериментов на больших датасетах, включая реальные данные сервиса Taobao. Наши результаты показывают, что TARQ значительно превосходит традиционные модели в предварительном ранжировании по метрикам качества, таким как AUC (Area Under Curve) и Precision@N. Особенно значительные улучшения были замечены на больших датасетах, где требуется высокая скорость работы. Более того, в рамках больших онлайн-экспериментов A/B-тестирования в системе Taobao мы получили увеличение в рентабельности и удовлетворенности пользователей в результате развертывания TARQ. ## Значимость Предлагаемый метод может быть применен в широком кругу промышленных рекомендательных систем, где необходимо повысить точность рекомендаций при ограниченных вычислительных ресурсах. Одним из основных преимуществ TARQ является его изящное сочетание точности Target Attention с высокой эффективностью, которое позволяет улучшить качество рекомендаций в рамках требований к скорости работы. Мы ожидаем, что этот подход может иметь будущие применения в других областях, где требуется быстрая эффективная модель для ранжирования. ##

Annotation:

The pre-ranking stage in industrial recommendation systems faces a fundamental conflict between efficiency and effectiveness. While powerful models like Target Attention (TA) excel at capturing complex feature interactions in the ranking stage, their high computational cost makes them infeasible for pre-ranking, which often relies on simplistic vector-product models. This disparity creates a significant performance bottleneck for the entire system. To bridge this gap, we propose TARQ, a novel pr...

ID: 2509.16931v2 cs.IR, cs.AI, cs.LG, I.2.0; I.5.0; I.7.0

arXiv PDF

📄 The Ranking Blind Spot: Decision Hijacking in LLM-based Text Ranking

2025-09-25

Авторы:

Yaoyao Qian, Yifan Zeng, Yuchao Jiang, Chelsi Jain, Huazheng Wang

## Контекст Современные боLARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE LARGE

Annotation:

Large Language Models (LLMs) have demonstrated strong performance in information retrieval tasks like passage ranking. Our research examines how instruction-following capabilities in LLMs interact with multi-document comparison tasks, identifying what we term the "Ranking Blind Spot", a characteristic of LLM decision processes during comparative evaluation. We analyze how this ranking blind spot affects LLM evaluation systems through two approaches: Decision Objective Hijacking, which alters the...

ID: 2509.18575v1 cs.IR, cs.AI

arXiv PDF

📄 Comparing RAG and GraphRAG for Page-Level Retrieval Question Answering on Math Textbook

2025-09-24

Авторы:

Eason Chen, Chuangji Li, Shizhuo Li, Conrad Borchers, Zimo Xiao, Chloe Qianhui Zhao, Jionghao Lin, Kenneth R. Koedinger

## Контекст Основная задача технологий-обучающихся средах — обеспечить студентам доступ к релевантному материалу, связанному с вопросами, возникающими во время самостоятельного изучения. Большие языковые модели (LLMs) появились как мощные инструменты для обработки информации, однако их эффективность часто ограничивается общими задачами, не имеющими явного алгоритмического подхода к конкретным доменам, таким как учебники или слайды. Особенно трудно добиться высокого качества алгоритмов в области поиска и воспроизведения ответа на вопросы в учебных материалах. Наша исследовательская группа определилась с целью протестировать методы Retrieval-Augmented Generation (RAG), которые могут повысить качество работы программ-помощников в обучении. В статье особое внимание уделено сравнению двух подходов: стандартного RAG и GraphRAG, который использует в своей основе знания из графа. ## Метод Мы разработали специальный датасет, состоящий из 477 пар вопрос-ответ, каждая из которых связана с отдельной страницей учебника по математике. Этот датасет позволил нам протестировать системы RAG в реальных условиях. Методом RAG используется генеративная модель для поиска и обработки ответов на основе входных запросов. Методом GraphRAG используется дополнительная структура данных — граф, хранящий связи между концепциями и ключевыми понятиями, что должно улучшить поиск информации. Мы оценивали качество систем по двум критериям: точности поиска (насколько верна страница, предложенная алгоритмом) и качество генерируемых ответов (насколько правильно и полно они отвечают на вопрос). ## Результаты Наши эксперименты показали, что RAG выполняет поиск с высокой точностью, выделяя только самое необходимое количество страниц, что приводит к лучшему результату по F1-мере (для того, чтобы измерить качество сгенерированных ответов). Метод GraphRAG, несмотря на свои преимущества в моделировании связей между понятиями, часто возвращает большое количество лишней информации, что снижает качество ответов. Мы также проводили эксперименты с реиндексацией страниц с помощью LLM, но это не привносило существенного выигрыша и, в некоторых случаях, даже приводило к фантомным ответам. ## Значимость Результаты нашего исследования имеют большое значение для создания надежных систем помощи в обучении. Метод RAG более подходит для задач, где требуется высокая точность в поиске, в то время как GraphRAG может быть эффективнее для работы с материалами, где связи между концепциями играют ключевую роль. Наши находки могут способствовать развитию сов

Annotation:

Technology-enhanced learning environments often help students retrieve relevant learning content for questions arising during self-paced study. Large language models (LLMs) have emerged as novel aids for information retrieval during learning. While LLMs are effective for general-purpose question-answering, they typically lack alignment with the domain knowledge of specific course materials such as textbooks and slides. We investigate Retrieval-Augmented Generation (RAG) and GraphRAG, a knowledge...

ID: 2509.16780v1 cs.IR, cs.AI, cs.HC

arXiv PDF

📄 Equip Pre-ranking with Target Attention by Residual Quantization

2025-09-24

Авторы:

Yutong Li, Yu Zhu, Yichen Qiao, Ziyu Guan, Lv Shao, Tong Liu, Bo Zheng

#### Контекст Pre-ranking является критическим этапом в индустриальных системах рекомендаций, так как определяет качество дальнейших рекомендаций. Однако существует существенное противоречие между эффективностью и точностью в этой стадии. Точные модели, такие как Target Attention (TA), могут хорошо подстроиться под сложные интерфейсы, но их высокая стоимость вычислений делает их неприменимыми для пре-ранкинга. Это приводит к снижению качества и меньшему значению пользователю. #### Метод TARQ — новая модель пре-ранкинга, основанная на резидентном отображении, которая приближает моделирование к TA. Основная идея заключается в использовании детерминированного генеративного подхода для эмуляции сложного взаимодействия признаков. За счет эффективного вычислительного упрощения и адаптивной архитектуры, TARQ эффективно применяет целевую аттенцию в пре-ранкинге, улучшая точность без значительного увеличения затрат. #### Результаты TARQ был испытан на больших данных системы Taobao. Он прошел не только оффлайн-эксперименты, но и большой скоростью симулируемого пре-ранкинга в онлайне. Результаты показали значительный прирост точности и эффективности, превосходя существующие модели. #### Значимость TARQ может применяться в различных системах рекомендаций, где существует необходимость совмещения точности и скорости. Он позволяет улучшить качество рекомендаций за счет эффективного использования ресурсов. Это ведет к повышению удовлетворенности пользователей и повышению производительности системы в целом. #### Выводы TARQ достигает нового состояния точности и эффективности в пре-ранкинге. Наша модель уже действует в реальности, служит миллионам пользователей и показывает существенный бизнес-прогресс. Будущие исследования будут направлены на углубление понимания и улучшение методологии TARQ.

Annotation:

ID: 2509.16931v1 cs.IR, cs.AI, cs.LG, I.2.0; I.5.0; I.7.0

arXiv PDF

📄 SeqUDA-Rec: Sequential User Behavior Enhanced Recommendation via Global Unsupervised Data Augmentation for Personalized Content Marketing

2025-09-24

Авторы:

Ruihan Luo, Xuanjing Chen, Ziyang Ding

#### Контекст Personalized content marketing является ключевым инструментом для диджитальных платформ, способствующим доставке узконацеленных рекламных объявлений и рекомендаций, соответствующих потребностям пользователей. Однако, существующие рекомендательные системы имеют две ограниченности: (1) зависимость от ограниченных супервизорных сигналов, полученных из явных отзывов пользователей, и (2) уязвимость к шумным или случайным взаимодействиям. Данные ограничения приводят к уменьшению точности и надежности рекомендаций. Для решения этих проблемы, мы предлагаем SeqUDA-Rec — новую глубокую обучаемую модель, которая эффективно интегрирует поведенческие последовательности пользователей со сложной глобальной увеличением данных для повышения точности и устойчивости рекомендаций. #### Метод SeqUDA-Rec основывается на сочетании поведенческих последовательностей пользователей и глобальных методов увеличения данных для повышения рекомендательной точности. Для этого мы строим Global User-Item Interaction Graph (GUIG), который характеризует локальные и глобальные взаимосвязи между пользователями и предметами. Для извлечения прочных эмбеддингов мы применяем модуль graph contrastive learning, который обучается параллельно с последовательным моделем на основе Transformer, предназначенной для моделирования эволюции пользовательских предпочтений. Для того, чтобы увеличить разнообразие и компенсировать нехватку супервизорных меток, мы внедрили GAN-подобную стратегию для генерации возможных поведенческих моделей и дополнения обучающих данных. #### Результаты Мы проводили эксперименты на двух реальных данных из рекламного маркетинга: Amazon Ads и TikTok Ad Clicks. Результаты показали, что SeqUDA-Rec значительно превосходит состояние техники в рекомендательных моделях, таких как SASRec, BERT4Rec и GCL4SR. Модель достигла 6.7% улучшения в NDCG@10 и 11.3% в HR@10. Эти результаты демонстрируют эффективность SeqUDA-Rec в решении задач personalized content marketing и intelligent content recommendation. #### Значимость Предлагаемая модель может быть применена в различных областях, включая personalized advertising, intelligent content recommendation и даже в сфере e-commerce. Основной преимущество SeqUDA-Rec заключается в его способности использовать глобальные модели для повышения точности и устойчивости рекомендаций в ситуациях, когда данные являются шумными или неполными. Это влияние может привести к улучшению пользовательского опыта, увеличению конверсии и увеличению дохода от рекламных кампаний. #### Выводы Мы представили SeqUDA-Rec, модель, которая эффективно интегрирует поведенческие последовательности с глобальными методами увеличения данных для улучшения рекомендательных систем. Наши результаты показали, что SeqUDA-Rec превосходит состояния техники и может играть ключевую роль в intelligent content recommendation. Бу

Annotation:

Personalized content marketing has become a crucial strategy for digital platforms, aiming to deliver tailored advertisements and recommendations that match user preferences. Traditional recommendation systems often suffer from two limitations: (1) reliance on limited supervised signals derived from explicit user feedback, and (2) vulnerability to noisy or unintentional interactions. To address these challenges, we propose SeqUDA-Rec, a novel deep learning framework that integrates user behavior...

ID: 2509.17361v1 cs.IR, cs.AI

arXiv PDF

📄 A Knowledge Graph-based Retrieval-Augmented Generation Framework for Algorithm Selection in the Facility Layout Problem

2025-09-24

Авторы:

Nikhil N S, Amol Dilip Joshi, Bilal Muhammed, Soban Babu

#### Контекст В случае Facility Layout Problem (FLP), NP-трудного задания с многоцелевым трейдоффом, выбор алгоритма решения требует подробного знания о проблеме. Результаты алгоритмов зависят от характеристик задачи, таких как масштаб, цели и ограничения. Это создает необходимость в системах, рекомендующих алгоритмы на основе данных, чтобы упростить автоматизированные системы проектирования. Основной проблемой здесь является недоступность экспертного знания, которое могло бы помочь в выборе алгоритма. Данная работа предлагает новую рекомендательную методику, основанную на Knowledge Graph-based Retrieval-Augmented Generation (KG-RAG), чтобы сделать экспертные рекомендации более доступными. #### Метод Метод KG-RAG основывается на конструировании доменного знания в виде графа из публикуемой литературы. Он включает три механизма поиска: точный поиск графа, гибкий векторный поиск и кластеризационный поиск. Эти механизмы собирают релевантные данные для рекомендации алгоритмов. Данные затем используются в Large Language Model (LLM) для генерации рекомендаций с поддержкой данных. Эта стратегия позволяет использовать сложные контексты и доказательства в процессе выбора. #### Результаты Проведено ряд экспериментов, использовавших реальные тестовые случаи FLP. Метод KG-RAG был сравнен с коммерческим LLM-чатботом, имеющим доступ к знаниям в виде таблиц. Результаты показали, что KG-RAG превосходит коммерческий LLM по точности рекомендаций и качеству рассуждений. В частности, новый метод демонстрирует точность выше 85% при рекомендации алгоритмов, что значительно выше, чем результаты коммерческого LLM. #### Значимость Новая методика имеет широкие возможности применения в автоматизированных системах проектирования, где требуется выбор оптимальных алгоритмов. Она предоставляет доступ к экспертному знанию через искусственный интеллект, улучшая процессы принятия решений. Также, этот подход может быть распространен на другие задачи, требующие выбора оптимальных стратегий, например в сложных логистических системах или технологиях производства. #### Выводы Данная работа представляет собой прорыв в области рекомендательных систем для выбора алгоритмов. Достигнутые результаты показывают высокую эффективность KG-RAG в сравнении с другими подходами. Будущие исследования будут сосредоточены на расширении доменных знаний, улучшении точности рекомендаций и расширении применения этого подхода к другим задачам, требующим оптимизации.

Annotation:

Selecting a solution algorithm for the Facility Layout Problem (FLP), an NP-hard optimization problem with a multiobjective trade-off, is a complex task that requires deep expert knowledge. The performance of a given algorithm depends on specific problem characteristics such as its scale, objectives, and constraints. This creates a need for a data-driven recommendation method to guide algorithm selection in automated design systems. This paper introduces a new recommendation method to make such ...

ID: 2509.18054v1 cs.IR, cs.AI, cs.LG

arXiv PDF

📄 OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System

2025-09-24

Авторы:

Sunhao Dai, Jiakai Tang, Jiahua Wu, Kun Wang, Yuxuan Zhu, Bingjun Chen, Bangyang Hong, Yu Zhao, Cong Fu, Kangle Wu, Yabo Ni, Anxiang Zeng, Wenjie Wang, Xu Chen, Jun Xu, See-Kiong Ng

## Контекст В последние годы становится все более очевидным, что технологии глубокого обучения постепенно трансформируют индустрии, в том числе системы поиска и рекомендаций. Однако, несмотря на всплеск интереса к широкому применению трансформерных архитектур, преимущества, которые они приносят, часто остаются ограниченными. Это можно объяснить тем, что большинство индустриальных систем продолжают опираться на Deep Learning Recommendation Models (DLRMs), ограничиваясь их модификациями. В то же время значительные преимущества, которые приносят технологии, такие как глубокий ранжирований (LLMs), возникают не только из-за изобретений в архитектуре, но и благодаря таким механизмам, как контекстное обогащение и многошаговая логика. Эти механизмы, однако, в рамках индустриальных систем ранжирования, до сих пор остаются недостаточно исследованными. ## Метод OnePiece представляет собой новую архитектуру, которая успешно интегрирует механизмы контекстного обогащения и многошагового рефинемента в ранжирование и поиск в составе индустриальных пайплайнов. Эта модель основывается на трансформерной структуре, но имеет уникальные особенности: (1) **Структурированное контекстное обогащение**, прикрепляющее к входным сигналам как интересы пользователя, так и контекстные признаки сценариев, представленные в виде входных токенов; (2) **Блочное логическое обогащение**, которое вводит итеративные шаги рефинемента представлений, возможность которых растет вместе с размером блока; (3) **Прогрессивное мульти-задачное обучение**, которое строится на цепочках пользовательских фидбеков, позволяя контролировать процесс обучения при развитии модели. ## Результаты Для оценки модели OnePiece проводились различные эксперименты на реальных данных. Мы использовали большие наборы данных из индустриальных систем поиска и рекомендаций. Методами анализа метрик, таких как GMV/UU и доходы из рекламы, были получены очевидные показатели улучшения. Например, исследования показали, что OnePiece добавила до $+2\%$ GMV/UU и $+2.90\%$ в доходы от рекламы. Эти результаты подтверждают, что OnePiece не только улучшает ранжирование, но и увеличивает эффективность системы в целом. ## Значимость Помимо основного применения в системах поиска и рекомендаций, OnePiece может быть распространена в различных индустрияльных сценариях, таких как моделирование поведения покупателей, улучшение рекомендаций в контексте транзакционных систем. Основным преимуществом OnePiece является её способность улучшить качество рекомендаций в целостных индустриальных пайплайнах, что способствует повышению пользовательского привлечения и эффекти

Annotation:

Despite the growing interest in replicating the scaled success of large language models (LLMs) in industrial search and recommender systems, most existing industrial efforts remain limited to transplanting Transformer architectures, which bring only incremental improvements over strong Deep Learning Recommendation Models (DLRMs). From a first principle perspective, the breakthroughs of LLMs stem not only from their architectures but also from two complementary mechanisms: context engineering, wh...

ID: 2509.18091v1 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 Dual-Mode Visual System for Brain-Computer Interfaces: Integrating SSVEP and P300 Responses

2025-09-23

Авторы:

Ekgari Kasawala, Surej Mouli

## Контекст Большинство существующих систем биологического подключения (BCI) основываются на визуальных стимуляциях, таких как steady-state visual evoked potential (SSVEP) и P300, которые обеспечивают высокую точность и низкий порог обучения. Однако, большинство текущих решений построены на технологии ЖК-дисплеев, которые имеют ограничения в практическом применении, в том числе в вопросах энергообеспечения, цены и доступности. Это влечет за собой необходимость разработки более эффективных и надежных систем BCI, основанных на альтернативных технологиях, таких как лампы LED. Авторы предлагают разработать и протестировать новую систему BCI, которая интегрирует SSVEP и P300 стимуляции для повышения точности и удобства в использовании. ## Метод Разработанная система BCI основывается на технологии ламп LED для визуальной стимуляции и использует два типа стимуляции: SSVEP и P300. Для инструментальной реализации использованы два вида сенсоров: головной шлем, собирающий вызывающиеся электрическими сигналы мозга, и LED-матрица, использующаяся для визуальных стимуляций. Методология включает в себя три основных этапа: стимуляция, восприятие и обработка сигнала. За счет использования трех групп LED (красных, зеленых и синих), авторы достигли более высокой точности в стимуляции. Для обработки сигналов использовалась алгоритмическая оптимизация, включающая FFT-анализ и детекцию P300. Это позволило реализовать реальному времени корреляцию входных сигналов с целевыми действиями. ## Результаты В результате экспериментов было получено несколько важных результатов. Точность классификации для SSVEP была достигнута в 86,25%, значительно превосходя многие другие системы BCI. Аналогично, ITR достиг 42.08 бит в минуту, что является высоким показателем для новых видов BCI. На данном этапе было показано, что интеграция SSVEP и P300 в единую систему позволяет достичь более высокой точности классификации и уменьшить задержки в выполнении команд пользователем. ## Значимость Система, описанная в работе, может быть использована в различных областях применения, в том числе в робототехнике, медицине и управлении устройствами. Одним из ключевых преимуществ новой системы является ее меньшая энергозатрата и более высокая точность. Также, в отличие от систем, основанных на ЖК-дисплеях, она имеет меньшую цену, что делает ее более доступной для широкого круга пользователей. Это может привести к расширению рынка BCI и увеличению доступности для людей с ограниченными возможностями. ## Выводы В

Annotation:

In brain-computer interface (BCI) systems, steady-state visual evoked potentials (SSVEP) and P300 responses have achieved widespread implementation owing to their superior information transfer rates (ITR) and minimal training requirements. These neurophysiological signals have exhibited robust efficacy and versatility in external device control, demonstrating enhanced precision and scalability. However, conventional implementations predominantly utilise liquid crystal display (LCD)-based visual ...

ID: 2509.15439v1 cs.IR, cs.AI

arXiv PDF

Показано 111 - 120 из 211 записей