📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 GraphMatch: Fusing Language and Graph Representations in a Dynamic Two-Sided Work Marketplace

2025-12-04

Авторы:

Mikołaj Sacha, Hammad Jafri, Mattie Terzolo, Ayan Sinha, Andrew Rabinovich

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Recommending matches in a text-rich, dynamic two-sided marketplace presents unique challenges due to evolving content and interaction graphs. We introduce GraphMatch, a new large-scale recommendation framework that fuses pre-trained language models with graph neural networks to overcome these challenges. Unlike prior approaches centered on standalone models, GraphMatch is a comprehensive recipe built on powerful text encoders and GNNs working in tandem. It employs adversarial negative sampling a...

ID: 2512.02849v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 Practical Code RAG at Scale: Task-Aware Retrieval Design Choices under Compute Budgets

2025-10-25

Авторы:

Timur Galimzyanov, Olga Kolomyttseva, Egor Bogomolov

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We study retrieval design for code-focused generation tasks under realistic compute budgets. Using two complementary tasks from Long Code Arena -- code completion and bug localization -- we systematically compare retrieval configurations across various context window sizes along three axes: (i) chunking strategy, (ii) similarity scoring, and (iii) splitting granularity. (1) For PL-PL, sparse BM25 with word-level splitting is the most effective and practical, significantly outperforming dense alt...

ID: 2510.20609v1 cs.LG, cs.AI, cs.IR, cs.LG, cs.IR, cs.SE, cs.AI

arXiv PDF

📄 MemoryBench: A Benchmark for Memory and Continual Learning in LLM Systems

2025-10-22

Авторы:

Qingyao Ai, Yichen Tang, Changyue Wang, Jianming Long, Weihang Su, Yiqun Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Scaling up data, parameters, and test-time computation has been the mainstream methods to improve LLM systems (LLMsys), but their upper bounds are almost reached due to the gradual depletion of high-quality data and marginal gains obtained from larger computational resource consumption. Inspired by the abilities of human and traditional AI systems in learning from practice, constructing memory and continual learning frameworks for LLMsys has become an important and popular research direction in ...

ID: 2510.17281v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 On-the-Fly OVD Adaptation with FLAME: Few-shot Localization via Active Marginal-Samples Exploration

2025-10-22

Авторы:

Yehonathan Refael, Amit Aides, Aviad Barzilai, George Leifman, Genady Beryozkin, Vered Silverman, Bolous Jaber, Tomer Shekel

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Open-vocabulary object detection (OVD) models offer remarkable flexibility by detecting objects from arbitrary text queries. However, their zero-shot performance in specialized domains like Remote Sensing (RS) is often compromised by the inherent ambiguity of natural language, limiting critical downstream applications. For instance, an OVD model may struggle to distinguish between fine-grained classes such as "fishing boat" and "yacht" since their embeddings are similar and often inseparable. Th...

ID: 2510.17670v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 Hierarchical LoRA MoE for Efficient CTR Model Scaling

2025-10-16

Авторы:

Zhichen Zeng, Mengyue Hang, Xiaolong Liu, Xiaoyi Liu, Xiao Lin, Ruizhong Qiu, Tianxin Wei, Zhining Liu, Siyang Yuan, Chaofei Yang, Yiqun Liu, Hang Yin, Jiyan Yang, Hanghang Tong

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Deep models have driven significant advances in click-through rate (CTR) prediction. While vertical scaling via layer stacking improves model expressiveness, the layer-by-layer sequential computation poses challenges to efficient scaling. Conversely, horizontal scaling through Mixture of Experts (MoE) achieves efficient scaling by activating a small subset of experts in parallel, but flat MoE layers may struggle to capture the hierarchical structure inherent in recommendation tasks. To push the ...

ID: 2510.10432v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 CHORD: Customizing Hybrid-precision On-device Model for Sequential Recommendation with Device-cloud Collaboration

2025-10-07

Авторы:

Tianqi Liu, Kairui Fu, Shengyu Zhang, Wenyan Fan, Zhaocheng Du, Jieming Zhu, Fan Wu, Fei Wu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

With the advancement of mobile device capabilities, deploying reranking models directly on devices has become feasible, enabling real-time contextual recommendations. When migrating models from cloud to devices, resource heterogeneity inevitably necessitates model compression. Recent quantization methods show promise for efficient deployment, yet they overlook device-specific user interests, resulting in compromised recommendation accuracy. While on-device finetuning captures personalized user p...

ID: 2510.03038v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 Learning to Construct Knowledge through Sparse Reference Selection with Reinforcement Learning

2025-09-12

Авторы:

Shao-An Yin

#### Контекст Modern scientific literature расширяется ощутимо, что затрудняет поиск и приобретение новых знаний, особенно в специализированных областях. Здесь проблематично получить полный текст работ, а важное знание может быть представлено в небольшом числе работ. Таким образом, необходимо развить методы, позволяющие выделить ценные ссылки среди огромного объема контента. Это важно для эффективного знаний приобретения, особенно в сферах, где знание основано на выборке и анализе близкого к ограниченному количеству литературы. #### Метод Методология, представленная в работе, основана на **Deep Reinforcement Learning (DRL)**. Рамочным решением является модель, которая "читает" литературу, построенную на последовательном выборе ссылок с подробным анализом, чтобы приобрести новые знания. Алгоритм оптимизирует подбор с привлечением ограниченных ресурсов, таких как время и затраты, чтобы выделить наиболее значимые работы. Архитектура фреймворка включает в себя составные модели, которые анализируют заголовки и абстракты работ, принимая решения о следующих действиях, как будто это делает человек с целью приобретения знаний. #### Результаты В ходе экспериментов, проводившихся на задаче выявления отношений между лекарствами и генами, модель была ограничена доступом к заголовкам и абстрактам работ. Она демонстрировала высокую эффективность в выборе ценных ссылок, имитируя ту же степень эффективности, которую может достигнуть человек при ограниченных ресурсах. Эксперименты показали, что DRL-фреймворк хорошо успешно моделирует работу человека в построении знаний, но при этом находится на более высокой скорости и точности. #### Значимость Предложенный подход может быть применен в различных сферах, где знание приобретается через анализ литературы, например, в научных исследованиях, в области патентов, в юридичных исследованиях. Он предоставляет преимущества в скорости и эффективности, позволяя значительно сократить время, потраченное на поиск и анализ источников. Это может привести к революции в поиске знаний, дающую новый опыт в специализированных областях. #### Выводы Работа показала, что модель DRL успешно справляется с задачей выбора спарских ссылок для построения знаний. Она демонстрирует высокую точность и эффективность, аналогичную человеческим решениям. Будущие исследования будут сосредоточены на расширении модели для более широкого круга задач, включая расширение доступа к полным текстам и улучшение модели адаптации к различным специализированным областям.

Annotation:

The rapid expansion of scientific literature makes it increasingly difficult to acquire new knowledge, particularly in specialized domains where reasoning is complex, full-text access is restricted, and target references are sparse among a large set of candidates. We present a Deep Reinforcement Learning framework for sparse reference selection that emulates human knowledge construction, prioritizing which papers to read under limited time and cost. Evaluated on drug--gene relation discovery wit...

ID: 2509.05874v1 cs.LG, cs.AI, cs.IR, I.2.6

arXiv PDF

📄 Knowledge Integration for Physics-informed Symbolic Regression Using Pre-trained Large Language Models

2025-09-05

Авторы:

Bilge Taskin, Wenxiong Xie, Teddy Lazebnik

## Контекст Физико-ориентированная символьная регрессия (PiSR) является мощным инструментом для автоматизированного научного открытия, позволяющим выводить уравнения, описывающие физические динамики, из экспериментальных данных. Она обеспечивает объединение математической модели и физических законов, что улучшает общность, точность и понятность полученных уравнений. Однако, существующие методы PiSR часто требуют специальных формализаций и ручного конструирования признаков, что ограничивает их применение, оставляя их доступность ограниченной для широкой кругов научных специалистов. Это приводит к необходимости в развитии методик, которые могут автоматизировать интеграцию доменного знания в процесс PiSR, сделав его более удобным и эффективным для разнообразных научных задач. ## Метод Мы предлагаем интегрировать предварительно обученные большие языковые модели (LLMs) в процесс PiSR для автоматической интеграции доменного знания. Наш подход добавляет новый терм в функцию потерь PiSR, который оценивает символьное уравнение, предложенное символьной регрессией, с помощью LLM. Это позволяет языковой модели анализировать символьное уравнение и выражать свое мнение о его соответствии физическому контексту. Мы использовали методы символьной регрессии DEAP, gplearn и PySR в сочетании с LLMs Falcon, Mistral и LLama 2. Для оценки подхода, мы проводили эксперименты на трех физических динамиках: движении предмета под воздействием гравитации, простым гармоническим движению и электромагнитным волной. ## Результаты Эксперименты показали, что интеграция LLMs в PsiSR повышает точность восстановления физических динамик, улучшает устойчивость моделей к шумам и усложненным данным. Особенно заметно улучшение в ситуациях, когда данные имели большой шум или неоднозначности. Мы также провели исследования воздействия промпто-инжиниринга, то есть того, насколько хорошо формулированы инструкции, предъявляемые модели. Наши результаты показали, что более подробные и информативные промпты могут значительно повысить эффективность решения задач. ## Значимость Наш подход может быть применен в различных областях, где требуется автоматизированное выявление правил и законов, таких как физика, биология, инженерия и даже финансы. Он обеспечивает доступ к более точным и обоснованным моделям, которые могут использоваться для получения новых научных открытий. Кроме того, метод снижает необходимость в ручной работе с моделями, делая их более доступными для научных сообществ, не обладающих особыми знаниями в области машинного обуч

Annotation:

Symbolic regression (SR) has emerged as a powerful tool for automated scientific discovery, enabling the derivation of governing equations from experimental data. A growing body of work illustrates the promise of integrating domain knowledge into the SR to improve the discovered equation's generality and usefulness. Physics-informed SR (PiSR) addresses this by incorporating domain knowledge, but current methods often require specialized formulations and manual feature engineering, limiting their...

ID: 2509.03036v1 cs.LG, cs.AI, cs.IR, cs.SC

arXiv PDF

📄 What Data is Really Necessary? A Feasibility Study of Inference Data Minimization for Recommender Systems

2025-09-02

Авторы:

Jens Leysen, Marco Favier, Bart Goethals

## Контекст Рекомендательные системы, используемые в сферах, таких как электронная коммерция, социальные сети и медиа, широко распространены в наше время. Однако они привлекают внимание из-за их требований к объемам данных, которые необходимо сборить и обрабатывать. Эти данные часто включают персональную информацию, чья обработка должна соответствовать законодательству о защите данных, таком как GDPR. Одно из ключевых требований этого закона — принцип данных минимализации, который ограничивает сбор и обработку данных теми, что необходимы для достижения конкретного целевого предназначения. Однако для рекомендательных систем, использующих объемы данных, полученных пользователями, становится сложно определить, какие данные являются "необходимыми". Это ставит перед исследователями задачу разработки методов, которые позволят оптимизировать обработку данных без значительного снижения качества рекомендаций. ## Метод В данном исследовании изучается возможность минимизации данных, используемых для вывода информации в рекомендательных системах, с использованием метода неявного обратного отклика (implicit feedback). Исследователи предлагают новую формулировку задачи, включающую два ключевых вида данных: 1) данные, необходимые для вывода и 2) данные, используемые для проверки эффективности. Они рассмотрены в разных конфигурациях, включая различные модели, уровни сложности пользовательских предпочтений и размер истории пользовательских данных. Эксперименты проводятся на разных наборах данных, используя метрики, которые позволяют оценить качество рекомендаций и степень уменьшения данных. ## Результаты Исследование показало, что можно значимо уменьшить объем необходимых данных для вывода без существенного снижения качества рекомендаций. Например, с помощью специальных алгоритмов сжатия и техники выбора моделей, которые оптимизируют обработку неявного обратного отклика, возможно достичь значительного снижения объема данных. Однако эффективность таких техник зависит от конкретной ситуации, включая целевые показатели производительности, модель, которую используют, и характеристики пользователей, такие как размер их истории данных и сложность их предпочтений. Таким образом, хотя проблему можно решить с точки зрения техники, её практическое применение во многом определяется конкретными обстоятельствами. ## Значимость Это исследование имеет значимую теоретическую и практическую значимость. Оно демонстрирует, что принцип данных минимализации может быть применен в рекомендательных системах, что делает их более соответствующими законым о защите данных. Благодаря этому можно реализовать рекомендательные системы

Annotation:

Data minimization is a legal principle requiring personal data processing to be limited to what is necessary for a specified purpose. Operationalizing this principle for recommender systems, which rely on extensive personal data, remains a significant challenge. This paper conducts a feasibility study on minimizing implicit feedback inference data for such systems. We propose a novel problem formulation, analyze various minimization techniques, and investigate key factors influencing their effec...

ID: 2508.21547v1 cs.LG, cs.AI, cs.IR

arXiv PDF

📄 Cross-Platform E-Commerce Product Categorization and Recategorization: A Multimodal Hierarchical Classification Approach

2025-08-29

Авторы:

Lotte Gross, Rebecca Walter, Nicole Zoppi, Adrien Justus, Alessandro Gambetti, Qiwei Han, Maximilian Kaiser

## Контекст Устойчивое развитие электронной коммерции приводит к возникновению новых вызовов, в частности, разнообразию платформ и ограниченности существующих категоризационных систем. Эти проблемы становятся особенно актуальными для международных платформ, где необходимо обеспечить точную и гибкую классификацию товаров. Были выделены два основных аспекта: 1) объединение различных видов данных (текстовые, визуальные, визуально-языковые) для улучшения точности классификации; 2) развитие гибкой системы, которая могла бы адаптироваться к новым категориям и неожиданным структурам. Мотивация заключается в создании универсальной многорежимной методологии, которая могла бы преодолевать устаревшие ограничения и обеспечивать точную категоризацию в различных контекстах. ## Метод Для решения вышеприведенных проблем была разработана многорежимная модель, которая интегрирует текстовые (RoBERTa), визуальные (ViT) и визуально-языковые (CLIP) представления. Функциональность модели основывается на многоуровневой архитектуре, которая использует три основных модальности, а также включает динамическое замаскирование для обеспечения консистентности в категоризации. Для улучшения универсальности и точности была предложена самостоятельная (self-supervised) система по пересортировке товаров, использующая SimCLR, UMAP и кластеризацию. Эта система позволяет обнаруживать новые, более тонкие категории (например, подтипы "Обувь") с высоким степенью чистоты кластеров (86%+). ## Результаты На 271,700 продуктов из 40 международных электронных торговых платформ было проведено значительное количество экспериментов. В результате было достигнуто высокий уровень точности в классификации - 98.59% на уровне дерева категорий. Изучены различные стратегии слияния (early, late, attention-based). Особый успех был показан стратегией late-fusion, которая объединяет CLIP и RoBERTa в рамках модели MLP. Была также проверена модель на точности и универсальности для неизвестных платформ, где была замечена сильная зависимость от количества тренировочных данных. Для расширения возможностей была предложена система по пересортировке товаров, которая обнаружила новые тонкие категории с высокой точностью. ## Значимость Разработанная модель может быть применена в сфере электронной коммерции для улучшения категоризации товаров на различных платформах. Она обладает высокой точностью и гибкостью, что делает её удобной для работы с многообразием данных и категорий. В то же время, модель может быть использована для обнаружения новых товарных категорий, что дает возможность адаптироваться к

Annotation:

This study addresses critical industrial challenges in e-commerce product categorization, namely platform heterogeneity and the structural limitations of existing taxonomies, by developing and deploying a multimodal hierarchical classification framework. Using a dataset of 271,700 products from 40 international fashion e-commerce platforms, we integrate textual features (RoBERTa), visual features (ViT), and joint vision--language representations (CLIP). We investigate fusion strategies, includin...

ID: 2508.20013v1 cs.LG, cs.AI, cs.IR

arXiv PDF

Показано 1 - 10 из 12 записей