📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Chenghan Fu, Daoze Zhang, Yukang Lin, Zhanheng Nie, Xiang Zhang, Jianyu Liu, Yueran Liu, Wanxian Guan, Pengjie Wang, Jian Xu, Bo Zheng
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We introduce MOON, our comprehensive set of sustainable iterative practices for multimodal representation learning for e-commerce applications. MOON has already been fully deployed across all stages of Taobao search advertising system, including retrieval, relevance, ranking, and so on. The performance gains are particularly significant on click-through rate (CTR) prediction task, which achieves an overall +20.00% online CTR improvement. Over the past three years, this project has delivered the ...
Авторы:
Sean Moran
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Approximate Nearest Neighbour (ANN) search is a fundamental problem in
information retrieval, underpinning large-scale applications in computer
vision, natural language processing, and cross-modal search. Hashing-based
methods provide an efficient solution by mapping high-dimensional data into
compact binary codes that enable fast similarity computations in Hamming space.
Over the past two decades, a substantial body of work has explored learning to
hash, where projection and quantisation functi...
Авторы:
Tuo Zhang, Yuechun Sun, Ruiliang Liu
Опубликовано: 13 января 2025 г.
## Контекст
### Область исследования
Проблематика происхождения археологических объектов, или провенанс, является ключевым аспектом вступательного анализа в археологии. Однако традиционные методы анализа часто требуют значительных поправок, введения ручных коррекций и наличия специализированных знаний. Это значительно снижает эффективность и доступность этого процесса для менее опытных исследователей.
### Мотивация
Существует необходимость в развитии методов, которые могут автоматически обрабатывать большие корпусы данных, обеспечивая точные и интерпретируемые выводы. Такой подход может существенно сократить время и труд, необходимый для проведения раннего анализа.
## Метод
### Описание методологии
Предложенная система основывается на технологии Retrieval-Augmented Generation (RAG) и использует значительные модели зрения и языка (VLMs). Она создает двухрежимную знанийную базу, которая объединяет текстовые справочные материалы и изображения.
### Технические решения
Система поддерживает три типа визуального поиска:
1. **Raw Visual Retrieval** — поиск по RAW-изображениям.
2. **Edge-Enhanced Retrieval** — поиск по усиленным контурам.
3. **Semantic Retrieval** — поиск по семантичному содержимому.
Выводимое содержимое включает:
- Хронологические, географические и культурные принадлежности.
- Интерпретируемые выводы с объяснениями.
## Результаты
### Используемые данные
Оценка системы проводилась на корпусе из Восточно-Евразийских знаменательных объектов Древней Западной Эры, содержащихся в Британском Музее.
### Результаты экспериментов
Система предоставила точные и значимые выводы, включая хронологические и географические характеристики, а также стилистические сходства. Эксперты отметили, что выводы системы значительно облегчают начальный анализ и снижают когнитивную нагрузку.
## Значимость
### Области применения
Система может быть применена в археологии, истории искусств и обработке изображений для анализа объектов культурного наследия.
### Преимущества
Она обеспечивает точные выводы, снижает когнитивный напряжение исследователей и может быть интегрирована в более широкие инструментальные пакеты для обработки артефактов.
### Потенциальное влияние
В будущем это может привести к новым возможностям в цифровой археологии, в том числе автоматического классификации и сравнения объектов.
## Выводы
### Основные достижения
Предложенная система демонстрирует высокую эффективность в выводе информации о происхождени
Annotation:
In this work, we present a retrieval-augmented generation (RAG)-based system
for provenance analysis of archaeological artifacts, designed to support expert
reasoning by integrating multimodal retrieval and large vision-language models
(VLMs). The system constructs a dual-modal knowledge base from reference texts
and images, enabling raw visual, edge-enhanced, and semantic retrieval to
identify stylistically similar objects. Retrieved candidates are synthesized by
the VLM to generate structured ...