📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Anantajit Subrahmanya, Chandrakanth Gudavalli, Connor Levenson, Umang Garg, B. S. Manjunath
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Accurately modeling human mobility is critical for urban planning,
epidemiology, and traffic management. In this work, we introduce Markovian Reeb
Graphs, a novel framework for simulating spatiotemporal trajectories that
preserve Patterns of Life (PoLs) learned from baseline data. By combining
individual- and population-level mobility structures within a probabilistic
topological model, our approach generates realistic future trajectories that
capture both consistency and variability in daily li...
Авторы:
Huaizhi Qu, Xiao Wang, Gengwei Zhang, Jie Peng, Tianlong Chen
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Cryo-electron microscopy (cryo-EM) has become a central tool for
high-resolution structural biology, yet the massive scale of datasets (often
exceeding 100k particle images) renders 3D reconstruction both computationally
expensive and memory intensive. Traditional Fourier-space methods are efficient
but lose fidelity due to repeated transforms, while recent real-space
approaches based on neural radiance fields (NeRFs) improve accuracy but incur
cubic memory and computation overhead. Therefore, w...
Авторы:
Huaizhi Qu, Xiao Wang, Gengwei Zhang, Jie Peng, Tianlong Chen
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Cryo-electron microscopy (cryo-EM) has become a central tool for
high-resolution structural biology, yet the massive scale of datasets (often
exceeding 100k particle images) renders 3D reconstruction both computationally
expensive and memory intensive. Traditional Fourier-space methods are efficient
but lose fidelity due to repeated transforms, while recent real-space
approaches based on neural radiance fields (NeRFs) improve accuracy but incur
cubic memory and computation overhead. Therefore, w...
Авторы:
Yiling Yun, Hongjing Lu
## Контекст
Социальные взаимодействия являются одним из основных аспектов человеческого общения, и их удобно распознавать, даже при простых визуальных признаках. Несмотря на то, что ранее много эмпирических исследований сосредоточилось на визуальных признаках, менее тщательно исследовано, какие семантические представления человек использует для дополнения визуальных признаков. Наше исследование опрашивает и измеряет способность человеческого мозга распознавать социальные взаимодействия на основании простых движущихся фигур. Это может способствовать лучшему пониманию того, как мы воспринимаем социальную реальность, а также улучшить модели искусственного зрения.
## Метод
Мы провели две экспериментальные серии. В **Study 1** участники просматривали анимации, состоящие из двигающихся фигур, и помечали их, опираясь на свои впечатления. Эти пометки были позже сгруппированы и анализированы. В **Study 2** использовались 27 типов социальных взаимодействий, которые были оценены с помощью жюри через симметрию в степени сходства. Мы сравнили результаты с моделями, работающими на основе визуальных признаков, лейблов и семантических эмбеддингов, полученных из описаний анимаций. Эмбеддинги были сформированы с использованием различных моделей, таких как GloVe и Word2Vec.
## Результаты
В **Study 1** наблюдались различные варианты оценки пользователей, что подтвердило сложность ручных анализов. В **Study 2** семантические модели показали лучшую точность по сравнению с моделями на основе лейблов и визуальных признаков. Особенно эффективны были модели на основе глаголов из описаний анимаций. Эти результаты указывают на важность семантической структуры социальных взаимодействий в понимании человеческих впечатлений.
## Значимость
Наша работа имеет практическое значение в области зрения компьютеров и обучения машин. Мы демонстрируем, что семантические модели могут расширять визуальные модели, улучшая понимание социальных взаимодействий. Это может быть применено в разработке интеллектуальных систем, например, в системах, которые распознают социальные ситуации для социального помощника или для видеоанализа в социальных сетях. Мы также открываем пути для будущих исследований в области искусственного зрения, компьютерного зрения и квантовой интеллектуальной системы.
## Выводы
Наши исследования показали, что человеческая семантическая представление социальных взаимодействий заключается не только в визуальных признаках, но и в семантической структуре отношений. Эти результаты могут помочь создать более точные модели в различных областях, таких как искусст
Annotation:
Humans are social creatures who readily recognize various social interactions
from simple display of moving shapes. While previous research has often focused
on visual features, we examine what semantic representations that humans employ
to complement visual features. In Study 1, we directly asked human participants
to label the animations based on their impression of moving shapes. We found
that human responses were distributed. In Study 2, we measured the
representational geometry of 27 social...
📄 Hybrid Machine Learning Framework for Predicting Geometric Deviations from 3D Surface Metrology
2025-08-14Авторы:
Hamidreza Samadi, Md Manjurul Ahsan, Shivakumar Raman
## Контекст
Господствующим угрозой качеству и надежности многих производственных процессов являются геометрические неточности в производимых компонентах. Несмотря на развитие современных технологий изготовления, поддержание высокой точности остается значительной проблемой, особенно при изготовлении компонентов с сложными геометрическими формами. Это приводит к увеличению отходов, ухудшению надежности и повышению затрат. Данная работа адресует эту проблему, ориентируясь на использование 3D-сканирования и искусственного интеллекта для точного прогнозирования геометрических неточностей.
## Метод
Процесс исследования включал сбор и обработку данных с помощью высокорезольвентного 3D-сканера. Были обработаны данные с 237 компонентов, изготовленных в разных партиях. Данные были тщательно анализированы и обработаны с использованием методов уменьшения шума, выравнивания и мержинга в 3D-представлениях. Для построения модели использовались алгоритмы глубокого обучения. Методология включала гибридную модель, где алгоритмы современного машинного обучения, такие как сверточные нейронные сети для извлечения признаков, и градиентно усиленные решающие деревья для прогнозирования, были объединены в единую систему.
## Результаты
Результаты экспериментов показали, что полученная модель достигла значительной точности прогнозирования геометрических неточностей, достигая значения 0,012 мм при уровне доверия 95%. Это составляет прирост примерно в 73% по сравнению с традиционными методами статистического контроля процессов. Более того, модель выделила важные корреляции между производственными параметрами и геометрическими неточностями, до этого недоступными для анализа. Это дает возможность проводить автоматизированный контроль качества, прогностическое обслуживание и оптимизации дизайна в производстве точных компонентов.
## Значимость
Предложенная модель может применяться в различных отраслях, включая авиастроение, автомобилестроение и медицинскую промышленность. Она обеспечивает значительное повышение точности прогнозирования, позволяя быстрее и эффективнее реагировать на проблемы. Также, новый подход создает возможности для развития новых алгоритмов и моделей для прогнозирования производственных неточностей. Данный исследовательский подход открывает новую плоскость развития в области цифровой индустрии и производственного контроля.
## Выводы
Данная работа доказывает эффективность гибридных моделей машинного обучения для развития прогностических моделей в производстве. Модель позволяет не только повысить точность прогностических моделей, но и открыть новые в
Annotation:
This study addresses the challenge of accurately forecasting geometric
deviations in manufactured components using advanced 3D surface analysis.
Despite progress in modern manufacturing, maintaining dimensional precision
remains difficult, particularly for complex geometries. We present a
methodology that employs a high-resolution 3D scanner to acquire multi-angle
surface data from 237 components produced across different batches. The data
were processed through precise alignment, noise reductio...
📄 FinMMR: Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging
2025-08-09Авторы:
Zichen Tang, Haihong E, Jiacheng Liu, Zhongjun Yang, Rongjin Li, Zihua Rong, Haoyang He, Zhuodi Hao, Xinyang Hu, Kun Ji, Ziyan Ma, Mengyuan Ji, Jun Zhang, Chenghao Ma, Qianhe Zheng, Yang Liu, Yiling Huang, Xinyi Hu, Qing Huang, Zijian Xie, Shiyao Peng
**FinMMR: Расширение Модальности, Широти Знаний и Сложности для Многомодальных Моделей в Финансовом Решении Задач**
FinMMR представляет собой новую билингвальную мультимодальную бенчмарк для оценки моделей многомодального машинного обучения в области финансового численного рассуждения. Она расширяет текущие работы в трех ключевых направлениях. Сначала, FinMMR включает 4.3K вопросов и 8.7K изображений, разбитых на 14 категорий — таблицы, графики и другие визуализации, включая сложные диаграммы владения. Второй, она затрагивает 14 финансовых поддисциплин, включая корпоративное финансирование и анализ отраслей, что значительно расширяет объем финансовых знаний в сравнении с предыдущими бенчмарками. Третий, FinMMR представляет высокую сложность, требуя извлечения и интеграцию многородной финансовой информации, включая текст и сложные визуальные данные. Только самые продвинутые модели достигают 53.0% точности на трудных задачах. Этот бенчмарк мотивирует улучшение моделей многомодального машинного обучения для реальных финансовых задач.
Annotation:
We present FinMMR, a novel bilingual multimodal benchmark tailored to
evaluate the reasoning capabilities of multimodal large language models (MLLMs)
in financial numerical reasoning tasks. Compared to existing benchmarks, our
work introduces three significant advancements. (1) Multimodality: We
meticulously transform existing financial reasoning benchmarks, and construct
novel questions from the latest Chinese financial research reports. FinMMR
comprises 4.3K questions and 8.7K images spanning ...