📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 ReeMark: Reeb Graphs for Simulating Patterns of Life in Spatiotemporal Trajectories

2025-10-07

Авторы:

Anantajit Subrahmanya, Chandrakanth Gudavalli, Connor Levenson, Umang Garg, B. S. Manjunath

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Accurately modeling human mobility is critical for urban planning, epidemiology, and traffic management. In this work, we introduce Markovian Reeb Graphs, a novel framework for simulating spatiotemporal trajectories that preserve Patterns of Life (PoLs) learned from baseline data. By combining individual- and population-level mobility structures within a probabilistic topological model, our approach generates realistic future trajectories that capture both consistency and variability in daily li...

ID: 2510.03152v1 cs.CV, cs.CE, cs.LG, cs.SI

arXiv PDF

📄 GEM: 3D Gaussian Splatting for Efficient and Accurate Cryo-EM Reconstruction

2025-10-03

Авторы:

Huaizhi Qu, Xiao Wang, Gengwei Zhang, Jie Peng, Tianlong Chen

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Cryo-electron microscopy (cryo-EM) has become a central tool for high-resolution structural biology, yet the massive scale of datasets (often exceeding 100k particle images) renders 3D reconstruction both computationally expensive and memory intensive. Traditional Fourier-space methods are efficient but lose fidelity due to repeated transforms, while recent real-space approaches based on neural radiance fields (NeRFs) improve accuracy but incur cubic memory and computation overhead. Therefore, w...

ID: 2509.25075v2 cs.CV, cs.CE

arXiv PDF

📄 GEM: 3D Gaussian Splatting for Efficient and Accurate Cryo-EM Reconstruction

2025-10-01

Авторы:

Huaizhi Qu, Xiao Wang, Gengwei Zhang, Jie Peng, Tianlong Chen

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

ID: 2509.25075v1 cs.CV, cs.CE

arXiv PDF

📄 Human Semantic Representations of Social Interactions from Moving Shapes

2025-09-27

Авторы:

Yiling Yun, Hongjing Lu

## Контекст Социальные взаимодействия являются одним из основных аспектов человеческого общения, и их удобно распознавать, даже при простых визуальных признаках. Несмотря на то, что ранее много эмпирических исследований сосредоточилось на визуальных признаках, менее тщательно исследовано, какие семантические представления человек использует для дополнения визуальных признаков. Наше исследование опрашивает и измеряет способность человеческого мозга распознавать социальные взаимодействия на основании простых движущихся фигур. Это может способствовать лучшему пониманию того, как мы воспринимаем социальную реальность, а также улучшить модели искусственного зрения. ## Метод Мы провели две экспериментальные серии. В **Study 1** участники просматривали анимации, состоящие из двигающихся фигур, и помечали их, опираясь на свои впечатления. Эти пометки были позже сгруппированы и анализированы. В **Study 2** использовались 27 типов социальных взаимодействий, которые были оценены с помощью жюри через симметрию в степени сходства. Мы сравнили результаты с моделями, работающими на основе визуальных признаков, лейблов и семантических эмбеддингов, полученных из описаний анимаций. Эмбеддинги были сформированы с использованием различных моделей, таких как GloVe и Word2Vec. ## Результаты В **Study 1** наблюдались различные варианты оценки пользователей, что подтвердило сложность ручных анализов. В **Study 2** семантические модели показали лучшую точность по сравнению с моделями на основе лейблов и визуальных признаков. Особенно эффективны были модели на основе глаголов из описаний анимаций. Эти результаты указывают на важность семантической структуры социальных взаимодействий в понимании человеческих впечатлений. ## Значимость Наша работа имеет практическое значение в области зрения компьютеров и обучения машин. Мы демонстрируем, что семантические модели могут расширять визуальные модели, улучшая понимание социальных взаимодействий. Это может быть применено в разработке интеллектуальных систем, например, в системах, которые распознают социальные ситуации для социального помощника или для видеоанализа в социальных сетях. Мы также открываем пути для будущих исследований в области искусственного зрения, компьютерного зрения и квантовой интеллектуальной системы. ## Выводы Наши исследования показали, что человеческая семантическая представление социальных взаимодействий заключается не только в визуальных признаках, но и в семантической структуре отношений. Эти результаты могут помочь создать более точные модели в различных областях, таких как искусст

Annotation:

Humans are social creatures who readily recognize various social interactions from simple display of moving shapes. While previous research has often focused on visual features, we examine what semantic representations that humans employ to complement visual features. In Study 1, we directly asked human participants to label the animations based on their impression of moving shapes. We found that human responses were distributed. In Study 2, we measured the representational geometry of 27 social...

ID: 2509.20673v1 cs.CV, cs.CE, cs.CL

arXiv PDF

📄 Hybrid Machine Learning Framework for Predicting Geometric Deviations from 3D Surface Metrology

2025-08-14

Авторы:

Hamidreza Samadi, Md Manjurul Ahsan, Shivakumar Raman

## Контекст Господствующим угрозой качеству и надежности многих производственных процессов являются геометрические неточности в производимых компонентах. Несмотря на развитие современных технологий изготовления, поддержание высокой точности остается значительной проблемой, особенно при изготовлении компонентов с сложными геометрическими формами. Это приводит к увеличению отходов, ухудшению надежности и повышению затрат. Данная работа адресует эту проблему, ориентируясь на использование 3D-сканирования и искусственного интеллекта для точного прогнозирования геометрических неточностей. ## Метод Процесс исследования включал сбор и обработку данных с помощью высокорезольвентного 3D-сканера. Были обработаны данные с 237 компонентов, изготовленных в разных партиях. Данные были тщательно анализированы и обработаны с использованием методов уменьшения шума, выравнивания и мержинга в 3D-представлениях. Для построения модели использовались алгоритмы глубокого обучения. Методология включала гибридную модель, где алгоритмы современного машинного обучения, такие как сверточные нейронные сети для извлечения признаков, и градиентно усиленные решающие деревья для прогнозирования, были объединены в единую систему. ## Результаты Результаты экспериментов показали, что полученная модель достигла значительной точности прогнозирования геометрических неточностей, достигая значения 0,012 мм при уровне доверия 95%. Это составляет прирост примерно в 73% по сравнению с традиционными методами статистического контроля процессов. Более того, модель выделила важные корреляции между производственными параметрами и геометрическими неточностями, до этого недоступными для анализа. Это дает возможность проводить автоматизированный контроль качества, прогностическое обслуживание и оптимизации дизайна в производстве точных компонентов. ## Значимость Предложенная модель может применяться в различных отраслях, включая авиастроение, автомобилестроение и медицинскую промышленность. Она обеспечивает значительное повышение точности прогнозирования, позволяя быстрее и эффективнее реагировать на проблемы. Также, новый подход создает возможности для развития новых алгоритмов и моделей для прогнозирования производственных неточностей. Данный исследовательский подход открывает новую плоскость развития в области цифровой индустрии и производственного контроля. ## Выводы Данная работа доказывает эффективность гибридных моделей машинного обучения для развития прогностических моделей в производстве. Модель позволяет не только повысить точность прогностических моделей, но и открыть новые в

Annotation:

This study addresses the challenge of accurately forecasting geometric deviations in manufactured components using advanced 3D surface analysis. Despite progress in modern manufacturing, maintaining dimensional precision remains difficult, particularly for complex geometries. We present a methodology that employs a high-resolution 3D scanner to acquire multi-angle surface data from 237 components produced across different batches. The data were processed through precise alignment, noise reductio...

ID: 2508.06845v1 cs.CV, cs.CE, eess.IV

arXiv PDF

📄 FinMMR: Make Financial Numerical Reasoning More Multimodal, Comprehensive, and Challenging

2025-08-09

Авторы:

Zichen Tang, Haihong E, Jiacheng Liu, Zhongjun Yang, Rongjin Li, Zihua Rong, Haoyang He, Zhuodi Hao, Xinyang Hu, Kun Ji, Ziyan Ma, Mengyuan Ji, Jun Zhang, Chenghao Ma, Qianhe Zheng, Yang Liu, Yiling Huang, Xinyi Hu, Qing Huang, Zijian Xie, Shiyao Peng

**FinMMR: Расширение Модальности, Широти Знаний и Сложности для Многомодальных Моделей в Финансовом Решении Задач** FinMMR представляет собой новую билингвальную мультимодальную бенчмарк для оценки моделей многомодального машинного обучения в области финансового численного рассуждения. Она расширяет текущие работы в трех ключевых направлениях. Сначала, FinMMR включает 4.3K вопросов и 8.7K изображений, разбитых на 14 категорий — таблицы, графики и другие визуализации, включая сложные диаграммы владения. Второй, она затрагивает 14 финансовых поддисциплин, включая корпоративное финансирование и анализ отраслей, что значительно расширяет объем финансовых знаний в сравнении с предыдущими бенчмарками. Третий, FinMMR представляет высокую сложность, требуя извлечения и интеграцию многородной финансовой информации, включая текст и сложные визуальные данные. Только самые продвинутые модели достигают 53.0% точности на трудных задачах. Этот бенчмарк мотивирует улучшение моделей многомодального машинного обучения для реальных финансовых задач.

Annotation:

We present FinMMR, a novel bilingual multimodal benchmark tailored to evaluate the reasoning capabilities of multimodal large language models (MLLMs) in financial numerical reasoning tasks. Compared to existing benchmarks, our work introduces three significant advancements. (1) Multimodality: We meticulously transform existing financial reasoning benchmarks, and construct novel questions from the latest Chinese financial research reports. FinMMR comprises 4.3K questions and 8.7K images spanning ...

ID: 2508.04625v1 cs.CV, cs.CE

arXiv PDF