📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 MotionV2V: Editing Motion in a Video

2025-11-27

Авторы:

Ryan Burgert, Charles Herrmann, Forrester Cole, Michael S Ryoo, Neal Wadhwa, Andrey Voynov, Nataniel Ruiz

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

While generative video models have achieved remarkable fidelity and consistency, applying these capabilities to video editing remains a complex challenge. Recent research has explored motion controllability as a means to enhance text-to-video generation or image animation; however, we identify precise motion control as a promising yet under-explored paradigm for editing existing videos. In this work, we propose modifying video motion by directly editing sparse trajectories extracted from the inp...

ID: 2511.20640v1 cs.CV, cs.AI, cs.GR, cs.LG

arXiv PDF

📄 TAUE: Training-free Noise Transplant and Cultivation Diffusion Model

2025-11-06

Авторы:

Daichi Nagai, Ryugo Morita, Shunsuke Kitada, Hitoshi Iyatomi

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Despite the remarkable success of text-to-image diffusion models, their output of a single, flattened image remains a critical bottleneck for professional applications requiring layer-wise control. Existing solutions either rely on fine-tuning with large, inaccessible datasets or are training-free yet limited to generating isolated foreground elements, failing to produce a complete and coherent scene. To address this, we introduce the Training-free Noise Transplantation and Cultivation Diffusion...

ID: 2511.02580v1 cs.CV, cs.AI, cs.GR, cs.LG

arXiv PDF

📄 Track, Inpaint, Resplat: Subject-driven 3D and 4D Generation with Progressive Texture Infilling

2025-10-29

Авторы:

Shuhong Zheng, Ashkan Mirzaei, Igor Gilitschenski

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Current 3D/4D generation methods are usually optimized for photorealism, efficiency, and aesthetics. However, they often fail to preserve the semantic identity of the subject across different viewpoints. Adapting generation methods with one or few images of a specific subject (also known as Personalization or Subject-driven generation) allows generating visual content that align with the identity of the subject. However, personalized 3D/4D generation is still largely underexplored. In this work,...

ID: 2510.23605v1 cs.CV, cs.AI, cs.GR, cs.LG, cs.RO

arXiv PDF

📄 HoloGarment: 360° Novel View Synthesis of In-the-Wild Garments

2025-09-17

Авторы:

Johanna Karras, Yingwei Li, Yasamin Jafarian, Ira Kemelmacher-Shlizerman

#### Контекст Отрисовка предметов в 360° позволяет получить разногласие вида, что широко применяется в графике компьютерной графики, виртуальной реальности и ретуши. Однако, новые виды (novel view synthesis, NVS) на предметах, особенно на одежде, требуются труднообходимые условия: сильные затенения, нетиповые позы тела, деформации ткани. Использование синтетических 3D-данных, часто статичных и без затенения, оказывается неэффективным в реальной жизни. Целью данной работы является создание метода, позволяющего генерировать 360°-виды предметов, одежды в частности, в непредсказуемых реальных условиях. #### Метод Предлагаемый подход, HoloGarment, основан на создании "атласа" ткани, который представляет собой 3D-представление всех видов предмета в точках 360°. Метод принимает в качестве входных данных от 1 до 3 изображений или видео с перемещением человека в одежде и генерирует 360°-виды в канонической позе. Главным инновационным решением является создание универсального метода, который объединяет 3D-трэйнинг с реальными 2D-данными. Это достигается с помощью внедрения имплазированного тренировочного парадигмы, в которой тренируется общий пространственный семантический признак для реальных и синтетических данных. Для построения атласа ткани, используется формирование трехмерной модели предмета на основе реальных видов с последующим оптимизационным процессом, который позволяет генерировать канвонные виды в любых положениях. #### Результаты Исследования проводились на стандартных датасетах, включающих как 2D-изображения, так и 3D-модели. Результаты показали, что HoloGarment превосходит другие методы NVS, особенно на видах, где требуется учитывать затенения, деформации ткани и различные позы тела. Доказано, что HoloGarment может быстро адаптироваться к новым данным, создавая точные 3D-модели по 2D-изображениям. Это улучшение в NVS в реальных условиях достигается благодаря совмещению данных из разных источников и оптимизации пространственных семантических признаков. #### Значимость Метод HoloGarment может применяться в сферах синтеза и редактирования изображений, виртуальной и расширенной реальности, где требуется точное 3D-представление одежды в различных позях. Он отличается робастностью в работе с реальными условиями, такими как затенения, неоднородность ткани, ошибки позы. Этот подход может быть использован для виртуального трибуна и модных коллекций, где нужно быстро подготовить 3D-модели в разных позях. #### Выводы Результаты свидетельствуют о том, что HoloGarment является новато

Annotation:

Novel view synthesis (NVS) of in-the-wild garments is a challenging task due significant occlusions, complex human poses, and cloth deformations. Prior methods rely on synthetic 3D training data consisting of mostly unoccluded and static objects, leading to poor generalization on real-world clothing. In this paper, we propose HoloGarment (Hologram-Garment), a method that takes 1-3 images or a continuous video of a person wearing a garment and generates 360{\deg} novel views of the garment in a c...

ID: 2509.12187v1 cs.CV, cs.AI, cs.GR, cs.LG

arXiv PDF

📄 RayletDF: Raylet Distance Fields for Generalizable 3D Surface Reconstruction from Point Clouds or Gaussians

2025-08-15

Авторы:

Shenxing Wei, Jinxi Li, Yafei Yang, Siyuan Zhou, Bo Yang

#### Контекст Область исследования 3D-сурфейс-реконструкции из точечных множеств или 3D-Гауссиан (т.е., приближенных нормальных распределений) является актуальной для многих прикладных задач, таких как виртуальная реальность, робототехника, 3D-дизайн и инспекция. Несмотря на успех методов, основанных на координатах (Coordinate-Based Methods, CBM), они часто сталкиваются с высокими затратами ресурсов при рендеринге точных эксплорных сурфейсов. Такие методы требуют многократного обращения к нейросетевым моделям для каждого пикселя, что приводит к высокому времени вычислений и неэффективности. Тем самым, существует необходимость в разработке более эффективных, гибких и производительных алгоритмов для решения этой задачи. #### Метод Метод RayletDF предлагает инновационный подход к решению проблемы 3D-сурфейс-реконструкции. Основная идея заключается в использовании "raylet distance field" (RDF), который рассчитывает расстояние до ближайшего сурфейса для каждого исследоваемого луча (raylet). Этот подход позволяет избежать непосредственного вычисления координат сурфейсной точки и, следовательно, снижает компьютерные затраты. Архитектура RayletDF состоит из трех модулей: 1. **Raylet Feature Extractor** — извлекает тонкие локальные геометрические признаки из запросов лучей. 2. **Raylet Distance Field Predictor** — прогнозирует расстояния до сурфейса по этим признакам. 3. **Multi-Raylet Blender** — комбинирует несколько прогнозов для построения точных сурфейсных точек. Эта архитектура обеспечивает точные и производительные реконструкции сурфейсов, с минимальными вычислительными затратами. #### Результаты Работа была проверена на нескольких широко известных реальных данных, в том числе в таких областях, как 3D-сурфейс-реконструкция и виртуальная реальность. Использовались различные точечные множества и 3D-Гауссианы, полученные с помощью 3DGS (3D Gaussian Sampling) из RGB-изображений. Полученные результаты сравнивались с другими современными методами, показав существенное преимущество RayletDF в скорости и точности реконструкции сурфейсов. Особенно выдающимся был его результат в области общей гибкости: RayletDF способен выполнить рендеринг 3D-сурфейсов в одном проходе (single-forward-pass) даже на неизвестных данных. #### Значимость Полученный подход имеет широкие приложения в сферах, требующих эффективной и точной 3D-реконструкции, таких как виртуальная реальность, робототехника, 3D-анализ и отображение. Он отличается высокой скоростью исполнения и гибкостью при работе с различными типами данных. В отличие от методов CBM, RayletDF не требует многократных вызовов нейросети, что де

Annotation:

In this paper, we present a generalizable method for 3D surface reconstruction from raw point clouds or pre-estimated 3D Gaussians by 3DGS from RGB images. Unlike existing coordinate-based methods which are often computationally intensive when rendering explicit surfaces, our proposed method, named RayletDF, introduces a new technique called raylet distance field, which aims to directly predict surface points from query rays. Our pipeline consists of three key modules: a raylet feature extractor...

ID: 2508.09830v1 cs.CV, cs.AI, cs.GR, cs.LG, cs.RO

arXiv PDF