📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 ControlHair: Physically-based Video Diffusion for Controllable Dynamic Hair Rendering

2025-09-30

Авторы:

Weikai Lin, Haoxiang Li, Yuhao Zhu

## Контекст Волосы, как основная компонента человеческого внешнего вида, широко используются в графическом дизайне, анимации и виртуальной реальности. Их симуляция и визуализация представляют собой сложную задачу из-за сложности динамики струй, разнообразия материальных свойств и затрудненных взаимодействий света с волосами. Несмотря на прогресс в симуляции, существующие модели предоставляют ограниченные возможности для тонкого контроля динамики волос. Решением этой проблемы может стать использование моделей видео-диффузии, которые могут генерировать высококачественные видео, но при этом не обладают возможностью точного управления динамикой волоса. Для решения этой проблемы предлагается ControlHair — новая физически обоснованная модель для управляемой динамики волос в видео. ## Метод ControlHair представляет собой гибридную систему, объединяющую физический симулятор и модель видео-диффузии. Метод работает в трех этапах. В первом этапе входные физические параметры (например, упругость и ветер) кодируются в геометрию кадра с помощью физического симулятора. Во втором этапе извлекаются периодические управляющие сигналы из геометрии кадра. В третьем этапе эти сигналы передаются в модель видео-диффузии для получения видео с желаемой динамикой волос. Этот подход разделяет логику физической симуляции от моделирования видео, что обеспечивает гибкость в работе с разными физическими моделями и упрощает процесс обучения модели видео-диффузии. ## Результаты ControlHair был протестирован на наборе данных, состоящем из 10 000 видео, и сравнивался с моделями, кондиционированными на текст и позу. Использовались различные физические ситуации, включая изменение длины, стифтовства и влияния ветра. Результаты показали, что ControlHair превосходит базовые модели, обеспечивая точный контроль динамики волос. Также были продемонстрированы три практических приложения: динамическое пробное накладывание различных стилей волос, эффекты "bullet-time" и медленный момент в кинографике. ## Значимость ControlHair открывает новый подход к моделированию динамики волос в видео, объединяя преимущества физической симуляции и моделей видео-диффузии. Он может быть применен в таких областях, как виртуальная реальность, анимация, моделирование волос в играх и видеомонтаж. Выгодно отличается гибкостью, точностью и простотой в использовании. Будущие исследования будут направлены на улучшение точности и скорости, а также расширение применений модели в различных сферах. ## Выводы ControlHair представляет собой первую физико-

Annotation:

Hair simulation and rendering are challenging due to complex strand dynamics, diverse material properties, and intricate light-hair interactions. Recent video diffusion models can generate high-quality videos, but they lack fine-grained control over hair dynamics. We present ControlHair, a hybrid framework that integrates a physics simulator with conditional video diffusion to enable controllable dynamic hair rendering. ControlHair adopts a three-stage pipeline: it first encodes physics paramete...

ID: 2509.21541v2 cs.GR, cs.CV, I.3; I.2; I.4

arXiv PDF

📄 Aerial Path Planning for Urban Geometry and Texture Co-Capture

2025-09-30

Авторы:

Weidan Xiong, Bochuan Zeng, Ziyu Hu, Jianwei Guo, Ke Xie, Hui Huang

## Контекст Изменения в области обработки изображений и сценовой реконструкции позволили создавать высококачественные геометрические модели городских сред, при условии достаточного объема съемочной информации. Однако, существующие технологии часто недостаточно уделяют внимания качеству текстуры, что приводит к визуальным несоответствиям в реконструированных моделях. В настоящем исследовании мы рассматриваем проблему совместного захвата геометрии и текстур городских сцен, используя ограниченные предварительные данные. Основным входным данным являются 2D-карта границ зданий и минимально допустимая высота самолета над ними. Мы предлагаем новую схему планирования аэродромных маршрутов, нацеленную на совместное захват изображений для построения как геометрически точных моделей, так и текстур с высоким разрешением. ## Метод Методология основывается на использовании многообъективной оптимизации с целью максимизировать фидби контента, улучшить точность геометрии и уменьшить затраты на аэродромные маршруты. Мы предложили два новых метрики для оценки качества текстуры, ориентированные на здания. Метод создает высококачественные плоские и вертикальные пики для эффективного захвата геометрии и текстуры. Оптимизационный подход выстраивает пути планирования, учитывая не только качество текстуры, но и геометрическую точность. Был предложен алгоритм последовательного планирования путей, который обеспечивает последовательность изображений с гарантией последовательности текстур. ## Результаты Мы провели эксперименты с использованием синтетических и реальных данных городских сцен. Модели, полученные с помощью нашего подхода, показали существенное улучшение качества текстуры в сравнении с традиционными техниками. Для тестирования мы использовали данные с различных городов, в том числе синтетические данные, включающие 10 тысяч строений. Оценка показала, что метод формирует корректные геометрические модели и текстуры с высоким разрешением, что обеспечивает реалистичные прототипы сцен. ## Значимость Наш подход может быть применен в сфере виртуальных географических моделей, архитектурной реконструкции и виртуальной реальности. Он обеспечивает высокое качество текстур и геометрии, уменьшает затраты на съемку, а также позволяет получить результаты с минимальным вмешательством. Это значительно повышает эффективность для приложений в интерактивных системах, виртуальных турах и улучшении архитектурной моделирования. ## Выводы Мы установили, что наш алгоритм предлагает эффективное решение для сов

Annotation:

Recent advances in image acquisition and scene reconstruction have enabled the generation of high-quality structural urban scene geometry, given sufficient site information. However, current capture techniques often overlook the crucial importance of texture quality, resulting in noticeable visual artifacts in the textured models. In this work, we introduce the urban geometry and texture co-capture problem under limited prior knowledge before a site visit. The only inputs are a 2D building conto...

ID: 2509.22227v1 cs.GR, cs.CV

arXiv PDF

📄 SeamCrafter: Enhancing Mesh Seam Generation for Artist UV Unwrapping via Reinforcement Learning

2025-09-29

Авторы:

Duoteng Xu, Yuguang Chen, Jing Li, Xinhai Liu, Xueqi Ma, Zhuo Chen, Dongyu Zhang, Chunchao Guo

#### Контекст Mesh seams являются ключевым аспектом разделения 3D-сурфацес для UV-параметризации и текстурирования. Некорректно расположенные seams могут вызвать серьезные проблемы, такие как высокая дисторция UV или избыточное разделение поверхности. Настоящие методы часто приходятся подвергаться торговле одной проблемой за другой, либо создавая высокую дисторцию, либо генерируя множество разделенных островов. В этом же контексте, новые методы необходимы для улучшения качества seams, сохраняя топологическую консистентность и визуальную фидлити. #### Метод Мы предлагаем SeamCrafter, авторегрессивную модель, выступающую в роли GPT-style seam generator, которая оперирует точечными облаками в качестве входных данных. Для повышения точности, SeamCrafter использует двух Branch Point-Cloud Encoder, который разделяет и захватывает геометрические и топологические признаки во время предобучения. Для дополнительного улучшения качества seams, мы оптимизируем модель с помощью Direct Preference Optimization (DPO), используя предпочтения полученные из новой фреймворка seam-evaluation. Этот фреймворк оценивает seams по дисторции UV и разделению островов, применяя парные предпочтения для уточнения модели. #### Результаты Мы провели множество экспериментов с разными подходами к seams. Результаты показали, что SeamCrafter значительно улучшает качество seams, уменьшая дисторцию и разделение островов. Мы проверили нашу модель на разных 3D-моделях, включая сложные и простые, и получили лучшие результаты по метрикам distortion и fragmentation в сравнении с другими методами. Также, мы проанализировали влияние нашего фреймворка на различные типы моделей и получили положительные результаты во всех сочетаниях. #### Значимость Наша модель может быть применена в различных областях, таких как 3D-моделирование, VR/AR, игровой индустрии, и других задачах, требующих точного разделения 3D-сурфацес. Улучшение качества seams не только ускоряет работу художников, но и повышает качество продуктов, особенно в текстурировании и рендеринге. Этот подход также открывает новые возможности для автоматизации и оптимизации процессов в UV-параметризации. #### Выводы Мы представили SeamCrafter, модель, которая улучшает качество seams в UV-параметризации. Наши результаты показывают, что SeamCrafter значительно превосходит предыдущие методы по метрикам distortion и fragmentation. В будущем, мы планируем расширить возможности модели, включив более сложные топологические структуры и провести дополнительные эксперименты на более крупных данных.

Annotation:

Mesh seams play a pivotal role in partitioning 3D surfaces for UV parametrization and texture mapping. Poorly placed seams often result in severe UV distortion or excessive fragmentation, thereby hindering texture synthesis and disrupting artist workflows. Existing methods frequently trade one failure mode for another-producing either high distortion or many scattered islands. To address this, we introduce SeamCrafter, an autoregressive GPT-style seam generator conditioned on point cloud inputs....

ID: 2509.20725v2 cs.GR, cs.CV

arXiv PDF

📄 ArtUV: Artist-style UV Unwrapping

2025-09-27

Авторы:

Yuguang Chen, Xinhai Liu, Yang Li, Victor Cheung, Zhuo Chen, Dongyu Zhang, Chunchao Guo

#### Контекст UV unwrapping является важной задачей в компьютерной графике, позволяющей выполнять различные операции визуального редактирования в рамках рабочих процессов рендеринга. Несмотря на развитие методов UV-развёртки, существующие способы сталкиваются с рядом проблем: долговечность, фрагментарность, отсутствие семантического смысла и неоднородность UV-островов. Эти ограничения существенно снижают практическую ценность существующих методов. Артистские UV-карты должны не только удовлетворять основным критериям, таким как отсутствие перекрытий и минимальная деформация, но и соответствовать высоким стандартам, включая чистые границы, эффективное использование пространства и семантическую согласованность. Для решения этих проблем мы предлагаем ArtUV — полностью автоматизированный полного цикла метод для создания artist-style UV-развёрток. #### Метод ArtUV разделяет задачу на две фазы: предсказание семантически осмысленных швы и артистский способ параметризации. В первой фазе, используется SeamGPT — система, основанная на генеративно-воспитательных нейронных сетях (GAN), для генерации семантически значимых швов. Эти швы учитывают семантические особенности меша и позволяют получить более естественный результат. Во второй фазе, сгенерированные швы используются вместе с мешом в оптимизационно-подобной модели, чтобы получить начальную UV-параметризацию. Затем, используя Auto-Encoder, эта начальная параметризация преобразуется в artist-style UV-карту. Особенностью ArtUV является то, что она сохраняет семантическую согласованность и топологическую структуру меша, обеспечивая качественное и удобное для 2D-редактирования решение. #### Результаты Мы провёряли ArtUV на нескольких наборах данных, включая сложные 3D-модели, и сравнивали результаты с трёх ручных методов. Наши эксперименты показали, что ArtUV превосходит другие методы как по скорости, так и по качеству результатов. Мы также проанализировали точность предсказания швов и качество рефинирования UV-карт. Результаты показывают, что ArtUV обеспечивает высокую точность, эффективность и семантическую согласованность, что делает её подходом привлекательным для профессиональных приложений. #### Значимость ArtUV может быть использована в различных областях, включая видеоигры, анимацию, виртуальную реальность и другие приложения в компьютерной графике. Особым преимуществом является возможность быстрого и качественного создания artist-style UV-карт, что уменьшает время на ручное редактирование. Это позволяет увеличить производительность в разработке гра

Annotation:

UV unwrapping is an essential task in computer graphics, enabling various visual editing operations in rendering pipelines. However, existing UV unwrapping methods struggle with time-consuming, fragmentation, lack of semanticity, and irregular UV islands, limiting their practical use. An artist-style UV map must not only satisfy fundamental criteria, such as overlap-free mapping and minimal distortion, but also uphold higher-level standards, including clean boundaries, efficient space utilizatio...

ID: 2509.20710v1 cs.GR, cs.CV

arXiv PDF

📄 SeamCrafte: Enhancing Mesh Seam Generation for Artist UV Unwrapping via Reinforcement Learning

2025-09-27

Авторы:

Duoteng Xu, Yuguang Chen, Jing Li, Xinhai Liu, Xueqi Ma, Zhuo Chen, Dongyu Zhang, Chunchao Guo

## Контекст Меш-сеты (mesh) широко используются в трехмерной графике, виртуальной реальности, играх и других приложениях, где требуется работа с трехмерными моделями. Одной из ключевых задач при работе с этими моделями является UV-разделение (UV-unwrapping), которое заключается в разбиении трехмерной поверхности на плоские участки (плоскости) для дальнейшего текстурирования. Центральной проблемой в этой области является поиск достаточно качественной сетки стыков (seams), которая минимизирует растяжение текстуры (distortion) и уменьшает количество фрагментов (fragmentation). Несоответствующие стыковые линии могут привести к неестественной повторяемости текстуры или к тому, что текстура будет неправильно растянута на модели. Несмотря на то, что существуют методы автоматического разделения сетки, они часто приводят к тому, что либо растяжение текстур сильно завышается, либо количество фрагментов становится слишком большим. Это приводит к необходимости в ручном вмешательстве или дополнительной повторной работе. Было предложено новый подход, SeamCrafter, который призван улучшить этот процесс, используя стиль GPT и технологии reinforcement learning. ## Метод SeamCrafter представляет собой авторегрессивную модель GPT, которая генерирует стыковые линии для трехмерных моделей. Основным инновационным аспектом является то, что модель обучается не только с целью минимизации растяжения и фрагментации, но также с учетом точечных облаков (point clouds), которые представляют трехмерную модель. Модель имеет двух branch-энкодер (двух различных кодировщиков), что позволяет ей различать и понять как топологические, так и геометрические аспекты модели. Затем, в процессе оптимизации, используется метод Direct Preference Optimization (DPO). Этот метод позволяет учитывать предпочтения художников и графических специалистов, генерируя стыковые линии, которые оптимальны по мнению экспертов. Таким образом, модель SeamCrafter обучается на заранее подготовленных данных, считая приоритеты как распределение размеров участков, так и геометрические особенности. ## Результаты В ходе экспериментов был проведен сравнительный анализ SeamCrafter с другими методами разделения меш-сетей. Для этого был проведен бенчмарк с различными типами моделей, включая те, которые имели высокий уровень растяжения, и те, что имели много фрагментов. На основе этого были измерены распределения размеров фрагментов, их растяжение и геометрические особенности. Результаты показали, что SeamCrafter значительно улучшает качество стыков по сравнению с другими методами. Оно показало существенно меньшее растяжение и меньшую фрагментацию. Были также проведены визуальные эксперимен

Annotation:

ID: 2509.20725v1 cs.GR, cs.CV

arXiv PDF

📄 ARMesh: Autoregressive Mesh Generation via Next-Level-of-Detail Prediction

2025-09-27

Авторы:

Jiabao Lei, Kewei Shi, Zhihao Liang, Kui Jia

## Контекст 3D-моделирование является основополагающей компонентой современных графических приложений, включая игры, виртуальную реальность и анимацию. Основным представителем трехмерных объектов в этой сфере является трехмерная решётка (mesh). Несмотря на то, что автокорреляционные модели стали популярными для генерации 3D-решёток, их традиционный подход, включающий генерацию по граней в лексикографическом порядке, часто не соотносится с человеческим представлением о геометрии. Это приводит к неэффективности в представлении и редактировании геометрических моделей. В этом контексте важно разработать прогрессивный подход, позволяющий управлять процессом генерации, улучшать качество моделей и оптимизировать время их построения. ## Метод Методология ARMesh основывается на идее генерировать 3D-решётки с использованием моделей с авторегрессией (AR) в прогрессивном порядке от простых к уточненным. Основополагающим элементом является переработка методов упрощения 3D-решёток, когда графы постепенно сокращаются для обеспечения более простой репрезентации. Авторы предлагают перевернуть этот подход и использовать трансформер-модели для построения геометрии в обратном порядке — от простого к сложному. Эта модель строит модель, начиная с одной точки и постепенно добавляя детали с помощью локального переработки топологии. Этот подход позволяет контролировать качество и время генерации благодаря возможности раннего завершения процесса. ## Результаты Исследования проводились на наборе данных с различными типами трехмерных моделей, включая сложные сцены и индивидуальные объекты. Модель ARMesh показала способность генерировать высококачественные решётки с точностью, продемонстрировав большую эффективность по сравнению с другими подходами. Также было продемонстрировано, что пользователи могут контролировать уровень детализации и скорость генерации, применяя процедуру раннего останова. Это делает модель применимую в таких областях, как редактирование геометрии, улучшение моделей и виртуальная реальность. ## Значимость Результаты ARMesh открывают пути для применения в широком круге графических и виртуальных приложений. Она обеспечивает улучшенное управление качеством геометрии, увеличивает скорость генерации моделей и позволяет выполнять редактирование в реальном времени. Это может оказаться критически важной для индустрии, где требуется высокая точность и гибкость в работе с трехмерными моделями. ## Выводы Модель ARMesh представляет собой прорыв в области генерирования 3D-решёток, обеспечивая прогрессивный подход к постро

Annotation:

Directly generating 3D meshes, the default representation for 3D shapes in the graphics industry, using auto-regressive (AR) models has become popular these days, thanks to their sharpness, compactness in the generated results, and ability to represent various types of surfaces. However, AR mesh generative models typically construct meshes face by face in lexicographic order, which does not effectively capture the underlying geometry in a manner consistent with human perception. Inspired by 2D m...

ID: 2509.20824v1 cs.GR, cs.CV

arXiv PDF

📄 ArchGPT: Understanding the World's Architectures with Large Multimodal Models

2025-09-27

Авторы:

Yuze Wang, Luo Yang, Junyi Wang, Yue Qi

## Контекст Архитектура является не только функциональным элементом жизни людей, но и творческим и культурным явлением, отображающим ценности, историю и культурные особенности разных народов. Однако существующие виртуальные, повышенной или смешанной реальностях не всегда удается полностью отобразить все значимые аспекты архитектуры, такие как стиль, структура, исторические значения и эстетические характеристики. В этом контексте возникает потребность в развитии методов, позволяющих более глубоко и точно интерпретировать и визуализировать архитектурные объекты, чтобы улучшить понимание и доступность этого направления для различных аудиторий. ## Метод Чтобы решить эту проблему, предлагается ArchGPT — модель визуального вопроса-ответа, объединяющая несколько моделей различных моделей. Её модель основывается на ShareGPT4V-7B, которая была усовершенствована для работы с архитектурными данными. Методология включает несколько ключевых этапов: 1. **Сбор данных**: Используется специальная подборка архивированных сцен из Wikimedia Commons. Для получения качественных изображений проводится фильтрация неконтролируемых туристических фотографий. Это делается с помощью трёхмерного реконструкции и семантической сегментации, чтобы выбрать кристально чистые изображения строений без оккультации. 2. **Очистка и анализ текстовых метаданных**: Для того, чтобы избежать шума и неоднозначности в метаданных, применяется текстовая модель с высоким уровнем технологического прогресса. Она улучшает качество вопросов и ответов, связанных с архитектурой. 3. **Синтез дополнительных данных**: Для повышения семантического разнообразия вводятся дополнительные вопросы-ответы, основанные на глубоких анализах архитектурных элементов. ## Результаты Проведенные эксперименты показали, что ArchGPT может давать точные ответы на вопросы, связанные с архитектурой, и обладает возможностью анализировать различные аспекты, такие как стиль, форма, цвет и другие. Данные, полученные с помощью Arch-300K, позволили подтвердить эффективность модели в применении к различным архитектурным стилям и периодам. ## Значимость Результаты могут быть применены в различных областях: - **Образование**: Улучшение уровня понимания архитектурных творений у студентов и учащихся. - **Сохранение культурного наследия**: Повышение доступности информации для широкой аудитории. - **Профессиональное дизайновое творчество**: Предоставление новых возможностей для творческой работы в области архитектуры. ## Выводы ArchGPT д

Annotation:

Architecture embodies aesthetic, cultural, and historical values, standing as a tangible testament to human civilization. Researchers have long leveraged virtual reality (VR), mixed reality (MR), and augmented reality (AR) to enable immersive exploration and interpretation of architecture, enhancing accessibility, public understanding, and creative workflows around architecture in education, heritage preservation, and professional design practice. However, existing VR/MR/AR systems are often dev...

ID: 2509.20858v1 cs.GR, cs.CV, cs.MM

arXiv PDF

📄 CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling

2025-09-27

Авторы:

Yuze He, Yanning Zhou, Wang Zhao, Jingwen Ye, Yushi Bai, Kaiwen Xiao, Yong-Jin Liu, Zhongqian Sun, Wei Yang

## Контекст Область исследования связана с 3D-моделированием аниме-причесок, которая характеризуется высоким стилизованным геометрическим подходом. Существующие методы строятся на мешевых или волокнистых моделях, что неэффективно для редактирования и не подходит для применения в масштабных задачах обучения. Отсутствие эффективной параметрической модели для этой специфической области моделирования является основной мотивацией для разработки CHARM. ## Метод CHARM предлагает новую параметрическую модель, основанную на узлах управления. Каждая трехмерная карта волос представляется через последовательность узлов управления, каждый из которых описывается пятью геометрическими параметрами. Эта модель обеспечивает точность и простоту редактирования. Чтобы обучить модель, авторы представили AnimeHair — большую выборку 37K высококачественных аниме-причесок с разделенными картами волос. Для генерации использована авторегрессионная модель на основе transformer'а, которая передает "язык волос" — от локальных геометрических форм к глобальной топологии причесок. ## Результаты Исследования проводились на AnimeHair, где CHARM показала высокую точность в воспроизведении и генерации причесок. Оценены показатели реконструкции и генерации, показавшие значительное превосходство CHARM перед современными методами. Это доказывает высокую эффективность модели как для редактирования, так и для создания новых причесок. ## Значимость CHARM может использоваться в разработке графических игр, анимации, а также в искусственном интеллекте для понимания геометрической структуры. Её преимущества заключаются в высокой эффективности, точности и эффектности при работе с стилизованным геометрическим подходом. Потенциальное влияние заключается в расширении возможностей для стилизованной графики и искусственных моделей в области визуальных искусств. ## Выводы CHARM представляет собой новую эффективную параметрическую модель для 3D-моделирования аниме-причесок. Она успешно справляется с вызовами, связанными с редактированием и генерацией. Будущие исследования могут нацелены на расширение модели для работы с другими стилизованными геометрическими объектами.

Annotation:

We present CHARM, a novel parametric representation and generative framework for anime hairstyle modeling. While traditional hair modeling methods focus on realistic hair using strand-based or volumetric representations, anime hairstyle exhibits highly stylized, piecewise-structured geometry that challenges existing techniques. Existing works often rely on dense mesh modeling or hand-crafted spline curves, making them inefficient for editing and unsuitable for scalable learning. CHARM introduces...

ID: 2509.21114v1 cs.GR, cs.CV

arXiv PDF

📄 SceneWeaver: All-in-One 3D Scene Synthesis with an Extensible and Self-Reflective Agent

2025-09-26

Авторы:

Yandan Yang, Baoxiong Jia, Shujie Zhang, Siyuan Huang

## Контекст Область виртуальных и интерактивных 3D-сред у presedstavljaet важность в сферах, таких как Embodied AI, имитационные игры, виртуальная реальность и интеллектуальные агенты. Однако создание 3D-сцен, которые не только выглядят реалистично, но и логично организованы с точки зрения физики и функциональности, остается сложной задачей. Существующие подходы часто ограничиваются фиксированными категориями сцен или недостаточным детализмом объектов, что приводит к несоответствию пользовательских инструкций или функциональным требованиям. Эти ограничения способствуют поиску новых подходов, которые могли бы объединить возможности различных методов синтеза сцен, обеспечивая гибкость и точность. ## Метод SceneWeaver — это расширяемый и саморефлексирующий фреймворк, который объединяет различные методы синтеза 3D-сцен с использованием инструментов основанных на генеративных моделях и технологиях глубокого обучения. Основным компонентом является language model-based planner, который выбирает соответствующие инструменты на каждом этапе синтеза. Эти инструменты включают в себя сгенерированные с помощью моделей глубокого обучения, а также методы, основанные на визуальных и текстовых сигналах. Фреймворк работает в замкнутом цикле: планировщик оценивает физическую точность, визуальную реалистичность и семантическое соответствие, а затем применяет нужные инструменты для корректировки сцены. Этот подход позволяет SceneWeaver адаптироваться к различным сценариям и компонентам, создавая более точные и функционально разнообразные сцены. ## Результаты Наблюдается значительное улучшение в основных метриках, включая физическую точность, визуальную реалистичность и семантическую аккуратность. SceneWeaver показал способность эффективно обрабатывать сложные пользовательские инструкции и охватывать широкий спектр сценариев. Эксперименты проводились на различных типах сцен, включая общедоступные комнаты и сцены с открытым словарем. Это позволило установить, что SceneWeaver превосходит другие методы как на тестовых, так и на реальных пользовательских задачах. ## Значимость Сцены, сгенерированные SceneWeaver, могут использоваться в различных приложениях, таких как Embodied AI, имитационные игры, виртуальная реальность и дизайн интерьеров. Главный преимущество этого подхода заключается в его расширяемости и саморефлексирующей структуре, которая позволяет улучшать качество сцен во время выполнения. Это открывает путь к новым возможностям в области генеративных моделей и интерактивных систем. ## Выводы SceneWeaver представляет собой полностью расширяем

Annotation:

Indoor scene synthesis has become increasingly important with the rise of Embodied AI, which requires 3D environments that are not only visually realistic but also physically plausible and functionally diverse. While recent approaches have advanced visual fidelity, they often remain constrained to fixed scene categories, lack sufficient object-level detail and physical consistency, and struggle to align with complex user instructions. In this work, we present SceneWeaver, a reflective agentic fr...

ID: 2509.20414v1 cs.GR, cs.CV, cs.LG, cs.RO

arXiv PDF

📄 Differentiable Light Transport with Gaussian Surfels via Adapted Radiosity for Efficient Relighting and Geometry Reconstruction

2025-09-25

Авторы:

Kaiwen Jiang, Jia-Mu Sun, Zilu Li, Dan Wang, Tzu-Mao Li, Ravi Ramamoorthi

## Контекст Исследования в области разновидности радиусных полей (radiance fields) показали огромный потенциал в таких прикладных областях, как моделирование перспективных производительностей и восстановление геометрических форм. Однако, классические подходы, основанные на Gaussian splatting, сталкивались с ограничениями в моделировании отражений и световых условий, что приводило к значительным геометрическим неопределенностям и сложностям в процессе повторного осветления (relighting). Для устранения этих проблем может быть применена физическая основа в виде рендеринга, однако данный подход требует высокой вычислительной сложности. Ранее работы стремились сократить этот риск, применяя упрощения, которые делали решение эффективным, но менее точным. В данной работе предлагается новый подход, основанный на применении Gaussian surfels как основных примитивов, в контексте развития различных цветовых моделей, включая добавление учета интегральных операций в радиусных полях. ## Метод Основная идея работы заключается в представлении света и материалов с использованием теории радиосити (radiosity), но в рамках расширенной модели, которая учитывает не только бинарную видимость, но и полупрозрачные примитивы. Для этого вводится развитая архитектура, основанная на методе шаровых гармоник, которая позволяет моделировать как диффузное, так и спекулярное отражение. В дополнение, предложены новые алгоритмы, позволяющие эффективно решать задачи рендеринга и оптимизации цвета в контексте распределенного компьютерного визуализации. Также разработаны новые решения для внутреннего прохода оптимизации, которые эффективнее автоматических дифференциаторов. ## Результаты Исследование включает в себя многочисленные эксперименты с использованием различных данных и условий света. Были проведены эксперименты для оценки точности геометрического восстановления, производительности во время реализации и качества синтеза перспективных изображений. Результаты показали, что предложенный подход превосходит существующие базы данных и методы противоположной природы в области разновидности радиусных полей. Особое внимание было уделено оценке восстановления геометрии и качества релайтинга в условиях известных и неизвестных световых условий. ## Значимость Данная работа имеет значительное значение в области инверсного рендеринга и моделирования света. Она может быть применена в таких технологиях, как моделирование перспективных изображений, виртуальная реальность и анимация. Особым преимуществом является увеличение производительности, обеспечение точности и надежности во время оптимизации, что делает эту моде

Annotation:

Radiance fields have gained tremendous success with applications ranging from novel view synthesis to geometry reconstruction, especially with the advent of Gaussian splatting. However, they sacrifice modeling of material reflective properties and lighting conditions, leading to significant geometric ambiguities and the inability to easily perform relighting. One way to address these limitations is to incorporate physically-based rendering, but it has been prohibitively expensive to include full...

ID: 2509.18497v1 cs.GR, cs.CV

arXiv PDF

Показано 51 - 60 из 115 записей