📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 Spatiotemporal Pyramid Flow Matching for Climate Emulation

2025-12-04

Авторы:

Jeremy Andrew Irvin, Jiaqi Han, Zikui Wang, Abdulaziz Alharbi, Yufei Zhao, Nomin-Erdene Bayarsaikhan, Daniele Visioni, Andrew Y. Ng, Duncan Watson-Parris

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Generative models have the potential to transform the way we emulate Earth's changing climate. Previous generative approaches rely on weather-scale autoregression for climate emulation, but this is inherently slow for long climate horizons and has yet to demonstrate stable rollouts under nonstationary forcings. Here, we introduce Spatiotemporal Pyramid Flows (SPF), a new class of flow matching approaches that model data hierarchically across spatial and temporal scales. Inspired by cascaded vide...

ID: 2512.02268v1 cs.CV, cs.AI, cs.LG, eess.IV, stat.ML

arXiv PDF

📄 Composition and Alignment of Diffusion Models using Constrained Learning

2025-08-28

Авторы:

Shervin Khalafi, Ignacio Hounie, Dongsheng Ding, Alejandro Ribeiro

## Контекст Generative модели, такие как diffusion models, стали популярными в области машинного обучения, в частности в генерировании графических изображений. Они могут хорошо работать в сложных распределениях, но часто сталкиваются с проблемами соответствия пользовательским требованиям. Два распространенных подхода к улучшению качества и соответствия выходных данных являются **alignment** (согласование модели с определенным регулятором) и **composition** (комбинирование различных моделей для достижения более широкого спектра качественных выходных данных). Однако, при попытке оптимизировать модель по нескольким критериям, возникают конфликты между ними, так как различные модели могут отражать противоречивые атрибуты. Существующие методы не могут гарантировать успех в создании модели, которая бы удовлетворяла всем требуемым критериям. Наша работа фокусируется на создании фреймворма, который может комбинировать и выравнивать модели diffusion, учитывая оба критерия — композицию и выравнивание. ## Метод Мы предлагаем новый фреймворк, который использует **constrained optimization**, чтобы объединить alignment и composition моделей diffusion. Фреймворк оптимизирует модель, чтобы она удовлетворяла определенным требованиям в плане выполнения, при этом оставаясь близкой к одной или нескольким предварительно обученным моделям. Мы используем технику Lagrangian-based primal-dual optimization для того, чтобы решать эти задачи в рамках нашей модели. Наша архитектура позволяет построить модель, которая решает проблему конфликта между несколькими требованиями, управляя ими в соответствии с предварительно определенными ограничениями. Алгоритм нашего подхода позволяет решать задачи композиции и выравнивания в рамках одной модели. ## Результаты Мы проверили нашу модель на задаче генерирования изображений, применяя ее как для выравнивания, так и для композиции. Мы сравнили результаты наших моделей с моделями, которые использовались в простых подходах, таких как equally-weighted approach. Мы показали, что наш подход эффективно решает задачи выравнивания и композиции, а также показал улучшение в выполнении по сравнению с методами, которые не учитывали ограничения. Эксперименты проводились на различных данных, позволяя проверить эффективность нашего подхода в разных условиях. ## Значимость Мы показали, что наша модель эффективно решает задачи в области машинного генерирования изображений, когда необходимо учитывать несколько разных критериев. Наш подход можно применить в различных областях, таких как генерирование изображений, текста, звука и даже в медицинской обработке изображений. Мы показали, что наша модель может лучше справиться с задачей сохранения нескольких атрибутов, что делает ее боле

Annotation:

Diffusion models have become prevalent in generative modeling due to their ability to sample from complex distributions. To improve the quality of generated samples and their compliance with user requirements, two commonly used methods are: (i) Alignment, which involves fine-tuning a diffusion model to align it with a reward; and (ii) Composition, which combines several pre-trained diffusion models, each emphasizing a desirable attribute in the generated outputs. However, trade-offs often arise ...

ID: 2508.19104v1 cs.LG, eess.IV, stat.ML

arXiv PDF

📄 OpenHAIV: A Framework Towards Practical Open-World Learning

2025-08-13

Авторы:

Xiang Xiang, Qinhao Zhou, Zhuo Xu, Jing Ma, Jiaxin Dai, Yifan Liang, Hanlin Li

## Контекст Открытый мир (open-world) — это многопрофильная область исследований, которая направлена на обнаружение и обработку неизвестных классов в данных. Открытый мир отличается от стандартных сценариев, где модели обучаются только на известных классах. В открытом мире необходимо обнаруживать неизвестные классы и обновлять модель в режиме реального времени. Существующие методы, такие как OOD-обнаружение и инкрементное обучение, сталкиваются с проблемами: OOD-обнаружение не обновляет знания модели, а инкрементное обучение требует наличия меток для новых классов, что не соответствует открытому миру. Наличие этих проблем подчеркивает необходимость разработки универсального подхода, который мог бы объединить OOD-обнаружение, обнаружение новых классов и инкрементное обучение в единое целое. ## Метод OpenHAIV представляет собой инновационный фреймворк, который решает вышеуказанные проблемы. Он состоит из трех основных компонентов: 1. **OOD-обнаружение (Out-of-Distribution Detection):** Этот компонент позволяет модели определять новые классы в данных. 2. **Обнаружение новых классов (New Class Discovery):** Этот модуль использует OOD-обнаруженные данные для выделения и обработки новых классов. 3. **Инкрементное обучение (Incremental Continual Fine-tuning):** Этот модуль обновляет модель, используя обнаруженные новые классы, и позволяет ей продолжительно обучаться в открытом мире. Технология OpenHAIV лежит в основе модели представления, объединяющей эти компоненты в единую целостную систему. ## Результаты Эксперименты проводились на стандартных датасетах, в том числе CIFAR-100, ImageNet или TinyImageNet. Открытый мир был воспроизведен, добавляя неизвестные классы во время выполнения. Результаты показали, что OpenHAIV превосходит существующие методы в обнаружении неизвестных классов, в новом классе обнаружения и сохранении модели на протяжении длительного времени. Открытый код и результаты доступны на сайте https://haiv-lab.github.io/openhaiv . ## Значимость OpenHAIV открывает новые возможности в широких областях применения, таких как робототехника, медицина, анализ данных и мониторинг сетей. Он позволяет моделям не только распознавать данные, но и адаптироваться к новым условиям в реальном времени. Это предоставляет потенциал для улучшения производительности в сложных интеллектуальных системах. ## Выводы OpenHAIV представляет собой новую модель, которая объединяет OOD-обнаружение, обнаружение новых классов и инкрементное обучение. Это решение развивает открытый мир, расширяя возможности моделей в реальном времени. Будущие исследования будут направлены на улучшение эффективности фреймворка, а также на расширение его применения в разли

Annotation:

Substantial progress has been made in various techniques for open-world recognition. Out-of-distribution (OOD) detection methods can effectively distinguish between known and unknown classes in the data, while incremental learning enables continuous model knowledge updates. However, in open-world scenarios, these approaches still face limitations. Relying solely on OOD detection does not facilitate knowledge updates in the model, and incremental fine-tuning typically requires supervised conditio...

ID: 2508.07270v1 cs.CV, cs.AI, cs.LG, eess.IV, stat.ML

arXiv PDF