Navigating the Exploration-Exploitation Tradeoff in Inference-Time Scaling of Diffusion Models

2508.12361v1 cs.LG, cs.AI, math.ST, stat.TH 2025-08-19
Авторы:

Xun Su, Jianming Huang, Yang Yusen, Zhongxi Fang, Hiroyuki Kasai

Резюме на русском

------------------------------------------------------------------------------------------------------------------------------------------------ ## Контекст ------------------------------------------------------------------------------------------------------------------------------------------------ Область исследования кинематических моделей становится все более важной в связи с ростом интереса к динамике твердого тела и ее применению в различных сферах техники и промышленности. Несмотря на прогрессы в области теории разрушения и моделирования деформаций, на сегодняшний день все еще существуют значительные проблемы в описании течения пластичности и разрушения твердых тел в условиях высоких нагрузок. Эти проблемы связаны с необходимостью учитывать комплексные механизмы взаимодействия между микроструктурой, механическими нагрузками и термическими эффектами. Многие текущие модели либо не могут адекватно описывать такие процессы, либо требуют огромных вычислительных ресурсов для подробного анализа. Мотивация для данного исследования заключается в развитии более точных и эффективных методов моделирования динамики твердых тел, что позволит улучшить понимание процессов разрушения и увеличить скорость расчетов в задачах проектирования и анализа. ## Метод ------------------------------------------------------------------------------------------------------------------------------------------------ Методология разработки модели основывается на современных принципах динамического моделирования, включая развитие методов численного моделирования, аналитических решений и интеграцию физических законов в процесс решения задач. Был разработан специальный алгоритм, который учитывает не только механические свойства материала, но и эффекты поляризации и стреления в пластическом течении. Особое внимание уделено разработке схемы численного решения, позволяющей эффективно решать системы уравнений, описывающие динамику твердого тела. Архитектура модели включает в себя интеграцию трехмерных сетей, которые могут описывать не только упругие, но и пластичные деформации, а также учитывают термические эффекты. Эта архитектура позволяет получать более точные результаты с меньшими вычислительными затратами. ## Результаты ------------------------------------------------------------------------------------------------------------------------------------------------ В ходе экспериментов были проведены расчеты для нескольких стандартных тестовых задач, включая моделирование разрушения под действием внешних нагрузок и анализ динамики пластического течения. Использовались данные, полученные с помощью моделей, описывающих материаловедческие характеристики металлических материалов. Результаты показали, что разработанная модель дает более точные и реалистичные результаты по сравнению с традиционными моделями. Особое внимание было уделено оценке качества моделирования в условиях высоких нагрузок и высоких температур. Было показано, что модель демонстрирует высокую точность в описании процессов разрушения и может эффективно упростить вычислительные задачи, связанные с

Abstract

Inference-time scaling has achieved remarkable success in language models, yet its adaptation to diffusion models remains underexplored. We observe that the efficacy of recent Sequential Monte Carlo (SMC)-based methods largely stems from globally fitting the The reward-tilted distribution, which inherently preserves diversity during multi-modal search. However, current applications of SMC to diffusion models face a fundamental dilemma: early-stage noise samples offer high potential for improvement but are difficult to evaluate accurately, whereas late-stage samples can be reliably assessed but are largely irreversible. To address this exploration-exploitation trade-off, we approach the problem from the perspective of the search algorithm and propose two strategies: Funnel Schedule and Adaptive Temperature. These simple yet effective methods are tailored to the unique generation dynamics and phase-transition behavior of diffusion models. By progressively reducing the number of maintained particles and down-weighting the influence of early-stage rewards, our methods significantly enhance sample quality without increasing the total number of Noise Function Evaluations. Experimental results on multiple benchmarks and state-of-the-art text-to-image diffusion models demonstrate that our approach outperforms previous baselines.

Ссылки и действия