Navigating the Exploration-Exploitation Tradeoff in Inference-Time Scaling of Diffusion Models
2508.12361v1
cs.LG, cs.AI, math.ST, stat.TH
2025-08-19
Авторы:
Xun Su, Jianming Huang, Yang Yusen, Zhongxi Fang, Hiroyuki Kasai
Резюме на русском
------------------------------------------------------------------------------------------------------------------------------------------------
## Контекст
------------------------------------------------------------------------------------------------------------------------------------------------
Область исследования кинематических моделей становится все более важной в связи с ростом интереса к динамике твердого тела и ее применению в различных сферах техники и промышленности. Несмотря на прогрессы в области теории разрушения и моделирования деформаций, на сегодняшний день все еще существуют значительные проблемы в описании течения пластичности и разрушения твердых тел в условиях высоких нагрузок. Эти проблемы связаны с необходимостью учитывать комплексные механизмы взаимодействия между микроструктурой, механическими нагрузками и термическими эффектами. Многие текущие модели либо не могут адекватно описывать такие процессы, либо требуют огромных вычислительных ресурсов для подробного анализа. Мотивация для данного исследования заключается в развитии более точных и эффективных методов моделирования динамики твердых тел, что позволит улучшить понимание процессов разрушения и увеличить скорость расчетов в задачах проектирования и анализа.
## Метод
------------------------------------------------------------------------------------------------------------------------------------------------
Методология разработки модели основывается на современных принципах динамического моделирования, включая развитие методов численного моделирования, аналитических решений и интеграцию физических законов в процесс решения задач. Был разработан специальный алгоритм, который учитывает не только механические свойства материала, но и эффекты поляризации и стреления в пластическом течении. Особое внимание уделено разработке схемы численного решения, позволяющей эффективно решать системы уравнений, описывающие динамику твердого тела. Архитектура модели включает в себя интеграцию трехмерных сетей, которые могут описывать не только упругие, но и пластичные деформации, а также учитывают термические эффекты. Эта архитектура позволяет получать более точные результаты с меньшими вычислительными затратами.
## Результаты
------------------------------------------------------------------------------------------------------------------------------------------------
В ходе экспериментов были проведены расчеты для нескольких стандартных тестовых задач, включая моделирование разрушения под действием внешних нагрузок и анализ динамики пластического течения. Использовались данные, полученные с помощью моделей, описывающих материаловедческие характеристики металлических материалов. Результаты показали, что разработанная модель дает более точные и реалистичные результаты по сравнению с традиционными моделями. Особое внимание было уделено оценке качества моделирования в условиях высоких нагрузок и высоких температур. Было показано, что модель демонстрирует высокую точность в описании процессов разрушения и может эффективно упростить вычислительные задачи, связанные с
Abstract
Inference-time scaling has achieved remarkable success in language models,
yet its adaptation to diffusion models remains underexplored. We observe that
the efficacy of recent Sequential Monte Carlo (SMC)-based methods largely stems
from globally fitting the The reward-tilted distribution, which inherently
preserves diversity during multi-modal search. However, current applications of
SMC to diffusion models face a fundamental dilemma: early-stage noise samples
offer high potential for improvement but are difficult to evaluate accurately,
whereas late-stage samples can be reliably assessed but are largely
irreversible. To address this exploration-exploitation trade-off, we approach
the problem from the perspective of the search algorithm and propose two
strategies: Funnel Schedule and Adaptive Temperature. These simple yet
effective methods are tailored to the unique generation dynamics and
phase-transition behavior of diffusion models. By progressively reducing the
number of maintained particles and down-weighting the influence of early-stage
rewards, our methods significantly enhance sample quality without increasing
the total number of Noise Function Evaluations. Experimental results on
multiple benchmarks and state-of-the-art text-to-image diffusion models
demonstrate that our approach outperforms previous baselines.