ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing

2508.10881v1 cs.CV, cs.AI 2025-08-16
Авторы:

Lingen Li, Guangzhi Wang, Zhaoyang Zhang, Yaowei Li, Xiaoyu Li, Qi Dou, Jinwei Gu, Tianfan Xue, Ying Shan

Резюме на русском

#### Контекст Производство мультфильмов и аниме строится на трех основных этапах: keyframing, inbetweening и colorization. Эти процессы требуют значительных усилий от художников и часто приводят к ошибкам из-за отдельного рассмотрения каждого этапа. Несмотря на прогресс в искусственном интеллекте, существующие методы решают эти задачи независимо, что приводит к аккумулированию ошибок и появлению артефактов. Авторы предлагают ToonComposer — модель, которая объединяет inbetweening и colorization в один этап post-keyframing, что позволяет уменьшить затраты времени и улучшить качество работ. #### Метод ToonComposer — это модель, основанная на методе sparse sketch injection, который позволяет использовать ключевые кадры для точного управления анимацией. Для улучшения временных свойств видео используется cartoon adaptation method с spatial low-rank adapter, который адаптирует современные модели видео к домену мультипликации, сохраняя при этом временные признаки. Модель может работать с одним скетчем и одним цветным кадром, что упрощает процесс, или с несколькими скетчами для более точного контроля. Это делает ее удобной для реальных сценариев работы. #### Результаты Проведенные эксперименты показывают, что ToonComposer превосходит существующие методы в трех ключевых аспектах: качество визуального изображения, последовательность движений и эффективность производства. Модель была тестирована на PKBench — бенчмарк, созданном на основе человечески прорисованных скетчей, что дает реалистичные условия эксплуатации. Результаты подтверждают, что ToonComposer значительно сокращает трудоемкость и улучшает качество работ, делая ее привлекательной для профессионалов в области мультипликации. #### Значимость ToonComposer может применяться в различных сферах, таких как мультипликация, анимация и даже рекламное производство. Он уменьшает затраты времени и усилий, позволяя художникам сосредоточиться на творчестве. Благодаря своему универсальному подходу, модель может стать полезным инструментом для развития цифрового искусства. #### Выводы ToonComposer представляет собой прорыв в области AI-помощи в производстве мультипликации. Он объединяет несколько этапов в один, уменьшая ошибки и улучшая качество. Будущие исследования будут сконцентрированы на улучшении точности и гибкости модели, а также на расширении ее возможностей для работы с более сложными сценариями.

Abstract

Traditional cartoon and anime production involves keyframing, inbetweening, and colorization stages, which require intensive manual effort. Despite recent advances in AI, existing methods often handle these stages separately, leading to error accumulation and artifacts. For instance, inbetweening approaches struggle with large motions, while colorization methods require dense per-frame sketches. To address this, we introduce ToonComposer, a generative model that unifies inbetweening and colorization into a single post-keyframing stage. ToonComposer employs a sparse sketch injection mechanism to provide precise control using keyframe sketches. Additionally, it uses a cartoon adaptation method with the spatial low-rank adapter to tailor a modern video foundation model to the cartoon domain while keeping its temporal prior intact. Requiring as few as a single sketch and a colored reference frame, ToonComposer excels with sparse inputs, while also supporting multiple sketches at any temporal location for more precise motion control. This dual capability reduces manual workload and improves flexibility, empowering artists in real-world scenarios. To evaluate our model, we further created PKBench, a benchmark featuring human-drawn sketches that simulate real-world use cases. Our evaluation demonstrates that ToonComposer outperforms existing methods in visual quality, motion consistency, and production efficiency, offering a superior and more flexible solution for AI-assisted cartoon production.

Ссылки и действия