ColorGPT: Leveraging Large Language Models for Multimodal Color Recommendation
2508.08987v1
cs.CV, cs.HC
2025-08-14
Авторы:
Ding Xia, Naoto Inoue, Qianru Qiu, Kotaro Kikuchi
Резюме на русском
## Контекст
Цвета являются важной составляющей дизайна векторных графических документов, влияя на визуальный аппеал, связь, удобство использования и доступность. Однако рекомендация цветов для завершения или улучшения дизайна часто сталкивается с проблемами, связанными с синтетичностью цветового дизайна и нехваткой данных. Традиционные методы часто не справлялись с этими задачами из-за сложности цветового дизайна и ограниченности доступной информации. В данном исследовании мы рассматриваем возможность использования предварительно обученных Large Language Models (LLMs) с их мощными возможностями рационального мышления для решения задач рекомендации цветов. Мы задали вопрос: могут ли LLMs действительно стать выдающимися дизайнерами для рекомендаций по цветовому дизайну?
## Метод
Мы разработали ColorGPT — продвинутую многомодальную систему рекомендации цветов, основанную на LLMs. Методология ColorGPT построена на систематических экспериментах с различными представлениями цветов и эффективными техниками продвинутого приглашения модели. Целью стало решение задачи рекомендации цветов в виде завершения цветовой палитры, когда одна или несколько цветов отсутствуют или требуют изменения. Кроме того, наша модель может расширяться для полной генерации цветовой палитры на основе текстового описания. Мы оценивали ColorGPT на различных задачах, включая завершение цветовой палитры и генерацию цветовой палитры из текста.
## Результаты
Эксперименты показали, что наша модель ColorGPT превосходит существующие методы в точности рекомендации цветов в задаче завершения цветовой палитры. Мы измеряли точность рекомендации, распределение цветов в палитре и устойчивость результатов. На задаче генерации цветовой палитры наша модель также демонстрировала улучшения в разнообразии цветов и их сходстве с целевыми цветовыми схемами, сравниваемыми с другими подходами. Эти результаты обосновывают потенциал LLMs в решении задач цветового дизайна.
## Значимость
Результаты ColorGPT открывают новые перспективы в области рекомендации цветов для векторной графики и дизайна графических интерфейсов. Модель показала выдающиеся результаты в области завершения цветовых палитр, а также продемонстрировала способность генерировать цветовые палитры на основе текстовых описаний. Ее применение может оказаться полезным для дизайнеров, программного обеспечения для дизайна и систем, требующих высококачественных рекомендаций по цвету. Будущие исследования будут сконцентрированы на расширении возможностей ColorGPT, включая лучшую интеграцию с другими моделями и расширение ее применения в других зонах д
Abstract
Colors play a crucial role in the design of vector graphic documents by
enhancing visual appeal, facilitating communication, improving usability, and
ensuring accessibility. In this context, color recommendation involves
suggesting appropriate colors to complete or refine a design when one or more
colors are missing or require alteration. Traditional methods often struggled
with these challenges due to the complex nature of color design and the limited
data availability. In this study, we explored the use of pretrained Large
Language Models (LLMs) and their commonsense reasoning capabilities for color
recommendation, raising the question: Can pretrained LLMs serve as superior
designers for color recommendation tasks? To investigate this, we developed a
robust, rigorously validated pipeline, ColorGPT, that was built by
systematically testing multiple color representations and applying effective
prompt engineering techniques. Our approach primarily targeted color palette
completion by recommending colors based on a set of given colors and
accompanying context. Moreover, our method can be extended to full palette
generation, producing an entire color palette corresponding to a provided
textual description. Experimental results demonstrated that our LLM-based
pipeline outperformed existing methods in terms of color suggestion accuracy
and the distribution of colors in the color palette completion task. For the
full palette generation task, our approach also yielded improvements in color
diversity and similarity compared to current techniques.
Ссылки и действия
Дополнительные ресурсы: