ColorGPT: Leveraging Large Language Models for Multimodal Color Recommendation

2508.08987v1 cs.CV, cs.HC 2025-08-14
Авторы:

Ding Xia, Naoto Inoue, Qianru Qiu, Kotaro Kikuchi

Резюме на русском

## Контекст Цвета являются важной составляющей дизайна векторных графических документов, влияя на визуальный аппеал, связь, удобство использования и доступность. Однако рекомендация цветов для завершения или улучшения дизайна часто сталкивается с проблемами, связанными с синтетичностью цветового дизайна и нехваткой данных. Традиционные методы часто не справлялись с этими задачами из-за сложности цветового дизайна и ограниченности доступной информации. В данном исследовании мы рассматриваем возможность использования предварительно обученных Large Language Models (LLMs) с их мощными возможностями рационального мышления для решения задач рекомендации цветов. Мы задали вопрос: могут ли LLMs действительно стать выдающимися дизайнерами для рекомендаций по цветовому дизайну? ## Метод Мы разработали ColorGPT — продвинутую многомодальную систему рекомендации цветов, основанную на LLMs. Методология ColorGPT построена на систематических экспериментах с различными представлениями цветов и эффективными техниками продвинутого приглашения модели. Целью стало решение задачи рекомендации цветов в виде завершения цветовой палитры, когда одна или несколько цветов отсутствуют или требуют изменения. Кроме того, наша модель может расширяться для полной генерации цветовой палитры на основе текстового описания. Мы оценивали ColorGPT на различных задачах, включая завершение цветовой палитры и генерацию цветовой палитры из текста. ## Результаты Эксперименты показали, что наша модель ColorGPT превосходит существующие методы в точности рекомендации цветов в задаче завершения цветовой палитры. Мы измеряли точность рекомендации, распределение цветов в палитре и устойчивость результатов. На задаче генерации цветовой палитры наша модель также демонстрировала улучшения в разнообразии цветов и их сходстве с целевыми цветовыми схемами, сравниваемыми с другими подходами. Эти результаты обосновывают потенциал LLMs в решении задач цветового дизайна. ## Значимость Результаты ColorGPT открывают новые перспективы в области рекомендации цветов для векторной графики и дизайна графических интерфейсов. Модель показала выдающиеся результаты в области завершения цветовых палитр, а также продемонстрировала способность генерировать цветовые палитры на основе текстовых описаний. Ее применение может оказаться полезным для дизайнеров, программного обеспечения для дизайна и систем, требующих высококачественных рекомендаций по цвету. Будущие исследования будут сконцентрированы на расширении возможностей ColorGPT, включая лучшую интеграцию с другими моделями и расширение ее применения в других зонах д

Abstract

Colors play a crucial role in the design of vector graphic documents by enhancing visual appeal, facilitating communication, improving usability, and ensuring accessibility. In this context, color recommendation involves suggesting appropriate colors to complete or refine a design when one or more colors are missing or require alteration. Traditional methods often struggled with these challenges due to the complex nature of color design and the limited data availability. In this study, we explored the use of pretrained Large Language Models (LLMs) and their commonsense reasoning capabilities for color recommendation, raising the question: Can pretrained LLMs serve as superior designers for color recommendation tasks? To investigate this, we developed a robust, rigorously validated pipeline, ColorGPT, that was built by systematically testing multiple color representations and applying effective prompt engineering techniques. Our approach primarily targeted color palette completion by recommending colors based on a set of given colors and accompanying context. Moreover, our method can be extended to full palette generation, producing an entire color palette corresponding to a provided textual description. Experimental results demonstrated that our LLM-based pipeline outperformed existing methods in terms of color suggestion accuracy and the distribution of colors in the color palette completion task. For the full palette generation task, our approach also yielded improvements in color diversity and similarity compared to current techniques.

Ссылки и действия