LatentPrompt: Optimizing Promts in Latent Space

2508.02452v1 cs.CL 2025-08-09
Авторы:

Mateusz Bystroński, Grzegorz Piotrowski, Nitesh V. Chawla, Tomasz Kajdanowicz

Резюме на русском

**Резюме** В статье предлагается LatentPrompt — модель-агностичный фреймворк для оптимизации предложений (prompts) в широковещательных языковых моделях (LLMs). Одной из основных проблем в этой области является то, что многие текущие подходы к оптимизации предложений полагаются на руководство экспертом или на использование техник, которые могут быть неэффективными или ограниченными в своих возможностях. LatentPrompt автоматически генерирует, оценивает и усовершенствованные предложения в пространстве смысловых соотношений, не требуя ручного вмешательства в процесс. Он начинает с набора семяных предложений, которые он затем кодирует в пространство непрерывных векторов и исследует это пространство, чтобы найти ту или иную самую эффективную комбинацию в зависимости от задачи. Запуск экспериментов на датасете Financial PhraseBank показал увеличение точности классификации на 3 процента, что демонстрирует высокую эффективность LatentPrompt. Фреймворк широко применим, требуя только черно-коробкового доступа к модели языка и метрики автоматической оценки, что делает его подходящим для различных доменов и задач.

Abstract

Recent advances have shown that optimizing prompts for Large Language Models (LLMs) can significantly improve task performance, yet many optimization techniques rely on heuristics or manual exploration. We present LatentPrompt, a model-agnostic framework for prompt optimization that leverages latent semantic space to automatically generate, evaluate, and refine candidate prompts without requiring hand-crafted rules. Beginning with a set of seed prompts, our method embeds them in a continuous latent space and systematically explores this space to identify prompts that maximize task-specific performance. In a proof-of-concept study on the Financial PhraseBank sentiment classification benchmark, LatentPrompt increased classification accuracy by approximately 3 percent after a single optimization cycle. The framework is broadly applicable, requiring only black-box access to an LLM and an automatic evaluation metric, making it suitable for diverse domains and tasks.

Ссылки и действия