LatentPrompt: Optimizing Promts in Latent Space
2508.02452v1
cs.CL
2025-08-09
Авторы:
Mateusz Bystroński, Grzegorz Piotrowski, Nitesh V. Chawla, Tomasz Kajdanowicz
Резюме на русском
**Резюме**
В статье предлагается LatentPrompt — модель-агностичный фреймворк для оптимизации предложений (prompts) в широковещательных языковых моделях (LLMs). Одной из основных проблем в этой области является то, что многие текущие подходы к оптимизации предложений полагаются на руководство экспертом или на использование техник, которые могут быть неэффективными или ограниченными в своих возможностях. LatentPrompt автоматически генерирует, оценивает и усовершенствованные предложения в пространстве смысловых соотношений, не требуя ручного вмешательства в процесс. Он начинает с набора семяных предложений, которые он затем кодирует в пространство непрерывных векторов и исследует это пространство, чтобы найти ту или иную самую эффективную комбинацию в зависимости от задачи. Запуск экспериментов на датасете Financial PhraseBank показал увеличение точности классификации на 3 процента, что демонстрирует высокую эффективность LatentPrompt. Фреймворк широко применим, требуя только черно-коробкового доступа к модели языка и метрики автоматической оценки, что делает его подходящим для различных доменов и задач.
Abstract
Recent advances have shown that optimizing prompts for Large Language Models
(LLMs) can significantly improve task performance, yet many optimization
techniques rely on heuristics or manual exploration. We present LatentPrompt, a
model-agnostic framework for prompt optimization that leverages latent semantic
space to automatically generate, evaluate, and refine candidate prompts without
requiring hand-crafted rules. Beginning with a set of seed prompts, our method
embeds them in a continuous latent space and systematically explores this space
to identify prompts that maximize task-specific performance. In a
proof-of-concept study on the Financial PhraseBank sentiment classification
benchmark, LatentPrompt increased classification accuracy by approximately 3
percent after a single optimization cycle. The framework is broadly applicable,
requiring only black-box access to an LLM and an automatic evaluation metric,
making it suitable for diverse domains and tasks.
Ссылки и действия
Дополнительные ресурсы: