LLM-as-classifier: Semi-Supervised, Iterative Framework for Hierarchical Text Classification using Large Language Models
2508.16478v1
cs.CL, cs.IR
2025-08-26
Авторы:
Doohee You, Andy Parisi, Zach Vander Velden, Lara Dantas Inojosa
Резюме на русском
## Контекст
В последние годы вызвано значительное внимание к использованию бо LLM (Large Language Models) для анализа неструктурированных текстовых данных. Однако, применение этих моделей в качестве надежных и мощных классификаторов в промышленных приложениях сталкивается с рядом технических и методологических проблем. Одной из главных сложностей является то, что стандартные методы оптимизации моделей часто оказываются ресурсоемкими и неэффективными при работе с динамически меняющимися данными, которые характерны для реального мира. Это взаимодействие между гибкостью LLMs и требованиями к производительности и устойчивости классификационных систем в реальных приложениях лежит в основе нашего исследования. Мы создаем подробную стратегию, которая использует мощь LLMs для построения разделенных классификаторов используя небольшие обучающие выборки и итеративные, человеком вовлеченные процессы.
## Метод
Мы предлагаем развитый, семи-супервизированный фреймворк, который основывается на нулевом и нескольких-супервизированных возможностях LLMs для построения леса классификаторов. Методология включает в себя несколько ключевых этапов, таких как:
1. **Элицирование доменных знаний** — получение информации для определения ключевых признаков и концепций, необходимых для классификации.
2. **Подготовка и уточнение запросов** — оптимизация запросов для лучшего понимания текстовых данных.
3. **Расширение иерархии классов** — мощные техники для расширения иерархической структуры классификатора.
4. **Многомерная валидация** — методы для проверки качества классификации с различных сторон.
5. **Оценка и снижение последовательностных биасов** — инструменты для выявления и устранения последовательных зависимостей в данных.
6. **Непрерывное мониторинг и адаптация** — протоколы для постоянного контроля и улучшения системы.
Этот подход позволяет использовать мощь LLMs в сочетании с человеческим опытом для построения более точных, понятных и устойчивых классификаторов.
## Результаты
Мы проводим эксперименты с различными данными, включая реальные из различных индустрий. Мы устанавливаем оптимальные параметры для запросов, создаем иерархические классификаторы и проводим многомерные валидации для оценки качества. Наши результаты показывают, что наш фреймворк позволяет повысить точность классификации и уменьшить частоту ошибок по сравнению с существующими методами. Также мы показываем, как наш подход справляется с последовательными биасами и устойчив к изменению данных в реальном времени.
## Значимость
Наш фреймворк имеет огромное значение для индустрии, так как он предоставляет мощный инструмент
Abstract
The advent of Large Language Models (LLMs) has provided unprecedented
capabilities for analyzing unstructured text data. However, deploying these
models as reliable, robust, and scalable classifiers in production environments
presents significant methodological challenges. Standard fine-tuning approaches
can be resource-intensive and often struggle with the dynamic nature of
real-world data distributions, which is common in the industry. In this paper,
we propose a comprehensive, semi-supervised framework that leverages the zero-
and few-shot capabilities of LLMs for building hierarchical text classifiers as
a framework for a solution to these industry-wide challenges. Our methodology
emphasizes an iterative, human-in-the-loop process that begins with domain
knowledge elicitation and progresses through prompt refinement, hierarchical
expansion, and multi-faceted validation. We introduce techniques for assessing
and mitigating sequence-based biases and outline a protocol for continuous
monitoring and adaptation. This framework is designed to bridge the gap between
the raw power of LLMs and the practical need for accurate, interpretable, and
maintainable classification systems in industry applications.
Ссылки и действия
Дополнительные ресурсы: