LLM-as-classifier: Semi-Supervised, Iterative Framework for Hierarchical Text Classification using Large Language Models

2508.16478v1 cs.CL, cs.IR 2025-08-26
Авторы:

Doohee You, Andy Parisi, Zach Vander Velden, Lara Dantas Inojosa

Резюме на русском

## Контекст В последние годы вызвано значительное внимание к использованию бо LLM (Large Language Models) для анализа неструктурированных текстовых данных. Однако, применение этих моделей в качестве надежных и мощных классификаторов в промышленных приложениях сталкивается с рядом технических и методологических проблем. Одной из главных сложностей является то, что стандартные методы оптимизации моделей часто оказываются ресурсоемкими и неэффективными при работе с динамически меняющимися данными, которые характерны для реального мира. Это взаимодействие между гибкостью LLMs и требованиями к производительности и устойчивости классификационных систем в реальных приложениях лежит в основе нашего исследования. Мы создаем подробную стратегию, которая использует мощь LLMs для построения разделенных классификаторов используя небольшие обучающие выборки и итеративные, человеком вовлеченные процессы. ## Метод Мы предлагаем развитый, семи-супервизированный фреймворк, который основывается на нулевом и нескольких-супервизированных возможностях LLMs для построения леса классификаторов. Методология включает в себя несколько ключевых этапов, таких как: 1. **Элицирование доменных знаний** — получение информации для определения ключевых признаков и концепций, необходимых для классификации. 2. **Подготовка и уточнение запросов** — оптимизация запросов для лучшего понимания текстовых данных. 3. **Расширение иерархии классов** — мощные техники для расширения иерархической структуры классификатора. 4. **Многомерная валидация** — методы для проверки качества классификации с различных сторон. 5. **Оценка и снижение последовательностных биасов** — инструменты для выявления и устранения последовательных зависимостей в данных. 6. **Непрерывное мониторинг и адаптация** — протоколы для постоянного контроля и улучшения системы. Этот подход позволяет использовать мощь LLMs в сочетании с человеческим опытом для построения более точных, понятных и устойчивых классификаторов. ## Результаты Мы проводим эксперименты с различными данными, включая реальные из различных индустрий. Мы устанавливаем оптимальные параметры для запросов, создаем иерархические классификаторы и проводим многомерные валидации для оценки качества. Наши результаты показывают, что наш фреймворк позволяет повысить точность классификации и уменьшить частоту ошибок по сравнению с существующими методами. Также мы показываем, как наш подход справляется с последовательными биасами и устойчив к изменению данных в реальном времени. ## Значимость Наш фреймворк имеет огромное значение для индустрии, так как он предоставляет мощный инструмент

Abstract

The advent of Large Language Models (LLMs) has provided unprecedented capabilities for analyzing unstructured text data. However, deploying these models as reliable, robust, and scalable classifiers in production environments presents significant methodological challenges. Standard fine-tuning approaches can be resource-intensive and often struggle with the dynamic nature of real-world data distributions, which is common in the industry. In this paper, we propose a comprehensive, semi-supervised framework that leverages the zero- and few-shot capabilities of LLMs for building hierarchical text classifiers as a framework for a solution to these industry-wide challenges. Our methodology emphasizes an iterative, human-in-the-loop process that begins with domain knowledge elicitation and progresses through prompt refinement, hierarchical expansion, and multi-faceted validation. We introduce techniques for assessing and mitigating sequence-based biases and outline a protocol for continuous monitoring and adaptation. This framework is designed to bridge the gap between the raw power of LLMs and the practical need for accurate, interpretable, and maintainable classification systems in industry applications.

Ссылки и действия