📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 HEFT: A Coarse-to-Fine Hierarchy for Enhancing the Efficiency and Accuracy of Language Model Reasoning

2025-09-16

Авторы:

Brennen Hill

## Контекст Статья «HEFT: A Coarse-to-Fine Hierarchy for Enhancing the Efficiency and Accuracy of Language Model Reasoning» посвящена проблеме ограничений вычислительных ресурсов при адаптации больших языковых моделей (LLMs) к задачам инференциального разума. Несмотря на то, что Parameter-Efficient Fine-Tuning (PEFT) методы нашли широкое применение в этой области, они разделены на два основных подхода: работа в весовом пространстве моделей и в пространстве их представлений. Авторы выдвигают гипотезу о возможности получения преимуществ при поэтапном их сочетании. Выбор LLama-2-7B и BoolQ демонстрирует то, что эта проблема становится все актуальнее в условиях сложных интеллектуальных задач. ## Метод Авторы предлагают новую стратегию HEFT (Hierarchical Efficient Fine-Tuning), которая объединяет два метода PEFT в последовательности понижения разрешения: в первую очередь, веса модели изменяются глобально при помощи Low-Rank Adaptation (LoRA), а затем локальные активации точечно адаптируются в Representation Fine-Tuning (ReFT). Это разделение позволяет сочетать в себе широковую общую адаптацию и точную корректировку внутренних структур. Архитектура HEFT, в которой каждый этап адаптации имеет свои цели и стратегии, разрешает одновременно эффективность и точность. ## Результаты Использование BoolQ как тестовой задачи позволило показать, что HEFT дает существенные преимущества. Тренировка в течение трех эпох дала 85.17% точности, что значительно превосходит результаты LoRA (85.05%) и ReFT (83.36%) при 20-эпочной тренировке. Это свидетельствует о том, что комбинирование LoRA и ReFT вовлекает значительные выигрыши в подготовке моделей к инференциальным задачам, особенно когда ресурсы ограничены. ## Значимость Этот подход может применяться в ситуациях, где вычислительные ресурсы ограничены, но требуется высокая точность, например, в области медицины, финансов или юриспруденции. Метод HEFT позволяет эффективно использовать ресурсы, давая моделям более высокую скорость восприятия и оценки сложных структур данных. Это открывает путь к более доступным и эффективным решениям для интеллектуальных задач, где традиционные подходы показались неэффективными. ## Выводы HEFT доказывает, что сочетание LoRA и ReFT в развитых PEFT-методах может повысить как эффективность, так и точность работы моделей. Эта стратегия может стать основой для будущих разработок в области адаптации LLMs к специализированным задачам. Для дальнейших работ следует расширить исследования на другие модели и данные, а также исследовать возможности дальнейшего улучшения этой архитектуры.

Annotation:

The adaptation of large language models (LLMs) to specialized reasoning tasks is fundamentally constrained by computational resources. Parameter-Efficient Fine-Tuning (PEFT) methods have emerged as a powerful solution, yet the landscape of these techniques is diverse, with distinct methods operating in either the model's weight space or its representation space. This paper investigates the hypothesis that a synergistic combination of these paradigms can unlock superior performance and efficiency...

ID: 2509.09801v1 cs.CL, cs.AI, cs.LG, 68T07, 68T50, 68T05, I.2.7; I.2.6; C.4

arXiv PDF