When Is Prior Knowledge Helpful? Exploring the Evaluation and Selection of Unsupervised Pretext Tasks from a Neuro-Symbolic Perspective

2508.07299v1 cs.LG, cs.AI 2025-08-13

Авторы:

Lin-Han Jia, Si-Yu Han, Wen-Chao Hu, Jie-Jing Shao, Wen-Da Wei, Zhi Zhou, Lan-Zhe Guo, Yu-Feng Li

Резюме на русском

## Контекст Проблемы с недостатком меток в области машинного обучения стимулируют развитие самостоятельных и самоподкрепляющихся подходов. Однако многие из этих подходов опираются на некоторые предположения, которые могут быть недостаточно надежными или точными, что влияет на эффективность моделей. Нейро-символьное (Nesy) обучение позволяет моделям улучшить свои результаты, сочетая в себе обучение с подкреплением и работу с символьным знанием. В этой работе авторы расширяют Nesy-теорию, применяя ее к случаю недостоверных предположений (например, неполных или неточных моделей), чтобы создать теоретическую платформу, объединяющую Nesy и методы самостоятельного и семи-самоподкрепляющего обучения. ## Метод Авторы развивают прогностическую модель, которая оценивает потенциальную эффективность независимых меток на основе трех основных метрик: научности (научные знания могут быть приобретены моделью), надежности (знания верны и надежны в контексте данных) и полноты (знания полностью охватывают целевую задачу). Для операционизации этих метрик, авторы предлагают метод, который использует небольшие объемы данных для прогнозирования результатов обучения модели в больших масштабах. Метод является гибким и может применяться к различным случаям независимых меток. ## Результаты В экспериментах авторы используют различные модели и данные для проверки прогностической модели. Они показывают, что предсказания модели крайне точны, когда используются небольшие объемы данных для оценки. Это доказывает, что метод может быть применен для эффективного выбора независимых меток до запуска полного обучения. Такая прогностическая модель позволяет избежать ненужных экспериментов с неэффективными метками, что сокращает время и ресурсы, необходимые для выбора лучших меток. ## Значимость Предложенный подход имеет широкое применение в самоподкрепляющихся и самостоятельных подходах к обучению моделей без меток. Он предоставляет более надежный и целенаправленный способ выбора независимых меток, улучшая эффективность и точность моделей. В будущем, это может привести к более универсальным и надежным моделям для обработки данных в различных областях, таких как робототехника, здравоохранение и обработка естественного языка. ## Выводы Данная работа предлагает новую теоретическую модель для оценки и выбора независимых меток в обучении с подкреплением. Она показывает, как нейро-символьные техники могут улучшить работу моделей, даже в случае недостоверных предположений. Будущими направлениями исследований будет расширение этой модели для различных типов данных и моделей,

Abstract

Neuro-symbolic (Nesy) learning improves the target task performance of models by enabling them to satisfy knowledge, while semi/self-supervised learning (SSL) improves the target task performance by designing unsupervised pretext tasks for unlabeled data to make models satisfy corresponding assumptions. We extend the Nesy theory based on reliable knowledge to the scenario of unreliable knowledge (i.e., assumptions), thereby unifying the theoretical frameworks of SSL and Nesy. Through rigorous theoretical analysis, we demonstrate that, in theory, the impact of pretext tasks on target performance hinges on three factors: knowledge learnability with respect to the model, knowledge reliability with respect to the data, and knowledge completeness with respect to the target. We further propose schemes to operationalize these theoretical metrics, and thereby develop a method that can predict the effectiveness of pretext tasks in advance. This will change the current status quo in practical applications, where the selections of unsupervised tasks are heuristic-based rather than theory-based, and it is difficult to evaluate the rationality of unsupervised pretext task selection before testing the model on the target task. In experiments, we verify a high correlation between the predicted performance-estimated using minimal data-and the actual performance achieved after large-scale semi-supervised or self-supervised learning, thus confirming the validity of the theory and the effectiveness of the evaluation method.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

When Is Prior Knowledge Helpful? Exploring the Evaluation and Selection of Unsupervised Pretext Tasks from a Neuro-Symbolic Perspective

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация