📚 Саммари научных статей из arXiv

Найдено 14827 результатов по запросу 'cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 LoSemB: Logic-Guided Semantic Bridging for Inductive Tool Retrieval

2025-08-13

Авторы:

Luyao Zhuang, Qinggang Zhang, Huachi Zhou, Juhua Liu, Qing Li, Xiao Huang

## Контекст Модели текстового понимания на базе трансформеров (LLMs) показали свои возможности в решении различных задач, в том числе в инструментном обучении (Tool Learning). Однако, с ростом репозиториев инструментов, становится все более сложной проблема их выбора для конкретной задачи. Для решения этой проблемы было предложено использовать модуль поиска инструментов (Tool Retrieval Module), который может выбирать наиболее подходящий инструмент для задачи. Тем не менее, большинство современных подходов ориентированы на трансдуктивные задачи, когда инструменты, доступные для обучения, соответствуют тем, которые могут быть использованы в реальной жизни. Необходимо разработать решение, которое бы работало в индуктивном режиме, когда инструменты появляются после обучения модели. ## Метод Мы предлагаем LoSemB – Logic-Guided Semantic Bridging, новую модель для индуктивного поиска инструментов. Основной идеей является использование логических моделей для решения проблемы распространения взаимозаменимости в задаче инструментного поиска. Модель LoSemB состоит из двух ключевых компонентов: модуля выравнивания логических представлений и системы реляционного поиска. Эти модули работают вместе для того, чтобы уменьшить распространение взаимозаменимости и улучшить точность поиска инструментов, даже если они не были видны во время обучения. ## Результаты Мы провели исследования на нескольких датасетах, включая обычные тестовые данные и те, которые включают невиденные инструменты. Модель LoSemB показала существенную выносливость в индуктивной среде, превосходя существующие методы в области инструментного поиска. Также было проведено сравнение с методами, ориентированными на трансдуктивные задачи, и мы показали, что LoSemB может выполняться в этих условиях, но с более высокой точностью в индуктивной задаче. ## Значимость Наше решение может быть применено в различных областях, где необходимо выбирать инструменты для решения задач в реальном времени, например, в области ИИ, машинного обучения, анализа данных. За счет использования логических моделей, мы можем уменьшить влияние распространения взаимозаменимости и улучшить качество решения задач. Это может привести к повышению эффективности использования инструментов в различных приложениях. ## Выводы Мы предлагаем LoSemB, новую модель для индуктивного поиска инструментов. Модель показала свою эффективность в индуктивных задачах, при этом оставаясь эффективной в трансдуктивных условиях. Мы также показали, что логические модели могут применяться для решения проблем распространения взаимозаменимости в инструментном поиске. В будущем мы планируем расширить модель, чтобы она могла работать с более сложными сц

Annotation:

Tool learning has emerged as a promising paradigm for large language models (LLMs) to solve many real-world tasks. Nonetheless, with the tool repository rapidly expanding, it is impractical to contain all tools within the limited input length of LLMs. To alleviate these issues, researchers have explored incorporating a tool retrieval module to select the most relevant tools or represent tools as unique tokens within LLM parameters. However, most state-of-the-art methods are under transductive se...

ID: 2508.07690v1 cs.CL, cs.AI

arXiv PDF

📄 Energy Consumption in Parallel Neural Network Training

2025-08-13

Авторы:

Philipp Huber, David Li, Juan Pedro Gutiérrez Hermosillo Muriedas, Deifilia Kieckhefen, Markus Götz, Achim Streit, Charlotte Debus

## Контекст The demand for computational power in training neural networks has surged significantly, driven by advancements in model architectures and the need for larger datasets. This growth has led to a substantial increase in energy consumption, posing environmental challenges and raising concerns about the sustainability of AI research. Parallelization has become a key strategy to address these challenges, enabling the scaling of model and dataset sizes and accelerating training processes. However, its influence on energy consumption remains insufficiently understood. This study addresses this gap by investigating how parallelization parameters, such as GPU count, global and local batch sizes, impact energy efficiency, predictive performance, and training time. The research focuses on the training of two models: ResNet50 and FourCastNet, providing insights into the complex dynamics of energy use in neural network training. ## Метод The study employed scaling experiments to evaluate the impact of parallelization parameters on the training of ResNet50 and FourCastNet models. These experiments involved varying the number of GPUs, global batch sizes, and local batch sizes to analyze their influence on training time, predictive performance, and energy consumption. The experiments were conducted on high-performance computing infrastructure, ensuring reliable and reproducible results. The metrics included energy usage per GPU hour, training time, and model accuracy. By systematically analyzing these factors, the authors aimed to uncover the complex interplay between parallelization parameters and their effect on energy efficiency in neural network training. ## Результаты The experiments revealed that energy consumption scales approximately linearly with the consumed GPU hours, but the scaling factor varies significantly between different models and hardware configurations. For ResNet50, increasing the global batch size led to a more efficient use of resources, with a smaller increase in energy consumption relative to the increase in GPU hours. In contrast, FourCastNet demonstrated a more complex relationship, with local batch size playing a more critical role in determining energy efficiency. The results also highlighted that the number of samples and gradient updates per GPU hour strongly influences the overall energy consumption. These findings provide a detailed understanding of the factors affecting energy use in neural network training and highlight the importance of optimizing parallelization strategies for sustainable AI research. ## Значимость The insights from this study are highly relevant for improving the sustainability of AI research. By quantifying the energy costs associated with parallelization, the research provides a foundation for developing more energy-efficient training strategies. The findings have practical applications in optimizing GPU utilization, reducing energy consumption, and minimizing the environmental impact of neural network training. Furthermore, the study informs the design of future hardware and software solutions tailored to the specific needs of energy-efficient AI training. The results contribute to the broader goal of making AI more sustainable and environmentally friendly. ## Выводы The study underscores the importance of understanding the energy dynamics in neural network training and the critical role of parallelization parameters in influencing energy consumption. It demonstrates that while parallelization accelerates training and enables the handling of larger datasets, it also introduces significant energy costs that must be carefully managed. The findings provide a basis for future research into more sustainable AI practices, including the development of energy-efficient algorithms and hardware. By addressing the challenges of energy use in neural network training, this research advances the field towards a more sustainable and responsible use of AI technologies.

Annotation:

The increasing demand for computational resources of training neural networks leads to a concerning growth in energy consumption. While parallelization has enabled upscaling model and dataset sizes and accelerated training, its impact on energy consumption is often overlooked. To close this research gap, we conducted scaling experiments for data-parallel training of two models, ResNet50 and FourCastNet, and evaluated the impact of parallelization parameters, i.e., GPU count, global batch size, a...

ID: 2508.07706v1 cs.LG, cs.AI

arXiv PDF

📄 Training-Free ANN-to-SNN Conversion for High-Performance Spiking Transformer

2025-08-13

Авторы:

Jingya Wang, Xin Deng, Wenjie Wei, Dehao Zhang, Shuai Wang, Qian Sun, Jieyuan Zhang, Hanwen Liu, Ning Xie, Malu Zhang

## Контекст Спайкинг Нейронные Сети (Spiking Neural Networks, SNNs) являются эффективным способом расчета, основанным на событиях, которые позволяют реализовывать высокоэффективные архитектуры трансформеров. Они значительно снижают потребление энергии по сравнению с традиционными нейронными сетями. Однако, существующие методы преобразования ANN-to-SNN для трансформеров сталкиваются с рядом проблем, включая неэффективное обработку нелинейных операций, высокую стоимость обучения, а также необходимость дополнительного шага файнтюнинга для предварительно обученных моделей. Наша работа сосредоточена на создании метода без обучения, который мог бы эффективно конвертировать предварительно обученные трансформерные модели в SNNs без ущерба для точности и с наименьшим временем работы. ## Метод Мы предлагаем метод ANN-to-SNN конвертации, основанный на использовании нового типа нейрона с экспоненциальным убыванием (Multi-basis Exponential Decay, MBE). Этот нейрон эффективно приближает нелинейные операции в сети, используя многобазисную кодировку, что позволяет избежать изменений весов в предварительно обученных моделях. Метод не требует дополнительных шагов обучения и позволяет достичь высокой точности преобразования. Мы также разработали специальные методы для улучшения обработки данных в спайкинге моделях, чтобы лучше подстроиться под необходимые требования для различных трансформеров и задач (CV, NLU, NLG). ## Результаты Мы провели эксперименты на различных задачах (Computer Vision, Natural Language Understanding, Natural Language Generation) и использовали трансформерные модели, такие как ViT, RoBERTa и GPT-2. Наши результаты показали, что метод MBE достигает близкой к затратившейся точности преобразования с значительно меньшим временем выполнения. Например, при конвертации ViT-сети мы достигли почти на 10% улучшения точности по сравнению с другими методами, а время работы было сокращено в 2 раза. Эти результаты доказывают высокую эффективность нашего подхода в сравнении с классическими методами. ## Значимость Наша работа открывает новые возможности для эффективного развертывания SNNs в реальном мире. Она позволяет сократить энергозатраты и улучшить скорость работы для трансформеров, что важно для приложений в области ИИ, таких как обработка естественного языка, глубокое обучение на видео и распознавание речи. Улучшенная точность и низкая задержка делают нашу модель привлекательной для применения в ситуациях, где необходима высокая эффективность и низкое потребление энергии. ## Выводы Мы представили новый метод конвертации ANN-to-SNN, который позволяет конвертировать предварительно обу

Annotation:

Leveraging the event-driven paradigm, Spiking Neural Networks (SNNs) offer a promising approach for constructing energy-efficient Transformer architectures. Compared to directly trained Spiking Transformers, ANN-to-SNN conversion methods bypass the high training costs. However, existing methods still suffer from notable limitations, failing to effectively handle nonlinear operations in Transformer architectures and requiring additional fine-tuning processes for pre-trained ANNs. To address these...

ID: 2508.07710v1 cs.LG, cs.AI

arXiv PDF

📄 DoorDet: Semi-Automated Multi-Class Door Detection Dataset via Object Detection and Large Language Models

2025-08-13

Авторы:

Licheng Zhang, Bach Le, Naveed Akhtar, Tuan Ngo

## Контекст Детальная распознаваемость и классификация различных типов дверей на планах помещений является ключевым заданием в таких областях, как проверка соответствия зданий нормам, анализ внутренних сцен и улучшение умных систем управления зданиями. Несмотря на важность этого задания, доступные общедоступные данные для тонкой классификации и распознавания дверей в многоклассовом режиме остаются ограниченными. Отсутствие подобных данных ставит под угрозу развитие инновационных решений в области анализа и моделирования помещений. Для преодоления этой проблемы необходимо разработать метод, позволяющий эффективно создавать и аннотировать большие данные для обучения и тестирования нейросетевых моделей в этой области. ## Метод Предлагаемая методология состоит из двух основных этапов. В первом этапе используется современный объектный детектор для распознавания всех дверей на изображениях планов как единой категории. Во втором этапе применяется значительно мощный языковой модель (LLM), которая классифицирует каждую распознанную дверь на основе её визуальных и контекстуальных признаков. Этот процесс автоматизируется, но включает в себя ручное вмешательство в виде "человека в цепи" для повышения точности и качества аннотированных данных. Эта подходка обеспечивает эффективность и точность в создании больших многоклассовых данных для детекции дверей, а также снижает трудозатраты и затраты ресурсов. ## Результаты Основываясь на предложенной методологии, был создан Dataset DoorDet, содержащий более 10 000 изображений планов с классифицированными двумядверными и многоклассовыми дверями. Данные были аннотированы с помощью LLM и проверены человеком, что обеспечило высокую точность и качество. Эксперименты показали, что данный подход эффективно снижает трудозатраты на аннотацию, без ущерба для качества данных, что делает DoorDet идеальной платформой для тестирования и обучения нейросетевых моделей в области анализа помещений. ## Значимость Предложенный подход имеет широкие области применения, включая проверку соответствия зданий нормам, моделирование интерьеров, улучшение умных систем управления зданиями и многое другое. Основные преимущества метода заключаются в повышении эффективности и точности, а также в существенной сокращении ресурсов за счет автоматизации процесса аннотации. Это демонстрирует потенциал комбинации неглубоких и глубоких методов для эффективного датасета создания в сложных реальных задачах. ## Выводы Разработанный метод DoorDet доказал свою эффективность в построении качественных многоклассовых данных для детекции дверей. Это открывает

Annotation:

Accurate detection and classification of diverse door types in floor plans drawings is critical for multiple applications, such as building compliance checking, and indoor scene understanding. Despite their importance, publicly available datasets specifically designed for fine-grained multi-class door detection remain scarce. In this work, we present a semi-automated pipeline that leverages a state-of-the-art object detector and a large language model (LLM) to construct a multi-class door detect...

ID: 2508.07714v1 cs.CV, cs.AI, cs.ET

arXiv PDF

📄 CognitiveArm: Enabling Real-Time EEG-Controlled Prosthetic Arm Using Embodied Machine Learning

2025-08-13

Авторы:

Abdul Basit, Maha Nawaz, Saim Rehman, Muhammad Shafique

## Контекст С появлением нейропротезирования, проблема эффективного контроля протезных конечностей становится все более важной. Управление такими конечностями через нейронные сети требует точного анализа и реализации быстрых классификаторов. Одним из ключевых вопросов является повышение точности классификации во время реального времени, не ухудшаясь по квалити. Нагрузка на ресурсы и задержка при совместном использовании моделей и железа также являются сложными проблемами для достижения эффективного управления. Область исследования включает нейробиомедицинскую инженерию, виртуальную и расширенную реальность, как области, где решения могут найти применение. Одним из ключевых мотивов является развитие технологий, которые позволят повысить самостоятельность и качество жизни людей с ограниченными физическими возможностями. ## Метод Мы представляем CognitiveArm - систему управления протезом, которая использует нейронные сети, обученные с использованием BrainFlow. Эта библиотека позволяет структурировать данные EEG и подавать их на вход дебированным DL-моделям. Мы использовали функции глубинного обучения, включая эволюционный поиск для поиска оптимальных параметров. Чтобы оптимизировать модели для реального времени, мы применяли методы как компрессии, так и квантования. Для обучения сетей мы создали выборку EEG-данных и провели пайплайн аннотации, чтобы получать точные метки для классификаторов. Помимо этого, мы добавили возможность управления голосом, чтобы включать режимы управления, используя речевой ввод. ## Результаты Наши эксперименты показали, что модели, обученные с помощью CognitiveArm, достигли 90% точности в классификации трех основных действий (лево, право, неподвижность). Мы выполнили эксперименты на OpenBCI UltraCortex Mark IV, который стабильно передавал сигналы EEG. Мы доказали, что модели работают на ресурсозатратном оборудовании, но не ухудшают точность. Мы также продемонстрировали, что модели могут реагировать на голосовые команды, что позволяет переключаться между режимами управления (например, рукопожатие или держание чашки). ## Значимость CognitiveArm может применяться в нейропротезировании, виртуальной и расширенной реальности, а также в биомедицинской инженерии. Он обеспечивает более высокую точность и реакцию, чем предыдущие решения, что позволяет повысить самостоятельность пользователя. За счет оптимизации для ресурсозатратного железа, CognitiveArm возможно использовать в настоящее время, что делает его более привлекательным для практического использования. Мы также отметили, что это решение может быть расширено для других сенсорных сигналов, таких как IMU и

Annotation:

Efficient control of prosthetic limbs via non-invasive brain-computer interfaces (BCIs) requires advanced EEG processing, including pre-filtering, feature extraction, and action prediction, performed in real time on edge AI hardware. Achieving this on resource-constrained devices presents challenges in balancing model complexity, computational efficiency, and latency. We present CognitiveArm, an EEG-driven, brain-controlled prosthetic system implemented on embedded AI hardware, achieving real-ti...

ID: 2508.07731v1 cs.HC, cs.AI, 68T50, 68T40, 68T07, 92C55, I.2.7; I.2.9

arXiv PDF

📄 A Rule-Based Approach to Specifying Preferences over Conflicting Facts and Querying Inconsistent Knowledge Bases

2025-08-13

Авторы:

Meghyn Bienvenu, Camille Bourgaux, Katsumi Inoue, Robin Jean

#### Контекст В настоящее время обработка неполных и несогласованных знаний является ключевым аспектом знаний и решения проблем в системах логических выводов и знаний. Особенно актуальным является вопрос, как установить приоритетные отношения между конфликтующими фактами в таких базах знаний. Несмотря на то, что многие работы рассматривали repair-based семантики для получения смысловых ответов на запросы к несогласованным KBs, вопрос о том, как эти отношения могут быть указаны и вычислены, остается практически неизлечим. Этот аспект мотивирует разработку декларативной регламентовой модели для установления и вычисления приоритета между конфликтующими фактами. #### Метод Мы предлагаем регламентовую модель, которая позволяет специфицировать отношения приоритета между фактами в несогласованных базах знаний. Основной компонент этой модели — правила, устанавливающие приоритеты между фактами. Мы проанализировали ситуации, когда такие правила могут привести к цикличным отношениям, и предложили методы для их разрешения, включая циклическое удаление и другие техники. Методология основывается на ответных программах, которые эффективно вычисляют наилучшее приоритетное отношение и адекватно отвечают на запросы к несогласованным KBs. #### Результаты Мы провели эксперименты, используя стандартные наборы данных в области несогласованных KBs. Наши результаты показали, что предложенная модель эффективно устанавливает приоритеты между конфликтующими фактами, решает проблему цикличности и позволяет выполнять запросы с приоритетными правилами. Мы также провели эксперименты с разными техниками удаления циклов и сравнили их эффективность. #### Значимость Предложенная модель имеет широкое применение в системах, требующих управления несогласованными знаниями, таких как автоматизированные системы решения задач, поисковые системы и решающие системы. Наш подход предоставляет преимущества в том, что он декларативен, гибкий и позволяет эффективно управлять конфликтами в знаниях. Мы ожидаем, что наше исследование может повлиять на понимание и реализацию семантик несогласованных знаний в будущих системах. #### Выводы Мы успешно развили декларативную модель для установления приоритетов между конфликтующими фактами и отображения результатов в несогласованных KBs. Дальнейшие исследования будут сфокусированы на оптимизации техник для разрешения цикличности и расширении модели для более сложных случаев.

Annotation:

Repair-based semantics have been extensively studied as a means of obtaining meaningful answers to queries posed over inconsistent knowledge bases (KBs). While several works have considered how to exploit a priority relation between facts to select optimal repairs, the question of how to specify such preferences remains largely unaddressed. This motivates us to introduce a declarative rule-based framework for specifying and computing a priority relation between conflicting facts. As the expresse...

ID: 2508.07742v1 cs.LO, cs.AI, cs.DB

arXiv PDF

📄 Symmetry-Aware Transformer Training for Automated Planning

2025-08-13

Авторы:

Markus Fritzsche, Elliot Gestrin, Jendrik Seipp

## Контекст На данный момент, трансформеры доказали свою эффективность во многих областях, но их применение в автоматизированном планировании ограничивается. Одним из основных поводов этого являются симметрии в планировании, которые вызывают значительные сложности для обучения. Известный стейт-оф-арт трансформера для автоматизированного планирования, PlanGPT, сталкивается с трудностями при проектировании сложных задач. Это происходит из-за того, что задачи планирования могут быть представлены в различных вариантах, используя произвольные идентификаторы переменных, которые не несут смысла. Это приводит к экспоненциальному росту эквивалентных представлений, которые трансформеры с трудом обучаются. Мы предлагаем новую методологию, основанную на создании более симметричного обучения, чтобы улучшить чувствительность трансформеров к таким симметриям и устранить это ограничение. ## Метод Мы предлагаем симметрично-подвижную обучающую систему, которая использует современные методы сопоставительного обучения. Эта методология включает в себя архитектурные усовершенствования, позволяющие трансформеру более эффективно обрабатывать симметрии в задачах планирования. Мы применяем специальный контрастирующий целевой функционал, который позволяет трансформеру изучить и отличать задачи с разными симметричными представлениями. Также, мы внедряем дополнительные архитектурные элементы, такие как дополнительные слои и механизмы внимания, для улучшения обработки плановых задач. ## Результаты Мы проводили эксперименты на нескольких планировании задачах, включая задачи планирования путей и задачи планирования действий. Мы сравнивали наши результаты с PlanGPT и другими моделями. Наши эксперименты показали, что наши трансформеры с симметричным обучением показали значительное улучшение в скорости обучения и точности решения сложных задач. Мы также показали, что модели с нашим методом могут эффективно выделять и использовать симметрии в задачах планирования, что приводит к более точным и эффективным решениям. ## Значимость Наш метод может быть применен в различных сферах, включая авиацию, производство и робототехнику, где автоматизированное планирование является критически важной задачей. Это решение позволяет использовать трансформеры для задач, где предыдущие модели сталкивались с ограничениями. Благодаря симметричному обучению, наша модель эффективно решает проблемы симметрии и улучшает общую эффективность. Это может привести к повышению производительности и уменьшению времени обучения во многих приложениях. ## Выводы

Annotation:

While transformers excel in many settings, their application in the field of automated planning is limited. Prior work like PlanGPT, a state-of-the-art decoder-only transformer, struggles with extrapolation from easy to hard planning problems. This in turn stems from problem symmetries: planning tasks can be represented with arbitrary variable names that carry no meaning beyond being identifiers. This causes a combinatorial explosion of equivalent representations that pure transformers cannot ef...

ID: 2508.07743v1 cs.AI, cs.LG

arXiv PDF

📄 Chimera: Harnessing Multi-Agent LLMs for Automatic Insider Threat Simulation

2025-08-13

Авторы:

Jiongchi Yu, Xiaofei Xie, Qiang Hu, Yuhan Ma, Ziming Zhao

## Контекст Инсайдерские угрозы (insider threats) представляют опасность, которая может привести к серьезным потерям для организаций. Они могут принимать различные формы, такие как утечка конфиденциальной информации, системный саботаж или кража интеллектуальной собственности. Одним из главных задач для гарантии безопасности является развитие эффективных методов для идентификации и симуляции таких угроз. Изучение этих вопросов требует доступа к качественным данным, что часто оказывается сложным из-за конфиденциальности организационных данных и их недостаточного количества для полноценного исследования. Это способствует ограниченности в развитии методов внутриорганизационного мониторинга и симуляции угроз. ## Метод Чимера (Chimera) — первая платформа, основанная на многоагентной модели л LLM, которая автоматически симулирует поведение пользователей внутри организации, включая как благонамеренное, так и злонамеренное. Она учитывает ролевое поведение различных типов сотрудников, включая руководителей, разработчиков и администраторов. Используя модули для групповых встреч, парные взаимодействия и самостоятельное расписание, платформа генерирует подробные логи действий пользователей. Процесс симуляции включает 15 типов угроз, таких как кража интеллектуальной собственности и системный саботаж. Данные, генерируемые Chimera, хранятся в формате ChimeraLog, представляющем собой новый высококачественный датасет, предназначенный для исследований в области определения внутриорганизационных угроз. ## Результаты Данные ChimeraLog были протестированы в составе нескольких кейсов, включая технологическую компанию, финансовую корпорацию и медицинское учреждение. Эксперименты показали высокую реалистичность генерируемых данных и разнообразие угроз, включая обоснованные шаблоны моделирования вредоносного поведения. В частности, проведенный тест на F1-метрике показал, что уровень сложности ChimeraLog значительно выше, чем у других датасетов. Это позволяет использовать Chimera для достижения более точных и сложных моделей поддержки решений в области мониторинга и симуляции внутриорганизационных угроз. ## Значимость Предложенный подход имеет широкие возможности в области безопасности и мониторинга. Платформа Chimera может применяться для создания достоверных датасетов, которые позволят развивать модели мониторинга и обнаружения внутриорганизационных угроз. Это также может способствовать развитию методов для идентификации и предотвращения внутренних угроз, таких как кража данных или саботаж. Благодаря своей реалистичности и разнооб

Annotation:

Insider threats, which can lead to severe losses, remain a major security concern. While machine learning-based insider threat detection (ITD) methods have shown promising results, their progress is hindered by the scarcity of high-quality data. Enterprise data is sensitive and rarely accessible, while publicly available datasets, when limited in scale due to cost, lack sufficient real-world coverage; and when purely synthetic, they fail to capture rich semantics and realistic user behavior. To ...

ID: 2508.07745v2 cs.CR, cs.AI, cs.SE

arXiv PDF

📄 Learning to Align, Aligning to Learn: A Unified Approach for Self-Optimized Alignment

2025-08-13

Авторы:

Haowen Wang, Yun Yue, Zhiling Ye, Shuowen Zhang, Lei Fan, Jiaxin Liang, Jiadi Jiang, Cheng Wei, Jingyuan Deng, Xudong Han, Ji Li, Chunxiao Guo, Peng Wei, Jian Wang, Jinjie Gu

## Контекст Одним из ключевых направлений развития языковых моделей является улучшение их возможностей алигментации. Это позволяет моделям лучше понимать и воспроизводить человеческие предпочтения в различных контекстах. Существующие подходы, такие как супервизованная тонкая настройка (SFT) и оптимизация политики с использованием опыта (PPO), имеют свои ограничения. SFT обеспечивает высокую точность, но не может эффективно адаптироваться к новым задачам. PPO, в свою очередь, предлагает более гибкий подход, но требует большого объема вычислительных ресурсов и высококачественных основных моделей. Эти ограничения поднимают вопрос о создании более универсального и эффективного подхода к алигментации. ## Метод Мы предлагаем **GRAO (Group Relative Alignment Optimization)** — унифицированный фреймворк, который объединяет сильные стороны SFT и RL. Фундаментальной идеей является использование **групповой оценки качества** и **относительной алигментации**. Метод включает следующие ключевые компоненты: 1. **Множественное генерирование сравнительного анализа**: модель генерирует несколько вариантов ответов и сравнивает их с помощью внешнего рейтинга, чтобы определить качество. 2. **Новая формула Group Direct Alignment Loss**: включает в себя весовую оценку внутригрупповых отношений, чтобы улучшить точность. 3. **Управление параметрами с учетом справочных данных**: адаптирует модель на основе параметров, которые учитывают предпочтения пользователя в динамическом режиме. Теоретические обоснования подтверждают, что GRAO обеспечивает более эффективную оптимизацию и высокую точность в сравнении с существующими методами. ## Результаты Мы провели эксперименты на множестве задач, включая комплексные задачи выравнивания на основе человеческих оценок. GRAO показал следующие результаты по сравнению с базовыми подходами: - **SFT**: 57.70% дополнительное улучшение в выполнении задач. - **DPO**: 17.65% улучшение в точности. - **PPO**: 7.95% уменьшение времени обучения. - **GRPO**: 5.18% увеличение эффективности. Эти результаты подтверждают эффективность GRAO в решении задач, где требуется быстрая и точная алигментация. ## Значимость GRAO может применяться в таких областях, как диалоговые системы, трансляторы и системы поиска информации. Он обеспечивает: - Более эффективную алигментацию за счет интеграции лучших аспектов SFT и RL. - Улучшенную точность и ресурсоснимаемость, что делает его привлекательным для реальных приложений. - Устойчивость к новым задачам без необходимости частых дорогостоящих тюнингов. ## Выводы GRAO

Annotation:

Alignment methodologies have emerged as a critical pathway for enhancing language model alignment capabilities. While SFT (supervised fine-tuning) accelerates convergence through direct token-level loss intervention, its efficacy is constrained by offline policy trajectory. In contrast, RL(reinforcement learning) facilitates exploratory policy optimization, but suffers from low sample efficiency and stringent dependency on high-quality base models. To address these dual challenges, we propose GR...

ID: 2508.07750v1 cs.LG, cs.AI, cs.CL

arXiv PDF

📄 Sparse Probabilistic Graph Circuits

2025-08-13

Авторы:

Martin Rektoris, Milan Papež, Václav Šmídl, Tomáš Pevný

#### Контекст Глубокие генерирующие модели (DGMs) для графов достигли впечатляющей выразительности благодаря эффективным и масштабируемым нейронным сетям. Однако, нелинейные операции в этих сетях мешают аналитическому вычислению простой проблемы простой проблемы логических запросов, что делает эти модели "нераспространенными". Недавно разработанные Probabilistic Graph Circuits (PGCs) решают эту проблему, предоставляя возможность распространенного аналитического вычисления проблем логических запросов. Однако, PGCs работают с толстыми представлениями графов, имеющими $\mathcal{O}(n^2)$ сложность, где $n$ — число узлов, а $m$ — число ребер в графе. Данная сложность становится проблемой при работе с большими графами. Чтобы улучшить эффективность, мы предлагаем Sparse Probabilistic Graph Circuits (SPGCs) — новую классу трактуемых моделей генерирующих графы, работающих с узкими представлениями графа, снижающими сложность до $\mathcal{O}(n + m)$, что значительно эффективнее для случаев $m \ll n^2$. #### Метод SPGCs оперируют спарсевыми представлениями графов, которые содержат только активные ребра, сокращая необходимую сложность. Для реализации используется архитектура глубоких нейронных сетей, адаптированная для эффективного вычисления стандартных запросов логического типа. Мы используем техники сжатия графов, что позволяет ускорить вычисления и сократить используемую память. Во время обучения, SPGCs используют потери, которые принуждают модель к точному вычислению количественных запросов. #### Результаты Мы проводили эксперименты на различных графовых задачах, включая задачу нового лекарственного дизайна. SPGCs доказали способность выполнять точные аналитические запросы с большей эффективностью по сравнению с интраккунтными DGMs. Мы показали, что SPGCs обеспечивают эффективность в памяти, эффективность вычислений и совпадают с интраккунтными DGMs по ключевым метрикам. Наши результаты подтвердили то, что SPGCs хорошо работают в скорости и точности, даже при работе с большими графами. #### Значимость SPGCs могут быть применены в различных областях, включая классификацию графов, разметку, новый дизайн лекарств и другие задачи, где требуется эффективный и точный вычислительный подход. Они предлагают выгоды в скорости и эффективности памяти по сравнению с интракктивными DGMs. Наш подход может положительно сказаться на развитии глубоких моделей графов, позволяя их применять в реальных задачах, где требуется высокая эффективность. #### Выводы Мы представили новую классу трактуемых моделе

Annotation:

Deep generative models (DGMs) for graphs achieve impressively high expressive power thanks to very efficient and scalable neural networks. However, these networks contain non-linearities that prevent analytical computation of many standard probabilistic inference queries, i.e., these DGMs are considered \emph{intractable}. While recently proposed Probabilistic Graph Circuits (PGCs) address this issue by enabling \emph{tractable} probabilistic inference, they operate on dense graph representation...

ID: 2508.07763v1 cs.LG, cs.AI

arXiv PDF

1
2
1407
1408
1409
1410
1411
1482
1483

Показано 14081 - 14090 из 14827 записей