📚 Саммари научных статей из arXiv

Найдено 2912 результатов по запросу 'cs.LG, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Learning Time-Varying Convexifications of Multiple Fairness Measures

2025-08-22

Авторы:

Quan Zhou, Jakub Marecek, Robert Shorten

## Контекст В последние годы возрастает признание необходимости учета нескольких мер справедливости при разработке алгоритмов, особенно в критичных областях приложений, таких как машинное обучение и анализ данных. Эти меры могут относиться как к групповым, так и к индивидуальным аспектам справедливости, их взаимодействие и влияние на решения алгоритмов требуют тщательного изучения. Одной из основных проблем является то, что поровнуравенство не является статическим понятием, а зависит от контекста и времени. В настоящее время существуют методы, которые пытаются учитывать эти вариации, но они часто требуют значительных ресурсов или неэффективны в условиях ограниченной информации. Этот аспект подчеркивает необходимость развития методов, работающих с ограниченными данными и имеющих возможность учитывать контекст на ходу. ## Метод В статье предлагается методология, основанная на концепции **time-varying convexifications** (временных разностных многомерных конвексий) для множества мер справедливости. Это достигается путем градиентного спуска с ограниченной информацией об обратной связи, поступающей в виде графа. Архитектура включает нейросетевые модели, которые моделируют взаимодействие между мерами справедливости, и гибкие методы, адаптирующиеся к временным переменностям. Технические решения включают в себя использование адаптивных весов для регуляризации, что позволяет отражать временную гибкость при оптимизации. ## Результаты На основе экспериментов, проведенных на синтетических и реальных данных, было доказано, что предлагаемый подход эффективно выжимает информацию из ограниченного графа обратной связи. Результаты показывают, что модель справляется хорошо с изменчивыми мерами справедливости и позволяет достичь более высоких показателей справедливости по сравнению с базовыми методами. Были проанализированы также сценарии, в которых ограничения доступа к данным были еще более существенными, и данный подход показал себя эффективным. ## Значимость Предлагаемый подход может быть применен в различных областях, где требуется учитывать временную изменчивость мер справедливости, такие как рекомендательные системы, финансовый анализ и боевые развязки. Преимущество текущего подхода заключается в том, что он не требует полного знания о всех мерах справедливости заранее, а адаптируется к изменениям в реальном времени. Это может существенно улучшить эффективность и справедливость работы искусственного интеллекта в критичных областях приложений. ## Выводы Результаты статьи подтверждают, что time-varying convexifications могут быть э

Annotation:

There is an increasing appreciation that one may need to consider multiple measures of fairness, e.g., considering multiple group and individual fairness notions. The relative weights of the fairness regularisers are a priori unknown, may be time varying, and need to be learned on the fly. We consider the learning of time-varying convexifications of multiple fairness measures with limited graph-structured feedback.

ID: 2508.14311v1 cs.LG, cs.AI

arXiv PDF

📄 Your Reward Function for RL is Your Best PRM for Search: Unifying RL and Search-Based TTS

2025-08-22

Авторы:

Can Jin, Yang Zhou, Qixin Zhang, Hongwu Peng, Di Zhang, Marco Pavone, Ligong Han, Zhang-Wei Hong, Tong Che, Dimitris N. Metaxas

## Контекст Развитие тестируемого темпоинтерования (Test-Time Scaling, TTS) для больших языковых моделей (LLMs) традиционно разделяется на два направления: (1) методы технического оптимизации (RL), которые оптимизируют спарсые результаты на основе высококвалифицированных наград, но страдают от нестабильности и низкой эффективности выбора, и (2) поисковые техники, которые используют статические процессные модели награды (PRMs), требующие дорогостоящих данных, генерируемых людьми или ЛСМ, и чувствительны к распространению отклонений. Однако эти подходы часто остаются нерешенными по отношению к эффективному управлению развитием логики и стоимости выполнения задач. В настоящей работе предлагается новый подход, который объединяет эти два направления, стремясь к максимальной эффективности и универсальности в обработке задач. ## Метод Предлагаемый подход, названный AIRL-S, объединяет техники субдифференцируемого оптимизации Реформленковского типа (AIRL) с групповой динамической оптимизацией политики (GRPO) для установления лучшего значения PRM. Основная идея заключается в том, что RL-реWARD FUNCTION может быть применена не только для оптимизации логики, но и для генерации лучшего PRM, который может использоваться в последующих поисковых задачах. В качестве основы AIRL-S используется технология обучения гамильтоновских систем, которая внедряет разделенную модель знаний для обеспечения более точной и эффективной обработки. Это позволяет динамически расширять логические цепи и улучшать их робастность предсказаний. ## Результаты Проведенные эксперименты показали, что AIRL-S показал значительное улучшение в 9% по сравнению с базовым модельным подходом в задачах, таких как математические решения, научная рассужденность и генерация кода. Эта модель показала свою лучшую робастность перед трудными подсчетами в тестируемом темпоинтеровании и увеличила суммарный процент успешных решений. Были выполнены эксперименты с несколькими PRMs, и AIRL-S показала свою выгоду в стоимости и эффективности в сравнении с другими моделями, тренированными с традиционными методами. ## Значимость Результаты AIRL-S показали многообразные применения в области логической обработки и поиска данных. Модель обеспечивает высокую точность и оптимальную стоимость выполнения задач, что может иметь большой потенциал в крупномасштабных практических приложениях, таких как генерация текста, кодирование и автоматическая синтезированная работа. Архитектура AIRL-S может стать базой для будущих развитий в тестируемом темпоинтеровании, обеспечивая продвинутый

Annotation:

Test-time scaling (TTS) for large language models (LLMs) has thus far fallen into two largely separate paradigms: (1) reinforcement learning (RL) methods that optimize sparse outcome-based rewards, yet suffer from instability and low sample efficiency; and (2) search-based techniques guided by independently trained, static process reward models (PRMs), which require expensive human- or LLM-generated labels and often degrade under distribution shifts. In this paper, we introduce AIRL-S, the first...

ID: 2508.14313v1 cs.LG, cs.AI

arXiv PDF

📄 A Comparative Evaluation of Teacher-Guided Reinforcement Learning Techniques for Autonomous Cyber Operations

2025-08-22

Авторы:

Konur Tholl, Mariam El Mezouar, Ranwa Al Mallah

## Контекст Autonomous Cyber Operations (ACO) — это системы, которые используют Reinforcement Learning (RL) для обучения агентов, принимающих эффективные решения в области кибербезопасности. Однако существующие ACO-системы требуют, чтобы агенты начинали обучение с нуля, что приводит к медленному схождению и низкой эффективности в начальной стадии. Использование "учителя" оказало успех в других областях, но пока не применялось в ACO. Мы решили провести эксперимент, оценивающий три разных метода учителя в симуляционной среде CybORG, чтобы изучить, насколько эти методы могут улучшить эффективность и скорость обучения агента. ## Метод Мы реализовали и оценили четыре метода учителя в симуляционной среде CybORG. Обучение осуществлялось на основе политики, эксперименты проводились с разными наборами данных и ситуациями. Мы измеряли скорость схождения, начальную производительность политики и качество решений в ходе обучения. Наша цель — выяснить, какие методы учителя дают лучшие результаты в сфере кибербезопасности. ## Результаты Наши эксперименты показали, что использование учителя может значительно улучшить производительность и быстроту схождения политики агента. Мы обнаружили, что одни методы учителя дают более стабильные результаты, в то время как другие показывают более быстрый запуск, но с меньшей стабильностью в процессе. Эти результаты показывают, что интеграция учителя может существенно оптимизировать обучение в ACO. ## Значимость Результаты могут быть применены в автоматизированных системах кибер-операций, помогая улучшить производительность и эффективность обучения. Это может привести к более быстрому развитию и применению ACO в защите систем от атак. Эти методы также могут быть применены в других областях, где RL выступает в качестве главного метода обучения. ## Выводы Мы показали, что методы учителя могут существенно улучшить обучение в ACO, увеличивая эффективность и скорость схождения. Наши результаты открывают путь для дальнейших исследований в области искусственного интеллекта в кибербезопасности, особенно в сфере применения учителей для ускорения и оптимизации обучения агентов.

Annotation:

Autonomous Cyber Operations (ACO) rely on Reinforcement Learning (RL) to train agents to make effective decisions in the cybersecurity domain. However, existing ACO applications require agents to learn from scratch, leading to slow convergence and poor early-stage performance. While teacher-guided techniques have demonstrated promise in other domains, they have not yet been applied to ACO. In this study, we implement four distinct teacher-guided techniques in the simulated CybORG environment and...

ID: 2508.14340v1 cs.LG, cs.AI

arXiv PDF

📄 Generative AI Against Poaching: Latent Composite Flow Matching for Wildlife Conservation

2025-08-22

Авторы:

Lingkai Kong, Haichuan Wang, Charles A. Emogor, Vincent Börsch-Supan, Lily Xu, Milind Tambe

## Контекст Посягательства на природу в виде поязания животных являются критической угрозой для экосистем и биоразнообразия. Эти действия часто связаны с шантажом и трафиком зверей, которые имеют не только экономический, но и этический характер. Для эффективного противостояния посягательствам животным необходимо предвидеть поведение пойманцев, чтобы грамотно распределить ресурсы на охранение и профилактику. Однако существующие методы предсказания поведения пойманцев, основывающиеся на линейных моделях или решающих деревьях, не могут корректно учитывать сложные нелинейные зависимости в пространственно-временных данных. Данная статья рассматривает применение генерирующего искусственного интеллекта (Generative AI) для решения этой проблемы. ## Метод Для предсказания поведения пойманцев использовалась модель Latent Composite Flow Matching (LCFM), которая основывается на подходе flow matching. LCFM расширяет применение flow matching за счет интеграции с моделью оккупантности, что позволяет модели лучше учитывать недостаточно отфильтрованные данные о поязаниях. Для улучшения обучения в ситуации данного типа, композитная модель инициализирована не случайным шумом, как в стандартных диффузионных моделях, а на основе предсказаний линейных моделей. Это позволяет внедрять предварительные знания в модель, увеличивая ее точность и общую ценность. ## Результаты Для оценки эффективности модели LCFM проводились эксперименты на данных, собранных в двух национальных парках Уганды. Модель показала высокую точность в предсказании поведения пойманцев, превосходя существующие методы в сравнительных тестах. Оценки показали, что LCFM лучше предсказывает зависимости между ситуациями поязаний и областями расположения охранных патролов. Эти результаты подтверждают, что LCFM может стать важной инструментом для улучшения планирования охранных мероприятий и снижения угроз от поязаний. ## Значимость Прогнозирование поведения пойманцев может иметь значительное влияние на эффективность мероприятий по охране природы. Особенно это актуально для территорий с ограниченным количеством ресурсов для охраны. LCFM может использоваться не только для прогнозирования поязаний, но также для развития стратегий профилактики и реагирования. Это делает модель ценным инструментом для принятия решений в области консервации биоразнообразия и уменьшения посягательств на природу. ## Выводы Результаты экспериментов показывают, что LCFM является эффективным средством для предсказания поведения пойманцев. Однако в будущем необходимо провести более обширные исследования на более крупных датасетах и применить модель к другим

Annotation:

Poaching poses significant threats to wildlife and biodiversity. A valuable step in reducing poaching is to forecast poacher behavior, which can inform patrol planning and other conservation interventions. Existing poaching prediction methods based on linear models or decision trees lack the expressivity to capture complex, nonlinear spatiotemporal patterns. Recent advances in generative modeling, particularly flow matching, offer a more flexible alternative. However, training such models on rea...

ID: 2508.14342v1 cs.LG, cs.AI, cs.MA

arXiv PDF

📄 Organ-Agents: Virtual Human Physiology Simulator via LLMs

2025-08-22

Авторы:

Rihao Chang, He Jiao, Weizhi Nie, Honglin Guo, Keliang Xie, Zhenhua Wu, Lina Zhao, Yunpeng Bai, Yongtao Ma, Lanjun Wang, Yuting Su, Xi Gao, Weijie Wang, Nicu Sebe, Bruno Lepri, Bingwei Sun

#### Контекст Прогресс в области больших языковых моделей (LLMs) открыл новые возможности для моделирования сложных физиологических систем. Однако существуют проблемы в точности, эффективности и воспроизводимости таких моделей, особенно при анализе многосистемных феноменов. Эти ограничения приводят к затруднению использования таких моделей в клинических решениях, таких как моделирование органов, симуляция терапии и выявление патологичных процессов. Данные проблемы мотивируют развитие моделей, которые обеспечат высокую точность, универсальность и возможность проведения интерпретируемых экспериментов в критической медицинской практике. #### Метод Мы предлагаем Organ-Agents — распределенную систему, основанную на multi-agent framework, где каждый agent представляет собой отдельную систему органа (например, сердечно-сосудистая, печеночная и т.д.). Модели реализуются на базе LLMs и тренируются с помощью наборов данных системных временных рядов, полученных из реальных клинических источников. Методология включает в себя предобучение на тренировочных данных (supervised fine-tuning), а затем улучшение поведения во время работы с помощью reinforcement-guided coordination. Данная стратегия позволяет координировать агенты динамически, применяя ошибочное исправление и выбор динамических спецификаций. Наши данные включают анонимные данные 7,134 пациентов с сепсисом и 7,895 контрольных случаев, покрывающие 9 систем органов и 125 переменных. #### Результаты Мы проводили тщательную оценку Organ-Agents на 4,509 отложенных пациентов, получив высокую точность с показателями MSE <0.16 для каждой системы. Для внешней валидации использовались данные 22,689 пациентов с критической ситуацией, собранных в двух клинических центрах. Мы обнаружили небольшую задержку в поведении модели при распространении различных данных, при этом уровень точности оставался высоким. Особое внимание уделено воспроизведению критических многосистемных событий, таких как гипотензия и гипоксия, с точностью во временной и фазовой прогрессии. Мы также провели сотрудничество с 15 критических заболеваний специалистов, которые оценили модели по интерпретируемости и физиологической достоверности (средние оценки 3.9 и 3.7 в шкале Likert). Наконец, Organ-Agents позволяет проводить анализ историй болезни в условиях альтернативных стратегий терапии, позволяя прогнозировать показатели здоровья и APACHE II. #### Значимость Предложенная модель может применяться в критической медицине для моделирования органов, симуляции терапии и тестирования гипотез. Она обеспечивает высокую точность воспроизведения физиологических про

Annotation:

Recent advances in large language models (LLMs) have enabled new possibilities in simulating complex physiological systems. We introduce Organ-Agents, a multi-agent framework that simulates human physiology via LLM-driven agents. Each Simulator models a specific system (e.g., cardiovascular, renal, immune). Training consists of supervised fine-tuning on system-specific time-series data, followed by reinforcement-guided coordination using dynamic reference selection and error correction. We curat...

ID: 2508.14357v1 cs.LG, cs.AI, cs.CV

arXiv PDF

📄 Online Incident Response Planning under Model Misspecification through Bayesian Learning and Belief Quantization

2025-08-22

Авторы:

Kim Hammar, Tao Li

#### Контекст В целом, системы онлайн-инцидентного реагирования требуют быстрых и точных решений, даже когда доступна ограниченная или неточная информация. Однако многие существующие рамки поддержки решений для инцидентного реагирования основываются на более-менее точном моделировании системы и инцидента, что ограничивает их практическую значимость. В данной работе будет решено этот вопрос. Мы предлагаем **MOBAL (Misspecified Online Bayesian Learning)**, методологию, которая может корректировать свое представление об инциденте на базе поступающей информации. Эта методика реализуется с помощью **Bayesian Learning (Непрерывное Байесовское Обучение)**, которое позволяет учитывать неизвестные модели в реальном времени. Также, мы используем **Belief Quantization (Квантование Убеждений)**, чтобы упростить моделирование и ускорить работу с инцидентами. #### Метод В целой методологии **MOBAL** включены два основных элемента: **Bayesian Learning (Непрерывное Байесовское Обучение)** и **Belief Quantization (Квантование Убеждений)**. Байесовское обучение используется для постепенного корректирования существующей модели инцидента в зависимости от полученной информации. Это позволяет системе адаптироваться к изменениям во время инцидента. Также, полученная модель злоумышленника (с помощью Байесовского обучения) конвертируется в **Markov Decision Process (Марковский Процесс Решений)**, чтобы упростить вывод решения. Таким образом, мы можем оценить возможные реакции и выбрать эффективный ответ в реальном времени. #### Результаты Мы проводили ряд экспериментов с помощью **CAGE-2 Benchmark**, чтобы проверить эффективность **MOBAL** в сравнении с другими подходами. Мы использовали разные сценарии инцидентов, включая сценарии с неполной информацией. Результаты показали, что **MOBAL** демонстрирует высокую адаптивность и жесткость к ошибкам моделирования. В частности, МОBAL показала более высокую точность в реагировании на инциденты в сравнении с традиционными методами, которые не имеют возможности адаптироваться к изменениям в модели. #### Значимость **MOBAL** может использоваться в различных областях безопасности, таких как охрана сетевых систем, здравоохранение, мониторинг критических инфраструктур. Она не только позволяет быстрее реагировать на инциденты, но и повышает точность решений, даже когда модель не является полностью точной. Особым преимуществом является уменьшение времени отклика и увеличение устойчивости к ошибкам моделирования. Это делает **MOBAL** очень полезным для реагирования на инциденты в реальном времени, где каждая минута может оказаться критичной. #### Выводы Мы доказали, что **MOBAL** является

Annotation:

Effective responses to cyberattacks require fast decisions, even when information about the attack is incomplete or inaccurate. However, most decision-support frameworks for incident response rely on a detailed system model that describes the incident, which restricts their practical utility. In this paper, we address this limitation and present an online method for incident response planning under model misspecification, which we call MOBAL: Misspecified Online Bayesian Learning. MOBAL iterativ...

ID: 2508.14385v1 cs.LG, cs.AI, cs.CR, cs.SY, eess.SY

arXiv PDF

📄 Exact Shapley Attributions in Quadratic-time for FANOVA Gaussian Processes

2025-08-22

Авторы:

Majid Mohammadi, Krikamol Muandet, Ilaria Tiddi, Annette Ten Teije, Siu Lun Chau

## Контекст Shapley values, представляющие собой метод принципиального подхода для оценки вклада входных признаков в машинное обучение, набирают всё большую популярность. Однако их точное вычисление становится вычислительно трудоёмким, так как зависит экспоненциально от числа признаков. Эта проблема усложняется при использовании гиперпараметрических моделей, таких как гауссовы процессы (Gaussian Processes, GP), где выходные значения являются случайными переменными. Такие модели требуют дополнительного вычислительного времени для моделирования второго и высших моментов. Наша модель FANOVA GP (Функциональная Аналитическая Нормальная Вариационная Аппроксимация) является особым случаем гауссовых процессов, которая явно моделирует все главные эффекты и взаимодействия. Мы показываем, что для этой модели можно вычислить точные Shapley-атрибуты как для локальных, так и для глобальных объяснений в **квадратичное время**. Это делает нашу модель применимую в практических задачах, что важно для повышения прозрачности и надежности выводов в области Экспертного Искусственного Интеллекта (ЭИИ). ## Метод Мы привлекаем закон Мёбиуса для комбинаторных функций и применяем рекурсивные алгоритмы, основанные на уравнениях Ньютона, для вычисления средних и дисперсий Shapley-атрибутов. Наш метод основывается на стохастической игре в рамках функционального разложения FANOVA, которая позволяет оценивать вклад каждого признака в модель. Для локальных, индивидуальных объяснений, мы рассчитываем точный стохастический Shapley-значение за квадратичное время, при этом учтены как средние значения, так и их неопределенность. Для глобальных объяснений, мы вводим вариант-функцию, основанную на детерминированной вариации, что позволяет мерировать вклад каждого признака в целом в модели. Этот подход использует характеристики модели FANOVA, чтобы эффективно вычислять Shapley-атрибуты для пространственных гиперпараметрических моделей. ## Результаты Мы проводим эксперименты, используя различные данные и сравниваем наши результаты с другими методами. Мы показываем, что наш подход даёт точные Shapley-атрибуты в квадратичном времени, что делает его применимым для практики. Мы также проверяем нашу модель на сложности входных данных и показываем, что она устойчива к изменениям в данных. Наши результаты показывают, что точные Shapley-атрибуты могут быть эффективно вычислены для FANOVA GP, что даёт более надежные, неизбежные и понятные объяснения для прогнозов модели. ## Значимость Наш подход может быть применен в сферах, где требуется подробное объяснение моделей, таких как здравоохранение, финансы и историческое исследование. Наш

Annotation:

Shapley values are widely recognized as a principled method for attributing importance to input features in machine learning. However, the exact computation of Shapley values scales exponentially with the number of features, severely limiting the practical application of this powerful approach. The challenge is further compounded when the predictive model is probabilistic - as in Gaussian processes (GPs) - where the outputs are random variables rather than point estimates, necessitating addition...

ID: 2508.14499v1 cs.LG, cs.AI

arXiv PDF

📄 Beyond ReLU: Chebyshev-DQN for Enhanced Deep Q-Networks

2025-08-22

Авторы:

Saman Yazdannik, Morteza Tayefi, Shamim Sanisales

## Контекст Deep Q-Networks (DQN) широко применяются в области глубокого обучения и алгоритмов управления в проблемах машинного обучения с присутствием динамики. Однако, стандартные функциональные аппроксиматоры, такие как многослойные перцептроны, часто сталкиваются с трудностями при представлении сложных значений в задачах управления. Это вызвано неэффективностью приближения значений в реальности. Таким образом, необходимо разработать более эффективные архитектуры, которые могли бы улучшить способность DQN к устойчивому и точному управлению в сложных задачах. ## Метод Чтобы улучшить эффективность DQN, в работе предлагается Chebyshev-DQN (Ch-DQN), архитектура, которая включает в себя полиномы Чебышева в качестве базиса для оптимизации коэффициентов. Чебышевские полиномы известны своими высокими свойствами аппроксимации и их универсальностью в различных задачах. В Ch-DQN, полиномы Чебышева позволяют создать более точное и эффективное представление задач управления, что улучшает глубину и точность опорной сети. Методология включает в себя предварительное формирование базисных функций, интеграцию их в DQN, а также оптимизацию с помощью обучения с подкреплением. ## Результаты Для проверки модели Ch-DQN, участники провели эксперименты на CartPole-v1 сравнивая ее с стандартной DQN. Для Ch-DQN выбран средний уровень полиномов Чебышева (N=4), который демонстрирует значительное улучшение в асимптотической производительности. Исследования показали, что Ch-DQN с N=4 достигла приблизительно 39% лучшего результата в сравнении с базовой DQN. Однако, анализ показывает, что выбор полинома Чебышева является критичным, так как высокие значения N (например, N=8) могут замедлить процесс обучения и снизить производительность. ## Значимость Результаты Ch-DQN открывают новые возможности для улучшения глубоких алгоритмов управления в области машинного обучения. Эта модель может быть применена в задачах с высокой динамикой, когда требуется точное представление значений. Также, Ch-DQN может помочь в улучшении работы DQN в проблемах, требующих большей точности и оптимизации. Этот подход может иметь значительное влияние на развитие новых алгоритмов в современной глубокой науке. ## Выводы Выводы Ch-DQN подтверждают значимость использования полиномов Чебышева в DQN для улучшения устойчивости и производительности. В дальнейшем, необходимо проводить дополнительные исследования для оптимизации уровня полиномов и поиска новых базисных функций, которые могут еще более эффективно ре

Annotation:

The performance of Deep Q-Networks (DQN) is critically dependent on the ability of its underlying neural network to accurately approximate the action-value function. Standard function approximators, such as multi-layer perceptrons, may struggle to efficiently represent the complex value landscapes inherent in many reinforcement learning problems. This paper introduces a novel architecture, the Chebyshev-DQN (Ch-DQN), which integrates a Chebyshev polynomial basis into the DQN framework to create ...

ID: 2508.14536v1 cs.LG, cs.AI

arXiv PDF

📄 Adaptively Robust LLM Inference Optimization under Prediction Uncertainty

2025-08-22

Авторы:

Zixi Chen, Yinyu Ye, Zijie Zhou

#### Контекст Ласточкиной проблемы, связанной с оптимизацией очередности выполнения задач в сервисных системах, приобрела новую роль в контексте больших языковых моделей (LLM). Эти модели широко применяются в различных областях, но их выполнение требует значительных вычислительных и энергетических ресурсов. Особенно критично эффективное управление ресурсами при выполнении последовательных запросов, которые включают неопределенность в длине выходных данных. Эта неопределенность может существенно сказываться на производительности и энергоэффективности. Цель данного исследования — разработать методы, позволяющие снизить задержки и энергопотребление в LLM-инференсе, используя прогнозирование длины выходных данных. #### Метод Для решения проблемы неопределенности в длине выходных данных LLM используется гибкий подход, основанный на машинном обучении. Модели предлагаются прогнозировать интервалы длины выходных данных для каждого запроса, точность которых может отличаться. Разработаны два алгоритма: 1. **Алгоритм $\mathcal{A}_{\max}$**: основывается на использовании верхней границы прогнозируемого интервала длины для следующего запроса. Это позволяет избежать переполнения памяти, но может привести к избыточной задержке и энергопотреблению. 2. **Алгоритм $\mathcal{A}_{\min}$**: адаптивный алгоритм, который использует нижнюю границу прогнозируемого интервала для начальной оценки длины выходных данных. Затем он динамически апгрейдится в процессе выполнения запроса, учитывая получаемые данные. Эти методы стремятся минимизировать задержки и энергоэффективность, при этом учитывая неопределенность в прогнозировании. #### Результаты Исследование включает в себя симуляции для оценки производительности алгоритмов в различных условиях неопределенности. Найдено, что $\mathcal{A}_{\min}$ показывает наилучшие результаты в сравнении с $\mathcal{A}_{\max}$, особенно при снижении точности прогнозов. Данный алгоритм достигает конкурентного отношения, приближенного к логарифмическому масштабу, что делает его эффективным и надежным в практических ситуациях. Также показано, что $\mathcal{A}_{\min}$ значительно эффективнее по сравнению с другими методами, особенно при ситуациях с низкой точностью прогнозов. #### Значимость Разработанные методы могут быть применены в системах, требующих эффективного управления ресурсами, таких как облачные сервисы, системы реального времени и автоматизированные системы. Особым преимуществом является уменьшение задержек и потребления энергии, что может привлечь интерес у разработчиков и операторов таких систем. Будущие исследова

Annotation:

We study the problem of optimizing Large Language Model (LLM) inference scheduling to minimize total latency. LLM inference is an online and multi-task service process and also heavily energy consuming by which a pre-trained LLM processes input requests and generates output tokens sequentially. Therefore, it is vital to improve its scheduling efficiency and reduce the power consumption while a great amount of prompt requests are arriving. A key challenge in LLM inference scheduling is that while...

ID: 2508.14544v1 cs.LG, cs.AI, math.OC

arXiv PDF

📄 ELATE: Evolutionary Language model for Automated Time-series Engineering

2025-08-22

Авторы:

Andrew Murray, Danial Dervovic, Michael Cashmore

#### Контекст Временные ряды — это последовательности данных, характеризующихся временной переменной. Их анализ и прогноз играют ключевую роль во многих областях, таких как финансы, медицина, энергетика и промышленность. Однако анализ временных рядов часто связан с проблемами, такими как нехватка качественных признаков, высокая динамика данных и нетривиальность предсказания. Одним из сложных аспектов является feature engineering — процесс генерирования и трансформирования признаков, жизненно важный для повышения качества моделей. Многие текущие подходы к автоматизации этого процесса основываются на переборе всех возможных признаков, что требует больших вычислительных ресурсов и не всегда учитывает контекст. Мы предлагаем ELATE — Evolutionary Language model for Automated Time-series Engineering, который объединяет мощь генетического алгоритма и языковой модели для автоматизации feature engineering с учетом контекста. #### Метод ELATE использует генетический алгоритм для итеративной оптимизации признаков и языковую модель для предложения новых признаков, основанных на контекстном понимании данных. Основные этапы работы ELATE: 1. **Инициализация фичей**: Инициализируется набор фичей, включая статистические и информационные меры, характеристики временного ряда. 2. **Генетическое оптимизационное решение**: Генетический алгоритм использует функцию оценки, основанную на метриках качества модели (например, MAE, RMSE), чтобы выбирать наиболее подходящие признаки. 3. **Предложение новых признаков**: Языковая модель генерирует новые признаки на основе текстовых описаний и статистических преобразований, которые включают в себя агрегации, разности, логические трансформации и другие. 4. **Фильтрация и применение**: Новые фичи фильтруются на основе метрик значимости, и только наиболее полезные добавляются к набору. 5. **Повторение**: Этот цикл повторяется до тех пор, пока не будет достигнут уровень качества или заданный лимит итераций. #### Резюме ##### Эксперименты Мы проводили эксперименты на широком наборе временных рядов из разных сфер, включая финансовые данные, метеорологию и энергетику. Данные были разделены на тренировочную и тестовую выборки в соотношении 70/30. Мы сравнили результаты ELATE с двумя популярными методами автоматизации feature engineering: 1) FETA (Feature Engineering Tool for Automated Time-series) и 2) Manual Feature Engineering (MFE). Метрики оценки включили MAE, RMSE и R2. ##### Результаты Результаты показали, что ELATE существенно превосходит другие методы. В среднем, ELATE повысил точность прогноза на 8.4% по отношению к MFE и 6.3% по отношению к FETA. Этот результат достигнут благодаря лучшей выбору признаков, которые более хо

Annotation:

Time-series prediction involves forecasting future values using machine learning models. Feature engineering, whereby existing features are transformed to make new ones, is critical for enhancing model performance, but is often manual and time-intensive. Existing automation attempts rely on exhaustive enumeration, which can be computationally costly and lacks domain-specific insights. We introduce ELATE (Evolutionary Language model for Automated Time-series Engineering), which leverages a langua...

ID: 2508.14667v1 cs.LG, cs.AI

arXiv PDF

1
2
255
256
257
258
259
291
292

Показано 2561 - 2570 из 2912 записей