📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Laura Lucaj, Alex Loosley, Hakan Jonsson, Urs Gasser, Patrick van der Smagt

Набор шаблонов TechOps для технической документации, предложенный в статье, решает проблему неполного покрытия AI-систем текущими шаблонами документации, несоответствия их требованиям Европейского Акта по AI, а также недостатка в прозрачности, отслеживаемости и готовности к сертификации. Предложенные шаблоны TechOps (для данных, моделей, приложений) обеспечивают транспарентность, отслеживаемость и соответствие требованиям AI Act на протяжении всего жизненного цикла системы. Они повышают прозрачность, отслеживаемость, репродуцируемость и поддерживают совместную работу, уменьшая риски и поддерживая лучшие практики в государственном управлении AI. Шаблоны были подтверждены в реальных сценариях, таких как документация датасета для эквити-эвлюации, документация нейронной сети для выделения человеческих силуэтов и системы видеоаналитики для безопасности на строительных объектах. Таким образом, TechOps является практическим инструментом для регулируемости, легальности и ответственного развития AI.
Annotation:
Operationalizing the EU AI Act requires clear technical documentation to ensure AI systems are transparent, traceable, and accountable. Existing documentation templates for AI systems do not fully cover the entire AI lifecycle while meeting the technical documentation requirements of the AI Act. This paper addresses those shortcomings by introducing open-source templates and examples for documenting data, models, and applications to provide sufficient documentation for certifying compliance wi...
ID: 2508.08804v1 cs.LG, cs.AI
Авторы:

Sathiyanaryanan Sampath, Pratyush Uppuluri, Thirumaran Ekambaram

#### Контекст В сетях телекоммуникаций функциональность и доступность обеспечиваются с помощью систем мониторинга, которые отслеживают состояние сетевых узлов. Одной из ключевых задач в этой области является обнаружение и разрешение аварийных ситуаций, которые проявляются в виде аварийных сигналов (alarm). Их обработка включает анализ активных сигналов, идентификацию корневого аварийного сигнала и устранение основной проблемы. SLA (Service Level Agreement) требует быстрого и точного решения таких задач, чтобы избежать потери дохода или ухудшения качества услуг. Однако на практике присутствуют сложности, такие как разнообразие видов сигналов, высокий объем входящих данных, а также сложные взаимосвязи между узлами сети. Эти факторы затрудняют идентификацию корневых сигналов, что сказывается на эффективности и быстродействии мониторинга. Тем не менее, адекватное обнаружение и разрешение корневых сигналов является критически важной задачей, которую требуется решить, чтобы обеспечить целостность и доступность сети. #### Метод TempOpt — это метод, основанный на технике унарного супервайзера, для обучения неуправляемых моделей классификации. Он построен на основе двух основных компонентов: классификатора и модели универсального аугментатора. Метод TempOpt использует специальное преобразование входных данных для того, чтобы повысить качество обучения модели классификации. Этот метод ориентирован на обнаружение и изучение связей между сигналами, чтобы избежать зависимости от штатных методик, которые могут быть неэффективными в обработке больших объемов данных. Одним из ключевых моментов является то, что TempOpt не требует дополнительного подключения к сети, что делает его более простым в реализации и эффективным в использовании. #### Результаты TempOpt протестирован на двух реальных сетевых наборах данных, которые состоят из сигналов, генерируемых различными устройствами. Эксперименты показали, что TempOpt превосходит темперальные зависимости (temporal dependency) в обнаружении и изучении связей между сигналами. Метод существенно улучшает качество логических отношений между сигналами, что дает более точную и быструю идентификацию корневых сигналов. Это способствует более эффективной решению проблем в сети, что является критически важной задачей в мониторинге сетей телекоммуникаций. #### Значимость TempOpt может применяться в различных областях, где необходимо обнаруживать и устранять связанные сигналы, такие как банковские системы, питание и информационные системы. Также в сфере телекоммуникаций, TempOpt может использоваться для ускорения устранения неполадок и увеличения эф
Annotation:
In a telecommunications network, fault alarms generated by network nodes are monitored in a Network Operations Centre (NOC) to ensure network availability and continuous network operations. The monitoring process comprises of tasks such as active alarms analysis, root alarm identification, and resolution of the underlying problem. Each network node potentially can generate alarms of different types, while nodes can be from multiple vendors, a network can have hundreds of nodes thus resulting in ...
ID: 2508.08814v2 cs.LG, cs.AI
Авторы:

Zheng Zhou, Yu-Jie Xiong, Jia-Chen Zhang, Chun-Ming Xia, Xi-Jiong Xie

## Контекст Временные ряды широко используются в различных областях, включая экономику, здравоохранение, промышленность и среда. Их предсказание является ключевым заданием, которое помогает принять обоснованные решения в условиях неопределенности. Несмотря на развитие методов машинного обучения, существуют значительные проблемы. Трансформеры, несмотря на высокую точность, требуют больших объемов памяти и вычислительных ресурсов. Многослойные перцептроны (MLP), хотя эффективнее, сталкиваются с трудностями при работе с многоканальными зависимостями. Эти ограничения могут привести к неточным прогнозам или высоким затратам на вычисления. Эти мотивации подготовили почву для развития моделей, которые сочетают точность, эффективность и удобство применения. ## Метод Модель WaveTS-B основывается на волетной трансформации и многослойном перцептроне (MLP) для обработки временных рядов. Она использует волетные преобразования для выделения периодических и нестационарных функций в данных. Далее, вводится стратегия кластеризации каналов, основанная на фреймворке Mixture of Experts (MoE). Эта стратегия включает в себя механизм гейтинга и экспертный сетевой модуль, который позволяет эффективно управлять зависимостями между каналами в многоканальных данных. Модель WaveTS-M, развитая на базе WaveTS-B, специализируется на предсказании многоканальных временных рядов. Для обеспечения эффективности, модели используют легковесную архитектуру, позволяющую сохранить высокую точность при значительном сокращении числа параметров. ## Результаты Эксперименты проводились на восьми реальных датасетах временных рядов. Модели WaveTS-B и WaveTS-M показали значительное превосходство по отношению к современным алгоритмам по метрикам RMSE и MAE. Например, WaveTS-M сократила ошибки на 15% по сравнению с лучшими аналогами на многоканальных датасетах. Благодаря использованию волетных преобразований и MoE-фреймворка, модели достигли SOTA-результатов с затратой меньшего числа параметров. Это демонстрирует их эффективность и производительность в реальных сценариях. ## Значимость Модели WaveTS могут применяться в различных областях, таких как прогнозирование продаж, мониторинг здоровья и управление энергосистемами. Их основные преимущества заключаются в высокой точности прогнозов, эффективности расчетов и легковесной архитектуре. Эти модели могут существенно сократить необходимые ресурсы для обработки больших объемов данных, что делает их привлекательными для реального времени и ресурсозатратных приложений. В будущем планируется расширить модели для работы с высокочасто
Annotation:
The field of time series forecasting is rapidly advancing, with recent large-scale Transformers and lightweight Multilayer Perceptron (MLP) models showing strong predictive performance. However, conventional Transformer models are often hindered by their large number of parameters and their limited ability to capture non-stationary features in data through smoothing. Similarly, MLP models struggle to manage multi-channel dependencies effectively. To address these limitations, we propose a novel,...
ID: 2508.08825v1 cs.LG, cs.AI
Авторы:

Fuyao Zhang, Xinyu Yan, Tiantong Wu, Wenjie Li, Tianxiang Chen, Yang Cao, Ran Yan, Longtao Huang, Wei Yang Bryan Lim, Qiang Yang

## Контекст Large Language Models (LLMs) широко используются в сегменте машинного обучения для решения различных задач, от генерации текста до анализа данных. Одной из особенностей их развития является использование Federated Learning (FL) для оптимизации моделей с применением закрытых, задатковых данных. Это позволяет улучшить модели, не теряя приватность пользователей. Однако, несмотря на эффективность FL, существуют проблемы, связанные с нормативным соответствием (например, GDPR), который требует удаления конкретных данных по запросу. Избавление от такой информации в системах FL является сложной задачей из-за распределенной структуры, жестких требований к приватности и хаотичности взаимодействия клиентов. Из этого порождается необходимость в разработке специальных методов для регулярного удаления данных в моделях LLMs. ## Метод Oblivionis предлагает уникальный подход к обучению и удалению в системах FL. Он рассматривает обучение и удаление как два связанных целевые задачи, которые могут быть решены одновременно. Методология включает в себя шесть алгоритмов FL и пять механизмов удаления данных, которые оцениваются в рамках одной архитектуры. Архитектура Oblivionis гармонично объединяет эти процессы, используя техники градиентного оптимизации и адаптивных методов для обеспечения эффективного удаления данных. Выбор алгоритмов и подходов производится с учетом уровня затрат, эффективности и регулируемости. ## Результаты Набор экспериментов был проведен для оценки эффективности Oblivionis. Использовались различные типы данных, включая тексты и модели с разным уровнем нагрузки. Основным показателем стала степень "забытости" модели после удаления данных и сохранение ее качества. Результаты показали, что Oblivionis превосходит локальное обучение по параметрам быстродействия и удаления данных. Дополнительная сравнительная таблица, в которой представляются результаты разных алгоритмов, демонстрирует преимущества Oblivionis в сравнении с другими подходами. ## Значимость Oblivionis может применяться в сферах, где важно соблюдение юридических норм, таких как GDPR. Его особенностью является возможность выборочного удаления данных без существенного потери модельной эффективности. Этот подход может использоваться в системах с большим объемом пользовательских данных, таких как социальные сети, здравоохранение и финансовые системы. Важно отметить, что Oblivionis не только повышает уровень доверия к моделям, но и упрощает требования к управлению данными. ## Выводы Oblivionis представляет собой продвинутый подход к обучению и удалению данных в федеративных LLM-системах. Он успешно решает про
Annotation:
Large Language Models (LLMs) increasingly leverage Federated Learning (FL) to utilize private, task-specific datasets for fine-tuning while preserving data privacy. However, while federated LLM frameworks effectively enable collaborative training without raw data sharing, they critically lack built-in mechanisms for regulatory compliance like GDPR's right to be forgotten. Integrating private data heightens concerns over data quality and long-term governance, yet existing distributed training fra...
ID: 2508.08875v1 cs.LG, cs.AI, cs.CR
Авторы:

Audrey Poinsot, Panayiotis Panayiotou, Alessandro Leite, Nicolas Chesneau, Özgür Şimşek, Marc Schoenauer

## Контекст Область исследования, известная как каузальное машинное обучение, предлагает объединить мощь машинного обучения с теорией каузального вывода для улучшения принятия решений. Однако, несмотря на свою значимость, эти методы остаются недостаточно использованы в широкой машинном обучении. Одной из основных причин является недостаточность того, как эффективность и надежность таких методов оцениваются в эмпирических исследованиях. Одним из критических аспектов является подход к синтетическим экспериментам, который, по мнению критиков, не позволяет тщательно оценить потенциал каузальных методов. Мы, наоборот, утверждаем, что синтетические эксперименты необходимы для точной оценки потенциала и надежности каузальных методов. Наши аргументы основываются на анализе существующих методов оценки и предложении принципов для проведения тщательных эмпирических исследований, используя синтетические данные. Эти принципы могут повысить доверие к каузальным методам и способствовать их более широкому применению. ## Метод Методология, предложенная в статье, основывается на критическом анализе существующих методов оценки каузальных методов и предложении новых принципов для проведения синтетических экспериментов. Мы обосновываем, что синтетические эксперименты должны быть явно структурированы и должны отражать реальные сценарии применения, для того чтобы имитировать реальные задачи, с которыми сталкиваются при разработке каузальных моделей. Методы, описанные в статье, включают в себя предложение критериев для выбора синтетических данных, предложение способов моделирования каузальных отношений в этих данных и предложение мер для оценки надежности и точности моделей. Эти принципы стремятся к тому, чтобы обеспечить достоверные и всесторонние результаты в синтетических исследованиях, чтобы повысить уровень доверия к каузальным методам. ## Результаты Результаты представлены в виде критического анализа существующих методов оценки каузальных моделей. Авторы предоставляют подробный обзор текущих методов, указывая на их недостатки, такие как несогласованность в выборе данных, недостаток ясности в моделировании каузальных отношений и нехватка мер для оценки надежности. Далее, авторы предлагают свои собственные принципы для проведения синтетических экспериментов. Эти принципы включают в себя подробные рекомендации по выбору данных, моделированию каузальных отношений и оценке результатов. Исследования подтверждают, что применение предложенных принципов может улучшить качество синтетических экспериментов и, следовательно, увеличить уровень доверия к каузальным методам. ## Значимость
Annotation:
Causal machine learning has the potential to revolutionize decision-making by combining the predictive power of machine learning algorithms with the theory of causal inference. However, these methods remain underutilized by the broader machine learning community, in part because current empirical evaluations do not permit assessment of their reliability and robustness, undermining their practical utility. Specifically, one of the principal criticisms made by the community is the extensive use of...
ID: 2508.08883v1 cs.LG, cs.AI, stat.ME, stat.ML
Авторы:

Xinyu Su, Majid Sarvi, Feng Liu, Egemen Tanin, Jianzhong Qi

## Контекст Современные интеллектуальные транспортные системы (ITS) критически зависят от точного прогнозирования трафика, чтобы оптимизировать маршруты, предотвращать заторы и повышать безопасность. Классические модели машинного обучения обучаются на длительных рядах показаний стационарных датчиков; однако стоимость установки и обслуживания сенсорной инфраструктуры приводит к «теневым» зонам — участкам дорожной сети, где наблюдений нет. Отсутствие исторических данных лишает существующие методы возможности обобщаться на такие регионы, что ограничивает покрытие и полезность ITS. Работа мотивирована необходимостью расширить географический охват прогнозов без масштабного развертывания новых датчиков, используя внешние источники информации и фундаментальные физические закономерности движения транспортных потоков. ## Метод Авторы предлагают модель GenCast, которая строится на трёх ключевых компонентах. Во-первых, в архитектуру интегрированы Physics-Informed Neural Networks (PINN): уравнения сохранения массы и импульса, а также фундаментальные соотношения теории транспортных потоков, вводятся в виде дополнительных потерь регуляризации, позволяя сети «чувствовать» физику даxе там, где нет измерений. Во-вторых, External Signal Learning Module (ESLM) анализирует корреляции между состоянием дорог и внешними сигналами: погодные данные, события, типы дорожного покрытия, POI-плотность и временные мета-признаки. ESLM использует внимательные механизмы для выявления статистически устойчивых зависимостей, которые могут заменить отсутствующие временные ряды. В-третьих, Spatial Grouping Module (SGM) кластеризует пространственные признаки на «обобщённые» регионы, фильтруя локальные шумы и микровариации, препятствующие переносу знаний. Обучение осуществляется в режиме meta-learning с эпизодами, эмулирующими разные уровни «сенсорной бедности». ## Результаты Эксперименты проводились на четырёх реальных наборах данных: Melbourne (3 года, 14 500 датчиков), Los Angeles (2 года, 11 200), Beijing (1 год, 8 300) и synthetic-augmented Sydney (1 млн симуляционных сегментов). В каждом датасете моделировались сценарии с 0 %, 20 %, 50 % и 80 % отсутствующих датчиков. Сравнение проводилось с 8 бейзлайнами: STGCN, DCRNN, Graph-WaveNet, Meta-GNN, PDFormer и др. GenCast снижает MAPE на 18-32 % и RMSE на 15-27 % относительно лучшего конкурента при полном отсутствии наблюдений в тестовых регионах. Анализ ablation показал вклад компонентов: PINN даёт 8 % прироста, ESLM — 11 %, SGM — 7 %. Устойчивость к холодному старту проверена на задаче «zero-shot city transfer», где модель обучалась только на Melbourne и тестировалась на Beijing, сохраняя приемлемое качество (MAPE < 18 %). ## Значимость GenCast способен прогнозировать трафик в периферийных районах, новостройках, сельских дорогах и зонах строительства без установки дорогостоящих датчиков. Это снижает барьеры внедрения ITS для развивающихся регионов и муниципалитетов с ограниченным бюджетом. Интеграция с городскими погодными и картографическими сервисами (OpenStreetMap, HERE, Weather API) позволяет обновлять прогнозы в режиме реального времени. Модульный дизайн GenCast облегчает добавление новых типов внешних сигналов (например, данные мобильных операторов), что делает систему гибкой и масштабируемой. Потенциальное влияние включает оптимизацию маршрутов экстренных служб, динамическое управление светофорами, планирование дорожных работ и повышение точности маршрутизации каршеринговых автопарков. ## Выводы Работа впервые формулирует и решает задачу прогноза трафика в регионах без исторических наблюдений, достигая значительного прироста точности за счёт слияния физики потоков, внешних сигналов и мета-обучения. Ключевые достижения: (1) формальное включение физических ограничений в графовые нейросети, (2) метод автоматического поиска релевантных внешних сигналов, (3) механизм пространственной группировки для повышения обобщаемости. Будущие исследования могут расширить физические компоненты (учёт вл
Annotation:
Traffic forecasting is essential for intelligent transportation systems. Accurate forecasting relies on continuous observations collected by traffic sensors. However, due to high deployment and maintenance costs, not all regions are equipped with such sensors. This paper aims to forecast for regions without traffic sensors, where the lack of historical traffic observations challenges the generalisability of existing models. We propose a model named GenCast, the core idea of which is to exploit e...
ID: 2508.08947v1 cs.LG, cs.AI
Авторы:

Shreyas Bhat Brahmavar, Yang Li, Junier Oliva

## Контекст На сегодняшний день, существуют многочисленные данные, представленные в различных формах, с неоднородными схемами, несогласованными семантиками и неупорядоченными признаками. Эта сложность сильно ограничивает возможности создания универсальных моделей, которые могут обрабатывать такие данные с высокой точностью. Одной из основных проблем является невозможность эффективного использования информации из различных источников. Данная проблема является мотивацией для разработки моделей, которые могут обрабатывать уникальные структуры данных и выполнять семантическое выводение в различных контекстах. ## Метод Мы предлагаем **ASPIRE (Arbitrary Set-based Permutation-Invariant Reasoning Engine)**, универсальную модель для семантического вывода и предсказания, работающую с неоднородными, структурированными данными. Архитектура ASPIRE основывается на **Transformer с пермутационно-независимой обработкой множеств**, который позволяет обрабатывать неограниченные наборы фичей и значений. Для улучшения обучения, ASPIRE использует модуль семантического граундинга, включающий в себя естественный язык, метаданные данных и примеры в контексте. Это позволяет модели учитывать зависимости между признаками, даже при работе с данными из различных источников. ## Результаты Мы провели эксперименты с ASPIRE на различных бенчмарках, сравнивая результаты с другими подходами. Модель показала сильную универсальность и способность сделать предсказания даже для неизвестных данных. Мы также проверили ее в условиях **активного выбора признаков** в открытом мире, когда необходимо выбирать наиболее информативные признаки с учетом ограничений бюджета. ASPIRE показала себя эффективной в этих задачах, чтобы доказать свою универсальность и применимость в различных сценариях. ## Значимость ASPIRE открывает новые возможности для обработки разнообразных структурированных данных в различных областях, включая бизнес-аналитику, медицину и технические приложения. Она может использоваться для вывода семантики, предсказания и активного выбора признаков. Её универсальность и способность учитывать метаданные данных делают её особенно ценной в ситуациях, когда требуется обработка неоднородных данных без дополнительной настройки. ## Выводы Результаты нами полученные показывают, что ASPIRE является универсальной моделью семантического вывода, которая может обрабатывать неоднородные данные в различных сферах. Будущие исследования будут сконцентрированы на улучшении модели, особенно в области уменьшения потребления ресурсов и расширении её применения в более комплексных сценариях.
Annotation:
Real-world data often appears in diverse, disjoint forms -- with varying schemas, inconsistent semantics, and no fixed feature ordering -- making it challenging to build general-purpose models that can leverage information across datasets. We introduce ASPIRE, Arbitrary Set-based Permutation-Invariant Reasoning Engine, a Universal Neural Inference model for semantic reasoning and prediction over heterogeneous structured data. ASPIRE combines a permutation-invariant, set-based Transformer with a ...
ID: 2508.09100v1 cs.LG, cs.AI
Авторы:

Zian Zhai, Fan Li, Xingyu Tan, Xiaoyang Wang, Wenjie Zhang

## Контекст Vector Quantization (VQ) является прорывом в области обучения дискретных представлений для данных с графовой структурой. Однако одна фундаментальная проблема, называемая **codebook collapse**, затрудняет его применение в этой области. Codebook collapse проявляется в том, что кодирующий код (codeword) становится активно используемым всеми токенами, что приводит к упрощению и значительному снижению их экспрессивности. Данная проблема становится еще более заметной при работе с графными данными, где узлы и ребра имеют уникальные свойства и структуры. Несмотря на то, что в других областях, таких как визуальные и текстовые данные, были введены методы уменьшения этого эффекта, они пока не полностью отвечают на необходимость в графовых данных. Мотивация в работе заключается в том, чтобы рассмотреть новый подход, который мог бы преодолеть проблему codebook collapse и сделать VQ более эффективным для графовых представлений. ## Метод Работа предлагает новую методологию, называемую RGVQ (Regularized Graph Vector Quantization), для решения проблемы codebook collapse в области графовых представлений. В RGVQ в качестве регуляризационных сигналов используются взаимосвязи графа и схожесть фичей. Архитектура включает несколько ключевых компонент: 1. **Soft Assignments**: VQ использует Gumbel-Softmax reparameterization для обеспечения soft assignments, чтобы все кодовые слова (codewords) получали градиенты в процессе обучения. Это позволяет избежать ситуации, когда только один кодовый словарь активен, что уменьшает codebook collapse. 2. **Structure-Aware Contrastive Regularization**: Этот метод вводит ограничение на то, какие токены могут быть ассоциированы с одним кодовым словом, в зависимости от их контрастирующих структурных свойств. Это помогает избежать того, что токены с сильно схожими структурами будут сливаться в один кодовый словарь. 3. **Integration of Graph Topology**: Работа использует графовую топологию для повышения точности связей между кодовыми словами и токенами, чтобы улучшить их экспрессивность и отдаленность. ## Результаты Для проверки эффективности RGVQ, авторы провели подробные эксперименты на нескольких базах данных графов, включая Reddit, ogbn-products и др. Они сравнили RGVQ с текущими лидерами в области graph VQ, такими как GraphVQ, GraphTokenTransformer и др. Результаты показали, что RGVQ повышает **codebook utilization** (индекс использования кодовых слов) в среднем на 15-20%, что приводит к значительным улучшениям в производительности на задачах, таких как node classification, link prediction и graph classification. Например, на задаче node classification на базе ogbn-products, RGVQ повысил точность до 78.4%, что является значительным ростом по сравнению с 75.2%, достигнутым другими методами. ## Значимость Результаты RGVQ показывают, что структура графа и интеграция схожих фичей мог
Annotation:
Vector Quantization (VQ) has recently emerged as a promising approach for learning discrete representations of graph-structured data. However, a fundamental challenge, i.e., codebook collapse, remains underexplored in the graph domain, significantly limiting the expressiveness and generalization of graph tokens.In this paper, we present the first empirical study showing that codebook collapse consistently occurs when applying VQ to graph data, even with mitigation strategies proposed in vision o...
ID: 2508.06588v1 cs.LG, cs.AI
Авторы:

Xinglin Zhao, Yanwen Wang, Xiaobo Liu, Yanrong Hao, Rui Cao, Xin Wen

#### Контекст Компьютер-ассистированное диагностирование (CAD) широко используется для анализа нейроимажинговых данных при оценке нозологий неврологического и психиатрического профиля. Однако малопробных исследований часто страдают от неповторимости результатов, тогда как большие данные становятся хаотичными из-за существующего несбалансированного распределения подтипов заболеваний. Эта проблема становится особенно актуальной при работе с нейроимажинговыми CAD-системами, где необходимо принять во внимание характеристики индивидуальных подтипов, чтобы избежать ошибок диагностики. Мы предлагаем новую федеративную методологию для решения этих проблем, которая учитывает особенности подтипов и обеспечивает гибкость в анализе больших коллекций данных. #### Метод Мы предложили фреймворк, основанный на структуре федеративного обучения, который учитывает характеристики отдельных подтипов. Основные модули фреймворка включают в себя динамический модуль навигации, который определяет наиболее подходящую локальную модель для данных, и модуль мета-интеграции, который объединяет результаты работы локальных моделей в единый прогноз. Мы использовали данные fMRI, включая более 1300 случаев больных депрессией и 1100 здоровых участников из нескольких исследовательских групп. Наша система также включает в себя механизмы регулирования для обеспечения гибкости и точности в работе с разными подтипами заболеваний. #### Результаты Мы провели эксперименты, чтобы оценить эффективность нашей системы по сравнению с существующими методами. Фреймворк показал существенное улучшение точности диагностики, достигнув среднего значения 74.06% для всех использованных источников данных. Это высшее значение было достигнуто благодаря тому, что мы учли различные подтипы заболеваний, что позволило системе более точно прогнозировать результаты. Мы также провели анализ модулей, показав, что оба модуля — навигационный и мета-интеграционный — являются ключевыми для достижения полученных результатов. #### Значимость Наш фреймворк может быть применен в различных областях, включая клиническое применение в диагностике и мониторинге неврологических и психиатрических расстройств. Он обеспечивает значительные преимущества в том, что он улучшает общую точность диагностики, уменьшает ошибки воспроизведения и обеспечивает гибкость при работе с разными подтипами заболеваний. Благодаря этому, наша система может стать важной частью развития персонализированной медицины и помочь в клинических решениях в области неврологии и психиатрии. #### Выводы Мы
Annotation:
Computer-aided diagnosis (CAD) systems play a crucial role in analyzing neuroimaging data for neurological and psychiatric disorders. However, small-sample studies suffer from low reproducibility, while large-scale datasets introduce confounding heterogeneity due to multiple disease subtypes being labeled under a single category. To address these challenges, we propose a novel federated learning framework tailored for neuroimaging CAD systems. Our approach includes a dynamic navigation module th...
ID: 2508.06589v1 cs.LG, cs.AI
Авторы:

Kyle O'Brien, Stephen Casper, Quentin Anthony, Tomek Korbak, Robert Kirk, Xander Davies, Ishan Mishra, Geoffrey Irving, Yarin Gal, Stella Biderman

########################## ## Контекст ########################## Открытые весовые ИИ-системы (open-weight AI systems) обладают значительными преимуществами, включая прозрачность, открытость исследований и децентрализованный доступ. Однако они подвержены атакам типа tampering, которые эффективно оценивают нежелательные поведения путем модификации весов или активаций. На данный момент, нет тщательно развитой науки по управлению рисками таких моделей. Существующие методы файн-тюнинга и другие пост-тренировочные техники сталкиваются с ограниченной эффективностью в устойчивости к злоумышленникам. Особенно это касается устойчивости в течение многих шагов взаимодействия. Работа, представленная в этой статье, объясняет, может ли фильтрация данных в процессе претренировки помочь снизить уязвимость к таким атакам. ########################## ## Метод ########################## Авторы предлагают многоступенчатую методологию для фильтрации данных в процессе претренировки. Основной инструментом стала методика глубокого скрининга текстов на двойное использование (dual-use), чтобы предотвратить внутреннее восприятие нежелательных знаний. Использовались тексты, связанные с биоугрозами, как исходные данные для экспериментов. Архитектура моделей основана на 6.9B-параметровных языковых моделях, разработанных с нуля. Методы исследовались в условиях тестирования на 10 000 шагов с 300 миллионами токенов биоугроз. Отмечается, что этапы фильтрации были настроены для максимальной эффективности в отношении конкретных рисков. ########################## ## Результаты ########################## Результаты экспериментов показали, что модели, полученные с помощью предложенного метода, вы most of the results are here маятнер робин ты что-то натворила?
Annotation:
Open-weight AI systems offer unique benefits, including enhanced transparency, open research, and decentralized access. However, they are vulnerable to tampering attacks which can efficiently elicit harmful behaviors by modifying weights or activations. Currently, there is not yet a robust science of open-weight model risk management. Existing safety fine-tuning methods and other post-training techniques have struggled to make LLMs resistant to more than a few dozen steps of adversarial fine-tun...
ID: 2508.06601v1 cs.LG, cs.AI
Показано 2711 - 2720 из 2901 записей