📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Challenges of Heterogeneity in Big Data: A Comparative Study of Classification in Large-Scale Structured and Unstructured Domains

2025-12-02

Авторы:

González Trigueros Jesús Eduardo, Alonso Sánchez Alejandro, Muñoz Rivera Emilio, Peñarán Prieto Mariana Jaqueline, Mendoza González Camila Natalia

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This study analyzes the impact of heterogeneity ("Variety") in Big Data by comparing classification strategies across structured (Epsilon) and unstructured (Rest-Mex, IMDB) domains. A dual methodology was implemented: evolutionary and Bayesian hyperparameter optimization (Genetic Algorithms, Optuna) in Python for numerical data, and distributed processing in Apache Spark for massive textual corpora. The results reveal a "complexity paradox": in high-dimensional spaces, optimized linear models (S...

ID: 2512.00298v1 cs.LG, cs.CL, cs.DC

arXiv PDF

📄 X-MoE: Enabling Scalable Training for Emerging Mixture-of-Experts Architectures on HPC Platforms

2025-08-21

Авторы:

Yueming Yuan, Ahan Gupta, Jianping Li, Sajal Dash, Feiyi Wang, Minjia Zhang

#### Контекст Во всемирных исследованиях в области обработки и анализа данных, нейросетевые модели, основанные на архитектурах Mixture-of-Experts (MoE), приобрели популярность благодаря способности обеспечить высокую модельную качество при гибком использовании ресурсов. Однако, у текущих реализаций MoE существуют значимые проблемы. Это существенный потребление памяти во время активации и высокостоимостная связь "все с всем" (all-to-all communication), которые ограничивают их масштабирование. Кроме того, существующие решения для тренировки MoE как правило оптимизированы для NVIDIA GPUs, что приводит к неэффективности при использовании других платформ, таких как AMD или Intel. X-MoE предлагается как решение этих проблем, предлагая новую MoE-систему для тренировки скорострельных моделей с высокой эффективностью и масштабируемостью. #### Метод X-MoE представляет собой новую архитектуру тренировки сетей с тонкой сегментацией экспертов, которая использует несколько инновационных техник. Одной из основных техник является padding-free MoE training, которая уменьшает затраты на память и ускоряет вычисления. Другим ключевым моментом является редундантность-бипассинг диспатча, что позволяет избежать ненужных расходов на связи. Также, X-MoE внедряет механизм hybrid parallelism, который позволяет разбить модель на сегменты (MoE blocks), которые могут быть последовательно отправлены на разных узлов. Это подход повышает эффективность тренировки и обеспечивает поддержку кросс-платформенности. Таким образом, X-MoE предоставляет систему, которая может эффективно работать на разных платформах, включая AMD и NVIDIA GPUs. #### Результаты В ходе экспериментов с X-MoE, использовались данные, тренировочные модели и оценки производительности на Frontier supercomputer, который оснащен AMD MI250X GPUs. Тестирование показало, что X-MoE может скользьть DeepSeek-style MoEs до 545 миллиардов параметров (без отказа в качестве вывода) на 1024 GPUs — 10 раз больше, чем существующие методы под указанным объемом ресурсов. Это позволяет поддерживать высокую скорость обучения при минимизации затрат на память и вычислительных вычислений. Таким образом, X-MoE доказывает свою эффективность в сравнении с имеющимися решениями. #### Значимость Полученная система X-MoE имеет широкие области применения в области тренировки сложных нейронных сетей, в том числе для моделей, оптимизированных для роботов, искусственного интеллекта и анализа больших данных. Одним из главных преимуществ X-MoE является ее кросс-платформенность и высокая эффективность, что позволяет ей работать на разных платформах, включая AMD и NVIDIA GPUs.

Annotation:

Emerging expert-specialized Mixture-of-Experts (MoE) architectures, such as DeepSeek-MoE, deliver strong model quality through fine-grained expert segmentation and large top-k routing. However, their scalability is limited by substantial activation memory overhead and costly all-to-all communication. Furthermore, current MoE training systems - primarily optimized for NVIDIA GPUs - perform suboptimally on non-NVIDIA platforms, leaving significant computational potential untapped. In this work, we...

ID: 2508.13337v1 cs.LG, cs.CL, cs.DC

arXiv PDF