📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Santosh Chapagain, Shah Muhammad Hamdi, Soukaina Filali Boubrahimi

Хейт спич — одна из наиболее вредных и распространенных форм дискурса в социальных сетях, включая X (ранее Twitter), Facebook и Instagram. Он приводит к серьезным последствиям для индивидуумов и общества. Авторы статьи "Advancing Hate Speech Detection with Transformers: Insights from the MetaHate" предлагают использовать трансформерные модели для его автоматического замещения. Они исследовали 36 датасетов, объединенных в MetaHate (1,2 млн примеров), и сравнили такие модели, как BERT, RoBERTa, GPT-2 и ELECTRA. Файнайдженная модель ELECTRA показала F1-меру 0,8980, лучше других. Анализ ошибок показал, что модели сталкиваются с сарказмом, кодированным языком и шумом в метках. Результаты подтверждают мощность трансформеров в решении задачи детекции хейт спича и выделяют необходимость улучшения понимания контекста в моделях.
Annotation:
Hate speech is a widespread and harmful form of online discourse, encompassing slurs and defamatory posts that can have serious social, psychological, and sometimes physical impacts on targeted individuals and communities. As social media platforms such as X (formerly Twitter), Facebook, Instagram, Reddit, and others continue to facilitate widespread communication, they also become breeding grounds for hate speech, which has increasingly been linked to real-world hate crimes. Addressing this iss...
ID: 2508.04913v1 cs.LG, cs.CL
Авторы:

Nameer Hirschkind, Joseph Liu, Mahesh Kumar Nandwana, Xiao Yu

Адаптивная обработка языков, особенно в режиме одновременной передачи (SimulST), остается сложной задачей из-за конфликта между качеством перевода и задержкой. Авторы предлагают REINA (Regularized Entropy INformation Adaptation) — новую методологию оптимизации этого баланса. Основываясь на принципах информационной теории, REINA регулирует потери для обучения адаптивной стратегии, оптимально распределяющей ресурсы между ждать дополнительных данных и начать перевод. Это решение, примененное к нескольким языкам (французский, гибрид с немецким и испанским), показало сокращение задержек при сохранении высокого качества перевода. Основным выводом является, что REINA позволяет достичь сокращения задержки до 21%, сохранив высокую точность перевода в сравнении с другими подходами. Это значительно повышает эффективность SimulST-систем, улучшая задачу реалитийного времени в переводе.
Annotation:
Simultaneous Speech Translation (SimulST) systems stream in audio while simultaneously emitting translated text or speech. Such systems face the significant challenge of balancing translation quality and latency. We introduce a strategy to optimize this tradeoff: wait for more input only if you gain information by doing so. Based on this strategy, we present Regularized Entropy INformation Adaptation (REINA), a novel loss to train an adaptive policy using an existing non-streaming translation mo...
ID: 2508.04946v1 cs.LG, cs.CL, eess.AS
Авторы:

Feiyu Wang, Guoan Wang, Yihao Zhang, Shengfan Wang, Weitao Li, Bokai Huang, Shimao Chen, Zihan Jiang, Rui Xu, Tong Yang

Активный исследовательский потенциал в области низкобитных моделей языковых моделей лежит в развитии Quantization-Aware Training (QAT), которое включает в себя квантизацию во время обучения. Однако существующие подходы ограничиваются улучшением точности квантизации в рамках upper bound, задаваемого точностью полного точности (accuracy ceiling). Данная работа предлагает революционную методологию, позволяющую сдвинуть этот upper bound и достичь новой точности, потому что всякий раз, когда мы квантизируем full-precision model, мы уже оптимизируем ему его точность. Авторы представляют Fairy$\pm i$, первую 2-битную квантизационную модель для complex-valued LLMs. Она использует симметричность и информационную оптимальность 2-битной системы вещественных чисел $\{\pm1, \pm i\}$, что позволяет воспроизводить сложность информационного пространства с минимумом компьютерных операций. Эксперименты показывают, что Fairy$\pm i$ не только способна выйти за пределы существующих 2-битных моделей, но и достигает высокой точности и эффективности, в то же время гарантируя низкий расход ресурсов. Это действительно новая дирекция для развития highly accurate, practical LLMs.
Annotation:
Quantization-Aware Training (QAT) integrates quantization into the training loop, enabling LLMs to learn robust low-bit representations, and is widely recognized as one of the most promising research directions. All current QAT research focuses on minimizing quantization error on full-precision models, where the full-precision accuracy acts as an upper bound (accuracy ceiling). No existing method has even attempted to surpass this ceiling. To break this ceiling, we propose a new paradigm: raisin...
ID: 2508.05571v1 cs.LG, cs.CL
Показано 231 - 233 из 233 записей