📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Luth: Efficient French Specialization for Small Language Models and Cross-Lingual Transfer

2025-10-09

Авторы:

Maxence Lasbordes, Sinoué Gad

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

The landscape of Large Language Models (LLMs) remains predominantly English-centric, resulting in a significant performance gap for other major languages, such as French, especially in the context of Small Language Models (SLMs). Existing multilingual models demonstrate considerably lower performance in French compared to English, and research on efficient adaptation methods for French remains limited. To address this, we introduce \textbf{Luth}, a family of French-specialized SLMs: through targ...

ID: 2510.05846v1 cs.CL, I.2.7

arXiv PDF

📄 Morpheme Induction for Emergent Language

2025-10-08

Авторы:

Brendon Boldt, David Mortensen

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We introduce CSAR, an algorithm for inducing morphemes from emergent language corpora of parallel utterances and meanings. It is a greedy algorithm that (1) weights morphemes based on mutual information between forms and meanings, (2) selects the highest-weighted pair, (3) removes it from the corpus, and (4) repeats the process to induce further morphemes (i.e., Count, Select, Ablate, Repeat). The effectiveness of CSAR is first validated on procedurally generated datasets and compared against ba...

ID: 2510.03439v1 cs.CL, I.2.7; I.6.m

arXiv PDF

📄 Searching for the Most Human-like Emergent Language

2025-10-08

Авторы:

Brendon Boldt, David Mortensen

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

In this paper, we design a signalling game-based emergent communication environment to generate state-of-the-art emergent languages in terms of similarity to human language. This is done with hyperparameter optimization, using XferBench as the objective function. XferBench quantifies the statistical similarity of emergent language to human language by measuring its suitability for deep transfer learning to human language. Additionally, we demonstrate the predictive power of entropy on the transf...

ID: 2510.03467v1 cs.CL, I.2.7; I.6.m

arXiv PDF

📄 ManagerBench: Evaluating the Safety-Pragmatism Trade-off in Autonomous LLMs

2025-10-04

Авторы:

Adi Simhi, Jonathan Herzig, Martin Tutek, Itay Itzhak, Idan Szpektor, Yonatan Belinkov

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

As large language models (LLMs) evolve from conversational assistants into autonomous agents, evaluating the safety of their actions becomes critical. Prior safety benchmarks have primarily focused on preventing generation of harmful content, such as toxic text. However, they overlook the challenge of agents taking harmful actions when the most effective path to an operational goal conflicts with human safety. To address this gap, we introduce ManagerBench, a benchmark that evaluates LLM decisio...

ID: 2510.00857v1 cs.CL, I.2.7

arXiv PDF

📄 Syntactic Blind Spots: How Misalignment Leads to LLMs Mathematical Errors

2025-10-04

Авторы:

Dane Williamson, Yangfeng Ji, Matthew Dwyer

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large Language Models (LLMs) demonstrate strong mathematical problem-solving abilities but frequently fail on problems that deviate syntactically from their training distribution. We identify a systematic failure mode, syntactic blind spots, in which models misapply familiar reasoning strategies to problems that are semantically straightforward but phrased in unfamiliar ways. These errors are not due to gaps in mathematical competence, but rather reflect a brittle coupling between surface form a...

ID: 2510.01831v1 cs.CL, I.2.7; I.2.0

arXiv PDF

📄 Fin-ExBERT: User Intent based Text Extraction in Financial Context using Graph-Augmented BERT and trainable Plugin

2025-10-01

Авторы:

Soumick Sarker, Abhijit Kumar Rai

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Financial dialogue transcripts pose a unique challenge for sentence-level information extraction due to their informal structure, domain-specific vocabulary, and variable intent density. We introduce Fin-ExBERT, a lightweight and modular framework for extracting user intent-relevant sentences from annotated financial service calls. Our approach builds on a domain-adapted BERT (Bidirectional Encoder Representations from Transformers) backbone enhanced with LoRA (Low-Rank Adaptation) adapters, ena...

ID: 2509.23259v1 cs.CL, I.2.7

arXiv PDF

📄 Ensembling Multilingual Transformers for Robust Sentiment Analysis of Tweets

2025-10-01

Авторы:

Meysam Shirdel Bilehsavar, Negin Mahmoudi, Mohammad Jalili Torkamani, Kiana Kiashemshaki

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Sentiment analysis is a very important natural language processing activity in which one identifies the polarity of a text, whether it conveys positive, negative, or neutral sentiment. Along with the growth of social media and the Internet, the significance of sentiment analysis has grown across numerous industries such as marketing, politics, and customer service. Sentiment analysis is flawed, however, when applied to foreign languages, particularly when there is no labelled data to train model...

ID: 2509.24080v1 cs.CL, I.2.7

arXiv PDF

📄 Artificial Phantasia: Evidence for Propositional Reasoning-Based Mental Imagery in Large Language Models

2025-10-01

Авторы:

Morgan McCarty, Jorge Morales

## Контекст В настоящее время визуальная ментальная имитажирование считается одним из ключевых способов решения задач, требующих сложного когнитивного поведения. Однако, существуют теории, согласно которым некоторые типы задач могут быть решены без визуального восприятия, а скорее с использованием пропозиционального рассуждения. Участники исследований часто утверждают, что данные задачи не могут быть выполнены без визуальной формы восприятия. Это ставит под сомнение возможность выполнения таких задач с использованием пропозиционального рассуждения. В данном исследовании предлагается новый подход для оценки таких когнитивных процессов в искусственных системах. ## Метод Для проведения исследования были использованы современные технологии в области глубокого обучения и машинного зрелища. Авторы создали новый набор парных изображений, которые были использованы в тестовых задачах. Для тестирования LLMs был применен метод визуального рассуждения, позволяющий изменять изображения в зависимости от выполненных трансформаций. Был также создан референсный тест для людей, чтобы сравнить их результаты с результатами LLMs. Эксперименты проводились на нескольких моделях текстовых LLMs с разным количеством токенов. ## Результаты На основе результатов экспериментов было обнаружено, что лучшие модели LLM могут решать задачи, которые, по идее, требуют визуальной ментальной имитажирование, с уровнем выполнения, превосходящим средний уровень человеческого выполнения. Было обнаружено, что лучшие модели показали высокую эффективность при использовании большего количества токенов для рассуждения. Также было обнаружено, что лучшие LLMs могут показать более высокий результат, чем человеческий уровень, при условии достаточного объема рассуждения. ## Значимость Найденные результаты могут иметь важное значение для развития теорий о визуальных ментальных имитажированиях. Они показывают, что некоторые задачи, которые ранее считались визуально-зависимыми, могут быть выполнены без визуального восприятия, а скорее с помощью пропозиционального рассуждения. Это может иметь значительное значение в развитии новых моделей и технологий, которые могут быть использованы в разных областях, таких как автоматизация, искусственный интеллект, робототехника и многие другие. ## Выводы В итоге, данное исследование демонстрирует, что лучшие модели LLM могут выполнять задачи, которые, по идее, требуют визуальной ментальной имитажирование, используя пропозициональное рассуждение. Это открывает новые возможности для развития искусственного

Annotation:

This study offers a novel approach for benchmarking complex cognitive behavior in artificial systems. Almost universally, Large Language Models (LLMs) perform best on tasks which may be included in their training data and can be accomplished solely using natural language, limiting our understanding of their emergent sophisticated cognitive capacities. In this work, we created dozens of novel items of a classic mental imagery task from cognitive psychology. A task which, traditionally, cognitive ...

ID: 2509.23108v1 cs.AI, cs.CL, I.2.7

arXiv PDF

📄 RedHerring Attack: Testing the Reliability of Attack Detection

2025-09-27

Авторы:

Jonathan Rusert

## Контекст В последние годы атаки на тексты, основанные на адверсарских методах, стали возникать все чаще в области естественного языкового процессинга (NLP). Эти атаки нацелены на то, чтобы подделать или манипулировать результатами текстовых классификаторов. Чтобы противостоять этим угрозам, были разработаны модели, определяющие такие атаки. Эти модели не только помогают обнаружить недостоверные данные, но и могут использоваться в качестве дополнительного этапа проверки для NLP-систем. Однако пока что недостаточно изучено вопрос об эффективности и надежности таких моделей анализа атак. Это подрывает их доверие как в академической области, так и в промышленности. Мы предлагаем новую угрозу, RedHerring, которая направлена на снижение надежности моделей атак, при этом не затрагивая надежность классификатора. ## Метод RedHerring — это новый тип атаки, предназначенный для сдерживания моделей атак. Он состоит в том, чтобы внести изменения в текст, чтобы модель атак ошиблась в определении, при этом сохранив правильный вывод классификатора. Метод RedHerring использует специальные стратегии для добавления изменений, которые не отражаются на конечном результате, но приводят к неверному определению моделью атак. Мы проводили эксперименты на 4 различных датасетах, применяя 3 модели атак и 4 классификаторов. Наши тесты показали, что RedHerring может снизить точность модели атак до 71%, при этом не влияя на точность классификатора или даже улучшая её. ## Результаты Мы проверили нашу модель на нескольких датасетах, включая IMDB, SST-2, AG News и Yelp. Мы модифицировали тексты для запутывания модели атака, при этом сохраняя верность классификатора. Наши результаты показали, что RedHerring может снизить доверие к модели атака до 71%, при этом не затрагивая или даже улучшая точность классификатора. Эти результаты показали, что RedHerring может стать серьезной угрозой для текущих моделей атак и показали необходимость разработки новых методов защиты. ## Значимость RedHerring может иметь значительное влияние на различные области, такие как безопасность текстовых моделей, моделирование предметных областей и проверка подлинности текста. Она показывает, что модели атак могут быть использованы не только для того, чтобы определить недостоверные данные, но и для того, чтобы опутать их. Этот подход может быть использован для раскрытия недостатков в текущих моделях атаки и для повышения их надежности. Мы также предлагаем простую внедряемую защиту, которая может увеличить доверие к моделям до 20-30%, не требуя изменений в реализации классификатора или модели атаки. ## Выводы Наши исследования показали, что RedHerring может быть эффективно использована для сни

Annotation:

In response to adversarial text attacks, attack detection models have been proposed and shown to successfully identify text modified by adversaries. Attack detection models can be leveraged to provide an additional check for NLP models and give signals for human input. However, the reliability of these models has not yet been thoroughly explored. Thus, we propose and test a novel attack setting and attack, RedHerring. RedHerring aims to make attack detection models unreliable by modifying a text...

ID: 2509.20691v1 cs.CL, I.2.7

arXiv PDF

📄 Overcoming Black-box Attack Inefficiency with Hybrid and Dynamic Select Algorithms

2025-09-27

Авторы:

Abhinay Shankar Belde, Rohit Ramkumar, Jonathan Rusert

## Контекст Область исследования, посвященная созданию атак на текстовые модели, является ключевой для оценки работы естественных языковых моделей (NLP) на прочность. Несмотря на то, что такие атаки помогают исследователям уязвимости моделей, они становятся все более сложными при работе с современными трансформер-моделями. Эти модели требуют больших вычислительных ресурсов для эффективного тестирования атак. Это особенно заметно для исследователей с ограниченными ресурсами, такими как доступ к GPU. Традиционные методы, такие как BinarySelect и GreedySelect, хотя и эффективны, но часто требуют много запросов для того, чтобы получить эффективные атаки. Это создает серьезные проблемы для исследователей, которые не могут позволить себе такие затраты на ресурсы. Для решения этой проблемы, предлагается два новых подхода, которые объединяют сильные стороны предыдущих алгоритмов. ## Метод Метод Hybrid Select является комбинацией BinarySelect и GreedySelect с использованием размышления о том, какой метод лучше подходит для той или иной ситуации. Для этого вводится размерный порог, при котором один из методов (Binary или Greedy) будет применен. Это позволяет оптимизировать выбор метода в зависимости от конкретной задачи. Метод Dynamic Select, в свою очередь, работает по-другому, оптимизируя выбор методов Greedy и Binary в зависимости от длины текста. Это подход решает проблему, когда один из методов может быть более эффективен на определенных длинах текста. Эти два метода, Hybrid и Dynamic Select, могут быть использованы на разных уровнях (токен, предложение, и т.д.) для создания более эффективных текстовых атак с меньшим количеством запросов. ## Результаты Исследователи проверили два новых метода на 4 разных датасетах и 6 различных моделях. Они сравнивали Hybrid и Dynamic Select с исходными BinarySelect и GreedySelect. На тестировании вы most of the cases была проверена эффективность и экономия на запросах. Например, на одной из моделей, Hybrid Select позволил сократить количество запросов на 25.82% в среднем, при этом сохранив эффективность атаки. Этот подход показал себя эффективнее для различных моделей, в том числе для LLMs. Dynamic Select показал похожие результаты, но имел некоторые ограничения в случае очень длинных текстов. ## Значимость Предложенные методы Hybrid и Dynamic Select представляют собой значительный шаг в направлении улучшения текстовых атак. Они могут использоваться во многих областях, таких как оценка уязвимости моделей, моделирование надежных текстовых систем и снижение риска атак на текстовые модели. Эти методы позволяют экономить ресурсы для исследователей, уменьшая количество запросов, необходимых для того, чтобы протестировать уязвимость моделей. Это может сде

Annotation:

Adversarial text attack research plays a crucial role in evaluating the robustness of NLP models. However, the increasing complexity of transformer-based architectures has dramatically raised the computational cost of attack testing, especially for researchers with limited resources (e.g., GPUs). Existing popular black-box attack methods often require a large number of queries, which can make them inefficient and impractical for researchers. To address these challenges, we propose two new attack...

ID: 2509.20699v1 cs.CL, I.2.7

arXiv PDF

Показано 21 - 30 из 63 записей