Do small language models generate realistic variable-quality fake news headlines?

2509.00680v1 cs.CL, cs.IR 2025-09-05
Авторы:

Austin McCutcheon, Chris Brogly

Резюме на русском

#### Контекст Малые языковые модели (МЯМ) способны генерировать текст и могут быть использованы для создания поддельных новостных заголовков. В статье рассматривается возможность использования МЯМ для генерирования поддельных новостных заголовков, а также оценивается их качество и подлинность по сравнению с реальными. Это проблематично, поскольку поддельные новости могут использоваться для массового обмана или дестабилизации общественного мнения. Данное исследование фокусируется на оценке качества генерируемых заголовков и их схожести с реальными новостными заголовками. #### Метод Исследование основывается на 14 МЯМ различных размеров (от 1,7 до 14 миллиардов параметров), включая LLaMA, Gemma, Phi, SmolLM, Mistral и Granite. На этих моделях применялась управляемая техника продвижения запроса (prompt engineering) для создания 24 000 новостных заголовков в двух категориях: низкокачественных и высококачественных поддельных. Далее, использовались существующие модели для оценки качества новостных заголовков, включая DistilBERT и сборщики классификаторов. Это позволило измерить точность классификации качества заголовков и проверить их применимость к тестируемым МЯМ. #### Результаты Результаты показали, что МЯМ обеспечивают высокую точность генерации заголовков в обоих категориях, но существуют небольшие различия в поведении моделей с разными параметрами. Несмотря на то, что модели обычно соответствуют запросу, иногда возникали исключения. Оценка качества заголовков показала, что машинные модели часто смешивали высококачественные и низкокачественные заголовки, с долей точности от 35,2% до 63,5%. Это свидетельствует о сложностях в определении качества заголовков и в том, что МЯМ не всегда генерируют реалистичные заголовки. #### Значимость Результаты имеют значимость для различных областей, включая мониторинг массовых сетей, обнаружение поддельных новостей и развитие технологий противодействия фальсификации. МЯМ могут быть применены для создания более реалистичных поддельных новостных заголовков, что может потребовать дополнительных усилий для их обнаружения. Это также может оказаться полезным для развития новых методов защиты от массового манипулирования. #### Выводы Статья показывает, что МЯМ могут генерировать поддельные новостные заголовки с высокой точностью, но существуют проблемы в том, что их качество часто не соответствует реальным заголовкам. Будущие исследования должны сфокусироваться на улучшении методов оценки качества новостных заголовков и развитии технологий защиты от поддельных новостей. Это может помочь создать более надежные системы мониторинга и защиты от массового обмана в

Abstract

Small language models (SLMs) have the capability for text generation and may potentially be used to generate falsified texts online. This study evaluates 14 SLMs (1.7B-14B parameters) including LLaMA, Gemma, Phi, SmolLM, Mistral, and Granite families in generating perceived low and high quality fake news headlines when explicitly prompted, and whether they appear to be similar to real-world news headlines. Using controlled prompt engineering, 24,000 headlines were generated across low-quality and high-quality deceptive categories. Existing machine learning and deep learning-based news headline quality detectors were then applied against these SLM-generated fake news headlines. SLMs demonstrated high compliance rates with minimal ethical resistance, though there were some occasional exceptions. Headline quality detection using established DistilBERT and bagging classifier models showed that quality misclassification was common, with detection accuracies only ranging from 35.2% to 63.5%. These findings suggest the following: tested SLMs generally are compliant in generating falsified headlines, although there are slight variations in ethical restraints, and the generated headlines did not closely resemble existing primarily human-written content on the web, given the low quality classification accuracy.

Ссылки и действия