Do small language models generate realistic variable-quality fake news headlines?
2509.00680v1
cs.CL, cs.IR
2025-09-05
Авторы:
Austin McCutcheon, Chris Brogly
Резюме на русском
#### Контекст
Малые языковые модели (МЯМ) способны генерировать текст и могут быть использованы для создания поддельных новостных заголовков. В статье рассматривается возможность использования МЯМ для генерирования поддельных новостных заголовков, а также оценивается их качество и подлинность по сравнению с реальными. Это проблематично, поскольку поддельные новости могут использоваться для массового обмана или дестабилизации общественного мнения. Данное исследование фокусируется на оценке качества генерируемых заголовков и их схожести с реальными новостными заголовками.
#### Метод
Исследование основывается на 14 МЯМ различных размеров (от 1,7 до 14 миллиардов параметров), включая LLaMA, Gemma, Phi, SmolLM, Mistral и Granite. На этих моделях применялась управляемая техника продвижения запроса (prompt engineering) для создания 24 000 новостных заголовков в двух категориях: низкокачественных и высококачественных поддельных. Далее, использовались существующие модели для оценки качества новостных заголовков, включая DistilBERT и сборщики классификаторов. Это позволило измерить точность классификации качества заголовков и проверить их применимость к тестируемым МЯМ.
#### Результаты
Результаты показали, что МЯМ обеспечивают высокую точность генерации заголовков в обоих категориях, но существуют небольшие различия в поведении моделей с разными параметрами. Несмотря на то, что модели обычно соответствуют запросу, иногда возникали исключения. Оценка качества заголовков показала, что машинные модели часто смешивали высококачественные и низкокачественные заголовки, с долей точности от 35,2% до 63,5%. Это свидетельствует о сложностях в определении качества заголовков и в том, что МЯМ не всегда генерируют реалистичные заголовки.
#### Значимость
Результаты имеют значимость для различных областей, включая мониторинг массовых сетей, обнаружение поддельных новостей и развитие технологий противодействия фальсификации. МЯМ могут быть применены для создания более реалистичных поддельных новостных заголовков, что может потребовать дополнительных усилий для их обнаружения. Это также может оказаться полезным для развития новых методов защиты от массового манипулирования.
#### Выводы
Статья показывает, что МЯМ могут генерировать поддельные новостные заголовки с высокой точностью, но существуют проблемы в том, что их качество часто не соответствует реальным заголовкам. Будущие исследования должны сфокусироваться на улучшении методов оценки качества новостных заголовков и развитии технологий защиты от поддельных новостей. Это может помочь создать более надежные системы мониторинга и защиты от массового обмана в
Abstract
Small language models (SLMs) have the capability for text generation and may
potentially be used to generate falsified texts online. This study evaluates 14
SLMs (1.7B-14B parameters) including LLaMA, Gemma, Phi, SmolLM, Mistral, and
Granite families in generating perceived low and high quality fake news
headlines when explicitly prompted, and whether they appear to be similar to
real-world news headlines. Using controlled prompt engineering, 24,000
headlines were generated across low-quality and high-quality deceptive
categories. Existing machine learning and deep learning-based news headline
quality detectors were then applied against these SLM-generated fake news
headlines. SLMs demonstrated high compliance rates with minimal ethical
resistance, though there were some occasional exceptions. Headline quality
detection using established DistilBERT and bagging classifier models showed
that quality misclassification was common, with detection accuracies only
ranging from 35.2% to 63.5%. These findings suggest the following: tested SLMs
generally are compliant in generating falsified headlines, although there are
slight variations in ethical restraints, and the generated headlines did not
closely resemble existing primarily human-written content on the web, given the
low quality classification accuracy.
Ссылки и действия
Дополнительные ресурсы: