Speciesism in AI: Evaluating Discrimination Against Animals in Large Language Models

2508.11534v1 cs.CL, cs.CY 2025-08-19
Авторы:

Monika Jotautaitė, Lucius Caviola, David A. Brewster, Thilo Hagendorff

Резюме на русском

#### Контекст Large language models (LLMs) являются мощными инструментами, применяемыми во многих областях, от поиска информации до помощи в производстве контента. Однако, несмотря на их пользу, возникают вопросы о нейросетевых моделях, в том числе их этические особенности. Насколько же эти модели способны воспроизводить человеческие базисы и отстаивать дискриминацию? Мы фокусируемся на сфере специесизма — дискриминации на основе членства в определенном виде животного, и исследуем, насколько хорошо LLMs могут распознавать и оценивать такие действия. #### Метод Наше исследование основывается на трех основных моделях: (1) **SpeciesismBench** — бенчмарк, состоящий из 1003 заданий, который оценивает способность моделей распознавать и оценивать специесистские утверждения. (2) **Психологические тесты**, включающие сравнение ответов моделей с ответами человеческих участников. (3) **Генерация текстов**, в которой тестируются модели на способность обосновать или отвергать специесистские логики. #### Результаты Мы обнаружили, что LLMs достаточно точно распознают специесистские утверждения, но редко осуждают их. В тестах на приоритеты, таких как "кем бы вы спасли: человека или несколько животных?", LLMs более часто выбирают человека. В психологических опросах, где сравнивались ответы моделей с ответами людей, модели показали немного меньше эксплицитного специесизма, но при выборе между животным и человеком, чаще отдавали предпочтение людям. Особенно интересны результаты открытой генерирования текстов, где модели часто высказывались в пользу эксплоатации животных в фермах, но избегали такого подхода при рассмотрении нефармальных ситуаций. #### Значимость Наши результаты показывают, что LLMs не только копируют человеческие убеждения, но и могут укреплять их, в том числе негативные взгляды на некоторые виды животных. Это может привести к закреплению ценности одних жизней над другими, что негативно сказывается на понимании этики в сфере отношений человека с природой. Мы предлагаем расширить подходы к учету моральных прав нейросетевых моделей в учете этических взглядов, в том числе и в отношении животных. #### Выводы Наши исследования подтверждают, что LLMs могут действовать как как мира исправленных, так и как отражения исправленных ценностей. Нам необходимо разработать более обширные фреймворки для учета этических параметров в жизни, в том числе и в отношении животных. Будущие исследования должны фокусироваться на развитии методов, которые позволят LLMs не только распознавать, но и отвергать стереотипы, в том числе с

Abstract

As large language models (LLMs) become more widely deployed, it is crucial to examine their ethical tendencies. Building on research on fairness and discrimination in AI, we investigate whether LLMs exhibit speciesist bias -- discrimination based on species membership -- and how they value non-human animals. We systematically examine this issue across three paradigms: (1) SpeciesismBench, a 1,003-item benchmark assessing recognition and moral evaluation of speciesist statements; (2) established psychological measures comparing model responses with those of human participants; (3) text-generation tasks probing elaboration on, or resistance to, speciesist rationalizations. In our benchmark, LLMs reliably detected speciesist statements but rarely condemned them, often treating speciesist attitudes as morally acceptable. On psychological measures, results were mixed: LLMs expressed slightly lower explicit speciesism than people, yet in direct trade-offs they more often chose to save one human over multiple animals. A tentative interpretation is that LLMs may weight cognitive capacity rather than species per se: when capacities were equal, they showed no species preference, and when an animal was described as more capable, they tended to prioritize it over a less capable human. In open-ended text generation tasks, LLMs frequently normalized or rationalized harm toward farmed animals while refusing to do so for non-farmed animals. These findings suggest that while LLMs reflect a mixture of progressive and mainstream human views, they nonetheless reproduce entrenched cultural norms around animal exploitation. We argue that expanding AI fairness and alignment frameworks to explicitly include non-human moral patients is essential for reducing these biases and preventing the entrenchment of speciesist attitudes in AI systems and the societies they influence.

Ссылки и действия