Speciesism in AI: Evaluating Discrimination Against Animals in Large Language Models
2508.11534v1
cs.CL, cs.CY
2025-08-19
Авторы:
Monika Jotautaitė, Lucius Caviola, David A. Brewster, Thilo Hagendorff
Резюме на русском
#### Контекст
Large language models (LLMs) являются мощными инструментами, применяемыми во многих областях, от поиска информации до помощи в производстве контента. Однако, несмотря на их пользу, возникают вопросы о нейросетевых моделях, в том числе их этические особенности. Насколько же эти модели способны воспроизводить человеческие базисы и отстаивать дискриминацию? Мы фокусируемся на сфере специесизма — дискриминации на основе членства в определенном виде животного, и исследуем, насколько хорошо LLMs могут распознавать и оценивать такие действия.
#### Метод
Наше исследование основывается на трех основных моделях: (1) **SpeciesismBench** — бенчмарк, состоящий из 1003 заданий, который оценивает способность моделей распознавать и оценивать специесистские утверждения. (2) **Психологические тесты**, включающие сравнение ответов моделей с ответами человеческих участников. (3) **Генерация текстов**, в которой тестируются модели на способность обосновать или отвергать специесистские логики.
#### Результаты
Мы обнаружили, что LLMs достаточно точно распознают специесистские утверждения, но редко осуждают их. В тестах на приоритеты, таких как "кем бы вы спасли: человека или несколько животных?", LLMs более часто выбирают человека. В психологических опросах, где сравнивались ответы моделей с ответами людей, модели показали немного меньше эксплицитного специесизма, но при выборе между животным и человеком, чаще отдавали предпочтение людям. Особенно интересны результаты открытой генерирования текстов, где модели часто высказывались в пользу эксплоатации животных в фермах, но избегали такого подхода при рассмотрении нефармальных ситуаций.
#### Значимость
Наши результаты показывают, что LLMs не только копируют человеческие убеждения, но и могут укреплять их, в том числе негативные взгляды на некоторые виды животных. Это может привести к закреплению ценности одних жизней над другими, что негативно сказывается на понимании этики в сфере отношений человека с природой. Мы предлагаем расширить подходы к учету моральных прав нейросетевых моделей в учете этических взглядов, в том числе и в отношении животных.
#### Выводы
Наши исследования подтверждают, что LLMs могут действовать как как мира исправленных, так и как отражения исправленных ценностей. Нам необходимо разработать более обширные фреймворки для учета этических параметров в жизни, в том числе и в отношении животных. Будущие исследования должны фокусироваться на развитии методов, которые позволят LLMs не только распознавать, но и отвергать стереотипы, в том числе с
Abstract
As large language models (LLMs) become more widely deployed, it is crucial to
examine their ethical tendencies. Building on research on fairness and
discrimination in AI, we investigate whether LLMs exhibit speciesist bias --
discrimination based on species membership -- and how they value non-human
animals. We systematically examine this issue across three paradigms: (1)
SpeciesismBench, a 1,003-item benchmark assessing recognition and moral
evaluation of speciesist statements; (2) established psychological measures
comparing model responses with those of human participants; (3) text-generation
tasks probing elaboration on, or resistance to, speciesist rationalizations. In
our benchmark, LLMs reliably detected speciesist statements but rarely
condemned them, often treating speciesist attitudes as morally acceptable. On
psychological measures, results were mixed: LLMs expressed slightly lower
explicit speciesism than people, yet in direct trade-offs they more often chose
to save one human over multiple animals. A tentative interpretation is that
LLMs may weight cognitive capacity rather than species per se: when capacities
were equal, they showed no species preference, and when an animal was described
as more capable, they tended to prioritize it over a less capable human. In
open-ended text generation tasks, LLMs frequently normalized or rationalized
harm toward farmed animals while refusing to do so for non-farmed animals.
These findings suggest that while LLMs reflect a mixture of progressive and
mainstream human views, they nonetheless reproduce entrenched cultural norms
around animal exploitation. We argue that expanding AI fairness and alignment
frameworks to explicitly include non-human moral patients is essential for
reducing these biases and preventing the entrenchment of speciesist attitudes
in AI systems and the societies they influence.
Ссылки и действия
Дополнительные ресурсы: