#### Контекст
Machine learning model repositories, такие как Hugging Face Model Hub, обеспечивают широкую эксплуатацию моделей машинного обучения. Однако вредоносные акторы могут использовать эти репозитории для распространения вредоносного кода через загруженные модели. Существующие меры защиты, такие как безопасные форматы моделей, ограниченные (но неэффективные) политики загрузки и сканеры моделей, имеют существенные недостатки. Например, 44,9% популярных моделей на Hugging Face все еще используют небезопасный формат pickle, 15% из них не могут быть загружены ограничивающими политиками, и сканеры моделей не только дают ложноположительные, но и ложные отрицательные результаты. Хотя pickle остается доминирующим форматом для обмена моделями, комьюнити машинного обучения не имеет транспарентного и эффективного средства для безопасной загрузки таких моделей.
#### Метод
PickleBall предлагает безопасное загрузка pickle-based моделей, используя статический анализ исходного кода машинного обучения библиотек. Эта библиотека строит политики загрузки, которые определяют безопасное поведение модели во время загрузки. PickleBall динамически применяет эти политики во время загрузки, действуя как замена модулю pickle. Оно было разработано для того, чтобы генерировать политики, которые корректно загружают 79,8% безопасных pickle-based моделей в нашем наборе данных, при этом блокируя 100% вредоносных примеров. В сравнении с модельными сканерами, которые не могут выявить известные вредоносные модели, и состоящими стандартом лоадерами, которые загружают 22% меньше безопасных моделей, PickleBall снижает угрозу от случайных функциональных вызовов и повышает порог для атак, заставляя вредоносных акторов полагаться на технологии кода-реюз.
#### Результаты
В нашем эксперименте мы сравнили PickleBall с другими фреймворками для загрузки моделей. PickleBall стабильно определяет и блокирует все вредоносные модели, достигая 100% точности в определении. Напротив, сканеры моделей пропускают известные вредоносные модели, и стандартные лоадеры показывают меньшую эффективность при загрузке безопасных моделей. Эти результаты подтверждают эффективность PickleBall в гарантировании безопасной загрузки pickle-based моделей.
#### Значимость
PickleBall может применяться в любых системах, использующих pickle для обмена моделями, таких как облачные сервисы, легковесные модели и модели речевого распознавания. Он обеспечивает значительный прирост безопасности, устраняя риск нежелательного выполнения вредоносного кода. В долгосрочной перспективе, PickleBall может стать стандартом для безопасной загрузки pickle-based моделей, повышая надежность моделей и уменьшая риск для пользователей.
#### Выводы
PickleBall я