Топ-10 угроз для приложений на основе больших языковых моделей (LLM) в 2025 году

С развитием технологий больших языковых моделей (LLM) их интеграция в различные приложения становится все более распространенной. Однако с увеличением использования LLM возрастает и количество угроз, связанных с их безопасностью. В этом обзоре мы рассмотрим десять основных угроз, выявленных в 2025 году, которые могут повлиять на безопасность и надежность LLM-приложений.

OWASP-Top-10-for-LLMs-v2025 Скачать

1. Внедрение команд (Prompt Injection)

Описание

Внедрение команд происходит, когда пользовательские запросы изменяют поведение или вывод модели непреднамеренным образом. Это может привести к раскрытию конфиденциальной информации, манипуляции контентом или несанкционированному доступу к функциям модели.

Примеры

Прямое внедрение: Злоумышленник вводит команду, которая заставляет модель игнорировать предыдущие инструкции и выполнять нежелательные действия.
Косвенное внедрение: Внешние источники данных содержат скрытые команды, которые изменяют поведение модели.

Меры предосторожности

Ограничение поведения модели и строгая проверка входных данных.
Использование фильтров для выявления и блокировки нежелательного контента.

2. Разглашение конфиденциальной информации

Описание

LLM могут случайно раскрывать личные данные, финансовую информацию или конфиденциальные бизнес-данные через свои ответы.

Примеры

Утечка персональных данных (PII) в результате взаимодействия с моделью.
Раскрытие алгоритмов или данных, используемых для обучения модели.

Меры предосторожности

Санитаризация данных и строгий контроль доступа.
Использование федеративного обучения и дифференциальной приватности для защиты данных.

3. Угрозы цепочки поставок

Описание

Уязвимости в цепочке поставок могут повлиять на целостность данных обучения, моделей и платформ развертывания.

Примеры

Использование устаревших или уязвимых компонентов.
Манипуляции с предварительно обученными моделями.

Меры предосторожности

Тщательная проверка источников данных и поставщиков.
Использование инструментов для управления уязвимостями и обновления компонентов.

4. Отравление данных и моделей

Описание

Отравление данных происходит, когда данные для обучения или дообучения манипулируются для внедрения уязвимостей или предвзятости.

Примеры

Внедрение вредоносных данных в процессе обучения.
Использование непроверенных источников данных, что может привести к предвзятым выводам.

Меры предосторожности

Отслеживание происхождения данных и их проверка.
Использование методов обнаружения аномалий для фильтрации вредоносных данных.

5. Неправильная обработка вывода

Описание

Недостаточная проверка и обработка выводов модели могут привести к выполнению нежелательных команд или утечке данных.

Примеры

Выполнение SQL-запросов без должной параметризации.
Использование вывода модели для создания файловых путей без проверки.

Меры предосторожности

Применение стандартов безопасности, таких как OWASP ASVS, для проверки и кодирования вывода.
Использование параметризованных запросов для всех операций с базами данных.

6. Чрезмерная автономия

Описание

Чрезмерная автономия возникает, когда LLM-системы получают слишком много полномочий, что может привести к выполнению нежелательных действий.

Примеры

Модель имеет доступ к функциям, которые не требуются для ее работы.
Использование расширений с избыточными правами доступа.

Меры предосторожности

Ограничение функциональности и прав доступа расширений.
Внедрение контроля с участием человека для подтверждения высокорисковых действий.

7. Утечка системных команд

Описание

Утечка системных команд может привести к раскрытию конфиденциальной информации, используемой для управления поведением модели.

Примеры

Раскрытие внутренних правил или уровней доступа.
Утечка данных о конфигурации системы.

Меры предосторожности

Избегание использования системных команд для управления поведением модели.
Внедрение внешних систем контроля и проверки вывода модели.

8. Уязвимости в векторах и встраиваниях

Описание

Уязвимости в векторах и встраиваниях могут быть использованы для внедрения вредоносного контента или манипуляции выводами модели.

Примеры

Неавторизованный доступ к встраиваниям, содержащим конфиденциальную информацию.
Атаки на инверсию встраиваний для восстановления исходной информации.

Меры предосторожности

Внедрение строгого контроля доступа и проверки данных.
Регулярный аудит и валидация базы знаний.

9. Дезинформация

Описание

Дезинформация возникает, когда LLM генерируют ложную или вводящую в заблуждение информацию, которая кажется достоверной.

Примеры

Генерация фактически неверных утверждений.
Создание необоснованных заявлений в чувствительных контекстах.

Меры предосторожности

Использование методов генерации с дополнением извлечением (RAG) для повышения надежности выводов.
Внедрение механизмов автоматической проверки и человеческого контроля.

10. Неограниченное потребление

Описание

Неограниченное потребление происходит, когда LLM позволяют пользователям проводить чрезмерное количество запросов, что может привести к отказу в обслуживании или финансовым потерям.

Примеры

Перегрузка системы запросами переменной длины.
Эксплуатация модели оплаты за использование облачных сервисов.

Меры предосторожности

Внедрение строгой проверки входных данных и ограничения скорости запросов.
Управление ресурсами и мониторинг использования для предотвращения чрезмерного потребления.

Заключение

С развитием технологий LLM важно учитывать и предотвращать потенциальные угрозы, связанные с их использованием. Применение описанных мер предосторожности поможет защитить приложения на основе LLM от возможных атак и обеспечить их надежность и безопасность.

1. Внедрение команд (Prompt Injection)

Описание

Примеры

Меры предосторожности

2. Разглашение конфиденциальной информации

Описание

Примеры

Меры предосторожности

3. Угрозы цепочки поставок

Описание

Примеры

Меры предосторожности

4. Отравление данных и моделей

Описание

Примеры

Меры предосторожности

5. Неправильная обработка вывода

Описание

Примеры

Меры предосторожности

6. Чрезмерная автономия

Описание

Примеры

Меры предосторожности

7. Утечка системных команд

Описание

Примеры

Меры предосторожности

8. Уязвимости в векторах и встраиваниях

Описание

Примеры

Меры предосторожности

9. Дезинформация

Описание

Примеры

Меры предосторожности

10. Неограниченное потребление

Описание

Примеры

Меры предосторожности

Заключение

Author: admin

Related Posts

Еженедельный дайджест КБ, ИИ и ИТ

ИИ-агенты в действии: экономика, риски и эволюция организационных моделей

Люди, агенты и роботы — как ИИ перестраивает работу и навыки