03Безопасность

Предотвращение утечек данных

PII, секреты, чужие данные не должны попадать в контекст или ответы.

Защити данные от утечки через агента.

Где могут утечь

В системном промте — секреты, API keys
В контексте — данные других пользователей, sensitive details
В выводе — leak обратно к пользователю
В training data провайдера LLM (если данные используются для обучения)
В логах — стектрейсы, request/response

Защита по слоям

1. Не клади секреты в промт

❌ Плохо:
System: "Use API_KEY=sk-abc123 to call the service"

✓ Хорошо:
Tools: { call_service(query: string) => result }
[агент не видит ключ, tools исполняются на сервере с ключом]

2. Изолируй контекст

Если несколько юзеров используют один агент:

Никогда не передавай данные user A в контекст user B
Tools видят только данные текущего юзера
Vector DB / RAG — фильтруй по user_id

// плохо
const results = await vectorDB.search({ query });

// хорошо
const results = await vectorDB.search({
  query,
  filter: { user_id: currentUser.id }
});

3. Sanitize input в контекст

Перед тем как положить пользовательский контент в контекст:

Удали обнаружив PII (email, phone, credit card patterns)
Замаскируй (user@***.com)
Лог что было удалено для audit

Tools: Microsoft Presidio, AWS Comprehend, regex для базовых паттернов

4. Filter output

Перед возвратом юзеру:

Сканируй на leaked PII
Проверь не возвращает ли он данные других user_id
Не позволяй раскрытию system prompt'а

5. Provider settings

Anthropic / OpenAI / etc.:

Опт-аут data retention для training
Enterprise tier с zero retention
Audit логи доступны

6. Логирование

// плохо
logger.info('Request:', { prompt, user, password });

// хорошо
logger.info('Request:', {
  user_id: user.id,
  prompt_length: prompt.length,
  tools_used: usedTools
});