Entendendo Bandeiras de Segurança
Aprenda sobre bandeiras de segurança e a Tríade Letal.
O Edison Watch usa três bandeiras para rastrear risco em sessões de IA.
Bandeiras de Segurança
📘 Acesso a Dados Privados (Private Data Access)
Acionado por: Ler arquivos, consultar bancos de dados ou acessar documentos internos. Risco: Informações sensíveis poderiam ser expostas.
🌐 Exposição a Conteúdo Não Confiável (Untrusted Content Exposure)
Acionado por: Buscar páginas web ou chamar APIs externas. Risco: A IA poderia receber instruções maliciosas (injeção de prompt).
✉️ Comunicação Externa (External Communication)
Acionado por: Enviar emails, postar no Slack ou fazer chamadas de API externas. Risco: Dados confidenciais poderiam ser exfiltrados.
A Tríade Letal
A "Tríade Letal" ocorre quando uma sessão tem todas as três bandeiras ativas:
| Status | Significado |
|---|---|
| ✓ Dados Privados | IA viu informações confidenciais. |
| ✓ Conteúdo Não Confiável | IA pode ter recebido instruções maliciosas. |
| ⏳ Comunicação Externa | IA está tentando enviar dados externamente. |
Proteção: O Edison Watch pausa automaticamente qualquer ação que completa esta tríade, exigindo sua aprovação manual para prosseguir.
Visualizando Bandeiras no Dashboard
A visualização de Sessões usa pontos coloridos para mostrar bandeiras ativas:
- 🔵 Azul: Acesso a Dados Privados
- 🟡 Âmbar: Exposição a Conteúdo Não Confiável
- 🔴 Vermelho: Comunicação Externa
Níveis de Risco
- Baixo (verde): 0 bandeiras
- Médio (âmbar): 1 bandeira
- Alto (vermelho): 2+ bandeiras
Níveis de ACL
Níveis de Controle de Acesso (ACL) fornecem proteção adicional:
| Nível | Significado |
|---|---|
| PÚBLICO | Dados não sensíveis. |
| PRIVADO | Dados internos/confidenciais. |
| SECRETO | Dados altamente sensíveis. |
Aplicação: O Edison Watch bloqueia automaticamente fluxos de dados de alto-para-baixo (ex: ler dados SECRETOS e depois postar em um canal PÚBLICO). Estes bloqueios não pedem aprovação - eles são prevenidos por padrão.
Para Admins: Você pode classificar ferramentas e definir níveis de ACL na configuração de Servidores.

