Entendendo as Flags de Segurança
Aprenda sobre as flags de segurança e a Lethal Trifecta.
O Edison Watch usa três flags para rastrear riscos em sessões de IA.
Flags de Segurança
📘 Acesso a Dados Privados
Disparado por: Leitura de arquivos, consultas a bancos de dados ou acesso a documentos internos. Risco: Informações sensíveis podem ser expostas.
🌐 Exposição a Conteúdo Não Confiável
Disparado por: Busca de páginas da web ou chamadas a APIs externas. Risco: A IA pode receber instruções maliciosas (prompt injection).
✉️ Comunicação Externa
Disparado por: Envio de e-mails, postagem no Slack ou chamadas a APIs externas. Risco: Dados confidenciais podem ser exfiltrados.
A Lethal Trifecta
A "Lethal Trifecta" ocorre quando uma sessão possui as três flags ativas:
| Status | Significado |
|---|---|
| ✓ Dados Privados | A IA viu informações confidenciais. |
| ✓ Conteúdo Não Confiável | A IA pode ter recebido instruções maliciosas. |
| ⏳ Comunicação Externa | A IA está tentando enviar dados externamente. |
Proteção: O Edison Watch pausa automaticamente qualquer ação que complete esta trifecta, exigindo sua aprovação manual para prosseguir.
Visualizando Flags no Dashboard
A visualização Sessions usa pontos coloridos para indicar flags ativas:
- 🔵 Azul: Acesso a Dados Privados
- 🟡 Âmbar: Exposição a Conteúdo Não Confiável
- 🔴 Vermelho: Comunicação Externa
Níveis de Risco
- Baixo (verde): 0 flags
- Médio (âmbar): 1 flag
- Alto (vermelho): 2+ flags
Níveis de ACL
Access Control Levels (ACL) oferecem proteção adicional:
| Nível | Significado |
|---|---|
| PUBLIC | Dados não sensíveis. |
| PRIVATE | Dados internos/confidenciais. |
| SECRET | Dados altamente sensíveis. |
Aplicação: O Edison Watch bloqueia automaticamente fluxos de dados de alta para baixa sensibilidade (por exemplo, ler dados SECRET e então postar em um canal PUBLIC). Esses bloqueios não pedem aprovação - são evitados por padrão.
Para Admins: Você pode classificar ferramentas e definir níveis de ACL na página Access Control e via Policy Rules.

