Entendendo as Flags de Segurança

O Edison Watch usa três flags para rastrear riscos em sessões de IA.

Flags de Segurança

📘 Acesso a Dados Privados

Disparado por: Leitura de arquivos, consultas a bancos de dados ou acesso a documentos internos. Risco: Informações sensíveis podem ser expostas.

🌐 Exposição a Conteúdo Não Confiável

Disparado por: Busca de páginas da web ou chamadas a APIs externas. Risco: A IA pode receber instruções maliciosas (prompt injection).

✉️ Comunicação Externa

Disparado por: Envio de e-mails, postagem no Slack ou chamadas a APIs externas. Risco: Dados confidenciais podem ser exfiltrados.

A Lethal Trifecta

A "Lethal Trifecta" ocorre quando uma sessão possui as três flags ativas:

Status	Significado
✓ Dados Privados	A IA viu informações confidenciais.
✓ Conteúdo Não Confiável	A IA pode ter recebido instruções maliciosas.
⏳ Comunicação Externa	A IA está tentando enviar dados externamente.

Proteção: O Edison Watch pausa automaticamente qualquer ação que complete esta trifecta, exigindo sua aprovação manual para prosseguir.

Visualizando Flags no Dashboard

A visualização Sessions usa pontos coloridos para indicar flags ativas:

🔵 Azul: Acesso a Dados Privados
🟡 Âmbar: Exposição a Conteúdo Não Confiável
🔴 Vermelho: Comunicação Externa

Níveis de Risco

Baixo (verde): 0 flags
Médio (âmbar): 1 flag
Alto (vermelho): 2+ flags

Níveis de ACL

Access Control Levels (ACL) oferecem proteção adicional:

Nível	Significado
PUBLIC	Dados não sensíveis.
PRIVATE	Dados internos/confidenciais.
SECRET	Dados altamente sensíveis.

Aplicação: O Edison Watch bloqueia automaticamente fluxos de dados de alta para baixa sensibilidade (por exemplo, ler dados SECRET e então postar em um canal PUBLIC). Esses bloqueios não pedem aprovação - são evitados por padrão.

Para Admins: Você pode classificar ferramentas e definir níveis de ACL na página Access Control e via Policy Rules.

Entendendo as Flags de Segurança

On this page