Edison Watch

Entendendo as Flags de Segurança

Aprenda sobre as flags de segurança e a Lethal Trifecta.

O Edison Watch usa três flags para rastrear riscos em sessões de IA.

Flags de Segurança

📘 Acesso a Dados Privados

Disparado por: Leitura de arquivos, consultas a bancos de dados ou acesso a documentos internos. Risco: Informações sensíveis podem ser expostas.

🌐 Exposição a Conteúdo Não Confiável

Disparado por: Busca de páginas da web ou chamadas a APIs externas. Risco: A IA pode receber instruções maliciosas (prompt injection).

✉️ Comunicação Externa

Disparado por: Envio de e-mails, postagem no Slack ou chamadas a APIs externas. Risco: Dados confidenciais podem ser exfiltrados.

A Lethal Trifecta

A "Lethal Trifecta" ocorre quando uma sessão possui as três flags ativas:

StatusSignificado
✓ Dados PrivadosA IA viu informações confidenciais.
✓ Conteúdo Não ConfiávelA IA pode ter recebido instruções maliciosas.
⏳ Comunicação ExternaA IA está tentando enviar dados externamente.

Proteção: O Edison Watch pausa automaticamente qualquer ação que complete esta trifecta, exigindo sua aprovação manual para prosseguir.

Visualizando Flags no Dashboard

A visualização Sessions usa pontos coloridos para indicar flags ativas:

  • 🔵 Azul: Acesso a Dados Privados
  • 🟡 Âmbar: Exposição a Conteúdo Não Confiável
  • 🔴 Vermelho: Comunicação Externa
Flags de segurança na tabela de sessões

Níveis de Risco

  • Baixo (verde): 0 flags
  • Médio (âmbar): 1 flag
  • Alto (vermelho): 2+ flags

Níveis de ACL

Access Control Levels (ACL) oferecem proteção adicional:

NívelSignificado
PUBLICDados não sensíveis.
PRIVATEDados internos/confidenciais.
SECRETDados altamente sensíveis.

Aplicação: O Edison Watch bloqueia automaticamente fluxos de dados de alta para baixa sensibilidade (por exemplo, ler dados SECRET e então postar em um canal PUBLIC). Esses bloqueios não pedem aprovação - são evitados por padrão.


Para Admins: Você pode classificar ferramentas e definir níveis de ACL na página Access Control e via Policy Rules.

On this page