Edison Watch

Entendendo Bandeiras de Segurança

Aprenda sobre bandeiras de segurança e a Tríade Letal.

O Edison Watch usa três bandeiras para rastrear risco em sessões de IA.

Bandeiras de Segurança

📘 Acesso a Dados Privados (Private Data Access)

Acionado por: Ler arquivos, consultar bancos de dados ou acessar documentos internos. Risco: Informações sensíveis poderiam ser expostas.

🌐 Exposição a Conteúdo Não Confiável (Untrusted Content Exposure)

Acionado por: Buscar páginas web ou chamar APIs externas. Risco: A IA poderia receber instruções maliciosas (injeção de prompt).

✉️ Comunicação Externa (External Communication)

Acionado por: Enviar emails, postar no Slack ou fazer chamadas de API externas. Risco: Dados confidenciais poderiam ser exfiltrados.

A Tríade Letal

A "Tríade Letal" ocorre quando uma sessão tem todas as três bandeiras ativas:

StatusSignificado
✓ Dados PrivadosIA viu informações confidenciais.
✓ Conteúdo Não ConfiávelIA pode ter recebido instruções maliciosas.
⏳ Comunicação ExternaIA está tentando enviar dados externamente.

Proteção: O Edison Watch pausa automaticamente qualquer ação que completa esta tríade, exigindo sua aprovação manual para prosseguir.

Visualizando Bandeiras no Dashboard

A visualização de Sessões usa pontos coloridos para mostrar bandeiras ativas:

  • 🔵 Azul: Acesso a Dados Privados
  • 🟡 Âmbar: Exposição a Conteúdo Não Confiável
  • 🔴 Vermelho: Comunicação Externa
Bandeiras de segurança na tabela de sessões

Níveis de Risco

  • Baixo (verde): 0 bandeiras
  • Médio (âmbar): 1 bandeira
  • Alto (vermelho): 2+ bandeiras

Níveis de ACL

Níveis de Controle de Acesso (ACL) fornecem proteção adicional:

NívelSignificado
PÚBLICODados não sensíveis.
PRIVADODados internos/confidenciais.
SECRETODados altamente sensíveis.

Aplicação: O Edison Watch bloqueia automaticamente fluxos de dados de alto-para-baixo (ex: ler dados SECRETOS e depois postar em um canal PÚBLICO). Estes bloqueios não pedem aprovação - eles são prevenidos por padrão.


Para Admins: Você pode classificar ferramentas e definir níveis de ACL na configuração de Servidores.

On this page