Edison Watch

Entendiendo las Banderas de Seguridad

Aprende sobre las banderas de seguridad y la Trifecta Letal.

Edison Watch utiliza tres banderas para rastrear el riesgo en las sesiones de IA.

Banderas de Seguridad

📘 Acceso a Datos Privados

Activado por: Leer archivos, consultar bases de datos o acceder a documentos internos. Riesgo: La información sensible podría estar expuesta.

🌐 Exposición a Contenido No Confiable

Activado por: Obtener páginas web o llamar a APIs externas. Riesgo: La IA podría recibir instrucciones maliciosas (inyección de prompt).

✉️ Comunicación Externa

Activado por: Enviar correos electrónicos, publicar en Slack o hacer llamadas a APIs externas. Riesgo: Los datos confidenciales podrían ser exfiltrados.

La Trifecta Letal

La "Trifecta Letal" ocurre cuando una sesión tiene las tres banderas activas:

EstadoSignificado
✓ Datos PrivadosLa IA ha visto información confidencial.
✓ Contenido No ConfiableLa IA puede haber recibido instrucciones maliciosas.
⏳ Comunicación ExternaLa IA está intentando enviar datos externamente.

Protección: Edison Watch pausa automáticamente cualquier acción que complete esta trifecta, requiriendo tu aprobación manual para proceder.

Viendo Banderas en el Panel de Control

La vista de Sesiones utiliza puntos de colores para mostrar banderas activas:

  • 🔵 Azul: Acceso a Datos Privados
  • 🟡 Ámbar: Exposición a Contenido No Confiable
  • 🔴 Rojo: Comunicación Externa
Banderas de seguridad en tabla de sesiones

Niveles de Riesgo

  • Bajo (verde): 0 banderas
  • Medio (ámbar): 1 bandera
  • Alto (rojo): 2+ banderas

Niveles ACL

Los Niveles de Control de Acceso (ACL) proporcionan protección adicional:

NivelSignificado
PÚBLICODatos no sensibles.
PRIVADODatos internos/confidenciales.
SECRETODatos altamente sensibles.

Aplicación: Edison Watch bloquea automáticamente los flujos de datos de alto a bajo (ej., leer datos SECRETOS y luego publicar en un canal PÚBLICO). Estos bloqueos no piden aprobación - se previenen por defecto.


Para Administradores: Puedes clasificar herramientas y establecer niveles ACL en la configuración de Servidores.

On this page