Entendiendo las Banderas de Seguridad
Aprende sobre las banderas de seguridad y la Trifecta Letal.
Edison Watch utiliza tres banderas para rastrear el riesgo en las sesiones de IA.
Banderas de Seguridad
📘 Acceso a Datos Privados
Activado por: Leer archivos, consultar bases de datos o acceder a documentos internos. Riesgo: La información sensible podría estar expuesta.
🌐 Exposición a Contenido No Confiable
Activado por: Obtener páginas web o llamar a APIs externas. Riesgo: La IA podría recibir instrucciones maliciosas (inyección de prompt).
✉️ Comunicación Externa
Activado por: Enviar correos electrónicos, publicar en Slack o hacer llamadas a APIs externas. Riesgo: Los datos confidenciales podrían ser exfiltrados.
La Trifecta Letal
La "Trifecta Letal" ocurre cuando una sesión tiene las tres banderas activas:
| Estado | Significado |
|---|---|
| ✓ Datos Privados | La IA ha visto información confidencial. |
| ✓ Contenido No Confiable | La IA puede haber recibido instrucciones maliciosas. |
| ⏳ Comunicación Externa | La IA está intentando enviar datos externamente. |
Protección: Edison Watch pausa automáticamente cualquier acción que complete esta trifecta, requiriendo tu aprobación manual para proceder.
Viendo Banderas en el Panel de Control
La vista de Sesiones utiliza puntos de colores para mostrar banderas activas:
- 🔵 Azul: Acceso a Datos Privados
- 🟡 Ámbar: Exposición a Contenido No Confiable
- 🔴 Rojo: Comunicación Externa
Niveles de Riesgo
- Bajo (verde): 0 banderas
- Medio (ámbar): 1 bandera
- Alto (rojo): 2+ banderas
Niveles ACL
Los Niveles de Control de Acceso (ACL) proporcionan protección adicional:
| Nivel | Significado |
|---|---|
| PÚBLICO | Datos no sensibles. |
| PRIVADO | Datos internos/confidenciales. |
| SECRETO | Datos altamente sensibles. |
Aplicación: Edison Watch bloquea automáticamente los flujos de datos de alto a bajo (ej., leer datos SECRETOS y luego publicar en un canal PÚBLICO). Estos bloqueos no piden aprobación - se previenen por defecto.
Para Administradores: Puedes clasificar herramientas y establecer niveles ACL en la configuración de Servidores.

