Entendiendo las Banderas de Seguridad

Edison Watch utiliza tres banderas para rastrear el riesgo en las sesiones de IA.

Banderas de Seguridad

📘 Acceso a Datos Privados

Activado por: Leer archivos, consultar bases de datos o acceder a documentos internos. Riesgo: La información sensible podría estar expuesta.

🌐 Exposición a Contenido No Confiable

Activado por: Obtener páginas web o llamar a APIs externas. Riesgo: La IA podría recibir instrucciones maliciosas (inyección de prompt).

✉️ Comunicación Externa

Activado por: Enviar correos electrónicos, publicar en Slack o hacer llamadas a APIs externas. Riesgo: Los datos confidenciales podrían ser exfiltrados.

La Trifecta Letal

La "Trifecta Letal" ocurre cuando una sesión tiene las tres banderas activas:

Estado	Significado
✓ Datos Privados	La IA ha visto información confidencial.
✓ Contenido No Confiable	La IA puede haber recibido instrucciones maliciosas.
⏳ Comunicación Externa	La IA está intentando enviar datos externamente.

Protección: Edison Watch pausa automáticamente cualquier acción que complete esta trifecta, requiriendo tu aprobación manual para proceder.

Viendo Banderas en el Panel de Control

La vista de Sesiones utiliza puntos de colores para mostrar banderas activas:

🔵 Azul: Acceso a Datos Privados
🟡 Ámbar: Exposición a Contenido No Confiable
🔴 Rojo: Comunicación Externa

Banderas de seguridad en tabla de sesiones

Niveles de Riesgo

Bajo (verde): 0 banderas
Medio (ámbar): 1 bandera
Alto (rojo): 2+ banderas

Niveles ACL

Los Niveles de Control de Acceso (ACL) proporcionan protección adicional:

Nivel	Significado
PÚBLICO	Datos no sensibles.
PRIVADO	Datos internos/confidenciales.
SECRETO	Datos altamente sensibles.

Aplicación: Edison Watch bloquea automáticamente los flujos de datos de alto a bajo (ej., leer datos SECRETOS y luego publicar en un canal PÚBLICO). Estos bloqueos no piden aprobación - se previenen por defecto.

Para Administradores: Puedes clasificar herramientas y establecer niveles ACL en la configuración de Servidores.

Entendiendo las Banderas de Seguridad

On this page