Comprendiendo los Indicadores de Seguridad

Edison Watch usa tres indicadores para rastrear el riesgo en sesiones de IA.

Indicadores de Seguridad

📘 Acceso a Datos Privados

Activado por: Leer archivos, consultar bases de datos o acceder a documentos internos. Riesgo: Información sensible podría quedar expuesta.

🌐 Exposición a Contenido No Confiable

Activado por: Obtener páginas web o llamar a APIs externas. Riesgo: La IA podría recibir instrucciones maliciosas (inyección de prompts).

✉️ Comunicación Externa

Activado por: Enviar correos, publicar en Slack o realizar llamadas a APIs externas. Riesgo: Datos confidenciales podrían ser exfiltrados.

El Lethal Trifecta

El "Lethal Trifecta" ocurre cuando una sesión tiene los tres indicadores activos:

Estado	Significado
✓ Datos Privados	La IA ha visto información confidencial.
✓ Contenido No Confiable	La IA puede haber recibido instrucciones maliciosas.
⏳ Comunicación Externa	La IA está intentando enviar datos al exterior.

Protección: Edison Watch pausa automáticamente cualquier acción que complete este trifecta, requiriendo tu aprobación manual para continuar.

Visualizando los Indicadores en el Panel

La vista Sessions usa puntos de color para mostrar los indicadores activos:

🔵 Azul: Acceso a Datos Privados
🟡 Ámbar: Exposición a Contenido No Confiable
🔴 Rojo: Comunicación Externa

Indicadores de seguridad en la tabla de sesiones

Niveles de Riesgo

Bajo (verde): 0 indicadores
Medio (ámbar): 1 indicador
Alto (rojo): 2+ indicadores

Niveles ACL

Los Access Control Levels (ACL) proporcionan protección adicional:

Nivel	Significado
PUBLIC	Datos no sensibles.
PRIVATE	Datos internos/confidenciales.
SECRET	Datos altamente sensibles.

Aplicación: Edison Watch bloquea automáticamente flujos de datos de mayor a menor sensibilidad (por ejemplo, leer datos SECRET y luego publicarlos en un canal PUBLIC). Estos bloqueos no solicitan aprobación: se previenen por defecto.

Para Administradores: Puedes clasificar herramientas y establecer niveles ACL desde la página Access Control y mediante Policy Rules.

Comprendiendo los Indicadores de Seguridad

On this page