Edison Watch

Comprendiendo los Indicadores de Seguridad

Aprende sobre los indicadores de seguridad y el Lethal Trifecta.

Edison Watch usa tres indicadores para rastrear el riesgo en sesiones de IA.

Indicadores de Seguridad

📘 Acceso a Datos Privados

Activado por: Leer archivos, consultar bases de datos o acceder a documentos internos. Riesgo: Información sensible podría quedar expuesta.

🌐 Exposición a Contenido No Confiable

Activado por: Obtener páginas web o llamar a APIs externas. Riesgo: La IA podría recibir instrucciones maliciosas (inyección de prompts).

✉️ Comunicación Externa

Activado por: Enviar correos, publicar en Slack o realizar llamadas a APIs externas. Riesgo: Datos confidenciales podrían ser exfiltrados.

El Lethal Trifecta

El "Lethal Trifecta" ocurre cuando una sesión tiene los tres indicadores activos:

EstadoSignificado
✓ Datos PrivadosLa IA ha visto información confidencial.
✓ Contenido No ConfiableLa IA puede haber recibido instrucciones maliciosas.
⏳ Comunicación ExternaLa IA está intentando enviar datos al exterior.

Protección: Edison Watch pausa automáticamente cualquier acción que complete este trifecta, requiriendo tu aprobación manual para continuar.

Visualizando los Indicadores en el Panel

La vista Sessions usa puntos de color para mostrar los indicadores activos:

  • 🔵 Azul: Acceso a Datos Privados
  • 🟡 Ámbar: Exposición a Contenido No Confiable
  • 🔴 Rojo: Comunicación Externa
Indicadores de seguridad en la tabla de sesiones

Niveles de Riesgo

  • Bajo (verde): 0 indicadores
  • Medio (ámbar): 1 indicador
  • Alto (rojo): 2+ indicadores

Niveles ACL

Los Access Control Levels (ACL) proporcionan protección adicional:

NivelSignificado
PUBLICDatos no sensibles.
PRIVATEDatos internos/confidenciales.
SECRETDatos altamente sensibles.

Aplicación: Edison Watch bloquea automáticamente flujos de datos de mayor a menor sensibilidad (por ejemplo, leer datos SECRET y luego publicarlos en un canal PUBLIC). Estos bloqueos no solicitan aprobación: se previenen por defecto.


Para Administradores: Puedes clasificar herramientas y establecer niveles ACL desde la página Access Control y mediante Policy Rules.

On this page