Todos los trabajos
Productos Oronts2024En curso

OGuardAI

Runtime de protección semántica de datos para sistemas de IA. Motor de políticas, detección de PII y tokenización reversible entre su aplicación y cualquier LLM.

De un vistazo

99.7%
Recall de detección de PII en nuestro corpus de prueba
<50ms
Latencia objetivo para contenido bloqueado
3
Capas de validación: políticas, PII, tokenización
0
Valores PII en bruto expuestos al modelo tras la tokenización

El desafío

Los sistemas LLM en producción comparten una clase de fallos: PII que se filtra en prompts y salidas, datos alucinados que llegan a clientes y textos generados que violan políticas de comunicación. Los filtros ad hoc resuelven un incidente y se rompen en el siguiente caso límite. El RGPD lo convierte en un problema de arquitectura, no de parches.

Nuestro enfoque

OGuardAI corre como filtro síncrono en el camino de petición y respuesta del LLM. Tres capas de validación: clasificación de contenido contra reglas YAML recargables en caliente, detección de PII que combina pattern matching con reconocimiento de entidades nombradas, y tokenización semántica que sustituye valores sensibles por tokens reversibles, de modo que el modelo nunca ve datos en bruto. La restauración sigue la política de cada canal de salida.

Arquitectura del sistema

Cargando diagrama...

Arquitectura del sistema: LLM Response, OGuardAI, Policy Check, Pass, Deliver to User, Violation, Content Classifier, PII Found?, Yes, Redact / Tokenize, No, Block + Reason, Upstream Retry

Decisiones de ingeniería

Un filtro sincrónico en la ruta de petición y respuesta

Las barreras solo funcionan si se ejecutan antes de que el modelo vea los datos y antes de que la salida llegue al usuario. OGuardAI va en línea en lugar de ser una auditoría posterior, aceptando un coste de latencia pequeño y acotado por una aplicación que no se puede saltar.

Tokenización reversible en lugar de censura brusca

La censura destruye el contexto que un modelo necesita para responder bien. OGuardAI cambia los valores sensibles por tokens que preservan la estructura, así el modelo razona sobre texto coherente y nunca ve datos en crudo. La restauración sigue la política por canal de salida, lo que hace del almacén de tokens el activo a proteger.

Políticas YAML recargables en caliente

Las reglas de comunicación y datos cambian más rápido que los ciclos de release. Las políticas son YAML que recarga sin reinicio, así operaciones puede endurecer o relajar reglas en vivo.

Coincidencia de patrones y NER juntos

Las expresiones regulares detectan formatos conocidos; el reconocimiento de entidades detecta PII contextual que un patrón pierde. Ambos juntos elevan el recall en vez de apostar por una sola técnica.

Tecnologías

Backend
PythonFastAPIPydantic
Infraestructura
DockerGitHub Actions
IA / ML
Semantic TokenizationNERPolicy Engine

Resultados clave

  • Arquitectura de IA conforme al RGPD por diseño, no por parches
  • Políticas YAML recargables en caliente sin reinicios ni despliegues
  • La tokenización reversible mantiene la calidad del LLM protegiendo los datos
  • El patrón está documentado públicamente en nuestras guías de ingeniería

El resultado

Una capa de salvaguardas reutilizable y agnóstica al framework que convierte la IA consciente del RGPD en infraestructura en lugar de apagafuegos por proyecto. Producto propietario de Oronts; la arquitectura está documentada en nuestra guía de fugas de datos.

Cómo es un despliegue de OGuardAI

OGuardAI se inserta en el stack de IA de un cliente como la capa entre la aplicación y cualquier proveedor de modelos.

  • Se sitúa entre su aplicación y cualquier LLM, en su infraestructura
  • Sus reglas de contenido y datos viven como YAML que usted controla
  • El alojamiento en la UE o privado mantiene los datos en su tenancy; el modelo nunca ve PII en crudo
  • Los tokens reversibles preservan la calidad de salida y protegen los valores sensibles
  • Lo integramos en su pipeline y entregamos una capa que opera su equipo