Tous les travaux
Produits Oronts2024En cours

OGuardAI

Runtime de protection sémantique des données pour systèmes IA. Moteur de règles, détection de PII et tokenisation réversible entre votre application et n'importe quel LLM.

En bref

99.7%
Rappel de détection PII sur notre corpus de test
<50ms
Latence cible pour les contenus bloqués
3
Couches de validation : règles, PII, tokenisation
0
Valeurs PII brutes exposées au modèle après tokenisation

Le défi

Les systèmes LLM en production partagent une même classe d'échecs : des PII fuient dans les prompts et les sorties, des données hallucinées atteignent les clients, des textes générés violent les règles de communication. Les filtres ad hoc règlent un incident et cassent au cas limite suivant. Le RGPD en fait un problème d'architecture, pas de rustines.

Notre approche

OGuardAI s'exécute comme filtre synchrone dans le chemin requête-réponse du LLM. Trois couches de validation : classification des contenus contre des règles YAML rechargeables à chaud, détection de PII combinant pattern matching et reconnaissance d'entités nommées, et tokenisation sémantique qui remplace les valeurs sensibles par des tokens réversibles, si bien que le modèle ne voit jamais les données brutes. La restitution suit la politique de chaque canal de sortie.

Architecture système

Chargement du diagramme...

Architecture système: LLM Response, OGuardAI, Policy Check, Pass, Deliver to User, Violation, Content Classifier, PII Found?, Yes, Redact / Tokenize, No, Block + Reason, Upstream Retry

Décisions d'ingénierie

Un filtre synchrone dans le chemin requête et réponse

Les garde-fous ne fonctionnent que s'ils s'exécutent avant que le modèle voie les données et avant que la sortie atteigne un utilisateur. OGuardAI est en ligne plutôt qu'un audit a posteriori, acceptant un coût de latence faible et borné pour une application impossible à contourner.

Tokenisation réversible plutôt que caviardage brut

Le caviardage détruit le contexte dont un modèle a besoin pour bien répondre. OGuardAI remplace les valeurs sensibles par des tokens préservant la structure, donc le modèle raisonne sur un texte cohérent et ne voit jamais de données brutes. La restauration suit la politique par canal de sortie, ce qui fait du coffre de tokens l'actif à sécuriser.

Politiques YAML rechargeables à chaud

Les règles de communication et de données changent plus vite que les cycles de release. Les politiques sont en YAML rechargé sans redémarrage, donc l'exploitation peut durcir ou assouplir les règles en direct.

Correspondance de motifs et NER ensemble

Les expressions régulières attrapent les formats connus ; la reconnaissance d'entités nommées attrape la PII contextuelle qu'un motif manque. Les deux ensemble augmentent le rappel plutôt que de parier sur une seule technique.

Technologies

Backend
PythonFastAPIPydantic
Infrastructure
DockerGitHub Actions
IA / ML
Semantic TokenizationNERPolicy Engine

Résultats clés

  • Architecture IA respectueuse du RGPD par conception, pas par rustine
  • Règles YAML rechargeables à chaud, sans redémarrage ni déploiement
  • La tokenisation réversible préserve la qualité du LLM en protégeant les données
  • Le motif est documenté publiquement dans nos guides d'ingénierie

Le résultat

Une couche de garde-fous réutilisable et agnostique du framework, qui fait de l'IA conforme au RGPD une infrastructure plutôt qu'un pompier par projet. Produit propriétaire Oronts ; l'architecture est documentée dans notre guide sur les fuites de données.

À quoi ressemble un déploiement OGuardAI

OGuardAI s'insère dans la pile IA d'un client comme la couche entre l'application et n'importe quel fournisseur de modèle.

  • Il se place entre votre application et tout LLM, dans votre infrastructure
  • Vos règles de contenu et de données sont en YAML que vous contrôlez
  • L'hébergement UE ou privé garde les données dans votre tenancy ; le modèle ne voit jamais de PII brute
  • Les tokens réversibles préservent la qualité de sortie tout en protégeant les valeurs sensibles
  • Nous l'intégrons dans votre pipeline et livrons une couche que votre équipe exploite