كل الأعمال
منتجات أورونتس2024مستمر

OGuardAI

بيئة حماية دلالية للبيانات في أنظمة الذكاء الاصطناعي. محرك سياسات، واكتشاف بيانات شخصية، وترميز قابل للعكس بين تطبيقك وأي نموذج لغوي.

لمحة سريعة

99.7%
استدعاء اكتشاف البيانات الشخصية على مجموعة اختبارنا
<50ms
هدف زمن الاستجابة للمحتوى المحظور
3
طبقات التحقق: السياسات، البيانات الشخصية، الترميز
0
قيم شخصية خام معروضة للنموذج بعد الترميز

التحدي

تتشارك أنظمة النماذج اللغوية في الإنتاج فئة أعطال واحدة: بيانات شخصية تتسرب إلى المدخلات والمخرجات، وبيانات مهلوسة تصل إلى العملاء، ونصوص مولّدة تخالف سياسات التواصل. الفلاتر المؤقتة تحل حادثة وتنكسر عند الحالة التالية. واللائحة الأوروبية لحماية البيانات تجعلها مشكلة معمارية لا مشكلة ترقيع.

نهجنا

يعمل OGuardAI كمرشّح متزامن في مسار الطلب والاستجابة للنموذج اللغوي. ثلاث طبقات تحقق: تصنيف المحتوى وفق قواعد YAML قابلة لإعادة التحميل الفوري، واكتشاف البيانات الشخصية بدمج مطابقة الأنماط مع التعرف على الكيانات المسماة، وترميز دلالي يستبدل القيم الحساسة برموز قابلة للعكس بحيث لا يرى النموذج البيانات الخام أبداً. وتجري الاستعادة وفق سياسة كل قناة إخراج.

بنية النظام

جاري تحميل الرسم البياني...

بنية النظام: LLM Response, OGuardAI, Policy Check, Pass, Deliver to User, Violation, Content Classifier, PII Found?, Yes, Redact / Tokenize, No, Block + Reason, Upstream Retry

قرارات هندسية

مرشّح متزامن في مسار الطلب والاستجابة

لا تعمل حواجز الأمان إلا إذا جرت قبل أن يرى النموذج البيانات وقبل أن تصل المخرجات إلى المستخدم. يجلس OGuardAI ضمن المسار لا كتدقيق لاحق، متقبّلًا كلفة زمن انتقال صغيرة ومحدودة مقابل فرضٍ لا يمكن تخطّيه.

ترميز قابل للعكس بدل الحجب الفظّ

يدمّر الحجب السياق الذي يحتاجه النموذج ليجيب جيّدًا. يستبدل OGuardAI القيم الحسّاسة برموز تحافظ على البنية، فيعمل النموذج على نصّ متماسك ولا يرى بيانات خام أبدًا. تتمّ الاستعادة وفق سياسة كل قناة إخراج، ما يجعل خزينة الرموز هي الأصل الواجب تأمينه.

سياسات YAML قابلة لإعادة التحميل الفوري

تتغيّر قواعد التواصل والبيانات أسرع من دورات الإصدار. السياسات بصيغة YAML تُعاد تحميلها دون إعادة تشغيل، فيمكن للتشغيل تشديد القواعد أو تخفيفها مباشرةً.

مطابقة الأنماط وNER معًا

تلتقط التعابير النمطية الصيغ المعروفة؛ ويلتقط التعرّف على الكيانات المسمّاة البيانات الشخصية السياقية التي يفوتها النمط. معًا يرفعان الاستدعاء بدل المراهنة على تقنية واحدة.

التقنيات

الخلفية
PythonFastAPIPydantic
البنية التحتية
DockerGitHub Actions
الذكاء الاصطناعي
Semantic TokenizationNERPolicy Engine

النتائج الرئيسية

  • معمارية ذكاء اصطناعي تراعي حماية البيانات بالتصميم لا بالترقيع
  • سياسات YAML قابلة للتحميل الفوري دون إعادة تشغيل أو نشر
  • الترميز القابل للعكس يحفظ جودة المخرجات ويحمي البيانات
  • النمط موثق علناً في أدلتنا الهندسية

النتيجة

طبقة حماية قابلة لإعادة الاستخدام ومستقلة عن الإطار، تحوّل الذكاء الاصطناعي المراعي للائحة حماية البيانات من إطفاء حرائق لكل مشروع إلى بنية تحتية. منتج مملوك لأورونتس؛ والمعمارية موثقة في دليلنا عن تسرب البيانات.

كيف يبدو نشر OGuardAI

يندمج OGuardAI في منظومة الذكاء الاصطناعي لدى العميل كطبقة بين التطبيق وأي مزوّد نماذج.

  • يجلس بين تطبيقك وأي نموذج لغوي، داخل بنيتك التحتية
  • قواعد المحتوى والبيانات لديك بصيغة YAML تتحكّم بها
  • الاستضافة في الاتحاد الأوروبي أو الخاصة تُبقي البيانات ضمن نطاقك؛ ولا يرى النموذج بيانات خام
  • الرموز القابلة للعكس تحافظ على جودة المخرجات وتحمي القيم الحسّاسة
  • نُدمجه في خطّك ونسلّم طبقة يشغّلها فريقك