Technical Guide

KI-Systeme & Agentische Architektur

Ein umfassender Leitfaden zum Aufbau von Unternehmens-KI-Systemen mit voller Kontrolle und Eigentum. Lerne über agentische Architektur, RAG-Systeme, Modellauswahl und wie du Vendor Lock-in vermeidest.

10. Juni 202510 Min. LesezeitOronts Engineering Team

Unsere Philosophie zu KI

Lass mich direkt sein: Die meisten KI-Implementierungen scheitern. Nicht weil die Technologie nicht funktioniert, sondern weil Unternehmen in KI stürzen, ohne zu verstehen, was sie bauen oder warum.

Wir haben es immer wieder gesehen. Ein Unternehmen will "KI", weil Wettbewerber sie haben. Sie melden sich bei einer SaaS-Plattform an, verbinden eine API und erklären es für erledigt. Sechs Monate später sind sie an einen Anbieter gebunden, zahlen steigende Gebühren, und ihre "KI-Lösung" ist nur ein glorifizierter Chatbot, der Kunden frustriert.

So arbeiten wir nicht.

Unsere Philosophie ist einfach: Du besitzt deine KI. Nicht in irgendeinem abstrakten Sinne, sondern buchstäblich. Die Modelle, die Daten, die Infrastruktur, den Code. Wenn wir KI-Systeme bauen, kannst du morgen alles nehmen und selbst betreiben, wenn du willst.

KI sollte eine Fähigkeit sein, die du besitzt, nicht ein Abonnement, das du mietest.

Das ist wichtiger als die meisten denken. KI wird zur Kerninfrastruktur. Das einem Anbieter zu überlassen ist wie dein gesamtes Engineering-Team auszulagern. Okay für Experimente, gefährlich für Produktion.

Was wir mit KI-Systemen meinen

Wenn wir von KI-Systemen sprechen, meinen wir keine Chatbots. Wir meinen intelligente Software, die tatsächlich Arbeit erledigt.

KI-TypWas sie tutBeispiel
Konversations-KIVerarbeitet natürlichsprachliche InteraktionenKundensupport, interne Assistenten
Agentische SystemeFührt mehrstufige Aufgaben autonom ausRecherche, Dokumentenverarbeitung, Workflow-Automatisierung
RAG-SystemeRuft ab und schlussfolgert über deine DatenWissensdatenbanken, Dokument-Q&A, Compliance-Prüfung
KlassifizierungKategorisiert und routet InformationenTicket-Routing, Content-Moderation, Lead-Scoring
ExtraktionZieht strukturierte Daten aus unstrukturierten QuellenRechnungsverarbeitung, Vertragsanalyse, Dateneingabe
GenerierungErstellt Inhalte nach deinen RichtlinienBerichte, Zusammenfassungen, Entwürfe, Übersetzungen

Die meisten Projekte kombinieren mehrere davon. Ein Kundensupport-System könnte Konversations-KI für die Schnittstelle, RAG für den Zugriff auf Produktwissen, Klassifizierung für Routing und Generierung für Antwortentwürfe nutzen.

Die Architektur, die wir bauen

Lass mich dir unsere typische KI-Architektur zeigen. Das ist nicht theoretisch—so läuft es in Produktion bei unseren Kunden.

Schicht 1: Modell-Orchestrierung

Oben sitzt die Orchestrierungsschicht. Das ist das Gehirn, das entscheidet, welche Modelle wann zu verwenden sind und wie ihre Ausgaben kombiniert werden.

interface ModelOrchestrator {
  // Anfragen an passende Modelle routen
  route(request: AIRequest): ModelSelection;

  // Mit Fallback-Kette ausführen
  execute(request: AIRequest): Promise<AIResponse>;

  // Multi-Modell-Antworten aggregieren
  aggregate(responses: AIResponse[]): AIResponse;
}

// Beispiel: Routing basierend auf Aufgabenkomplexität
const router = {
  route(request) {
    if (request.requiresReasoning) {
      return { primary: 'claude-opus', fallback: 'gpt-4o' };
    }
    if (request.isSimpleQuery) {
      return { primary: 'claude-haiku', fallback: 'gpt-4o-mini' };
    }
    return { primary: 'claude-sonnet', fallback: 'gpt-4o' };
  }
};

Warum Orchestrierung wichtig ist: Du bist nicht an ein Modell gebunden. Wenn ein besseres Modell kommt, wechselst du. Wenn sich Preise ändern, optimierst du. Bei einem Provider-Ausfall machst du Failover.

Schicht 2: Kontext-Management

KI ist nur so gut wie der Kontext, den du ihr gibst. Diese Schicht handhabt alles, was mit dem Aufbau dieses Kontexts zu tun hat.

Kurzzeit-Kontext: Die aktuelle Konversation, letzte Aktionen, unmittelbarer Aufgabenstatus.

Langzeit-Gedächtnis: Was das System über die Zeit gelernt hat. Benutzerpräferenzen, vergangene Interaktionen, angesammeltes Wissen.

Abgerufener Kontext: Informationen aus deinen Wissensdatenbanken, Datenbanken und Dokumenten via RAG.

Schicht 3: Tool-Integration

KI-Systeme müssen Dinge tun, nicht nur reden. Diese Schicht verbindet KI mit deinen tatsächlichen Geschäftssystemen.

Tool-KategorieBeispieleWarum es wichtig ist
DatenzugriffDatenbankabfragen, API-Aufrufe, DateilesenKI kann Fragen über echte Daten beantworten
AktionenE-Mails senden, Tickets erstellen, Datensätze aktualisierenKI kann Aufgaben tatsächlich abschließen
BerechnungKalkulationen, Code ausführen, Berichte generierenKI kann komplexe Analysen durchführen
Externe DiensteSuche, Zahlungen, Versand, KalenderKI kann mit der Außenwelt interagieren

Der Schlüssel ist Sandboxing. Jedes Tool hat explizite Berechtigungen. Die KI kann nur tun, was du autorisiert hast, nicht mehr.

Schicht 4: Evaluation & Monitoring

Du kannst nicht verbessern, was du nicht messen kannst. Diese Schicht verfolgt alles.

  • Qualitätsmetriken: Sind Antworten genau? Hilfreich? Markenkonform?
  • Performance-Metriken: Latenz, Durchsatz, Kosten pro Anfrage
  • Sicherheitsmetriken: Funktionieren die Leitplanken? Irgendwelche Richtlinienverstöße?
  • Geschäftsmetriken: Lösungsrate, Kundenzufriedenheit, eingesparte Zeit

RAG: Damit KI dein Geschäft kennt

Retrieval-Augmented Generation ist, wie wir KI tatsächlich nützlich für dein spezifisches Geschäft machen. Anstatt sich auf allgemeines Wissen zu verlassen, ruft die KI Informationen aus deinen Dokumenten, Datenbanken und Wissensdatenbanken ab, bevor sie antwortet.

Wie RAG funktioniert

1. Benutzer fragt: "Was ist unsere Rückgaberichtlinie für Enterprise-Kunden?"

2. System durchsucht deine Wissensdatenbank nach relevanten Dokumenten

3. Ruft ab: Enterprise-Vereinbarung v2.3, Rückgaberichtlinie, Support-SLA

4. KI liest diese Dokumente und generiert eine genaue Antwort

5. Antwort enthält Zitate, damit Benutzer verifizieren können

Effektives RAG bauen

Der Unterschied zwischen gutem und schlechtem RAG ist massiv. Hier ist, was wir gelernt haben:

Chunking-Strategie ist wichtig

Teile Dokumente nicht einfach bei beliebigen Zeichengrenzen. Teile semantisch—nach Abschnitt, Absatz oder logischer Einheit.

Hybride Suche gewinnt

Reine Vektorsuche verpasst exakte Treffer. Reine Schlüsselwortsuche verpasst semantische Ähnlichkeit. Nutze beides.

SuchtypGut fürSchlecht für
Vektor/SemantischKonzeptuelle Fragen, UmschreibungenExakte Namen, Zahlen, Codes
Schlüsselwort/BM25Spezifische Begriffe, Produktnamen, IDsKonzeptuelle Anfragen, Synonyme
HybridAllesEtwas komplexer zu implementieren

Modellauswahl: Keine einzige Antwort

Es gibt kein "bestes" KI-Modell. Es gibt das beste Modell für deine spezifische Aufgabe, Budget und Anforderungen.

ModellAm besten fürTrade-offs
Claude OpusKomplexes Reasoning, nuancierte AufgabenHöhere Kosten, langsamer
Claude SonnetAllzweck, gute BalanceMittelweg bei allem
Claude HaikuHohes Volumen, einfache AufgabenWeniger fähig bei komplexer Arbeit
GPT-4oStarke Alternative, gutes ÖkosystemAndere Stärken/Schwächen
Open Source (Llama, Mistral)Privatsphäre, Kostenkontrolle, AnpassungMehr operativer Overhead

Unser Ansatz: Design für Modellflexibilität. Das beste Modell von heute wird nicht das von morgen sein. Deine Architektur sollte Wechsel einfach machen.

Eigentum & Kein Lock-in

Lass mich erklären, was wir mit Eigentum konkret meinen.

Du besitzt den Code

Alles, was wir für dich bauen, gehört dir. Nicht an dich lizenziert, nicht über unsere Plattform zugänglich—tatsächlich deins. Git-Repository, komplette History, alle Dokumentation.

Du besitzt die Daten

Deine Trainingsdaten, deine Embeddings, deine Vektordatenbanken, deine Gesprächsprotokolle. Alles bleibt in deiner Infrastruktur oder wird am Projektende übergeben.

Du besitzt die Modelle

Wenn wir Modelle für dich finetunen, gehören diese finegetunten Gewichte dir. Du kannst sie auf deiner eigenen Infrastruktur betreiben.

Keine proprietären Abhängigkeiten

Wir bauen keine Systeme, die unsere proprietären Tools zum Laufen brauchen. Alles nutzt offene Standards, Open-Source-Tools und dokumentierte APIs.

Wo KI heute wirklich funktioniert

Lass uns ehrlich sein, was KI zuverlässig in Produktion kann und was nicht.

Hochvertrauenswürdige Anwendungen

AnwendungsfallWarum es funktioniertBeispiel-Auswirkung
Kundensupport Tier-1Gut definierter Umfang, einfach zu verifizieren40-60% Automatisierungsrate
Dokument-Q&ARAG macht es genau, Zitate verifizierenStunden→Minuten für Recherche
Content-EntwürfeMensch prüft vor Veröffentlichung3x schnellere Content-Produktion
Code-AssistenzEntwickler validiert Output20-30% Produktivitätssteigerung
DatenextraktionStrukturierter Output, einfach zu prüfen90% weniger manuelle Eingabe

Mit Vorsicht vorgehen

AnwendungsfallHerausforderungAbsicherung
Medizinische/Rechtliche BeratungHaftung, Genauigkeit kritischImmer menschliche Prüfung
FinanzentscheidungenHalluzinationsrisiko, hohe EinsätzeLeitplanken + menschliche Genehmigung
Autonome AktionenFehler schwer rückgängig zu machenErst nur Vorschläge

Loslegen mit uns

So engagieren wir uns typischerweise bei KI-Projekten:

Phase 1: Discovery (1-2 Wochen) Wir verstehen dein Geschäft, deine Daten, deine bestehenden Systeme. Wir identifizieren, wo KI wirklich helfen kann versus wo es nur Hype ist.

Phase 2: Proof of Concept (4-6 Wochen) Wir bauen einen funktionierenden Prototyp mit echten Daten. Du siehst tatsächliche Ergebnisse, keine Folien. Wir messen Performance und validieren den Ansatz.

Phase 3: Produktions-Build (8-16 Wochen) Vollständige Implementierung mit allen beschriebenen Schichten. Ordentliches Monitoring, Sicherheit und operatives Tooling.

Phase 4: Übergabe & Support Du besitzt alles. Wir schulen dein Team. Wir bieten Support nach Bedarf, aber du bist nie von uns abhängig.

Fazit

KI ist transformative Technologie, aber nur wenn du es richtig machst. Das bedeutet:

  • Für Eigentum bauen, nicht Abhängigkeit
  • Mit klaren Anwendungsfällen starten, nicht vager "KI-Strategie"
  • Alles messen und basierend auf Daten iterieren
  • Menschen bei wichtigen Entscheidungen einbeziehen
  • Von Tag eins für Modellflexibilität designen

Die Unternehmen, die mit KI gewinnen werden, sind nicht die, die sie zuerst einsetzen. Es sind die, die sie richtig einsetzen—mit Systemen, die sie besitzen, verstehen und weiterentwickeln können.

Wenn du über KI für deine Organisation nachdenkst, teilen wir gerne, was wir gelernt haben.

Topics covered

KI-Systemeagentische ArchitekturUnternehmens-KIRAGLLMKI-Eigentumkein Vendor Lock-inKI-InfrastrukturModell-Orchestrierung

Ready to implement agentic AI?

Our team specializes in building production-ready AI systems. Let's discuss how we can help you leverage agentic AI for your enterprise.

Start a conversation