Technical Guide

KI-Systeme & Agentische Architektur

Ein umfassender Leitfaden zum Aufbau von Unternehmens-KI-Systemen mit voller Kontrolle und Eigentum. Lerne über agentische Architektur, RAG-Systeme, Modellauswahl und wie du Vendor Lock-in vermeidest.

10. Juni 202510 Min. LesezeitOronts Engineering Team

Unsere Philosophie zu KI

Lass mich direkt sein: Die meisten KI-Implementierungen scheitern. Nicht weil die Technologie nicht funktioniert, sondern weil Unternehmen in KI stürzen, ohne zu verstehen, was sie bauen oder warum.

Wir haben es immer wieder gesehen. Ein Unternehmen will "KI", weil Wettbewerber sie haben. Sie melden sich bei einer SaaS-Plattform an, verbinden eine API und erklären es für erledigt. Sechs Monate später sind sie an einen Anbieter gebunden, zahlen steigende Gebühren, und ihre "KI-Lösung" ist nur ein glorifizierter Chatbot, der Kunden frustriert.

So arbeiten wir nicht.

Unsere Philosophie ist einfach: Du besitzt deine KI. Nicht in irgendeinem abstrakten Sinne, sondern buchstäblich. Die Modelle, die Daten, die Infrastruktur, den Code. Wenn wir KI-Systeme bauen, kannst du morgen alles nehmen und selbst betreiben, wenn du willst.

KI sollte eine Fähigkeit sein, die du besitzt, nicht ein Abonnement, das du mietest.

Das ist wichtiger als die meisten denken. KI wird zur Kerninfrastruktur. Das einem Anbieter zu überlassen ist wie dein gesamtes Engineering-Team auszulagern. Okay für Experimente, gefährlich für Produktion.

Was wir mit KI-Systemen meinen

Wenn wir von KI-Systemen sprechen, meinen wir keine Chatbots. Wir meinen intelligente Software, die tatsächlich Arbeit erledigt.

KI-Typ	Was sie tut	Beispiel
Konversations-KI	Verarbeitet natürlichsprachliche Interaktionen	Kundensupport, interne Assistenten
Agentische Systeme	Führt mehrstufige Aufgaben autonom aus	Recherche, Dokumentenverarbeitung, Workflow-Automatisierung
RAG-Systeme	Ruft ab und schlussfolgert über deine Daten	Wissensdatenbanken, Dokument-Q&A, Compliance-Prüfung
Klassifizierung	Kategorisiert und routet Informationen	Ticket-Routing, Content-Moderation, Lead-Scoring
Extraktion	Zieht strukturierte Daten aus unstrukturierten Quellen	Rechnungsverarbeitung, Vertragsanalyse, Dateneingabe
Generierung	Erstellt Inhalte nach deinen Richtlinien	Berichte, Zusammenfassungen, Entwürfe, Übersetzungen

Die meisten Projekte kombinieren mehrere davon. Ein Kundensupport-System könnte Konversations-KI für die Schnittstelle, RAG für den Zugriff auf Produktwissen, Klassifizierung für Routing und Generierung für Antwortentwürfe nutzen.

Die Architektur, die wir bauen

Lass mich dir unsere typische KI-Architektur zeigen. Das ist nicht theoretisch—so läuft es in Produktion bei unseren Kunden.

Schicht 1: Modell-Orchestrierung

Oben sitzt die Orchestrierungsschicht. Das ist das Gehirn, das entscheidet, welche Modelle wann zu verwenden sind und wie ihre Ausgaben kombiniert werden.

interface ModelOrchestrator {
  // Anfragen an passende Modelle routen
  route(request: AIRequest): ModelSelection;

  // Mit Fallback-Kette ausführen
  execute(request: AIRequest): Promise<AIResponse>;

  // Multi-Modell-Antworten aggregieren
  aggregate(responses: AIResponse[]): AIResponse;
}

// Beispiel: Routing basierend auf Aufgabenkomplexität
const router = {
  route(request) {
    if (request.requiresReasoning) {
      return { primary: 'claude-opus', fallback: 'gpt-4o' };
    }
    if (request.isSimpleQuery) {
      return { primary: 'claude-haiku', fallback: 'gpt-4o-mini' };
    }
    return { primary: 'claude-sonnet', fallback: 'gpt-4o' };
  }
};

Warum Orchestrierung wichtig ist: Du bist nicht an ein Modell gebunden. Wenn ein besseres Modell kommt, wechselst du. Wenn sich Preise ändern, optimierst du. Bei einem Provider-Ausfall machst du Failover.

Schicht 2: Kontext-Management

KI ist nur so gut wie der Kontext, den du ihr gibst. Diese Schicht handhabt alles, was mit dem Aufbau dieses Kontexts zu tun hat.

Kurzzeit-Kontext: Die aktuelle Konversation, letzte Aktionen, unmittelbarer Aufgabenstatus.

Langzeit-Gedächtnis: Was das System über die Zeit gelernt hat. Benutzerpräferenzen, vergangene Interaktionen, angesammeltes Wissen.

Abgerufener Kontext: Informationen aus deinen Wissensdatenbanken, Datenbanken und Dokumenten via RAG.

Schicht 3: Tool-Integration

KI-Systeme müssen Dinge tun, nicht nur reden. Diese Schicht verbindet KI mit deinen tatsächlichen Geschäftssystemen.

Tool-Kategorie	Beispiele	Warum es wichtig ist
Datenzugriff	Datenbankabfragen, API-Aufrufe, Dateilesen	KI kann Fragen über echte Daten beantworten
Aktionen	E-Mails senden, Tickets erstellen, Datensätze aktualisieren	KI kann Aufgaben tatsächlich abschließen
Berechnung	Kalkulationen, Code ausführen, Berichte generieren	KI kann komplexe Analysen durchführen
Externe Dienste	Suche, Zahlungen, Versand, Kalender	KI kann mit der Außenwelt interagieren

Der Schlüssel ist Sandboxing. Jedes Tool hat explizite Berechtigungen. Die KI kann nur tun, was du autorisiert hast, nicht mehr.

Schicht 4: Evaluation & Monitoring

Du kannst nicht verbessern, was du nicht messen kannst. Diese Schicht verfolgt alles.

Qualitätsmetriken: Sind Antworten genau? Hilfreich? Markenkonform?
Performance-Metriken: Latenz, Durchsatz, Kosten pro Anfrage
Sicherheitsmetriken: Funktionieren die Leitplanken? Irgendwelche Richtlinienverstöße?
Geschäftsmetriken: Lösungsrate, Kundenzufriedenheit, eingesparte Zeit

RAG: Damit KI dein Geschäft kennt

Retrieval-Augmented Generation ist, wie wir KI tatsächlich nützlich für dein spezifisches Geschäft machen. Anstatt sich auf allgemeines Wissen zu verlassen, ruft die KI Informationen aus deinen Dokumenten, Datenbanken und Wissensdatenbanken ab, bevor sie antwortet.

Wie RAG funktioniert

1. Benutzer fragt: "Was ist unsere Rückgaberichtlinie für Enterprise-Kunden?"

2. System durchsucht deine Wissensdatenbank nach relevanten Dokumenten

3. Ruft ab: Enterprise-Vereinbarung v2.3, Rückgaberichtlinie, Support-SLA

4. KI liest diese Dokumente und generiert eine genaue Antwort

5. Antwort enthält Zitate, damit Benutzer verifizieren können

Effektives RAG bauen

Der Unterschied zwischen gutem und schlechtem RAG ist massiv. Hier ist, was wir gelernt haben:

Chunking-Strategie ist wichtig

Teile Dokumente nicht einfach bei beliebigen Zeichengrenzen. Teile semantisch—nach Abschnitt, Absatz oder logischer Einheit.

Hybride Suche gewinnt

Reine Vektorsuche verpasst exakte Treffer. Reine Schlüsselwortsuche verpasst semantische Ähnlichkeit. Nutze beides.

Suchtyp	Gut für	Schlecht für
Vektor/Semantisch	Konzeptuelle Fragen, Umschreibungen	Exakte Namen, Zahlen, Codes
Schlüsselwort/BM25	Spezifische Begriffe, Produktnamen, IDs	Konzeptuelle Anfragen, Synonyme
Hybrid	Alles	Etwas komplexer zu implementieren

Modellauswahl: Keine einzige Antwort

Es gibt kein "bestes" KI-Modell. Es gibt das beste Modell für deine spezifische Aufgabe, Budget und Anforderungen.

Modell	Am besten für	Trade-offs
Claude Opus	Komplexes Reasoning, nuancierte Aufgaben	Höhere Kosten, langsamer
Claude Sonnet	Allzweck, gute Balance	Mittelweg bei allem
Claude Haiku	Hohes Volumen, einfache Aufgaben	Weniger fähig bei komplexer Arbeit
GPT-4o	Starke Alternative, gutes Ökosystem	Andere Stärken/Schwächen
Open Source (Llama, Mistral)	Privatsphäre, Kostenkontrolle, Anpassung	Mehr operativer Overhead

Unser Ansatz: Design für Modellflexibilität. Das beste Modell von heute wird nicht das von morgen sein. Deine Architektur sollte Wechsel einfach machen.

Eigentum & Kein Lock-in

Lass mich erklären, was wir mit Eigentum konkret meinen.

Du besitzt den Code

Alles, was wir für dich bauen, gehört dir. Nicht an dich lizenziert, nicht über unsere Plattform zugänglich—tatsächlich deins. Git-Repository, komplette History, alle Dokumentation.

Du besitzt die Daten

Deine Trainingsdaten, deine Embeddings, deine Vektordatenbanken, deine Gesprächsprotokolle. Alles bleibt in deiner Infrastruktur oder wird am Projektende übergeben.

Du besitzt die Modelle

Wenn wir Modelle für dich finetunen, gehören diese finegetunten Gewichte dir. Du kannst sie auf deiner eigenen Infrastruktur betreiben.

Keine proprietären Abhängigkeiten

Wir bauen keine Systeme, die unsere proprietären Tools zum Laufen brauchen. Alles nutzt offene Standards, Open-Source-Tools und dokumentierte APIs.

Wo KI heute wirklich funktioniert

Lass uns ehrlich sein, was KI zuverlässig in Produktion kann und was nicht.

Hochvertrauenswürdige Anwendungen

Anwendungsfall	Warum es funktioniert	Beispiel-Auswirkung
Kundensupport Tier-1	Gut definierter Umfang, einfach zu verifizieren	40-60% Automatisierungsrate
Dokument-Q&A	RAG macht es genau, Zitate verifizieren	Stunden→Minuten für Recherche
Content-Entwürfe	Mensch prüft vor Veröffentlichung	3x schnellere Content-Produktion
Code-Assistenz	Entwickler validiert Output	20-30% Produktivitätssteigerung
Datenextraktion	Strukturierter Output, einfach zu prüfen	90% weniger manuelle Eingabe

Mit Vorsicht vorgehen

Anwendungsfall	Herausforderung	Absicherung
Medizinische/Rechtliche Beratung	Haftung, Genauigkeit kritisch	Immer menschliche Prüfung
Finanzentscheidungen	Halluzinationsrisiko, hohe Einsätze	Leitplanken + menschliche Genehmigung
Autonome Aktionen	Fehler schwer rückgängig zu machen	Erst nur Vorschläge

Loslegen mit uns

So engagieren wir uns typischerweise bei KI-Projekten:

Phase 1: Discovery (1-2 Wochen) Wir verstehen dein Geschäft, deine Daten, deine bestehenden Systeme. Wir identifizieren, wo KI wirklich helfen kann versus wo es nur Hype ist.

Phase 2: Proof of Concept (4-6 Wochen) Wir bauen einen funktionierenden Prototyp mit echten Daten. Du siehst tatsächliche Ergebnisse, keine Folien. Wir messen Performance und validieren den Ansatz.

Phase 3: Produktions-Build (8-16 Wochen) Vollständige Implementierung mit allen beschriebenen Schichten. Ordentliches Monitoring, Sicherheit und operatives Tooling.

Phase 4: Übergabe & Support Du besitzt alles. Wir schulen dein Team. Wir bieten Support nach Bedarf, aber du bist nie von uns abhängig.

Fazit

KI ist transformative Technologie, aber nur wenn du es richtig machst. Das bedeutet:

Für Eigentum bauen, nicht Abhängigkeit
Mit klaren Anwendungsfällen starten, nicht vager "KI-Strategie"
Alles messen und basierend auf Daten iterieren
Menschen bei wichtigen Entscheidungen einbeziehen
Von Tag eins für Modellflexibilität designen

Die Unternehmen, die mit KI gewinnen werden, sind nicht die, die sie zuerst einsetzen. Es sind die, die sie richtig einsetzen—mit Systemen, die sie besitzen, verstehen und weiterentwickeln können.

Wenn du über KI für deine Organisation nachdenkst, teilen wir gerne, was wir gelernt haben.

Topics covered

KI-Systemeagentische ArchitekturUnternehmens-KIRAGLLMKI-Eigentumkein Vendor Lock-inKI-InfrastrukturModell-Orchestrierung

Ready to implement agentic AI?

Our team specializes in building production-ready AI systems. Let's discuss how we can help you leverage agentic AI for your enterprise.

Start a conversation