KI-Agenten, die echte Aktionen ausführen, unter Ihrer Aufsicht
Ein Agent ist die richtige Wahl, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen, Werkzeuge und Kontext braucht. Wenn ein Skript, ein Workflow oder ein einzelner Prompt die Aufgabe erledigt, sagen wir Ihnen das stattdessen.
Oronts konzipiert, baut und betreibt agentische KI-Systeme aus München: Agenten, die Werkzeuge und APIs aufrufen, den richtigen Kontext abrufen und Aktionen mit einem Menschen in der Schleife ausführen, wo es das Risiko verlangt. Aufgebaut auf offenen Frameworks wie Mastra, LangGraph, CrewAI und dem Vercel AI SDK, mit Modellen von OpenAI und Anthropic, sodass Ihnen das System gehört und Sie es in Ihrer eigenen Infrastruktur betreiben können.
Wählen Sie ein agentisches KI-System, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen braucht: Kontext lesen, entscheiden was zu tun ist, Werkzeuge oder APIs aufrufen und auf das Ergebnis reagieren, statt einem festen Pfad zu folgen. Ein Agent passt, wenn die Arbeit für einen deterministischen Workflow zu variabel, aber zu wiederkehrend und verstanden ist, um sie weiter von Hand zu erledigen: Triage und Routing, Retrieval über Ihre eigenen Dokumente, Entwerfen und Prüfen, mehrstufige Recherche und Abläufe, die mehrere Systeme berühren. Wir bauen diese auf offenen Frameworks, Mastra, LangGraph, CrewAI und dem Vercel AI SDK, mit Modellen von OpenAI und Anthropic hinter einer anbieterunabhangigen Schicht, sodass Sie nie an einen einzelnen Anbieter gebunden sind. Der Kompromiss: Agenten sind probabilistisch, daher brauchen sie Leitplanken, Evaluation und einen Menschen in der Schleife überall dort, wo eine Aktion riskant oder schwer umkehrbar ist. Wo ein deterministisches Skript, ein n8n-Workflow oder ein einzelner Prompt den Bedarf deckt, sagen wir das im ersten Gespräch klar. Der Beleg, auf den wir verweisen, ist unser eigener Assistent, der auf dieser Website im Produktivbetrieb läuft, gebaut auf Mastra.
Agenten, die Werkzeuge und APIs nutzen, Kontext abrufen und echte Aktionen ausführen, nicht nur chatten
Aufgebaut auf offenen Frameworks: Mastra, LangGraph, CrewAI und dem Vercel AI SDK
Anbieterunabhangig über OpenAI und Anthropic, sodass Sie nicht an einen Modellanbieter gebunden sind
Mensch in der Schleife und Leitplanken überall dort, wo eine Aktion riskant oder schwer umkehrbar ist
BelegevorVersprechen
Läuft auf dieser Website, im Produktivbetrieb
Live
Der Assistent auf dieser Website ist ein agentisches System, das wir auf Mastra gebaut haben und das im Produktivbetrieb läuft. Es ist keine Demo hinter einem Login: Es ist dieselbe Art von werkzeugnutzendem, kontextabrufendem Agenten, den wir für Kunden bauen, und Sie können ihn hier nutzen, bevor Sie mit uns sprechen.
Unsere Agenten rufen Werkzeuge und APIs auf und führen Aktionen aus, aber die riskanten laufen mit einem Menschen in der Schleife. Wir legen fest, wo ein Agent eigenständig handelt und wo er einen Vorschlag macht und auf Bestätigung wartet, sodass eine unumkehrbare Aktion nie stillschweigend geschieht.
Framework-unabhangiges Engineering
Fähigkeit
Wir bauen auf offenen Frameworks, Mastra, LangGraph, CrewAI und dem Vercel AI SDK, und halten den Modellanbieter hinter einer Schicht, OpenAI oder Anthropic. Die Agenten-Logik gehört Ihnen, in Ihrem Repository, sodass eine Framework- oder Modellwahl nie eine Einbahnstraße ist.
EU-Datenhandhabung
Fähigkeit
Wir gestalten den Datenfluss so, dass Sie steuern, wohin Kontext und Prompts gehen und welcher Modellanbieter was sieht. Wo personenbezogene Daten beteiligt sind, arbeiten wir DSGVO-bewusst, schließen einen Auftragsverarbeitungsvertrag und halten Retrieval und Speicherung in einer Infrastruktur, die Sie betreiben, wenn der Fall es verlangt.
Multi-Agenten-Orchestrierung
Ein Koordinator plant die Arbeit und verteilt sie an spezialisierte Agenten, mit expliziten Übergaben, gemeinsamem Speicher und klar begrenzten Werkzeugen.
Übergaben sind explizit und nachvollziehbar, der gemeinsame Speicher trägt den Zustand über alle Agenten hinweg, und ein Freigabeschritt durch einen Menschen sichert folgenreiche Aktionen ab.
WaswirmitagentischerKItun
Agenten-Design und Scoping
Wir definieren, was der Agent tun soll, wo er eigenständig handelt und wo ein Mensch freigibt. Das Ergebnis ist ein abgestecktes Design: die Aufgabengrenze, die Werkzeuge, der benotigte Kontext und die Punkte, an denen er innehalten und nachfragen muss, bevor der Bau beginnt.
Werkzeug- und API-Integration
Agenten sind nur nutzlich, wenn sie handeln können. Wir verbinden sie über saubere, typisierte Werkzeuge und APIs mit Ihren Systemen, mit Idempotenz und Fehlerbehandlung, sodass ein Werkzeugaufruf sicher wiederholbar und ein Fehler sichtbar statt stillschweigend ist.
RAG und Retrieval
Wir bauen Retrieval über Ihre eigenen Dokumente und Daten, sodass der Agent aus Ihrem Wissen antwortet, nicht aus seinem Training. Chunking, Embeddings und ein Vector Store, verdrahtet mit dem Agenten, mit Quellenangaben zurück zur Quelle, sodass eine Antwort geprüft werden kann.
Mensch in der Schleife und Leitplanken
Wir gestalten die Grenze zwischen dem, was ein Agent eigenständig tut, und dem, was er zur Bestätigung vorschlägt, dazu Leitplanken für Ein- und Ausgabe, Raten- und Kostengrenzen und einen klaren Audit-Trail, sodass das System innerhalb der von Ihnen gesetzten Linien bleibt.
Evaluation und Observability
Wir bauen Evaluationen, die messen, ob der Agent die Aufgabe erfüllt, sowie Tracing und Logging, sodass Sie jeden Schritt, Werkzeugaufruf und jede Entscheidung im Produktivbetrieb sehen. Ohne Evals ist ein Agent eine Blackbox, daher behandeln wir sie als Teil des Baus, nicht als nachträglichen Gedanken.
Produktivhärtung
Wir bringen einen Agenten von einem funktionierenden Prototyp zu etwas, das Sie betreiben können: Kostenkontrollen, Wiederholungen und Fallbacks über Modellanbieter, Prompt- und Ausgabevalidierung, Monitoring und ein Deployment, das Ihre Ingenieure ohne uns in der Schleife betreiben können.
EntwickeltfürIhrTeam
Agenten agieren auf Ihren Systemen, daher beurteilen alle Beteiligten diese unterschiedlich.
CTOs und IT-Führungskräfte
Sie möchten Agenten betreiben und ändern können, nicht eine Black-Box-Plattform.
Modell-neutrale Agenten auf offenen Frameworks, Ihr Code, EU-gehostet, kein Lock-in.
Unternehmensebene und Procurement
Agenten, die auf Systemen agieren, benötigen Governance und Audit.
Human-in-the-Loop-Genehmigung, Audit-Logging und Guardrails, DSGVO und TOM-Bereitschaft.
Startup-CTOs und Gründer
Sie benötigen einen funktionierenden Agenten, kein Forschungsprojekt.
Ein abgegrenzter Agent in einem 90-Tage-Pilot, dann skaliert.
Agenturen und Partner
Ihr Kunde benötigt Senior-Agentic-Arbeit unter Ihrer Marke.
White-Label-Agenten-Engineering, derselbe Stack hinter unserer öffentlichen Arbeit.
WiewireinagentischesSystemliefern
Vom Anwendungsfall-Fit bis zum gestarteten, eigenen Agenten: abgesteckt, mit Evaluationen gebaut, mit einem Menschen in der Schleife geprüft, gehärtet und betrieben, von Senior-Ingenieuren, mit dem Code und der Roadmap in Ihren Handen.
01
Anwendungsfall abstecken
Wir legen die Aufgabe fest, die Eingaben, die Aktionen, die der Agent ausführen darf, und die Kosten, wenn eine davon falsch läuft. Wir bestätigen, dass ein Agent hier das richtige Werkzeug ist, und wenn ein Workflow oder ein einzelner Prompt die Aufgabe erledigt, sagen wir das vor der Zusage.
Aufgabengrenze
Aktions- und Risikokarte
Fit-Prüfung
02
Agent und Werkzeuge entwerfen
Wir entwerfen den Agenten: das Framework, den Modellanbieter, die Werkzeuge und APIs, die er aufruft, den Kontext und das Retrieval, das er braucht, und die Punkte, an denen ein Mensch freigeben muss. Das Design ist vor dem Code prüfbar, nicht erst während des Codes entdeckt.
Framework und Modell
Werkzeuge und Retrieval
Aufsichtspunkte
03
Mit Evaluationen bauen
Wir bauen den Agenten und seine Evaluationen gemeinsam. Evals messen, ob er die Aufgabe in den Fallen erfüllt, die zahlen, sodass eine Änderung, die einen Pfad verbessert und einen anderen bricht, vor dem Produktivbetrieb sichtbar wird statt danach.
Agent und Werkzeuge
Eval-Suite
Testfalle
04
Prüfung mit Mensch in der Schleife
Wir verdrahten die Bestätigungspunkte: wo der Agent vorschlägt und wartet, was ein Prüfer sieht und wie eine Aktion freigegeben, bearbeitet oder abgelehnt wird. Riskante und unumkehrbare Aktionen laufen nie, ohne dass ein Mensch entscheidet.
Bestätigungsablauf
Prüfer-Ansicht
Audit-Trail
05
Härten und beobachten
Wir fügen die Produktivteile hinzu: Kosten- und Ratengrenzen, Wiederholungen und Anbieter-Fallbacks, Leitplanken für Ein- und Ausgabe und Tracing, sodass jeder Schritt und Werkzeugaufruf sichtbar ist. Der Agent hört auf, eine Blackbox zu sein, und wird ein System, das Sie betreiben können.
Leitplanken und Grenzen
Tracing und Logs
Anbieter-Fallbacks
06
Im Produktivbetrieb betreiben
Wir deployen den Agenten in Ihre Infrastruktur und übergeben den Code, die Evals und ein Runbook, sodass Sie ihn ohne uns in der Schleife betreiben. Ein optionaler Retainer deckt Wartung, Evals, Modell-Updates und Bereitschaft bis zu einem vereinbarten SLA-Ziel.
Deployment
Runbook und Evals
Optionaler Retainer
WanneinAgentpasstundwannnicht
Ein agentisches System bringt Macht und Komplexität zugleich. Vier Fragen entscheiden, ob es das richtige Werkzeug für Ihren Fall ist.
Wann Agenten passen
Agenten verdienen ihre Komplexität, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen braucht: Kontext lesen, wählen, welches Werkzeug aufgerufen wird, und auf das Ergebnis reagieren, wo der Pfad für einen festen Workflow zu variabel ist. Ist die Aufgabe eine feste Schrittfolge, ist ein deterministischer Workflow oder ein Skript einfacher, günstiger und vorhersehbarer, und wir empfehlen das stattdessen.
Aufsicht und Sicherheit
Agenten sind probabilistisch, daher läuft eine riskante oder schwer umkehrbare Aktion mit einem Menschen in der Schleife: Der Agent schlägt vor, ein Mensch bestätigt. Wir gestalten diese Grenze ausdrücklich, fügen Leitplanken für Ein- und Ausgabe hinzu und halten einen Audit-Trail, sodass das System autonom ist, wo es sicher ist, und beaufsichtigt, wo nicht.
Daten und EU-Hosting
Sie steuern, wohin Kontext und Prompts gehen und welcher Modellanbieter was sieht. Wir halten Retrieval und Speicherung in einer Infrastruktur, die Sie betreiben, wo der Fall es verlangt, schließen einen Auftragsverarbeitungsvertrag und gestalten DSGVO-bewusste Datenflüsse, wo personenbezogene Daten beteiligt sind. Modellaufrufe an OpenAI oder Anthropic sind auf das beschränkt, was die Aufgabe braucht.
Eigentum
Die Agenten-Logik, die Werkzeuge, die Evals und die Prompts gehören Ihnen, in Ihrem Repository, gebaut auf offenen Frameworks mit dem Modellanbieter hinter einer Schicht. Es gibt keine Oronts-Lizenzsperre für Betrieb oder Änderung, und jedes kompetente Engineering-Team kann es übernehmen, sodass die Framework- und Anbieterwahl nie eine Einbahnstraße ist.
Dasselbe Ziel verlangt sehr unterschiedliche Werkzeuge, je nachdem, wie variabel die Aufgabe ist und wie viel Urteilsvermögen sie braucht. Hier endet ein einzelner Prompt, hier endet ein fester Workflow, und hier verdient ein agentisches System seine zusätzliche Komplexität.
Seitwarts scrollen, um alle drei Spalten zu vergleichen.
Einzelner Prompt
Workflow-Automatisierung
Agentisch + Oronts
Bewältigt variable, mehrstufige Aufgaben, die kein fester Pfad sind
Ruft Werkzeuge und APIs auf und führt echte Aktionen aus
Entscheidet anhand des Kontexts, welches Werkzeug zu nutzen ist
Ruft Kontext aus Ihren eigenen Dokumenten und Daten ab
Mensch in der Schleife bei riskanten Aktionen
Evaluation und Tracing für den Produktivbetrieb eingebaut
Deterministische und vollständig vorhersehbare Ausgabe
Senior-Engineering-Team dahinter
Ein Haken bedeutet, es passt ab Werk gut zum Fall. Ein Minus bedeutet teilweise oder mit Aufwand. Textzellen sagen, was es tatsächlich braucht. Ein deterministischer Workflow bleibt die bessere Wahl, wo der Pfad fest ist und volle Vorhersehbarkeit wichtiger als Urteilsvermögen ist.
WoeinAgentseinenPlatzverdient
Konkrete Situationen, in denen Urteilsvermögen über mehrere Schritte ein festes Skript schlägt, und das Ergebnis, das der Agent zusammen mit unserem Engineering liefert.
Commerce
Ein Käufer beschreibt seinen Bedarf in eigenen Worten, während Katalog, Bestand und Preise über mehrere Systeme verteilt liegen
Ein agentischer Checkout-Assistent, der über typisierte Werkzeuge die passenden Produkte findet, Verfügbarkeit und Preis prüft und die Bestellung zur Bestätigung durch einen Menschen vorschlägt, bevor sie verbindlich wird.
Operations
Routinearbeit im Back-Office erstreckt sich über E-Mail, ERP und interne Werkzeuge, mit genug Varianz, dass ein fester Workflow immer wieder bricht
Ein Operations-Agent, der den Fall liest, entscheidet, welches Werkzeug er aufruft, und innerhalb gesetzter Grenzen handelt, mit Eskalation an einen Menschen, sobald ein Schritt heikel oder schwer rückgängig zu machen ist.
Support
Anfragen kommen gemischt in Sprache und Anliegen herein, und die Antworten hängen von Ihren eigenen Dokumenten ab, nicht von Allgemeinwissen
Ein Support-Triage-Agent, der jede Anfrage klassifiziert und weiterleitet, eine fundierte Antwort mit Quellenverweisen entwirft und die sensiblen Fälle mit vollem Kontext an einen Menschen übergibt.
VomeinzelnenPromptzumkontrolliertenAgenten
Die meisten Teams brauchen am ersten Tag keinen Agenten. Wir führen Sie nur so weit die Leiter hinauf, wie die Aufgabe es verlangt, und sagen klar, wenn ein günstigerer Schritt den Bedarf bereits deckt. Jede Stufe ist ein funktionierendes System, das Ihnen gehört, kein Wegwerfstück.
1
Einzelner Prompt
Wir beginnen mit einem gut formulierten Modellaufruf, wenn ein einzelner Prompt mit guten Anweisungen die Aufgabe erledigt. Das ist die günstigste, am besten vorhersehbare Option, und für viele Aufgaben ist es der richtige Punkt zum Aufhören. Wir sagen Ihnen, wenn es ausreicht.
2
Deterministischer Workflow
Wenn die Aufgabe eine feste Abfolge von Schritten ist, verdrahten wir einen deterministischen Workflow oder einen n8n-Flow, der Werkzeuge in bekannter Reihenfolge aufruft. Vollständig vorhersehbar, leicht nachvollziehbar und ohne Modellurteil, wo keines nötig ist.
3
Retrieval und Fundierung
Wenn Antworten von Ihren eigenen Dokumenten abhängen, ergänzen wir Retrieval über Ihre Daten mit Quellenverweisen, sodass die Ausgabe in Ihrem Wissen verankert und überprüfbar ist, statt blind vertraut zu werden.
4
Kontrollierter Agent
Wenn die Arbeit wirklich Urteilsvermögen über mehrere Schritte braucht, heben wir sie zu einem Agenten an, der entscheidet, welches Werkzeug er aufruft, mit Leitplanken, Kosten- und Ratengrenzen, Evaluierungen und einem Menschen in der Schleife bei jeder heiklen Aktion.
5
Produktion und Eigentum
Wir härten das System mit Tracing, Anbieter-Fallbacks und einem Runbook und übergeben dann den Code und die Evals, sodass Sie es in Ihrer eigenen Infrastruktur betreiben. Ein optionaler Retainer deckt Wartung und Modellaktualisierungen bis zu einem vereinbarten SLA-Ziel ab.
WerwasbeieinemAgenten-Buildverantwortet
Wie sich die Verantwortung zwischen Oronts, Ihrem Team und den Modell- und Cloud-Anbietern bei einer agentischen Umsetzung aufteilt.
Verantwortlichkeiten entlang der Lieferkette
Verantwortung
Oronts
Ihre Agentur / Ihr Partner
Sie
Modell- / Cloud-Anbieter
Agentendesign und Orchestrierung
Oronts verantwortet Agentendesign und Orchestrierung
–
–
–
Evaluierungen und Test-Harness
Oronts verantwortet Evaluierungen und Test-Harness
–
–
–
Guardrails und Freigabe-Gates
Oronts verantwortet Guardrails und Freigabe-Gates
–
Sie verantwortet Guardrails und Freigabe-Gates
–
Prompts, Richtlinien und Geschäftsregeln
–
–
Sie verantwortet Prompts, Richtlinien und Geschäftsregeln
–
Hosting, Daten und Modell-Keys
–
–
Sie verantwortet Hosting, Daten und Modell-Keys
Modell- / Cloud-Anbieter verantwortet Hosting, Daten und Modell-Keys
Bereitschaft und Incident Response
Oronts verantwortet Bereitschaft und Incident Response
–
–
–
Code und IP
–
–
Sie verantwortet Code und IP
–
WanneinAgentnichtdierichtigeWahlist
Ein deterministischer Workflow, bei dem die Schritte fest und bekannt sind: Ein Skript oder ein n8n-Flow ist einfacher, günstiger und vollständig vorhersehbar, und ein Agent fügt nur Kosten und Unvorhersehbarkeit hinzu, wo keine notig sind.
Einfaches CRUD oder eine einzelne, klar definierte Transformation: Ist die Aufgabe Lesen, Schreiben oder eine klare Zuordnung, erledigt schlichter Code sie besser als ein Modell, und ein Agent ist das falsche Werkzeug.
Eine riskante Aktion ohne Menschen, der sie beaufsichtigt: Kann niemand einen unumkehrbaren Schritt prüfen und bestätigen, ist ein autonomer Agent ein Risiko, das wir nicht empfehlen, bis die Aufsicht besteht.
Ein Fall, den ein einzelner, gut formulierter Prompt bereits bewältigt: Erledigt ein Modellaufruf mit guten Anweisungen die Aufgabe, sind die Orchestrierung, Werkzeuge und Evals eines Agenten ein Mehraufwand, den Sie nicht brauchen.
Die Baukosten hangen vom Anwendungsfall ab: wie viele Werkzeuge er berührt, wie viel Retrieval er braucht und wie viel Prüfung durch einen Menschen die Aktionen verlangen. Die Betriebskosten sind hauptsächlich die Modellnutzung von OpenAI oder Anthropic plus Ihr Hosting, das wir mit Kostengrenzen und Tracing sichtbar halten. Wir stecken nach dem ersten Gespräch einen Festpreis für Ihren Fall ab, und wir sagen Ihnen, wenn ein günstigerer Workflow oder einzelner Prompt die Aufgabe stattdessen erledigen wurde.
Wir gestalten die Grenze zwischen dem, was der Agent eigenständig tut, und dem, was er zur Bestätigung durch einen Menschen vorschlagen muss. Riskante und unumkehrbare Aktionen laufen nie, ohne dass eine Person entscheidet. Darauf aufbauend halten Leitplanken für Ein- und Ausgabe, Raten- und Kostengrenzen und ein Audit-Trail jedes Schritts und Werkzeugaufrufs das System innerhalb der von Ihnen gesetzten Linien.
Zwei Ebenen. Retrieval erdet den Agenten in Ihren eigenen Dokumenten mit Quellenangaben zurück zur Quelle, sodass eine Antwort geprüft statt blind vertraut werden kann. Evaluationen messen, ob der Agent die Aufgabe in den Fallen erfüllt, die zahlen, und Leitplanken plus ein Mensch in der Schleife fangen die riskanten Aktionen ab, bevor sie laufen. Wir behaupten nicht, ein Agent irre nie. Wir gestalten so, dass die Fehler, die zahlen, abgefangen werden.
Sie steuern, wohin Kontext und Prompts gehen und welcher Modellanbieter was sieht. Wir halten Retrieval und Speicherung in einer Infrastruktur, die Sie betreiben, wo der Fall es verlangt, schließen einen Auftragsverarbeitungsvertrag und gestalten DSGVO-bewusste Datenflüsse, wo personenbezogene Daten beteiligt sind. Modellaufrufe an OpenAI oder Anthropic sind auf das beschränkt, was die Aufgabe braucht, und nichts wird irgendwohin geleitet, dem Sie nicht zugestimmt haben.
Wenn die Aufgabe eine feste Schrittfolge ist, ist ein deterministischer Workflow oder ein Skript einfacher und vorhersehbarer. Ist es einfaches CRUD oder eine klare Transformation, erledigt schlichter Code es besser. Bewältigt ein einzelner, gut formulierter Prompt es bereits, ist ein Agent Mehraufwand. Und hat eine riskante Aktion keinen Menschen, der sie beaufsichtigt, empfehlen wir keinen autonomen Agenten, bis die Aufsicht besteht. Wir sagen all das im ersten Gespräch.
Alles: Die Agenten-Logik, die Werkzeuge, die Evals und die Prompts werden als Code in Ihrem Repository ausgeliefert, gebaut auf offenen Frameworks wie Mastra, LangGraph, CrewAI oder dem Vercel AI SDK, mit dem Modellanbieter hinter einer Schicht. Es gibt keine Oronts-Lizenzsperre, und jedes kompetente Engineering-Team kann es übernehmen. Uns zu verlassen ist nie ein Neubau.