Agentische KI

KI-Agenten, die echte Aktionen ausführen, unter Ihrer Aufsicht

Ein Agent ist die richtige Wahl, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen, Werkzeuge und Kontext braucht. Wenn ein Skript, ein Workflow oder ein einzelner Prompt die Aufgabe erledigt, sagen wir Ihnen das stattdessen.

Oronts konzipiert, baut und betreibt agentische KI-Systeme aus München: Agenten, die Werkzeuge und APIs aufrufen, den richtigen Kontext abrufen und Aktionen mit einem Menschen in der Schleife ausführen, wo es das Risiko verlangt. Aufgebaut auf offenen Frameworks wie Mastra, LangGraph, CrewAI und dem Vercel AI SDK, mit Modellen von OpenAI und Anthropic, sodass Ihnen das System gehört und Sie es in Ihrer eigenen Infrastruktur betreiben können.

Ihren Agenten-Anwendungsfall abstecken 30-minutiges Gespräch buchen

AI agent human in the loop

1Receive goal

2Plan and choose a tool

3Call tool or API

4Observe and decide

loops until the goal is met or a human steps in

Tool-usingHuman oversightFramework-agnostic

Der Stack, auf dem wir bauen

MastraLangGraphCrewAIVercel AI SDKAnthropic

Wann ein agentisches System die richtige Wahl ist

Wählen Sie ein agentisches KI-System, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen braucht: Kontext lesen, entscheiden was zu tun ist, Werkzeuge oder APIs aufrufen und auf das Ergebnis reagieren, statt einem festen Pfad zu folgen. Ein Agent passt, wenn die Arbeit für einen deterministischen Workflow zu variabel, aber zu wiederkehrend und verstanden ist, um sie weiter von Hand zu erledigen: Triage und Routing, Retrieval über Ihre eigenen Dokumente, Entwerfen und Prüfen, mehrstufige Recherche und Abläufe, die mehrere Systeme berühren. Wir bauen diese auf offenen Frameworks, Mastra, LangGraph, CrewAI und dem Vercel AI SDK, mit Modellen von OpenAI und Anthropic hinter einer anbieterunabhangigen Schicht, sodass Sie nie an einen einzelnen Anbieter gebunden sind. Der Kompromiss: Agenten sind probabilistisch, daher brauchen sie Leitplanken, Evaluation und einen Menschen in der Schleife überall dort, wo eine Aktion riskant oder schwer umkehrbar ist. Wo ein deterministisches Skript, ein n8n-Workflow oder ein einzelner Prompt den Bedarf deckt, sagen wir das im ersten Gespräch klar. Der Beleg, auf den wir verweisen, ist unser eigener Assistent, der auf dieser Website im Produktivbetrieb läuft, gebaut auf Mastra.

Agenten, die Werkzeuge und APIs nutzen, Kontext abrufen und echte Aktionen ausführen, nicht nur chatten
Aufgebaut auf offenen Frameworks: Mastra, LangGraph, CrewAI und dem Vercel AI SDK
Anbieterunabhangig über OpenAI und Anthropic, sodass Sie nicht an einen Modellanbieter gebunden sind
Mensch in der Schleife und Leitplanken überall dort, wo eine Aktion riskant oder schwer umkehrbar ist

Belege vor Versprechen

Läuft auf dieser Website, im Produktivbetrieb

Live

Der Assistent auf dieser Website ist ein agentisches System, das wir auf Mastra gebaut haben und das im Produktivbetrieb läuft. Es ist keine Demo hinter einem Login: Es ist dieselbe Art von werkzeugnutzendem, kontextabrufendem Agenten, den wir für Kunden bauen, und Sie können ihn hier nutzen, bevor Sie mit uns sprechen.

Unsere KI-Arbeit ansehen

Werkzeugnutzung mit menschlicher Aufsicht

Fähigkeit

Unsere Agenten rufen Werkzeuge und APIs auf und führen Aktionen aus, aber die riskanten laufen mit einem Menschen in der Schleife. Wir legen fest, wo ein Agent eigenständig handelt und wo er einen Vorschlag macht und auf Bestätigung wartet, sodass eine unumkehrbare Aktion nie stillschweigend geschieht.

Framework-unabhangiges Engineering

Fähigkeit

Wir bauen auf offenen Frameworks, Mastra, LangGraph, CrewAI und dem Vercel AI SDK, und halten den Modellanbieter hinter einer Schicht, OpenAI oder Anthropic. Die Agenten-Logik gehört Ihnen, in Ihrem Repository, sodass eine Framework- oder Modellwahl nie eine Einbahnstraße ist.

EU-Datenhandhabung

Fähigkeit

Wir gestalten den Datenfluss so, dass Sie steuern, wohin Kontext und Prompts gehen und welcher Modellanbieter was sieht. Wo personenbezogene Daten beteiligt sind, arbeiten wir DSGVO-bewusst, schließen einen Auftragsverarbeitungsvertrag und halten Retrieval und Speicherung in einer Infrastruktur, die Sie betreiben, wenn der Fall es verlangt.

Multi-Agenten-Orchestrierung

Ein Koordinator plant die Arbeit und verteilt sie an spezialisierte Agenten, mit expliziten Übergaben, gemeinsamem Speicher und klar begrenzten Werkzeugen.

Übergaben sind explizit und nachvollziehbar, der gemeinsame Speicher trägt den Zustand über alle Agenten hinweg, und ein Freigabeschritt durch einen Menschen sichert folgenreiche Aktionen ab.

Was wir mit agentischer KI tun

Agenten-Design und Scoping

Wir definieren, was der Agent tun soll, wo er eigenständig handelt und wo ein Mensch freigibt. Das Ergebnis ist ein abgestecktes Design: die Aufgabengrenze, die Werkzeuge, der benotigte Kontext und die Punkte, an denen er innehalten und nachfragen muss, bevor der Bau beginnt.

Werkzeug- und API-Integration

Agenten sind nur nutzlich, wenn sie handeln können. Wir verbinden sie über saubere, typisierte Werkzeuge und APIs mit Ihren Systemen, mit Idempotenz und Fehlerbehandlung, sodass ein Werkzeugaufruf sicher wiederholbar und ein Fehler sichtbar statt stillschweigend ist.

RAG und Retrieval

Wir bauen Retrieval über Ihre eigenen Dokumente und Daten, sodass der Agent aus Ihrem Wissen antwortet, nicht aus seinem Training. Chunking, Embeddings und ein Vector Store, verdrahtet mit dem Agenten, mit Quellenangaben zurück zur Quelle, sodass eine Antwort geprüft werden kann.

Mensch in der Schleife und Leitplanken

Wir gestalten die Grenze zwischen dem, was ein Agent eigenständig tut, und dem, was er zur Bestätigung vorschlägt, dazu Leitplanken für Ein- und Ausgabe, Raten- und Kostengrenzen und einen klaren Audit-Trail, sodass das System innerhalb der von Ihnen gesetzten Linien bleibt.

Evaluation und Observability

Wir bauen Evaluationen, die messen, ob der Agent die Aufgabe erfüllt, sowie Tracing und Logging, sodass Sie jeden Schritt, Werkzeugaufruf und jede Entscheidung im Produktivbetrieb sehen. Ohne Evals ist ein Agent eine Blackbox, daher behandeln wir sie als Teil des Baus, nicht als nachträglichen Gedanken.

Produktivhärtung

Wir bringen einen Agenten von einem funktionierenden Prototyp zu etwas, das Sie betreiben können: Kostenkontrollen, Wiederholungen und Fallbacks über Modellanbieter, Prompt- und Ausgabevalidierung, Monitoring und ein Deployment, das Ihre Ingenieure ohne uns in der Schleife betreiben können.

Entwickelt für Ihr Team

Agenten agieren auf Ihren Systemen, daher beurteilen alle Beteiligten diese unterschiedlich.

CTOs und IT-Führungskräfte

Sie möchten Agenten betreiben und ändern können, nicht eine Black-Box-Plattform.

Modell-neutrale Agenten auf offenen Frameworks, Ihr Code, EU-gehostet, kein Lock-in.

Unternehmensebene und Procurement

Agenten, die auf Systemen agieren, benötigen Governance und Audit.

Human-in-the-Loop-Genehmigung, Audit-Logging und Guardrails, DSGVO und TOM-Bereitschaft.

Startup-CTOs und Gründer

Sie benötigen einen funktionierenden Agenten, kein Forschungsprojekt.

Ein abgegrenzter Agent in einem 90-Tage-Pilot, dann skaliert.

Agenturen und Partner

Ihr Kunde benötigt Senior-Agentic-Arbeit unter Ihrer Marke.

White-Label-Agenten-Engineering, derselbe Stack hinter unserer öffentlichen Arbeit.

Wie wir ein agentisches System liefern

Vom Anwendungsfall-Fit bis zum gestarteten, eigenen Agenten: abgesteckt, mit Evaluationen gebaut, mit einem Menschen in der Schleife geprüft, gehärtet und betrieben, von Senior-Ingenieuren, mit dem Code und der Roadmap in Ihren Handen.

Anwendungsfall abstecken

Wir legen die Aufgabe fest, die Eingaben, die Aktionen, die der Agent ausführen darf, und die Kosten, wenn eine davon falsch läuft. Wir bestätigen, dass ein Agent hier das richtige Werkzeug ist, und wenn ein Workflow oder ein einzelner Prompt die Aufgabe erledigt, sagen wir das vor der Zusage.

Aufgabengrenze
Aktions- und Risikokarte
Fit-Prüfung

Agent und Werkzeuge entwerfen

Wir entwerfen den Agenten: das Framework, den Modellanbieter, die Werkzeuge und APIs, die er aufruft, den Kontext und das Retrieval, das er braucht, und die Punkte, an denen ein Mensch freigeben muss. Das Design ist vor dem Code prüfbar, nicht erst während des Codes entdeckt.

Framework und Modell
Werkzeuge und Retrieval
Aufsichtspunkte

Mit Evaluationen bauen

Wir bauen den Agenten und seine Evaluationen gemeinsam. Evals messen, ob er die Aufgabe in den Fallen erfüllt, die zahlen, sodass eine Änderung, die einen Pfad verbessert und einen anderen bricht, vor dem Produktivbetrieb sichtbar wird statt danach.

Agent und Werkzeuge
Eval-Suite
Testfalle

Prüfung mit Mensch in der Schleife

Wir verdrahten die Bestätigungspunkte: wo der Agent vorschlägt und wartet, was ein Prüfer sieht und wie eine Aktion freigegeben, bearbeitet oder abgelehnt wird. Riskante und unumkehrbare Aktionen laufen nie, ohne dass ein Mensch entscheidet.

Bestätigungsablauf
Prüfer-Ansicht
Audit-Trail

Härten und beobachten

Wir fügen die Produktivteile hinzu: Kosten- und Ratengrenzen, Wiederholungen und Anbieter-Fallbacks, Leitplanken für Ein- und Ausgabe und Tracing, sodass jeder Schritt und Werkzeugaufruf sichtbar ist. Der Agent hört auf, eine Blackbox zu sein, und wird ein System, das Sie betreiben können.

Leitplanken und Grenzen
Tracing und Logs
Anbieter-Fallbacks

Im Produktivbetrieb betreiben

Wir deployen den Agenten in Ihre Infrastruktur und übergeben den Code, die Evals und ein Runbook, sodass Sie ihn ohne uns in der Schleife betreiben. Ein optionaler Retainer deckt Wartung, Evals, Modell-Updates und Bereitschaft bis zu einem vereinbarten SLA-Ziel.

Deployment
Runbook und Evals
Optionaler Retainer

Wann ein Agent passt und wann nicht

Ein agentisches System bringt Macht und Komplexität zugleich. Vier Fragen entscheiden, ob es das richtige Werkzeug für Ihren Fall ist.

Wann Agenten passen

Agenten verdienen ihre Komplexität, wenn eine Aufgabe über mehrere Schritte Urteilsvermögen braucht: Kontext lesen, wählen, welches Werkzeug aufgerufen wird, und auf das Ergebnis reagieren, wo der Pfad für einen festen Workflow zu variabel ist. Ist die Aufgabe eine feste Schrittfolge, ist ein deterministischer Workflow oder ein Skript einfacher, günstiger und vorhersehbarer, und wir empfehlen das stattdessen.

Aufsicht und Sicherheit

Agenten sind probabilistisch, daher läuft eine riskante oder schwer umkehrbare Aktion mit einem Menschen in der Schleife: Der Agent schlägt vor, ein Mensch bestätigt. Wir gestalten diese Grenze ausdrücklich, fügen Leitplanken für Ein- und Ausgabe hinzu und halten einen Audit-Trail, sodass das System autonom ist, wo es sicher ist, und beaufsichtigt, wo nicht.

Daten und EU-Hosting

Sie steuern, wohin Kontext und Prompts gehen und welcher Modellanbieter was sieht. Wir halten Retrieval und Speicherung in einer Infrastruktur, die Sie betreiben, wo der Fall es verlangt, schließen einen Auftragsverarbeitungsvertrag und gestalten DSGVO-bewusste Datenflüsse, wo personenbezogene Daten beteiligt sind. Modellaufrufe an OpenAI oder Anthropic sind auf das beschränkt, was die Aufgabe braucht.

Eigentum

Die Agenten-Logik, die Werkzeuge, die Evals und die Prompts gehören Ihnen, in Ihrem Repository, gebaut auf offenen Frameworks mit dem Modellanbieter hinter einer Schicht. Es gibt keine Oronts-Lizenzsperre für Betrieb oder Änderung, und jedes kompetente Engineering-Team kann es übernehmen, sodass die Framework- und Anbieterwahl nie eine Einbahnstraße ist.

Einzelner Prompt, Workflow-Automatisierung oder ein agentisches System

Dasselbe Ziel verlangt sehr unterschiedliche Werkzeuge, je nachdem, wie variabel die Aufgabe ist und wie viel Urteilsvermögen sie braucht. Hier endet ein einzelner Prompt, hier endet ein fester Workflow, und hier verdient ein agentisches System seine zusätzliche Komplexität.

Seitwarts scrollen, um alle drei Spalten zu vergleichen.

	Einzelner Prompt	Workflow-Automatisierung	Agentisch + Oronts
Bewältigt variable, mehrstufige Aufgaben, die kein fester Pfad sind
Ruft Werkzeuge und APIs auf und führt echte Aktionen aus
Entscheidet anhand des Kontexts, welches Werkzeug zu nutzen ist
Ruft Kontext aus Ihren eigenen Dokumenten und Daten ab
Mensch in der Schleife bei riskanten Aktionen
Evaluation und Tracing für den Produktivbetrieb eingebaut
Deterministische und vollständig vorhersehbare Ausgabe
Senior-Engineering-Team dahinter

Ein Haken bedeutet, es passt ab Werk gut zum Fall. Ein Minus bedeutet teilweise oder mit Aufwand. Textzellen sagen, was es tatsächlich braucht. Ein deterministischer Workflow bleibt die bessere Wahl, wo der Pfad fest ist und volle Vorhersehbarkeit wichtiger als Urteilsvermögen ist.

Wo ein Agent seinen Platz verdient

Konkrete Situationen, in denen Urteilsvermögen über mehrere Schritte ein festes Skript schlägt, und das Ergebnis, das der Agent zusammen mit unserem Engineering liefert.

Commerce

Ein Käufer beschreibt seinen Bedarf in eigenen Worten, während Katalog, Bestand und Preise über mehrere Systeme verteilt liegen

Ein agentischer Checkout-Assistent, der über typisierte Werkzeuge die passenden Produkte findet, Verfügbarkeit und Preis prüft und die Bestellung zur Bestätigung durch einen Menschen vorschlägt, bevor sie verbindlich wird.

Operations

Routinearbeit im Back-Office erstreckt sich über E-Mail, ERP und interne Werkzeuge, mit genug Varianz, dass ein fester Workflow immer wieder bricht

Ein Operations-Agent, der den Fall liest, entscheidet, welches Werkzeug er aufruft, und innerhalb gesetzter Grenzen handelt, mit Eskalation an einen Menschen, sobald ein Schritt heikel oder schwer rückgängig zu machen ist.

Support

Anfragen kommen gemischt in Sprache und Anliegen herein, und die Antworten hängen von Ihren eigenen Dokumenten ab, nicht von Allgemeinwissen

Ein Support-Triage-Agent, der jede Anfrage klassifiziert und weiterleitet, eine fundierte Antwort mit Quellenverweisen entwirft und die sensiblen Fälle mit vollem Kontext an einen Menschen übergibt.

Vom einzelnen Prompt zum kontrollierten Agenten

Die meisten Teams brauchen am ersten Tag keinen Agenten. Wir führen Sie nur so weit die Leiter hinauf, wie die Aufgabe es verlangt, und sagen klar, wenn ein günstigerer Schritt den Bedarf bereits deckt. Jede Stufe ist ein funktionierendes System, das Ihnen gehört, kein Wegwerfstück.

Einzelner Prompt

Wir beginnen mit einem gut formulierten Modellaufruf, wenn ein einzelner Prompt mit guten Anweisungen die Aufgabe erledigt. Das ist die günstigste, am besten vorhersehbare Option, und für viele Aufgaben ist es der richtige Punkt zum Aufhören. Wir sagen Ihnen, wenn es ausreicht.

Deterministischer Workflow

Wenn die Aufgabe eine feste Abfolge von Schritten ist, verdrahten wir einen deterministischen Workflow oder einen n8n-Flow, der Werkzeuge in bekannter Reihenfolge aufruft. Vollständig vorhersehbar, leicht nachvollziehbar und ohne Modellurteil, wo keines nötig ist.

Retrieval und Fundierung

Wenn Antworten von Ihren eigenen Dokumenten abhängen, ergänzen wir Retrieval über Ihre Daten mit Quellenverweisen, sodass die Ausgabe in Ihrem Wissen verankert und überprüfbar ist, statt blind vertraut zu werden.

Kontrollierter Agent

Wenn die Arbeit wirklich Urteilsvermögen über mehrere Schritte braucht, heben wir sie zu einem Agenten an, der entscheidet, welches Werkzeug er aufruft, mit Leitplanken, Kosten- und Ratengrenzen, Evaluierungen und einem Menschen in der Schleife bei jeder heiklen Aktion.

Produktion und Eigentum

Wir härten das System mit Tracing, Anbieter-Fallbacks und einem Runbook und übergeben dann den Code und die Evals, sodass Sie es in Ihrer eigenen Infrastruktur betreiben. Ein optionaler Retainer deckt Wartung und Modellaktualisierungen bis zu einem vereinbarten SLA-Ziel ab.

Wer was bei einem Agenten-Build verantwortet

Wie sich die Verantwortung zwischen Oronts, Ihrem Team und den Modell- und Cloud-Anbietern bei einer agentischen Umsetzung aufteilt.

Verantwortlichkeiten entlang der Lieferkette
Verantwortung	Oronts	Sie	Modell- / Cloud-Anbieter
Agentendesign und Orchestrierung	Oronts verantwortet Agentendesign und Orchestrierung
Evaluierungen und Test-Harness	Oronts verantwortet Evaluierungen und Test-Harness
Guardrails und Freigabe-Gates	Oronts verantwortet Guardrails und Freigabe-Gates	Sie verantwortet Guardrails und Freigabe-Gates
Prompts, Richtlinien und Geschäftsregeln		Sie verantwortet Prompts, Richtlinien und Geschäftsregeln
Hosting, Daten und Modell-Keys		Sie verantwortet Hosting, Daten und Modell-Keys	Modell- / Cloud-Anbieter verantwortet Hosting, Daten und Modell-Keys
Bereitschaft und Incident Response	Oronts verantwortet Bereitschaft und Incident Response
Code und IP		Sie verantwortet Code und IP

Wann ein Agent nicht die richtige Wahl ist

Ein deterministischer Workflow, bei dem die Schritte fest und bekannt sind: Ein Skript oder ein n8n-Flow ist einfacher, günstiger und vollständig vorhersehbar, und ein Agent fügt nur Kosten und Unvorhersehbarkeit hinzu, wo keine notig sind.
Einfaches CRUD oder eine einzelne, klar definierte Transformation: Ist die Aufgabe Lesen, Schreiben oder eine klare Zuordnung, erledigt schlichter Code sie besser als ein Modell, und ein Agent ist das falsche Werkzeug.
Eine riskante Aktion ohne Menschen, der sie beaufsichtigt: Kann niemand einen unumkehrbaren Schritt prüfen und bestätigen, ist ein autonomer Agent ein Risiko, das wir nicht empfehlen, bis die Aufsicht besteht.
Ein Fall, den ein einzelner, gut formulierter Prompt bereits bewältigt: Erledigt ein Modellaufruf mit guten Anweisungen die Aufgabe, sind die Orchestrierung, Werkzeuge und Evals eines Agenten ein Mehraufwand, den Sie nicht brauchen.

Mit wem Sie arbeiten

HRB 288224

Eingetragen in München

15+

Jahre, gründergeführt

DE · EN · AR

Liefersprachen

Open Source auf GitHub

Datenresidenz, Frankfurt

AVV/DPA

Unterschriftsbereit, Art. 28

Engagement-Stufen

Oronts arbeitet mit ernsthaften Teams, die Senior-Delivery brauchen, kein Billig-Outsourcing.

Production Pilot: ab 25k EUR
Individualsoftware- und KI-Projekte: ab 50k EUR
Laufende technische Retainer: ab 15k EUR/Monat

Der genaue Preis hängt von Umfang, Verantwortung, Liefergeschwindigkeit, Teamgröße, Integrationen, Support-Erwartungen und Produktionsrisiko ab.

Den 90-Tage Production Pilot anfragen

Fragen zu agentischer KI, direkt beantwortet

Die Baukosten hangen vom Anwendungsfall ab: wie viele Werkzeuge er berührt, wie viel Retrieval er braucht und wie viel Prüfung durch einen Menschen die Aktionen verlangen. Die Betriebskosten sind hauptsächlich die Modellnutzung von OpenAI oder Anthropic plus Ihr Hosting, das wir mit Kostengrenzen und Tracing sichtbar halten. Wir stecken nach dem ersten Gespräch einen Festpreis für Ihren Fall ab, und wir sagen Ihnen, wenn ein günstigerer Workflow oder einzelner Prompt die Aufgabe stattdessen erledigen wurde.

Wir gestalten die Grenze zwischen dem, was der Agent eigenständig tut, und dem, was er zur Bestätigung durch einen Menschen vorschlagen muss. Riskante und unumkehrbare Aktionen laufen nie, ohne dass eine Person entscheidet. Darauf aufbauend halten Leitplanken für Ein- und Ausgabe, Raten- und Kostengrenzen und ein Audit-Trail jedes Schritts und Werkzeugaufrufs das System innerhalb der von Ihnen gesetzten Linien.

Zwei Ebenen. Retrieval erdet den Agenten in Ihren eigenen Dokumenten mit Quellenangaben zurück zur Quelle, sodass eine Antwort geprüft statt blind vertraut werden kann. Evaluationen messen, ob der Agent die Aufgabe in den Fallen erfüllt, die zahlen, und Leitplanken plus ein Mensch in der Schleife fangen die riskanten Aktionen ab, bevor sie laufen. Wir behaupten nicht, ein Agent irre nie. Wir gestalten so, dass die Fehler, die zahlen, abgefangen werden.

Wenn die Aufgabe eine feste Schrittfolge ist, ist ein deterministischer Workflow oder ein Skript einfacher und vorhersehbarer. Ist es einfaches CRUD oder eine klare Transformation, erledigt schlichter Code es besser. Bewältigt ein einzelner, gut formulierter Prompt es bereits, ist ein Agent Mehraufwand. Und hat eine riskante Aktion keinen Menschen, der sie beaufsichtigt, empfehlen wir keinen autonomen Agenten, bis die Aufsicht besteht. Wir sagen all das im ersten Gespräch.

Alles: Die Agenten-Logik, die Werkzeuge, die Evals und die Prompts werden als Code in Ihrem Repository ausgeliefert, gebaut auf offenen Frameworks wie Mastra, LangGraph, CrewAI oder dem Vercel AI SDK, mit dem Modellanbieter hinter einer Schicht. Es gibt keine Oronts-Lizenzsperre, und jedes kompetente Engineering-Team kann es übernehmen. Uns zu verlassen ist nie ein Neubau.

Agentische Entwicklung, veröffentlicht

Sprechen Sie mit den Ingenieuren, nicht mit einem Vertriebsteam

Grunder-geführte, ausschließlich seniorbesetzte Lieferung aus München. Stecken Sie Ihren agentischen KI-Anwendungsfall in einem Gespräch ab.

Ihren Anwendungsfall abstecken

Die Engineering-Arbeit ansehen