IA agentique

Des agents IA qui exécutent de vraies actions, sous votre supervision

Un agent est le bon choix quand une tâche exige du jugement, des outils et du contexte sur plusieurs étapes. Quand un script, un flux ou un seul prompt fait l'affaire, nous vous le disons à la place.

Oronts conçoit, construit et exploite des systèmes d'IA agentique depuis Munich : des agents qui appellent des outils et des API, récupèrent le bon contexte et exécutent des actions avec un humain dans la boucle quand le risque l'exige. Construits sur des frameworks ouverts comme Mastra, LangGraph, CrewAI et le Vercel AI SDK, avec des modèles OpenAI et Anthropic, de sorte que le système vous appartient et que vous pouvez l'exploiter dans votre propre infrastructure.

AI agent human in the loop
1Receive goal
2Plan and choose a tool
3Call tool or API
4Observe and decide
loops until the goal is met or a human steps in
Tool-usingHuman oversightFramework-agnostic

La stack sur laquelle nous construisons

MastraLangGraphCrewAIVercel AI SDKAnthropic

Quand un système agentique est le bon choix

Choisissez un système d'IA agentique quand une tâche exige du jugement sur plusieurs étapes : lire le contexte, décider quoi faire, appeler des outils ou des API et agir sur le résultat, plutôt que de suivre un chemin fixe. Un agent convient quand le travail est trop variable pour un flux déterministe mais trop répétitif et bien compris pour continuer à le faire à la main : tri et routage, récupération sur vos propres documents, rédaction et relecture, recherche en plusieurs étapes et opérations qui touchent plusieurs systèmes. Nous les construisons sur des frameworks ouverts, Mastra, LangGraph, CrewAI et le Vercel AI SDK, avec des modèles OpenAI et Anthropic derrière une couche indépendante du fournisseur, de sorte que vous n'êtes jamais lié à un seul prestataire. Le compromis : les agents sont probabilistes, ils ont donc besoin de garde-fous, d'évaluation et d'un humain dans la boucle partout où une action est à fort enjeu ou difficile à annuler. Là où un script déterministe, un flux n8n ou un seul prompt couvre le besoin, nous le disons clairement dès le premier appel. La preuve que nous citons est notre propre assistant qui tourne en production sur ce site, construit sur Mastra.

  • Des agents qui utilisent des outils et des API, récupèrent du contexte et exécutent de vraies actions, pas seulement de la conversation
  • Construits sur des frameworks ouverts : Mastra, LangGraph, CrewAI et le Vercel AI SDK
  • Indépendants du fournisseur entre OpenAI et Anthropic, de sorte que vous n'êtes pas lié à un seul fournisseur de modèles
  • Humain dans la boucle et garde-fous partout où une action est à fort enjeu ou difficile à annuler

Des preuves avant les promesses

En service sur ce site, en production

En direct

L'assistant de ce site est un système agentique que nous avons construit sur Mastra, en production. Ce n'est pas une démo derrière une connexion : c'est le même type d'agent utilisant des outils et récupérant du contexte que nous construisons pour nos clients, et vous pouvez l'utiliser ici avant de nous parler.

Voir notre travail en IA

Usage d'outils avec supervision humaine

Capacité

Nos agents appellent des outils et des API et exécutent des actions, mais celles à fort enjeu tournent avec un humain dans la boucle. Nous définissons où un agent agit seul et où il doit proposer puis attendre une confirmation, de sorte qu'une action irréversible ne se produit jamais en silence.

Ingénierie indépendante du framework

Capacité

Nous construisons sur des frameworks ouverts, Mastra, LangGraph, CrewAI et le Vercel AI SDK, et gardons le fournisseur de modèles derrière une couche, OpenAI ou Anthropic. La logique de l'agent vous appartient, dans votre dépôt, de sorte qu'un choix de framework ou de modèle n'est jamais une porte à sens unique.

Traitement des données dans l'UE

Capacité

Nous concevons le flux de données pour que vous contrôliez où vont le contexte et les prompts et quel fournisseur de modèles voit quoi. Quand des données personnelles sont en jeu, nous travaillons dans le respect du RGPD, signons un Auftragsverarbeitungsvertrag allemand et gardons la récupération et le stockage dans une infrastructure que vous exploitez quand le cas l'exige.

Orchestration multi-agents

Un coordinateur planifie le travail et le répartit entre des agents spécialisés, avec des transferts explicites, une mémoire partagée et des outils délimités.

hand-offhand-offCoordinator agentplans + routesPlannerResearcherExecutorShared memory and stateTools and APIsGuardrails

Les transferts sont explicites et observables, la mémoire partagée transmet l'état entre les agents, et un point de validation humaine protège les actions à fort impact.

Ce que nous faisons avec l'IA agentique

Conception et cadrage d'agent

Nous définissons ce que l'agent doit faire, où il agit seul et où un humain valide. Le résultat est une conception cadrée : la frontière de la tâche, les outils, le contexte nécessaire et les points où il doit s'arrêter et demander, avant tout développement.

Intégration d'outils et d'API

Les agents ne sont utiles que s'ils peuvent agir. Nous les relions à vos systèmes via des outils et des API propres et typés, avec idempotence et gestion des erreurs, de sorte qu'un appel d'outil soit sûr à réessayer et qu'une défaillance soit visible plutôt que silencieuse.

RAG et récupération

Nous construisons une récupération sur vos propres documents et données, de sorte que l'agent réponde à partir de votre savoir, pas de son entraînement. Découpage, embeddings et base vectorielle reliés à l'agent, avec des citations vers la source, de sorte qu'une réponse puisse être vérifiée.

Humain dans la boucle et garde-fous

Nous concevons la frontière entre ce qu'un agent fait de manière autonome et ce qu'il propose pour confirmation, plus des garde-fous en entrée et en sortie, des limites de débit et de coût et une piste d'audit claire, de sorte que le système reste dans les limites que vous fixez.

Évaluation et observabilité

Nous construisons des évaluations qui mesurent si l'agent fait le travail, ainsi que du tracing et du logging pour que vous voyiez chaque étape, chaque appel d'outil et chaque décision en production. Sans evals, un agent est une boîte noire, nous les traitons donc comme une partie du développement, pas comme une réflexion après coup.

Durcissement pour la production

Nous menons un agent d'un prototype fonctionnel à quelque chose que vous pouvez exploiter : contrôles de coût, réessais et plans de repli entre fournisseurs de modèles, validation des prompts et des sorties, supervision et un déploiement que vos ingénieurs peuvent exploiter sans nous dans la boucle.

Conçu pour votre équipe

Les agents agissent sur vos systèmes, donc chaque poste à table les juge différemment.

Directeurs techniques et responsables IT

Vous voulez des agents que vous pouvez exécuter et modifier, pas une plateforme boîte noire.

Agents neutres au modèle sur frameworks open source, votre code, hébergement UE, sans verrouillage.

Entreprises et achats

Les agents agissant sur les systèmes ont besoin de gouvernance et d'audit.

Approbation humaine dans la boucle, enregistrement d'audit et garde-fous, conformité AVV et TOM.

CTOs startups et fondateurs

Vous avez besoin d'un agent fonctionnant, pas d'un projet de recherche.

Un agent délimité livré en pilote de 90 jours, puis une montée en charge.

Agences et partenaires

Votre client a besoin d'un travail agentic senior livré sous votre marque.

Ingénierie agent en marque blanche, le même stack derrière notre travail public.

Comment nous livrons un système agentique

Du test d'adéquation du cas d'usage à un agent lancé et possédé : cadré, construit avec des évaluations, relu avec un humain dans la boucle, durci et exploité, par des ingénieurs seniors, avec le code et la feuille de route entre vos mains.

01

Cadrer le cas d'usage

Nous précisons la tâche, les entrées, les actions que l'agent peut exécuter et le coût d'une erreur. Nous confirmons qu'un agent est le bon outil ici, et si un flux ou un seul prompt fait l'affaire, nous le disons avant de nous engager.

  • Frontière de la tâche
  • Carte des actions et des risques
  • Test d'adéquation
02

Concevoir l'agent et les outils

Nous concevons l'agent : le framework, le fournisseur de modèles, les outils et les API qu'il appelle, le contexte et la récupération dont il a besoin, et les points où un humain doit valider. La conception est révisable avant le code, pas découverte pendant.

  • Framework et modèle
  • Outils et récupération
  • Points de supervision
03

Construire avec des évaluations

Nous construisons l'agent et ses évaluations ensemble. Les evals mesurent s'il fait le travail sur les cas qui comptent, de sorte qu'un changement qui aide un chemin et casse un autre apparaisse avant la production plutôt qu'après.

  • Agent et outils
  • Suite d'evals
  • Cas de test
04

Relecture avec un humain dans la boucle

Nous câblons les points de confirmation : où l'agent propose et attend, ce qu'un relecteur voit et comment une action est validée, modifiée ou rejetée. Les actions à fort enjeu et irréversibles ne tournent jamais sans qu'un humain décide.

  • Flux de confirmation
  • Vue du relecteur
  • Piste d'audit
05

Durcir et observer

Nous ajoutons les éléments de production : limites de coût et de débit, réessais et plans de repli entre fournisseurs, garde-fous en entrée et en sortie, et tracing pour que chaque étape et chaque appel d'outil soit visible. L'agent cesse d'être une boîte noire et devient un système que vous pouvez exploiter.

  • Garde-fous et limites
  • Tracing et logs
  • Plans de repli fournisseur
06

Exploiter en production

Nous déployons l'agent dans votre infrastructure et remettons le code, les evals et un runbook pour que vous l'exploitiez sans nous dans la boucle. Un contrat de maintenance optionnel couvre la maintenance, les evals, les mises à jour de modèles et l'astreinte jusqu'à un objectif de SLA convenu.

  • Déploiement
  • Runbook et evals
  • Contrat optionnel

Quand un agent convient, et quand non

Un système agentique apporte puissance et complexité à la fois. Quatre questions décident s'il est le bon outil pour votre cas.

Quand les agents conviennent

Les agents méritent leur complexité quand une tâche exige du jugement sur plusieurs étapes : lire le contexte, choisir quel outil appeler et agir sur le résultat, là où le chemin est trop variable pour un flux fixe. Si la tâche est une séquence fixe d'étapes, un flux déterministe ou un script est plus simple, moins cher et plus prévisible, et nous le recommandons à la place.

Supervision et sécurité

Les agents sont probabilistes, donc une action à fort enjeu ou difficile à annuler tourne avec un humain dans la boucle : l'agent propose, une personne confirme. Nous concevons cette frontière explicitement, ajoutons des garde-fous en entrée et en sortie et gardons une piste d'audit, de sorte que le système soit autonome là où c'est sûr et supervisé là où ça ne l'est pas.

Données et hébergement UE

Vous contrôlez où vont le contexte et les prompts et quel fournisseur de modèles voit quoi. Nous gardons la récupération et le stockage dans une infrastructure que vous exploitez quand le cas l'exige, signons un Auftragsverarbeitungsvertrag allemand et concevons des flux de données respectueux du RGPD quand des données personnelles sont en jeu. Les appels de modèles à OpenAI ou Anthropic sont limités à ce dont la tâche a besoin.

Propriété

La logique de l'agent, les outils, les evals et les prompts vous appartiennent, dans votre dépôt, construits sur des frameworks ouverts avec le fournisseur de modèles derrière une couche. Il n'y a aucune licence Oronts qui bloque l'exécution ou la modification, et toute équipe d'ingénierie compétente peut le reprendre, de sorte que les choix de framework et de fournisseur ne sont jamais une porte à sens unique.

Prompt unique, automatisation de flux ou système agentique

Le même objectif appelle des outils très différents selon la variabilité de la tâche et le jugement qu'elle exige. Voici où un prompt unique s'arrête, où un flux fixe s'arrête, et où un système agentique mérite sa complexité ajoutée.

Faites défiler sur le côté pour comparer les trois colonnes.

Prompt uniqueAutomatisation de fluxAgentique + Oronts
Gère des tâches variables, en plusieurs étapes, qui ne sont pas un chemin fixe
Appelle des outils et des API et exécute de vraies actions
Décide quel outil utiliser selon le contexte
Récupère du contexte depuis vos propres documents et données
Humain dans la boucle sur les actions à fort enjeu
Évaluation et tracing intégrés pour la production
Sortie déterministe et entièrement prévisible
Équipe d'ingénierie senior derrière

Une coche signifie que cela convient bien au cas dès le départ. Un moins signifie partiel ou à travailler. Les cellules de texte disent ce qu'il faut réellement. Un flux déterministe reste le meilleur choix là où le chemin est fixe et où la prévisibilité totale compte plus que le jugement.

un agent gagne sa place

Des situations concrètes où le jugement sur plusieurs étapes l'emporte sur un script figé, et le résultat que l'agent associé à notre ingénierie apporte.

Commerce

Un acheteur décrit son besoin avec ses propres mots, tandis que le catalogue, le stock et les prix sont répartis sur plusieurs systèmes

Un assistant de paiement agentique qui retrouve les bons produits via des outils typés, vérifie la disponibilité et le prix, et propose la commande à la confirmation d'un humain avant de l'engager.

Opérations

Le travail courant de back-office s'étend sur la messagerie, l'ERP et les outils internes, avec assez de variabilité pour qu'un flux figé casse sans cesse

Un agent d'opérations qui lit le dossier, décide quel outil appeler et agit dans des limites définies, en escaladant vers une personne dès qu'une étape est à fort enjeu ou difficile à annuler.

Support

Les demandes entrantes arrivent mêlées en langue et en intention, et les réponses dépendent de vos propres documents plutôt que de connaissances génériques

Un agent de tri du support qui classe et oriente chaque demande, rédige une réponse étayée avec citations vers vos sources, et confie les cas sensibles à une personne disposant de tout le contexte.

D'un simple prompt à un agent encadré

La plupart des équipes n'ont pas besoin d'un agent dès le premier jour. Nous vous faisons monter l'échelle seulement autant que la tâche l'exige, et nous disons clairement quand une étape moins coûteuse couvre déjà le besoin. Chaque palier est un système opérationnel qui vous appartient, pas un jetable.

    1

    Simple prompt

    Nous commençons par un appel de modèle bien conçu lorsqu'un simple prompt assorti de bonnes instructions fait le travail. C'est l'option la moins coûteuse et la plus prévisible, et pour bien des tâches c'est le bon endroit où s'arrêter. Nous vous disons quand cela suffit.

    2

    Flux déterministe

    Lorsque la tâche est une séquence fixe d'étapes, nous câblons un flux déterministe ou un flux n8n qui appelle les outils dans un ordre connu. Entièrement prévisible, facile à raisonner, et sans jugement du modèle là où il n'en faut pas.

    3

    Récupération et ancrage

    Lorsque les réponses dépendent de vos propres documents, nous ajoutons une récupération sur vos données avec citations vers la source, afin que la sortie soit ancrée dans votre savoir et vérifiable plutôt que crue aveuglément.

    4

    Agent encadré

    Lorsque le travail exige vraiment du jugement sur plusieurs étapes, nous le faisons passer à un agent qui décide quel outil appeler, avec des garde-fous, des limites de coût et de débit, des évaluations et un humain dans la boucle sur chaque action à fort enjeu.

    5

    Production et propriété

    Nous durcissons le système avec du traçage, des replis entre fournisseurs et un runbook, puis nous remettons le code et les évaluations afin que vous l'exploitiez dans votre propre infrastructure. Un forfait de maintenance optionnel couvre l'entretien et les mises à jour de modèle jusqu'à un objectif de SLA convenu.

Qui possède quoi dans un build d’agents

Comment la responsabilité se répartit entre Oronts, votre équipe et les fournisseurs de modèles et de cloud sur un projet agentique.

Répartition des responsabilités sur la chaîne de livraison
ResponsabilitéOrontsVotre agence / partenaireVousFournisseur de modèle / cloud
Conception et orchestration des agentsOronts prend en charge Conception et orchestration des agents
Évaluations et harnais de testOronts prend en charge Évaluations et harnais de test
Garde-fous et étapes de validationOronts prend en charge Garde-fous et étapes de validationVous prend en charge Garde-fous et étapes de validation
Prompts, politiques et règles métierVous prend en charge Prompts, politiques et règles métier
Hébergement, données et clés de modèleVous prend en charge Hébergement, données et clés de modèleFournisseur de modèle / cloud prend en charge Hébergement, données et clés de modèle
Astreinte et réponse aux incidentsOronts prend en charge Astreinte et réponse aux incidents
Code et PIVous prend en charge Code et PI

Quand un agent n'est pas le bon choix

  • Un flux déterministe où les étapes sont fixes et connues : un script ou un flux n8n est plus simple, moins cher et entièrement prévisible, et un agent n'ajoute que coût et imprévisibilité là où il n'en faut aucune.
  • Du CRUD simple ou une seule transformation bien définie : si la tâche est lire, écrire ou un mappage clair, du code simple le fait mieux qu'un modèle, et un agent est le mauvais outil.
  • Une action à fort enjeu sans humain disponible pour la superviser : si personne ne peut relire et confirmer une étape irréversible, un agent autonome est un risque que nous ne recommandons pas tant que la supervision n'existe pas.
  • Un cas qu'un seul prompt bien conçu gère déjà : si un appel de modèle avec de bonnes instructions fait l'affaire, l'orchestration, les outils et les evals d'un agent sont une surcharge dont vous n'avez pas besoin.

Avec qui vous travaillez

HRB 288224
Immatriculée à Munich
15+
Ans, dirigée par le fondateur
DE · EN · AR
Langues de travail
2
Open source sur GitHub
EU
Résidence des données, Francfort
AVV/DPA
Prêt à signer, art. 28

Niveaux d'engagement

Oronts travaille avec des équipes sérieuses qui ont besoin d'une livraison senior, pas d'externalisation low-cost.

Pilote de production
à partir de 25k EUR
Projets logiciels et IA sur mesure
à partir de 50k EUR
Retainers techniques continus
à partir de 15k EUR/mois

Le prix exact dépend du périmètre, des responsabilités, de la vitesse de livraison, de la taille d'équipe, des intégrations, des attentes de support et du risque de production.

Questions sur l'IA agentique, répondues directement

Le coût de construction dépend du cas d'usage : combien d'outils il touche, combien de récupération il exige et combien de relecture humaine les actions demandent. Le coût d'exploitation est surtout l'usage des modèles OpenAI ou Anthropic plus votre hébergement, que nous gardons visible avec des limites de coût et du tracing. Nous cadrons un prix fixe pour votre cas après le premier appel, et nous vous disons si un flux ou un prompt unique moins cher ferait l'affaire à la place.
Nous concevons la frontière entre ce que l'agent fait seul et ce qu'il doit proposer pour qu'un humain confirme. Les actions à fort enjeu et irréversibles ne tournent jamais sans qu'une personne décide. En plus, des garde-fous en entrée et en sortie, des limites de débit et de coût et une piste d'audit de chaque étape et appel d'outil gardent le système dans les limites que vous fixez.
Deux couches. La récupération ancre l'agent dans vos propres documents avec des citations vers la source, de sorte qu'une réponse puisse être vérifiée plutôt que crue aveuglément. Les évaluations mesurent si l'agent fait le travail sur les cas qui comptent, et les garde-fous plus un humain dans la boucle attrapent les actions à fort enjeu avant qu'elles ne tournent. Nous ne prétendons pas qu'un agent ne se trompe jamais. Nous concevons pour que les erreurs qui comptent soient attrapées.
Vous contrôlez où vont le contexte et les prompts et quel fournisseur de modèles voit quoi. Nous gardons la récupération et le stockage dans une infrastructure que vous exploitez quand le cas l'exige, signons un Auftragsverarbeitungsvertrag allemand et concevons des flux de données respectueux du RGPD quand des données personnelles sont en jeu. Les appels de modèles à OpenAI ou Anthropic sont limités à ce dont la tâche a besoin, et rien n'est routé quelque part sans votre accord.
Quand la tâche est une séquence fixe d'étapes, un flux déterministe ou un script est plus simple et plus prévisible. Quand c'est du CRUD simple ou une transformation claire, du code simple le fait mieux. Quand un seul prompt bien conçu le gère déjà, un agent est une surcharge. Et quand une action à fort enjeu n'a aucun humain pour la superviser, nous ne recommandons pas d'agent autonome tant que la supervision n'existe pas. Nous disons tout cela dès le premier appel.
Tout : la logique de l'agent, les outils, les evals et les prompts sont livrés sous forme de code dans votre dépôt, construits sur des frameworks ouverts comme Mastra, LangGraph, CrewAI ou le Vercel AI SDK, avec le fournisseur de modèles derrière une couche. Il n'y a aucune licence Oronts qui bloque, et toute équipe d'ingénierie compétente peut le reprendre. Nous quitter n'est jamais une reconstruction.

Parlez aux ingénieurs, pas à une équipe commerciale

Livraison dirigée par le fondateur, exclusivement senior, depuis Munich. Cadrez votre cas d'usage d'IA agentique en une conversation.