IA agéntica

Agentes de IA que ejecutan acciones reales, bajo su supervisión

Un agente es la opción correcta cuando una tarea necesita criterio, herramientas y contexto a lo largo de varios pasos. Cuando un script, un flujo o un solo prompt resuelven el caso, se lo decimos en su lugar.

Oronts diseña, construye y opera sistemas de IA agéntica desde Múnich: agentes que llaman a herramientas y API, recuperan el contexto adecuado y ejecutan acciones con un humano en el bucle cuando el riesgo lo exige. Construidos sobre frameworks abiertos como Mastra, LangGraph, CrewAI y el Vercel AI SDK, con modelos de OpenAI y Anthropic, de modo que el sistema le pertenece y puede operarlo en su propia infraestructura.

AI agent human in the loop
1Receive goal
2Plan and choose a tool
3Call tool or API
4Observe and decide
loops until the goal is met or a human steps in
Tool-usingHuman oversightFramework-agnostic

El stack sobre el que construimos

MastraLangGraphCrewAIVercel AI SDKAnthropic

Cuándo un sistema agéntico es la opción correcta

Elija un sistema de IA agéntica cuando una tarea necesite criterio a lo largo de varios pasos: leer el contexto, decidir qué hacer, llamar a herramientas o API y actuar sobre el resultado, en lugar de seguir un camino fijo. Un agente encaja cuando el trabajo es demasiado variable para un flujo determinista pero demasiado repetitivo y conocido para seguir haciéndolo a mano: triaje y enrutamiento, recuperación sobre sus propios documentos, redacción y revisión, investigación en varios pasos y operaciones que tocan varios sistemas. Los construimos sobre frameworks abiertos, Mastra, LangGraph, CrewAI y el Vercel AI SDK, con modelos de OpenAI y Anthropic detrás de una capa independiente del proveedor, de modo que nunca queda atado a un solo proveedor. El compromiso: los agentes son probabilísticos, por lo que necesitan barreras, evaluación y un humano en el bucle allí donde una acción sea de alto riesgo o difícil de revertir. Donde un script determinista, un flujo n8n o un solo prompt cubren la necesidad, lo decimos con claridad en la primera llamada. La prueba que citamos es nuestro propio asistente funcionando en producción en este sitio, construido sobre Mastra.

  • Agentes que usan herramientas y API, recuperan contexto y ejecutan acciones reales, no solo conversan
  • Construidos sobre frameworks abiertos: Mastra, LangGraph, CrewAI y el Vercel AI SDK
  • Independientes del proveedor entre OpenAI y Anthropic, de modo que no queda atado a un solo proveedor de modelos
  • Humano en el bucle y barreras allí donde una acción sea de alto riesgo o difícil de revertir

Pruebas antes que promesas

En funcionamiento en este sitio, en producción

En vivo

El asistente de este sitio es un sistema agéntico que construimos sobre Mastra, en producción. No es una demo tras un inicio de sesión: es el mismo tipo de agente que usa herramientas y recupera contexto que construimos para clientes, y puede usarlo aquí antes de hablar con nosotros.

Ver nuestro trabajo en IA

Uso de herramientas con supervisión humana

Capacidad

Nuestros agentes llaman a herramientas y API y ejecutan acciones, pero las de alto riesgo funcionan con un humano en el bucle. Definimos dónde un agente actúa por su cuenta y dónde debe proponer y esperar confirmación, de modo que una acción irreversible nunca ocurra en silencio.

Ingeniería independiente del framework

Capacidad

Construimos sobre frameworks abiertos, Mastra, LangGraph, CrewAI y el Vercel AI SDK, y mantenemos el proveedor de modelos detrás de una capa, OpenAI o Anthropic. La lógica del agente le pertenece, en su repositorio, de modo que una elección de framework o de modelo nunca es una puerta de un solo sentido.

Tratamiento de datos en la UE

Capacidad

Diseñamos el flujo de datos para que usted controle a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Cuando hay datos personales en juego, trabajamos con conciencia del RGPD, firmamos un Auftragsverarbeitungsvertrag alemán y mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera cuando el caso lo exige.

Orquestación multiagente

Un coordinador planifica el trabajo y lo distribuye entre agentes especializados, con traspasos explícitos, memoria compartida y herramientas acotadas.

hand-offhand-offCoordinator agentplans + routesPlannerResearcherExecutorShared memory and stateTools and APIsGuardrails

Los traspasos son explícitos y observables, la memoria compartida transporta el estado entre agentes y una compuerta de aprobación humana protege las acciones de mayor impacto.

Qué hacemos con la IA agéntica

Diseño y delimitación del agente

Definimos qué debe hacer el agente, dónde actúa por su cuenta y dónde un humano aprueba. El resultado es un diseño delimitado: la frontera de la tarea, las herramientas, el contexto que necesita y los puntos en los que debe detenerse y preguntar, antes de empezar a construir.

Integración de herramientas y API

Los agentes solo son útiles si pueden actuar. Los conectamos a sus sistemas mediante herramientas y API limpias y tipadas, con idempotencia y manejo de errores, de modo que una llamada a una herramienta sea segura de reintentar y un fallo sea visible en lugar de silencioso.

RAG y recuperación

Construimos recuperación sobre sus propios documentos y datos, de modo que el agente responda desde su conocimiento, no desde su entrenamiento. Troceado, embeddings y un almacén vectorial conectados al agente, con citas a la fuente, de modo que una respuesta pueda comprobarse.

Humano en el bucle y barreras

Diseñamos la frontera entre lo que un agente hace de forma autónoma y lo que propone para confirmación, más barreras de entrada y salida, límites de tasa y coste y un registro de auditoría claro, de modo que el sistema se mantenga dentro de las líneas que usted fija.

Evaluación y observabilidad

Construimos evaluaciones que miden si el agente cumple la tarea, más trazas y registro para que vea cada paso, cada llamada a herramienta y cada decisión en producción. Sin evaluaciones un agente es una caja negra, por eso las tratamos como parte de la construcción, no como una ocurrencia tardía.

Endurecimiento para producción

Llevamos un agente de un prototipo funcional a algo que usted puede operar: controles de coste, reintentos y planes alternativos entre proveedores de modelos, validación de prompts y salidas, monitorización y un despliegue que sus ingenieros pueden operar sin nosotros en el bucle.

Diseñado para su equipo

Los agentes actúan sobre sus sistemas, por lo que cada puesto en la mesa los evalúa de manera diferente.

CTOs y líderes de TI

Usted quiere agentes que pueda ejecutar y cambiar, no una plataforma de caja negra.

Agentes neutrales en cuanto a modelos en marcos abiertos, su código, alojamiento en UE, sin dependencia de proveedores.

Empresa y adquisiciones

Los agentes que actúan sobre sistemas necesitan gobernanza y auditoría.

Aprobación con persona en el bucle, registro de auditoría y barreras de protección, disponibilidad de RGPD y TOM.

CTOs de startups y fundadores

Usted necesita un agente que funcione, no un proyecto de investigación.

Un agente acotado entregado en una prueba piloto de 90 días, luego escalado.

Agencias y socios

Su cliente necesita trabajo agéntico senior bajo su marca.

Ingeniería de agentes de marca blanca, el mismo stack detrás de nuestro trabajo público.

Cómo entregamos un sistema agéntico

Desde la comprobación de ajuste del caso de uso hasta un agente lanzado y propio: delimitado, construido con evaluaciones, revisado con un humano en el bucle, endurecido y operado, por ingenieros senior, con el código y la hoja de ruta en sus manos.

01

Delimitar el caso de uso

Fijamos la tarea, las entradas, las acciones que el agente puede ejecutar y el coste de equivocarse en una. Confirmamos que un agente es la herramienta adecuada aquí, y si un flujo o un solo prompt resuelven el caso, lo decimos antes de comprometernos.

  • Frontera de la tarea
  • Mapa de acciones y riesgos
  • Comprobación de ajuste
02

Diseñar el agente y las herramientas

Diseñamos el agente: el framework, el proveedor de modelos, las herramientas y API que llama, el contexto y la recuperación que necesita, y los puntos en los que un humano debe aprobar. El diseño es revisable antes del código, no se descubre durante él.

  • Framework y modelo
  • Herramientas y recuperación
  • Puntos de supervisión
03

Construir con evaluaciones

Construimos el agente y sus evaluaciones a la vez. Las evaluaciones miden si cumple la tarea en los casos que importan, de modo que un cambio que ayuda a un camino y rompe otro aparezca antes de producción en lugar de después.

  • Agente y herramientas
  • Conjunto de evaluaciones
  • Casos de prueba
04

Revisión con humano en el bucle

Cableamos los puntos de confirmación: dónde el agente propone y espera, qué ve un revisor y cómo una acción se aprueba, edita o rechaza. Las acciones de alto riesgo e irreversibles nunca funcionan sin que un humano decida.

  • Flujo de confirmación
  • Vista del revisor
  • Registro de auditoría
05

Endurecer y observar

Añadimos las partes de producción: límites de coste y tasa, reintentos y planes alternativos entre proveedores, barreras de entrada y salida y trazas para que cada paso y cada llamada a herramienta sean visibles. El agente deja de ser una caja negra y se convierte en un sistema que usted puede operar.

  • Barreras y límites
  • Trazas y registros
  • Planes alternativos de proveedor
06

Operar en producción

Desplegamos el agente en su infraestructura y entregamos el código, las evaluaciones y un runbook para que lo opere sin nosotros en el bucle. Un contrato opcional cubre mantenimiento, evaluaciones, actualizaciones de modelos y guardia hasta un objetivo de SLA acordado.

  • Despliegue
  • Runbook y evaluaciones
  • Contrato opcional

Cuándo encaja un agente, y cuándo no

Un sistema agéntico aporta potencia y complejidad a la vez. Cuatro preguntas deciden si es la herramienta adecuada para su caso.

Cuándo encajan los agentes

Los agentes merecen su complejidad cuando una tarea necesita criterio a lo largo de varios pasos: leer el contexto, elegir qué herramienta llamar y actuar sobre el resultado, donde el camino es demasiado variable para un flujo fijo. Si la tarea es una secuencia fija de pasos, un flujo determinista o un script es más simple, más barato y más predecible, y lo recomendamos en su lugar.

Supervisión y seguridad

Los agentes son probabilísticos, por lo que una acción de alto riesgo o difícil de revertir funciona con un humano en el bucle: el agente propone, una persona confirma. Diseñamos esa frontera de forma explícita, añadimos barreras de entrada y salida y mantenemos un registro de auditoría, de modo que el sistema sea autónomo donde es seguro y supervisado donde no.

Datos y alojamiento en la UE

Usted controla a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera donde el caso lo exige, firmamos un Auftragsverarbeitungsvertrag alemán y diseñamos flujos de datos conscientes del RGPD cuando hay datos personales en juego. Las llamadas a modelos de OpenAI o Anthropic se limitan a lo que la tarea necesita.

Propiedad

La lógica del agente, las herramientas, las evaluaciones y los prompts le pertenecen, en su repositorio, construidos sobre frameworks abiertos con el proveedor de modelos detrás de una capa. No hay ninguna licencia de Oronts que bloquee ejecutarlo o cambiarlo, y cualquier equipo de ingeniería competente puede asumirlo, de modo que las elecciones de framework y proveedor nunca son una puerta de un solo sentido.

Prompt único, automatización de flujos o un sistema agéntico

El mismo objetivo pide herramientas muy distintas según lo variable que sea la tarea y cuánto criterio necesite. Aquí es donde un prompt único se detiene, donde un flujo fijo se detiene, y donde un sistema agéntico merece su complejidad añadida.

Desplace lateralmente para comparar las tres columnas.

Prompt únicoAutomatización de flujosAgéntico + Oronts
Maneja tareas variables y de varios pasos que no son un camino fijo
Llama a herramientas y API y ejecuta acciones reales
Decide qué herramienta usar según el contexto
Recupera contexto desde sus propios documentos y datos
Humano en el bucle en acciones de alto riesgo
Evaluación y trazas integradas para producción
Salida determinista y totalmente predecible
Equipo de ingeniería senior detrás

Una marca significa que encaja bien con el caso de fábrica. Un menos significa parcial o que requiere trabajo. Las celdas de texto dicen lo que realmente hace falta. Un flujo determinista sigue siendo la mejor opción donde el camino es fijo y la previsibilidad total importa más que el criterio.

Donde un agente se gana su lugar

Situaciones concretas en las que el juicio a lo largo de varios pasos supera a un guion fijo, y el resultado que el agente junto con nuestra ingeniería entrega.

Comercio

Un comprador describe lo que necesita con sus propias palabras, mientras el catálogo, el stock y los precios viven repartidos en varios sistemas

Un asistente de pago agéntico que recupera los productos adecuados mediante herramientas tipadas, comprueba disponibilidad y precio, y propone el pedido para que una persona lo confirme antes de comprometerlo.

Operaciones

El trabajo rutinario de back-office abarca el correo, el ERP y las herramientas internas, con suficiente variación para que un flujo fijo se rompa una y otra vez

Un agente de operaciones que lee el caso, decide qué herramienta llamar y actúa dentro de límites definidos, escalando a una persona siempre que un paso sea de alto riesgo o difícil de revertir.

Soporte

Las solicitudes entrantes llegan mezcladas en idioma e intención, y las respuestas dependen de sus propios documentos en lugar de conocimiento genérico

Un agente de clasificación de soporte que clasifica y enruta cada solicitud, redacta una respuesta fundamentada con citas a sus fuentes, y entrega los casos sensibles a una persona con todo el contexto.

De un solo prompt a un agente gobernado

La mayoría de los equipos no necesitan un agente el primer día. Le hacemos subir la escalera solo hasta donde la tarea lo exija, y decimos con claridad cuándo un paso más barato ya cubre la necesidad. Cada etapa es un sistema en funcionamiento que es suyo, no un descarte.

    1

    Un solo prompt

    Empezamos con una sola llamada al modelo bien elaborada cuando un solo prompt con buenas instrucciones hace el trabajo. Es la opción más barata y predecible, y para muchas tareas es el punto correcto para detenerse. Le decimos cuándo es suficiente.

    2

    Flujo determinista

    Cuando la tarea es una secuencia fija de pasos, cableamos un flujo determinista o un flujo de n8n que llama a las herramientas en un orden conocido. Totalmente predecible, fácil de razonar y sin juicio del modelo donde no hace falta.

    3

    Recuperación y fundamentación

    Cuando las respuestas dependen de sus propios documentos, añadimos recuperación sobre sus datos con citas a la fuente, de modo que la salida quede anclada en su conocimiento y pueda comprobarse en lugar de confiarse a ciegas.

    4

    Agente gobernado

    Cuando el trabajo realmente necesita juicio a lo largo de varios pasos, lo promovemos a un agente que decide qué herramienta llamar, con barreras de protección, límites de coste y de tasa, evaluaciones y una persona en el bucle en cada acción de alto riesgo.

    5

    Producción y propiedad

    Endurecemos el sistema con trazabilidad, alternativas entre proveedores y un runbook, y luego entregamos el código y las evaluaciones para que lo opere en su propia infraestructura. Un retainer opcional cubre el mantenimiento y las actualizaciones de modelo hasta un objetivo de SLA acordado.

Quién posee qué en una implementación de agentes

Cómo se reparte la responsabilidad entre Oronts, su equipo y los proveedores de modelos y nube en un proyecto agentic.

Distribución de responsabilidades en la cadena de entrega
ResponsabilidadOrontsSu agencia / socioUstedProveedor de modelo / nube
Diseño y orquestación de agentesOronts se encarga de Diseño y orquestación de agentes
Evaluaciones y banco de pruebasOronts se encarga de Evaluaciones y banco de pruebas
Guardarraíles y pasos de aprobaciónOronts se encarga de Guardarraíles y pasos de aprobaciónUsted se encarga de Guardarraíles y pasos de aprobación
Prompts, políticas y reglas de negocioUsted se encarga de Prompts, políticas y reglas de negocio
Alojamiento, datos y claves de modeloUsted se encarga de Alojamiento, datos y claves de modeloProveedor de modelo / nube se encarga de Alojamiento, datos y claves de modelo
Guardia y respuesta a incidentesOronts se encarga de Guardia y respuesta a incidentes
Código y PIUsted se encarga de Código y PI

Cuándo un agente no es la opción correcta

  • Un flujo determinista donde los pasos son fijos y conocidos: un script o un flujo n8n es más simple, más barato y totalmente predecible, y un agente solo añade coste e imprevisibilidad donde no hace ninguna falta.
  • CRUD simple o una sola transformación bien definida: si la tarea es leer, escribir o un mapeo claro, el código simple lo hace mejor que un modelo, y un agente es la herramienta equivocada.
  • Una acción de alto riesgo sin un humano disponible para supervisarla: si nadie puede revisar y confirmar un paso irreversible, un agente autónomo es un riesgo que no recomendamos hasta que exista la supervisión.
  • Un caso que un solo prompt bien diseñado ya resuelve: si una llamada a un modelo con buenas instrucciones cumple la tarea, la orquestación, las herramientas y las evaluaciones de un agente son una sobrecarga que no necesita.

Con quién trabaja

HRB 288224
Registrada en Múnich
15+
Años, dirigida por el fundador
DE · EN · AR
Idiomas de trabajo
2
Código abierto en GitHub
EU
Residencia de datos, Fráncfort
AVV/DPA
Listo para firmar, art. 28

Niveles de compromiso

Oronts trabaja con equipos serios que necesitan entrega senior, no externalización de bajo coste.

Production Pilot
desde 25k EUR
Proyectos de software e IA a medida
desde 50k EUR
Retainers técnicos continuos
desde 15k EUR/mes

El precio exacto depende del alcance, la responsabilidad, la velocidad de entrega, el tamaño del equipo, las integraciones, las expectativas de soporte y el riesgo de producción.

Preguntas sobre IA agéntica, respondidas directamente

El coste de construcción depende del caso de uso: cuántas herramientas toca, cuánta recuperación necesita y cuánta revisión humana exigen las acciones. El coste de operación es sobre todo el uso de modelos de OpenAI o Anthropic más su alojamiento, que mantenemos visible con límites de coste y trazas. Delimitamos un precio fijo para su caso tras la primera llamada, y le decimos si un flujo o un prompt único más barato resolvería el caso en su lugar.
Diseñamos la frontera entre lo que el agente hace por su cuenta y lo que debe proponer para que un humano confirme. Las acciones de alto riesgo e irreversibles nunca funcionan sin que una persona decida. Además, barreras de entrada y salida, límites de tasa y coste y un registro de auditoría de cada paso y cada llamada a herramienta mantienen el sistema dentro de las líneas que usted fija.
Dos capas. La recuperación ancla al agente en sus propios documentos con citas a la fuente, de modo que una respuesta pueda comprobarse en lugar de confiarse a ciegas. Las evaluaciones miden si el agente cumple la tarea en los casos que importan, y las barreras más un humano en el bucle atrapan las acciones de alto riesgo antes de que se ejecuten. No afirmamos que un agente nunca yerre. Diseñamos para que los errores que importan se atrapen.
Usted controla a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera donde el caso lo exige, firmamos un Auftragsverarbeitungsvertrag alemán y diseñamos flujos de datos conscientes del RGPD cuando hay datos personales en juego. Las llamadas a modelos de OpenAI o Anthropic se limitan a lo que la tarea necesita, y nada se enruta a ningún lugar que usted no haya aprobado.
Cuando la tarea es una secuencia fija de pasos, un flujo determinista o un script es más simple y más predecible. Cuando es CRUD simple o una transformación clara, el código simple lo hace mejor. Cuando un solo prompt bien diseñado ya lo resuelve, un agente es una sobrecarga. Y cuando una acción de alto riesgo no tiene un humano que la supervise, no recomendamos un agente autónomo hasta que exista la supervisión. Decimos todo esto en la primera llamada.
Todo: la lógica del agente, las herramientas, las evaluaciones y los prompts se entregan como código en su repositorio, construidos sobre frameworks abiertos como Mastra, LangGraph, CrewAI o el Vercel AI SDK, con el proveedor de modelos detrás de una capa. No hay ninguna licencia de Oronts que bloquee, y cualquier equipo de ingeniería competente puede asumirlo. Dejarnos nunca es una reconstrucción.

Hable con los ingenieros, no con un equipo comercial

Entrega dirigida por el fundador, exclusivamente senior, desde Múnich. Delimite su caso de uso de IA agéntica en una conversación.