Agentes de IA que ejecutan acciones reales, bajo su supervisión
Un agente es la opción correcta cuando una tarea necesita criterio, herramientas y contexto a lo largo de varios pasos. Cuando un script, un flujo o un solo prompt resuelven el caso, se lo decimos en su lugar.
Oronts diseña, construye y opera sistemas de IA agéntica desde Múnich: agentes que llaman a herramientas y API, recuperan el contexto adecuado y ejecutan acciones con un humano en el bucle cuando el riesgo lo exige. Construidos sobre frameworks abiertos como Mastra, LangGraph, CrewAI y el Vercel AI SDK, con modelos de OpenAI y Anthropic, de modo que el sistema le pertenece y puede operarlo en su propia infraestructura.
Elija un sistema de IA agéntica cuando una tarea necesite criterio a lo largo de varios pasos: leer el contexto, decidir qué hacer, llamar a herramientas o API y actuar sobre el resultado, en lugar de seguir un camino fijo. Un agente encaja cuando el trabajo es demasiado variable para un flujo determinista pero demasiado repetitivo y conocido para seguir haciéndolo a mano: triaje y enrutamiento, recuperación sobre sus propios documentos, redacción y revisión, investigación en varios pasos y operaciones que tocan varios sistemas. Los construimos sobre frameworks abiertos, Mastra, LangGraph, CrewAI y el Vercel AI SDK, con modelos de OpenAI y Anthropic detrás de una capa independiente del proveedor, de modo que nunca queda atado a un solo proveedor. El compromiso: los agentes son probabilísticos, por lo que necesitan barreras, evaluación y un humano en el bucle allí donde una acción sea de alto riesgo o difícil de revertir. Donde un script determinista, un flujo n8n o un solo prompt cubren la necesidad, lo decimos con claridad en la primera llamada. La prueba que citamos es nuestro propio asistente funcionando en producción en este sitio, construido sobre Mastra.
Agentes que usan herramientas y API, recuperan contexto y ejecutan acciones reales, no solo conversan
Construidos sobre frameworks abiertos: Mastra, LangGraph, CrewAI y el Vercel AI SDK
Independientes del proveedor entre OpenAI y Anthropic, de modo que no queda atado a un solo proveedor de modelos
Humano en el bucle y barreras allí donde una acción sea de alto riesgo o difícil de revertir
Pruebasantesquepromesas
En funcionamiento en este sitio, en producción
En vivo
El asistente de este sitio es un sistema agéntico que construimos sobre Mastra, en producción. No es una demo tras un inicio de sesión: es el mismo tipo de agente que usa herramientas y recupera contexto que construimos para clientes, y puede usarlo aquí antes de hablar con nosotros.
Nuestros agentes llaman a herramientas y API y ejecutan acciones, pero las de alto riesgo funcionan con un humano en el bucle. Definimos dónde un agente actúa por su cuenta y dónde debe proponer y esperar confirmación, de modo que una acción irreversible nunca ocurra en silencio.
Ingeniería independiente del framework
Capacidad
Construimos sobre frameworks abiertos, Mastra, LangGraph, CrewAI y el Vercel AI SDK, y mantenemos el proveedor de modelos detrás de una capa, OpenAI o Anthropic. La lógica del agente le pertenece, en su repositorio, de modo que una elección de framework o de modelo nunca es una puerta de un solo sentido.
Tratamiento de datos en la UE
Capacidad
Diseñamos el flujo de datos para que usted controle a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Cuando hay datos personales en juego, trabajamos con conciencia del RGPD, firmamos un Auftragsverarbeitungsvertrag alemán y mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera cuando el caso lo exige.
Orquestaciónmultiagente
Un coordinador planifica el trabajo y lo distribuye entre agentes especializados, con traspasos explícitos, memoria compartida y herramientas acotadas.
Los traspasos son explícitos y observables, la memoria compartida transporta el estado entre agentes y una compuerta de aprobación humana protege las acciones de mayor impacto.
QuéhacemosconlaIAagéntica
Diseño y delimitación del agente
Definimos qué debe hacer el agente, dónde actúa por su cuenta y dónde un humano aprueba. El resultado es un diseño delimitado: la frontera de la tarea, las herramientas, el contexto que necesita y los puntos en los que debe detenerse y preguntar, antes de empezar a construir.
Integración de herramientas y API
Los agentes solo son útiles si pueden actuar. Los conectamos a sus sistemas mediante herramientas y API limpias y tipadas, con idempotencia y manejo de errores, de modo que una llamada a una herramienta sea segura de reintentar y un fallo sea visible en lugar de silencioso.
RAG y recuperación
Construimos recuperación sobre sus propios documentos y datos, de modo que el agente responda desde su conocimiento, no desde su entrenamiento. Troceado, embeddings y un almacén vectorial conectados al agente, con citas a la fuente, de modo que una respuesta pueda comprobarse.
Humano en el bucle y barreras
Diseñamos la frontera entre lo que un agente hace de forma autónoma y lo que propone para confirmación, más barreras de entrada y salida, límites de tasa y coste y un registro de auditoría claro, de modo que el sistema se mantenga dentro de las líneas que usted fija.
Evaluación y observabilidad
Construimos evaluaciones que miden si el agente cumple la tarea, más trazas y registro para que vea cada paso, cada llamada a herramienta y cada decisión en producción. Sin evaluaciones un agente es una caja negra, por eso las tratamos como parte de la construcción, no como una ocurrencia tardía.
Endurecimiento para producción
Llevamos un agente de un prototipo funcional a algo que usted puede operar: controles de coste, reintentos y planes alternativos entre proveedores de modelos, validación de prompts y salidas, monitorización y un despliegue que sus ingenieros pueden operar sin nosotros en el bucle.
Diseñadoparasuequipo
Los agentes actúan sobre sus sistemas, por lo que cada puesto en la mesa los evalúa de manera diferente.
CTOs y líderes de TI
Usted quiere agentes que pueda ejecutar y cambiar, no una plataforma de caja negra.
Agentes neutrales en cuanto a modelos en marcos abiertos, su código, alojamiento en UE, sin dependencia de proveedores.
Empresa y adquisiciones
Los agentes que actúan sobre sistemas necesitan gobernanza y auditoría.
Aprobación con persona en el bucle, registro de auditoría y barreras de protección, disponibilidad de RGPD y TOM.
CTOs de startups y fundadores
Usted necesita un agente que funcione, no un proyecto de investigación.
Un agente acotado entregado en una prueba piloto de 90 días, luego escalado.
Agencias y socios
Su cliente necesita trabajo agéntico senior bajo su marca.
Ingeniería de agentes de marca blanca, el mismo stack detrás de nuestro trabajo público.
Cómoentregamosunsistemaagéntico
Desde la comprobación de ajuste del caso de uso hasta un agente lanzado y propio: delimitado, construido con evaluaciones, revisado con un humano en el bucle, endurecido y operado, por ingenieros senior, con el código y la hoja de ruta en sus manos.
01
Delimitar el caso de uso
Fijamos la tarea, las entradas, las acciones que el agente puede ejecutar y el coste de equivocarse en una. Confirmamos que un agente es la herramienta adecuada aquí, y si un flujo o un solo prompt resuelven el caso, lo decimos antes de comprometernos.
Frontera de la tarea
Mapa de acciones y riesgos
Comprobación de ajuste
02
Diseñar el agente y las herramientas
Diseñamos el agente: el framework, el proveedor de modelos, las herramientas y API que llama, el contexto y la recuperación que necesita, y los puntos en los que un humano debe aprobar. El diseño es revisable antes del código, no se descubre durante él.
Framework y modelo
Herramientas y recuperación
Puntos de supervisión
03
Construir con evaluaciones
Construimos el agente y sus evaluaciones a la vez. Las evaluaciones miden si cumple la tarea en los casos que importan, de modo que un cambio que ayuda a un camino y rompe otro aparezca antes de producción en lugar de después.
Agente y herramientas
Conjunto de evaluaciones
Casos de prueba
04
Revisión con humano en el bucle
Cableamos los puntos de confirmación: dónde el agente propone y espera, qué ve un revisor y cómo una acción se aprueba, edita o rechaza. Las acciones de alto riesgo e irreversibles nunca funcionan sin que un humano decida.
Flujo de confirmación
Vista del revisor
Registro de auditoría
05
Endurecer y observar
Añadimos las partes de producción: límites de coste y tasa, reintentos y planes alternativos entre proveedores, barreras de entrada y salida y trazas para que cada paso y cada llamada a herramienta sean visibles. El agente deja de ser una caja negra y se convierte en un sistema que usted puede operar.
Barreras y límites
Trazas y registros
Planes alternativos de proveedor
06
Operar en producción
Desplegamos el agente en su infraestructura y entregamos el código, las evaluaciones y un runbook para que lo opere sin nosotros en el bucle. Un contrato opcional cubre mantenimiento, evaluaciones, actualizaciones de modelos y guardia hasta un objetivo de SLA acordado.
Despliegue
Runbook y evaluaciones
Contrato opcional
Cuándoencajaunagente,ycuándono
Un sistema agéntico aporta potencia y complejidad a la vez. Cuatro preguntas deciden si es la herramienta adecuada para su caso.
Cuándo encajan los agentes
Los agentes merecen su complejidad cuando una tarea necesita criterio a lo largo de varios pasos: leer el contexto, elegir qué herramienta llamar y actuar sobre el resultado, donde el camino es demasiado variable para un flujo fijo. Si la tarea es una secuencia fija de pasos, un flujo determinista o un script es más simple, más barato y más predecible, y lo recomendamos en su lugar.
Supervisión y seguridad
Los agentes son probabilísticos, por lo que una acción de alto riesgo o difícil de revertir funciona con un humano en el bucle: el agente propone, una persona confirma. Diseñamos esa frontera de forma explícita, añadimos barreras de entrada y salida y mantenemos un registro de auditoría, de modo que el sistema sea autónomo donde es seguro y supervisado donde no.
Datos y alojamiento en la UE
Usted controla a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera donde el caso lo exige, firmamos un Auftragsverarbeitungsvertrag alemán y diseñamos flujos de datos conscientes del RGPD cuando hay datos personales en juego. Las llamadas a modelos de OpenAI o Anthropic se limitan a lo que la tarea necesita.
Propiedad
La lógica del agente, las herramientas, las evaluaciones y los prompts le pertenecen, en su repositorio, construidos sobre frameworks abiertos con el proveedor de modelos detrás de una capa. No hay ninguna licencia de Oronts que bloquee ejecutarlo o cambiarlo, y cualquier equipo de ingeniería competente puede asumirlo, de modo que las elecciones de framework y proveedor nunca son una puerta de un solo sentido.
El mismo objetivo pide herramientas muy distintas según lo variable que sea la tarea y cuánto criterio necesite. Aquí es donde un prompt único se detiene, donde un flujo fijo se detiene, y donde un sistema agéntico merece su complejidad añadida.
Desplace lateralmente para comparar las tres columnas.
Prompt único
Automatización de flujos
Agéntico + Oronts
Maneja tareas variables y de varios pasos que no son un camino fijo
Llama a herramientas y API y ejecuta acciones reales
Decide qué herramienta usar según el contexto
Recupera contexto desde sus propios documentos y datos
Humano en el bucle en acciones de alto riesgo
Evaluación y trazas integradas para producción
Salida determinista y totalmente predecible
Equipo de ingeniería senior detrás
Una marca significa que encaja bien con el caso de fábrica. Un menos significa parcial o que requiere trabajo. Las celdas de texto dicen lo que realmente hace falta. Un flujo determinista sigue siendo la mejor opción donde el camino es fijo y la previsibilidad total importa más que el criterio.
Dondeunagenteseganasulugar
Situaciones concretas en las que el juicio a lo largo de varios pasos supera a un guion fijo, y el resultado que el agente junto con nuestra ingeniería entrega.
Comercio
Un comprador describe lo que necesita con sus propias palabras, mientras el catálogo, el stock y los precios viven repartidos en varios sistemas
Un asistente de pago agéntico que recupera los productos adecuados mediante herramientas tipadas, comprueba disponibilidad y precio, y propone el pedido para que una persona lo confirme antes de comprometerlo.
Operaciones
El trabajo rutinario de back-office abarca el correo, el ERP y las herramientas internas, con suficiente variación para que un flujo fijo se rompa una y otra vez
Un agente de operaciones que lee el caso, decide qué herramienta llamar y actúa dentro de límites definidos, escalando a una persona siempre que un paso sea de alto riesgo o difícil de revertir.
Soporte
Las solicitudes entrantes llegan mezcladas en idioma e intención, y las respuestas dependen de sus propios documentos en lugar de conocimiento genérico
Un agente de clasificación de soporte que clasifica y enruta cada solicitud, redacta una respuesta fundamentada con citas a sus fuentes, y entrega los casos sensibles a una persona con todo el contexto.
Deunsolopromptaunagentegobernado
La mayoría de los equipos no necesitan un agente el primer día. Le hacemos subir la escalera solo hasta donde la tarea lo exija, y decimos con claridad cuándo un paso más barato ya cubre la necesidad. Cada etapa es un sistema en funcionamiento que es suyo, no un descarte.
1
Un solo prompt
Empezamos con una sola llamada al modelo bien elaborada cuando un solo prompt con buenas instrucciones hace el trabajo. Es la opción más barata y predecible, y para muchas tareas es el punto correcto para detenerse. Le decimos cuándo es suficiente.
2
Flujo determinista
Cuando la tarea es una secuencia fija de pasos, cableamos un flujo determinista o un flujo de n8n que llama a las herramientas en un orden conocido. Totalmente predecible, fácil de razonar y sin juicio del modelo donde no hace falta.
3
Recuperación y fundamentación
Cuando las respuestas dependen de sus propios documentos, añadimos recuperación sobre sus datos con citas a la fuente, de modo que la salida quede anclada en su conocimiento y pueda comprobarse en lugar de confiarse a ciegas.
4
Agente gobernado
Cuando el trabajo realmente necesita juicio a lo largo de varios pasos, lo promovemos a un agente que decide qué herramienta llamar, con barreras de protección, límites de coste y de tasa, evaluaciones y una persona en el bucle en cada acción de alto riesgo.
5
Producción y propiedad
Endurecemos el sistema con trazabilidad, alternativas entre proveedores y un runbook, y luego entregamos el código y las evaluaciones para que lo opere en su propia infraestructura. Un retainer opcional cubre el mantenimiento y las actualizaciones de modelo hasta un objetivo de SLA acordado.
Quiénposeequéenunaimplementacióndeagentes
Cómo se reparte la responsabilidad entre Oronts, su equipo y los proveedores de modelos y nube en un proyecto agentic.
Distribución de responsabilidades en la cadena de entrega
Responsabilidad
Oronts
Su agencia / socio
Usted
Proveedor de modelo / nube
Diseño y orquestación de agentes
Oronts se encarga de Diseño y orquestación de agentes
–
–
–
Evaluaciones y banco de pruebas
Oronts se encarga de Evaluaciones y banco de pruebas
–
–
–
Guardarraíles y pasos de aprobación
Oronts se encarga de Guardarraíles y pasos de aprobación
–
Usted se encarga de Guardarraíles y pasos de aprobación
–
Prompts, políticas y reglas de negocio
–
–
Usted se encarga de Prompts, políticas y reglas de negocio
–
Alojamiento, datos y claves de modelo
–
–
Usted se encarga de Alojamiento, datos y claves de modelo
Proveedor de modelo / nube se encarga de Alojamiento, datos y claves de modelo
Guardia y respuesta a incidentes
Oronts se encarga de Guardia y respuesta a incidentes
–
–
–
Código y PI
–
–
Usted se encarga de Código y PI
–
Cuándounagentenoeslaopcióncorrecta
Un flujo determinista donde los pasos son fijos y conocidos: un script o un flujo n8n es más simple, más barato y totalmente predecible, y un agente solo añade coste e imprevisibilidad donde no hace ninguna falta.
CRUD simple o una sola transformación bien definida: si la tarea es leer, escribir o un mapeo claro, el código simple lo hace mejor que un modelo, y un agente es la herramienta equivocada.
Una acción de alto riesgo sin un humano disponible para supervisarla: si nadie puede revisar y confirmar un paso irreversible, un agente autónomo es un riesgo que no recomendamos hasta que exista la supervisión.
Un caso que un solo prompt bien diseñado ya resuelve: si una llamada a un modelo con buenas instrucciones cumple la tarea, la orquestación, las herramientas y las evaluaciones de un agente son una sobrecarga que no necesita.
Oronts trabaja con equipos serios que necesitan entrega senior, no externalización de bajo coste.
Production Pilot
desde 25k EUR
Proyectos de software e IA a medida
desde 50k EUR
Retainers técnicos continuos
desde 15k EUR/mes
El precio exacto depende del alcance, la responsabilidad, la velocidad de entrega, el tamaño del equipo, las integraciones, las expectativas de soporte y el riesgo de producción.
El coste de construcción depende del caso de uso: cuántas herramientas toca, cuánta recuperación necesita y cuánta revisión humana exigen las acciones. El coste de operación es sobre todo el uso de modelos de OpenAI o Anthropic más su alojamiento, que mantenemos visible con límites de coste y trazas. Delimitamos un precio fijo para su caso tras la primera llamada, y le decimos si un flujo o un prompt único más barato resolvería el caso en su lugar.
Diseñamos la frontera entre lo que el agente hace por su cuenta y lo que debe proponer para que un humano confirme. Las acciones de alto riesgo e irreversibles nunca funcionan sin que una persona decida. Además, barreras de entrada y salida, límites de tasa y coste y un registro de auditoría de cada paso y cada llamada a herramienta mantienen el sistema dentro de las líneas que usted fija.
Dos capas. La recuperación ancla al agente en sus propios documentos con citas a la fuente, de modo que una respuesta pueda comprobarse en lugar de confiarse a ciegas. Las evaluaciones miden si el agente cumple la tarea en los casos que importan, y las barreras más un humano en el bucle atrapan las acciones de alto riesgo antes de que se ejecuten. No afirmamos que un agente nunca yerre. Diseñamos para que los errores que importan se atrapen.
Usted controla a dónde van el contexto y los prompts y qué proveedor de modelos ve qué. Mantenemos la recuperación y el almacenamiento en una infraestructura que usted opera donde el caso lo exige, firmamos un Auftragsverarbeitungsvertrag alemán y diseñamos flujos de datos conscientes del RGPD cuando hay datos personales en juego. Las llamadas a modelos de OpenAI o Anthropic se limitan a lo que la tarea necesita, y nada se enruta a ningún lugar que usted no haya aprobado.
Cuando la tarea es una secuencia fija de pasos, un flujo determinista o un script es más simple y más predecible. Cuando es CRUD simple o una transformación clara, el código simple lo hace mejor. Cuando un solo prompt bien diseñado ya lo resuelve, un agente es una sobrecarga. Y cuando una acción de alto riesgo no tiene un humano que la supervise, no recomendamos un agente autónomo hasta que exista la supervisión. Decimos todo esto en la primera llamada.
Todo: la lógica del agente, las herramientas, las evaluaciones y los prompts se entregan como código en su repositorio, construidos sobre frameworks abiertos como Mastra, LangGraph, CrewAI o el Vercel AI SDK, con el proveedor de modelos detrás de una capa. No hay ninguna licencia de Oronts que bloquee, y cualquier equipo de ingeniería competente puede asumirlo. Dejarnos nunca es una reconstrucción.