Generación Aumentada por Recuperación

RAG, diseñado para producción, no para demostraciones

Un único tipo de RAG fracasa a escala empresarial. Nosotros diseñamos la combinación adecuada.

La Generación Aumentada por Recuperación fundamenta un modelo de lenguaje en sus datos aprobados para que las respuestas sigan siendo precisas y trazables. A escala empresarial, una sola búsqueda vectorial ingenua no basta: productos, documentos, clientes y sistemas de socios necesitan cada uno una estrategia de recuperación distinta. Diseñamos, construimos y operamos la combinación adecuada, con alojamiento en la UE, con su código y sin dependencia de proveedor.

Hable con un ingeniero Vea nuestro trabajo en IA

Por qué un solo tipo de RAG no es suficiente

La Generación Aumentada por Recuperación (RAG) conecta un modelo de lenguaje con sus propios datos para que responda a partir de fuentes aprobadas en lugar de adivinar. Una demostración ejecuta una sola búsqueda vectorial sobre una carpeta de texto. Un sistema en producción a escala empresarial superpone una recuperación especializada por tipo de dato, fusiona la búsqueda por palabras clave y la vectorial, recorre grafos de conocimiento en busca de relaciones y enruta cada consulta hacia la estrategia adecuada. Diseñamos esa taxonomía completa, fundamentada, consciente de los permisos y auditada de forma predeterminada.

Respuestas fundamentadas con citas, no alucinaciones
Recuperación consciente de los permisos, acotada antes de que el modelo la vea
Recuperación Hybrid, por grafo y Agentic, no una única búsqueda vectorial
Alojamiento en la UE, su código, neutral respecto al modelo, sin dependencia de proveedor

Cómo funciona RAG, de principio a fin

Desde sus datos hasta una respuesta fundamentada: ingeridos e incrustados, recuperados mediante búsqueda Hybrid y por grafo, reordenados y, después, generados y verificados.

La recuperación Hybrid fusiona la búsqueda vectorial, por palabras clave y por grafo. Una capa de salvaguardas, evaluación y auditoría envuelve cada paso antes de devolver la respuesta.

La taxonomía de RAG

RAG especializado, ajustado al problema

Las arquitecturas de IA modernas usan una taxonomía de patrones de recuperación. Trabajamos con las tres familias y las combinamos por activo de datos.

Arquitectónico y algorítmico básico

Las arquitecturas de recuperación, elegidas según la forma de los datos y el grado de exactitud que debe tener la coincidencia.

Naive / Standard RAG

Búsqueda vectorial de un solo paso sobre fragmentos de texto.

Coincidencia simple de preguntas frecuentes

GraphRAG

Los grafos de conocimiento enlazan entidades, por ejemplo un cliente con los productos comprados a través de una arista de transacción.

Relaciones y entidades

Hybrid RAG

Fusiona la búsqueda por palabras clave (BM25) con la similitud vectorial.

Coincidencia exacta de SKU y código

Hierarchical RAG (RAPTOR)

Resume el texto de forma recursiva en árboles padre-hijo.

Contratos y manuales extensos

Multimodal RAG

Recupera a la vez sobre texto, imágenes, vídeo y audio.

De fotos a fichas de producto

Bucles dinámicos y Agentic

Bucles que deciden, verifican y enrutan, para respuestas de múltiples fuentes y control de calidad.

Agentic RAG

Agentes equipados con herramientas planifican una recuperación de varios pasos a través de silos de datos independientes.

Respuestas entre sistemas

Corrective RAG (CRAG)

Un evaluador juzga la calidad de la recuperación y recurre a otra fuente cuando es deficiente.

Garantías de precisión

Self-RAG

El modelo critica su propia salida y vuelve a recuperar cuando es necesario.

Control de calidad en tiempo real

Adaptive RAG

Un enrutador lee primero la consulta y luego la envía a una vía económica o a una más exigente.

Control de coste y latencia

Ingeniería de contexto y de entrada

Diseñar cada fragmento y cada turno para que aporte el contexto adecuado antes de incorporarlo al embedding.

Conversational RAG

Tiene en cuenta todo el historial del diálogo para que las preguntas de seguimiento conserven su referente.

Asistentes de varios turnos

Contextual Retrieval

Antepone el contexto global del documento a cada fragmento antes de incrustarlo.

Sin enlaces semánticos rotos

HyDE

Genera primero una respuesta hipotética y luego busca con ella para salvar las diferencias de vocabulario.

De la jerga a los términos internos

GraphRAG: respuestas que siguen las relaciones

La búsqueda vectorial por sí sola encuentra coincidencias de texto que parecen similares. GraphRAG añade una capa de entidades y relaciones tipadas, de modo que el sistema puede responder preguntas que dependen de cómo se conectan sus datos: un cliente con sus pedidos, un pedido con sus productos, un producto con su política. Para datos de comercio, soporte e ingeniería, esa es la diferencia entre una suposición plausible y una respuesta correcta y trazable.

Un grafo de conocimiento enlaza entidades mediante aristas tipadas, de modo que una consulta puede recorrer desde un cliente hasta los productos y documentos exactos que fundamentan la respuesta.

Asigne RAG a sus activos de datos

Para escalar, cada tipo de entidad se asigna a la arquitectura de recuperación que mejor le conviene. Así estructuramos la recuperación para una plataforma de comercio empresarial.

	Estrategia RAG óptima	Por qué importa esta elección
Productos de comercio electrónico	Hybrid RAG + GraphRAG	Evita que la búsqueda semántica alucine recuentos de inventario o seleccione la talla o el SKU equivocados.
Documentos	Hierarchical RAG + Conversational	Resume manuales y contratos completos con precisión mientras mantiene el hilo del diálogo.
Clientes	GraphRAG + consciente del contexto	Encuentra vínculos estructurales en el historial de pedidos para mostrar rutas de compra personalizadas.
Agencias y socios	Agentic RAG	Obtiene datos de forma activa desde plataformas de terceros mediante un uso de herramientas en vivo y auditado.

Ejemplos mostrados para una plataforma de comercio; el mismo método de asignación se aplica a datos de fabricación, finanzas y sector público.

Estado objetivo en producción

Structured Agentic RAG

En producción no se elige un solo tipo de RAG. Un enrutador Adaptive RAG se sitúa por encima y envía cada consulta por la vía adecuada.

El enrutador clasifica cada consulta y luego la envía a una búsqueda simple, a un recorrido de grafo o a herramientas Agentic en vivo, reconvergiendo a través de salvaguardas y evaluación.

¿Cuál es el estado de mi envío?

Agentic RAGconsulta la API de logística en vivo.

¿Hay chaquetas que combinen con los zapatos que compré el mes pasado?

GraphRAGevalúa el grafo de compras de cliente a producto.

Qué obtiene cada equipo

Las decisiones sobre RAG se ven distintas desde cada puesto. Esto es lo que importa a las personas que aprueban la arquitectura.

CTO y responsables de TI

Necesita respuestas fundamentadas en sus sistemas, no un chatbot que invente políticas.

Una arquitectura de recuperación con nombre propio, que se ejecuta en su nube, conforme al nivel del RGPD y con evaluaciones en cada cambio.

Empresa y compras

Un comité de compras tiene que auditar cómo llega el sistema a una respuesta.

Citas, recuperación consciente de los permisos y un registro de auditoría, con preparación para AVV y TOM.

CTO y fundadores de startups

Quiere recuperación funcional en semanas, no un proyecto de investigación.

Un Hybrid o Agentic RAG pragmático entregado en un piloto de 90 días y luego escalado.

Agencias y socios

Su cliente necesita trabajo sénior de RAG entregado bajo su marca.

Ingeniería de recuperación de marca blanca, con la misma disciplina que respalda nuestro trabajo de código abierto.

Ingeniería pública que puede inspeccionar

En producción en este sitio

En vivo

El asistente de este sitio es un sistema agéntico que usa herramientas, construido por nosotros y en producción, no una demo tras un inicio de sesión.

Vendure Data Hub

Open source

Un plugin de comercio Vendure que construimos y publicamos, público en GitHub. Dos de nuestros once bundles desarrollados son públicos.

Ver en GitHub

Pimcore Asset Pilot

Open source

Un bundle de assets de Pimcore que construimos y publicamos, público en GitHub e inspeccionable de extremo a extremo.

Ver en GitHub

Cuándo RAG no es la respuesta

La verdad numérica puramente en tiempo real, por ejemplo los recuentos de inventario en vivo, corresponde a una consulta directa, no a la recuperación.
Cambiar el tono o el comportamiento esencial del modelo es una tarea de ajuste fino, no de RAG.
Una base de conocimiento estática y minúscula puede resultar más económica si se coloca directamente en el prompt.
Las tareas sin una fuente de verdad sobre la que fundamentarse no son un problema de recuperación.

Preguntas que los equipos hacen sobre RAG

Se agrupan en tres familias: patrones arquitectónicos básicos (Naive, GraphRAG, Hybrid, Hierarchical o RAPTOR, Multimodal), bucles dinámicos y Agentic (Agentic RAG, Corrective o CRAG, Self-RAG, Adaptive RAG) e ingeniería de contexto (Conversational, Contextual Retrieval, HyDE). Los sistemas en producción combinan varios.

Agentic RAG dota al sistema de agentes equipados con herramientas que planifican una recuperación de varios pasos a través de fuentes de datos independientes, incluidas API en vivo, en lugar de una sola búsqueda vectorial. Es el patrón adecuado cuando una respuesta necesita datos de más de un sistema.

El RAG vectorial es mejor para la similitud difusa de texto. GraphRAG es mejor cuando la respuesta depende de relaciones entre entidades, por ejemplo vincular un cliente con productos a través del historial de compras. La mayoría de los sistemas empresariales usan ambos detrás de un enrutador.

RAG fundamenta el modelo en datos actuales y aprobados y mantiene las respuestas trazables. El ajuste fino cambia el tono, el estilo o la lógica de dominio del modelo. Resuelven problemas distintos y a menudo se ejecutan juntos; le asesoramos sobre cuál encaja en cada caso.

Los productos usan Hybrid RAG más GraphRAG para que no se aluciquen SKU exactos ni el inventario; los documentos usan Hierarchical RAG; los clientes usan GraphRAG; los sistemas de socios usan Agentic RAG. Un enrutador Adaptive los une.

La recuperación es la base. La producción también necesita evaluación, salvaguardas, contexto consciente de los permisos, observabilidad y enrutamiento. Diseñamos el sistema completo, con alojamiento en la UE, con su código y sin dependencia de proveedor.

Explore el stack de IA

Frameworks agénticos

IA en producción

IA empresarial

Fundamente su IA en sus propios datos

Cuéntenos cómo son sus sistemas y datos. Asignaremos la arquitectura de recuperación adecuada y un camino hacia producción.

Hable con un ingeniero

Vea nuestro trabajo en IA

Con quién trabaja

HRB 288224

Registrada en Múnich

15+

Años, dirigida por el fundador

DE · EN · AR

Idiomas de trabajo

Código abierto en GitHub

Residencia de datos, Fráncfort

AVV/DPA

Listo para firmar, art. 28

Niveles de compromiso

Oronts trabaja con equipos serios que necesitan entrega senior, no externalización de bajo coste.

Production Pilot: desde 25k EUR
Proyectos de software e IA a medida: desde 50k EUR
Retainers técnicos continuos: desde 15k EUR/mes

El precio exacto depende del alcance, la responsabilidad, la velocidad de entrega, el tamaño del equipo, las integraciones, las expectativas de soporte y el riesgo de producción.

Definir el piloto de 90 días