Generación Aumentada por Recuperación

RAG, diseñado para producción, no para demostraciones

Un único tipo de RAG fracasa a escala empresarial. Nosotros diseñamos la combinación adecuada.

La Generación Aumentada por Recuperación fundamenta un modelo de lenguaje en sus datos aprobados para que las respuestas sigan siendo precisas y trazables. A escala empresarial, una sola búsqueda vectorial ingenua no basta: productos, documentos, clientes y sistemas de socios necesitan cada uno una estrategia de recuperación distinta. Diseñamos, construimos y operamos la combinación adecuada, con alojamiento en la UE, con su código y sin dependencia de proveedor.

Por qué un solo tipo de RAG no es suficiente

La Generación Aumentada por Recuperación (RAG) conecta un modelo de lenguaje con sus propios datos para que responda a partir de fuentes aprobadas en lugar de adivinar. Una demostración ejecuta una sola búsqueda vectorial sobre una carpeta de texto. Un sistema en producción a escala empresarial superpone una recuperación especializada por tipo de dato, fusiona la búsqueda por palabras clave y la vectorial, recorre grafos de conocimiento en busca de relaciones y enruta cada consulta hacia la estrategia adecuada. Diseñamos esa taxonomía completa, fundamentada, consciente de los permisos y auditada de forma predeterminada.

  • Respuestas fundamentadas con citas, no alucinaciones
  • Recuperación consciente de los permisos, acotada antes de que el modelo la vea
  • Recuperación Hybrid, por grafo y Agentic, no una única búsqueda vectorial
  • Alojamiento en la UE, su código, neutral respecto al modelo, sin dependencia de proveedor

Cómo funciona RAG, de principio a fin

Desde sus datos hasta una respuesta fundamentada: ingeridos e incrustados, recuperados mediante búsqueda Hybrid y por grafo, reordenados y, después, generados y verificados.

Your dataDB, docs, APIsEmbed + chunkpermission-scopedVector searchKeyword (BM25)Knowledge graphRerank + contextLLMGrounded answerwith citationsGuardrails + evaluation + audit on every step

La recuperación Hybrid fusiona la búsqueda vectorial, por palabras clave y por grafo. Una capa de salvaguardas, evaluación y auditoría envuelve cada paso antes de devolver la respuesta.

La taxonomía de RAG

RAG especializado, ajustado al problema

Las arquitecturas de IA modernas usan una taxonomía de patrones de recuperación. Trabajamos con las tres familias y las combinamos por activo de datos.

Arquitectónico y algorítmico básico

Las arquitecturas de recuperación, elegidas según la forma de los datos y el grado de exactitud que debe tener la coincidencia.

Naive / Standard RAG

Búsqueda vectorial de un solo paso sobre fragmentos de texto.

Coincidencia simple de preguntas frecuentes

GraphRAG

Los grafos de conocimiento enlazan entidades, por ejemplo un cliente con los productos comprados a través de una arista de transacción.

Relaciones y entidades

Hybrid RAG

Fusiona la búsqueda por palabras clave (BM25) con la similitud vectorial.

Coincidencia exacta de SKU y código

Hierarchical RAG (RAPTOR)

Resume el texto de forma recursiva en árboles padre-hijo.

Contratos y manuales extensos

Multimodal RAG

Recupera a la vez sobre texto, imágenes, vídeo y audio.

De fotos a fichas de producto

Bucles dinámicos y Agentic

Bucles que deciden, verifican y enrutan, para respuestas de múltiples fuentes y control de calidad.

Agentic RAG

Agentes equipados con herramientas planifican una recuperación de varios pasos a través de silos de datos independientes.

Respuestas entre sistemas

Corrective RAG (CRAG)

Un evaluador juzga la calidad de la recuperación y recurre a otra fuente cuando es deficiente.

Garantías de precisión

Self-RAG

El modelo critica su propia salida y vuelve a recuperar cuando es necesario.

Control de calidad en tiempo real

Adaptive RAG

Un enrutador lee primero la consulta y luego la envía a una vía económica o a una más exigente.

Control de coste y latencia

Ingeniería de contexto y de entrada

Diseñar cada fragmento y cada turno para que aporte el contexto adecuado antes de incorporarlo al embedding.

Conversational RAG

Tiene en cuenta todo el historial del diálogo para que las preguntas de seguimiento conserven su referente.

Asistentes de varios turnos

Contextual Retrieval

Antepone el contexto global del documento a cada fragmento antes de incrustarlo.

Sin enlaces semánticos rotos

HyDE

Genera primero una respuesta hipotética y luego busca con ella para salvar las diferencias de vocabulario.

De la jerga a los términos internos

GraphRAG: respuestas que siguen las relaciones

La búsqueda vectorial por sí sola encuentra coincidencias de texto que parecen similares. GraphRAG añade una capa de entidades y relaciones tipadas, de modo que el sistema puede responder preguntas que dependen de cómo se conectan sus datos: un cliente con sus pedidos, un pedido con sus productos, un producto con su política. Para datos de comercio, soporte e ingeniería, esa es la diferencia entre una suposición plausible y una respuesta correcta y trazable.

placedviewedboughtcitesCustomerOrderDocumentJacketShoesPolicy

Un grafo de conocimiento enlaza entidades mediante aristas tipadas, de modo que una consulta puede recorrer desde un cliente hasta los productos y documentos exactos que fundamentan la respuesta.

Asigne RAG a sus activos de datos

Para escalar, cada tipo de entidad se asigna a la arquitectura de recuperación que mejor le conviene. Así estructuramos la recuperación para una plataforma de comercio empresarial.

Estrategia RAG óptimaPor qué importa esta elección
Productos de comercio electrónicoHybrid RAG + GraphRAGEvita que la búsqueda semántica alucine recuentos de inventario o seleccione la talla o el SKU equivocados.
DocumentosHierarchical RAG + ConversationalResume manuales y contratos completos con precisión mientras mantiene el hilo del diálogo.
ClientesGraphRAG + consciente del contextoEncuentra vínculos estructurales en el historial de pedidos para mostrar rutas de compra personalizadas.
Agencias y sociosAgentic RAGObtiene datos de forma activa desde plataformas de terceros mediante un uso de herramientas en vivo y auditado.

Ejemplos mostrados para una plataforma de comercio; el mismo método de asignación se aplica a datos de fabricación, finanzas y sector público.

Estado objetivo en producción

Structured Agentic RAG

En producción no se elige un solo tipo de RAG. Un enrutador Adaptive RAG se sitúa por encima y envía cada consulta por la vía adecuada.

QueryAdaptive routerclassify + routeSimple lookupGraph traversalAgentic toolslive APIsGuardrail + evalAnswer

El enrutador clasifica cada consulta y luego la envía a una búsqueda simple, a un recorrido de grafo o a herramientas Agentic en vivo, reconvergiendo a través de salvaguardas y evaluación.

¿Cuál es el estado de mi envío?

Agentic RAGconsulta la API de logística en vivo.

¿Hay chaquetas que combinen con los zapatos que compré el mes pasado?

GraphRAGevalúa el grafo de compras de cliente a producto.

Qué obtiene cada equipo

Las decisiones sobre RAG se ven distintas desde cada puesto. Esto es lo que importa a las personas que aprueban la arquitectura.

CTO y responsables de TI

Necesita respuestas fundamentadas en sus sistemas, no un chatbot que invente políticas.

Una arquitectura de recuperación con nombre propio, que se ejecuta en su nube, conforme al nivel del RGPD y con evaluaciones en cada cambio.

Empresa y compras

Un comité de compras tiene que auditar cómo llega el sistema a una respuesta.

Citas, recuperación consciente de los permisos y un registro de auditoría, con preparación para AVV y TOM.

CTO y fundadores de startups

Quiere recuperación funcional en semanas, no un proyecto de investigación.

Un Hybrid o Agentic RAG pragmático entregado en un piloto de 90 días y luego escalado.

Agencias y socios

Su cliente necesita trabajo sénior de RAG entregado bajo su marca.

Ingeniería de recuperación de marca blanca, con la misma disciplina que respalda nuestro trabajo de código abierto.

Ingeniería pública que puede inspeccionar

En producción en este sitio

En vivo

El asistente de este sitio es un sistema agéntico que usa herramientas, construido por nosotros y en producción, no una demo tras un inicio de sesión.

Vendure Data Hub

Open source

Un plugin de comercio Vendure que construimos y publicamos, público en GitHub. Dos de nuestros once bundles desarrollados son públicos.

Ver en GitHub

Pimcore Asset Pilot

Open source

Un bundle de assets de Pimcore que construimos y publicamos, público en GitHub e inspeccionable de extremo a extremo.

Ver en GitHub

Cuándo RAG no es la respuesta

  • La verdad numérica puramente en tiempo real, por ejemplo los recuentos de inventario en vivo, corresponde a una consulta directa, no a la recuperación.
  • Cambiar el tono o el comportamiento esencial del modelo es una tarea de ajuste fino, no de RAG.
  • Una base de conocimiento estática y minúscula puede resultar más económica si se coloca directamente en el prompt.
  • Las tareas sin una fuente de verdad sobre la que fundamentarse no son un problema de recuperación.

Preguntas que los equipos hacen sobre RAG

Se agrupan en tres familias: patrones arquitectónicos básicos (Naive, GraphRAG, Hybrid, Hierarchical o RAPTOR, Multimodal), bucles dinámicos y Agentic (Agentic RAG, Corrective o CRAG, Self-RAG, Adaptive RAG) e ingeniería de contexto (Conversational, Contextual Retrieval, HyDE). Los sistemas en producción combinan varios.
Agentic RAG dota al sistema de agentes equipados con herramientas que planifican una recuperación de varios pasos a través de fuentes de datos independientes, incluidas API en vivo, en lugar de una sola búsqueda vectorial. Es el patrón adecuado cuando una respuesta necesita datos de más de un sistema.
El RAG vectorial es mejor para la similitud difusa de texto. GraphRAG es mejor cuando la respuesta depende de relaciones entre entidades, por ejemplo vincular un cliente con productos a través del historial de compras. La mayoría de los sistemas empresariales usan ambos detrás de un enrutador.
RAG fundamenta el modelo en datos actuales y aprobados y mantiene las respuestas trazables. El ajuste fino cambia el tono, el estilo o la lógica de dominio del modelo. Resuelven problemas distintos y a menudo se ejecutan juntos; le asesoramos sobre cuál encaja en cada caso.
Los productos usan Hybrid RAG más GraphRAG para que no se aluciquen SKU exactos ni el inventario; los documentos usan Hierarchical RAG; los clientes usan GraphRAG; los sistemas de socios usan Agentic RAG. Un enrutador Adaptive los une.
La recuperación es la base. La producción también necesita evaluación, salvaguardas, contexto consciente de los permisos, observabilidad y enrutamiento. Diseñamos el sistema completo, con alojamiento en la UE, con su código y sin dependencia de proveedor.

Fundamente su IA en sus propios datos

Cuéntenos cómo son sus sistemas y datos. Asignaremos la arquitectura de recuperación adecuada y un camino hacia producción.

Con quién trabaja

HRB 288224
Registrada en Múnich
15+
Años, dirigida por el fundador
DE · EN · AR
Idiomas de trabajo
2
Código abierto en GitHub
EU
Residencia de datos, Fráncfort
AVV/DPA
Listo para firmar, art. 28

Niveles de compromiso

Oronts trabaja con equipos serios que necesitan entrega senior, no externalización de bajo coste.

Production Pilot
desde 25k EUR
Proyectos de software e IA a medida
desde 50k EUR
Retainers técnicos continuos
desde 15k EUR/mes

El precio exacto depende del alcance, la responsabilidad, la velocidad de entrega, el tamaño del equipo, las integraciones, las expectativas de soporte y el riesgo de producción.