Qué es RAG: Retrieval-Augmented Generation

¿Qué es RAG?

Los modelos de lenguaje (GPT, Claude, Gemini) tienen dos limitaciones críticas:

Alucinaciones: pueden inventar datos cuando no los conocen.
Información obsoleta o privada: no saben de tu catálogo de 2026 ni de tu base de clientes.

RAG resuelve ambos dando al LLM un contexto recuperado en tiempo real desde tu base de datos:

Usuario pregunta → Sistema busca documentos relevantes → LLM responde usándolos

El LLM cita los documentos y dice “no lo sé” cuando el contexto no cubre la pregunta — comportamiento mucho más confiable que generación pura.

Arquitectura típica RAG

Indexación: documentos (productos, FAQs, manuales) se trocean (chunking) y se convierten en embeddings que se guardan en una base vectorial.
Recuperación: la consulta del usuario se embebe y se buscan los top-k documentos similares (típicamente k=3-10).
Augmentación: los documentos recuperados se inyectan en el prompt del LLM como contexto.
Generación: el LLM genera la respuesta usando ese contexto + cita las fuentes.

RAG en e-commerce

Casos de uso donde RAG aporta valor:

Asistente de compra conversacional: “¿cuál de tus aceites de oliva es mejor para freír?”. El asistente recupera los aceites con punto de humo alto y los compara.
Soporte automatizado: “¿el envío llega a Canarias?”. RAG busca en las políticas de envío y responde con la información correcta y la URL.
Comparativas de productos generadas: “compárame estos tres móviles”. RAG recupera las fichas y genera tabla.

Cuidado: el ROI de RAG conversacional en e-commerce sigue siendo discutible. En la mayoría de tiendas, una búsqueda híbrida + filtros bien diseñados convierte más que un chatbot RAG.

RAG en APPROSEARCH

Hoy APPROSEARCH se enfoca en búsqueda directa (resultados, no respuestas generadas). El roadmap para 2026-2027 incluye un módulo opcional APPROSEARCH Assistant basado en RAG sobre el mismo índice híbrido. Estará disponible primero en planes Enterprise como add-on con LLM provider configurable (OpenAI, Anthropic, Mistral, modelo propio).

Lecturas recomendadas

Lewis et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (paper fundacional).
Anthropic guide: Building with Claude — RAG.
/glosario/busqueda-hibrida/ explica el motor de recuperación que normalmente alimenta RAG.

Última actualización: 2026-05-25

RAG

¿Qué es RAG?

Arquitectura típica RAG

RAG en e-commerce

RAG en APPROSEARCH

Lecturas recomendadas

Lleva la teoría a tu tienda