Glosario
Definiciones técnicas concisas de los conceptos clave de la búsqueda con IA aplicada a e-commerce.
Autocomplete
Type-aheadEl autocomplete (o type-ahead) muestra sugerencias en tiempo real mientras el usuario teclea en la barra de búsqueda: productos populares, categorías, consultas frecuentes y correcciones tipográficas. Bien implementado, reduce abandono de búsqueda un 20-40 % y acorta el camino a la conversión.
BM25
Best Matching 25BM25 (Best Matching 25) es un algoritmo probabilístico de ranking que ordena documentos por relevancia frente a una consulta. Calcula la puntuación combinando frecuencia del término, frecuencia inversa de documento y normalización de longitud. Es el estándar de facto en buscadores desde los años 90.
Búsqueda híbrida
Hybrid searchLa búsqueda híbrida combina BM25 (matching léxico) y vector search (semántica) en una sola consulta. Cada motor recupera sus mejores resultados y un re-ranker los mezcla con pesos dinámicos según la naturaleza de la query. Captura lo mejor de ambos: precisión exacta + comprensión de intención.
Búsqueda semántica
Semantic searchLa búsqueda semántica es una técnica que utiliza embeddings vectoriales para entender la intención y el significado detrás de una consulta, en lugar de coincidir palabra por palabra. En e-commerce permite que consultas como 'abrigo barato para invierno' devuelvan productos relevantes aunque ningún título contenga esas palabras exactas.
CLIP
Contrastive Language-Image Pre-trainingCLIP (Contrastive Language-Image Pre-training) es un modelo multimodal de OpenAI publicado en 2021 que embebe imágenes y textos en el mismo espacio vectorial. Permite buscar imágenes por descripción textual o productos similares a una imagen de referencia con una sola línea de código.
Embeddings vectoriales
Vector embeddingsUn embedding es una representación numérica de un texto (palabra, frase, producto) como un vector de cientos o miles de dimensiones, donde la cercanía entre vectores indica similitud semántica. Es la pieza fundacional de la búsqueda semántica moderna.
Faceted search
Filtros facetadosFaceted search (búsqueda facetada) es la técnica de filtrar resultados por atributos múltiples calculados dinámicamente sobre el conjunto recuperado: marca, talla, color, rango de precio, valoraciones, atributos custom. Los recuentos se actualizan en tiempo real conforme el usuario selecciona filtros.
RAG
Retrieval-Augmented GenerationRAG (Retrieval-Augmented Generation) es una técnica que combina un sistema de búsqueda (retrieval) con un modelo generativo (LLM) para producir respuestas fundamentadas en información concreta. El LLM no genera de memoria: primero recupera los documentos relevantes y luego responde citándolos.
Vector search
Búsqueda vectorialVector search (o búsqueda vectorial) es la técnica de recuperar los documentos cuyos embeddings son más similares al embedding de una consulta, normalmente mediante algoritmos de Approximate Nearest Neighbor (ANN). Es la infraestructura que hace viable la búsqueda semántica a escala con latencias < 50 ms.
Whisper
OpenAI WhisperWhisper es el modelo de reconocimiento automático de voz (ASR) publicado por OpenAI en 2022. Soporta 99 idiomas, transcripción y traducción, y es el estándar de facto para búsqueda por voz en interfaces web. Su precisión en español rural y acentos es notablemente superior a la de los ASR comerciales clásicos.