APPROSEARCH APPROSEARCH
Recursos

Glosario

Definiciones técnicas concisas de los conceptos clave de la búsqueda con IA aplicada a e-commerce.

Autocomplete

Type-ahead

El autocomplete (o type-ahead) muestra sugerencias en tiempo real mientras el usuario teclea en la barra de búsqueda: productos populares, categorías, consultas frecuentes y correcciones tipográficas. Bien implementado, reduce abandono de búsqueda un 20-40 % y acorta el camino a la conversión.

BM25

Best Matching 25

BM25 (Best Matching 25) es un algoritmo probabilístico de ranking que ordena documentos por relevancia frente a una consulta. Calcula la puntuación combinando frecuencia del término, frecuencia inversa de documento y normalización de longitud. Es el estándar de facto en buscadores desde los años 90.

Búsqueda híbrida

Hybrid search

La búsqueda híbrida combina BM25 (matching léxico) y vector search (semántica) en una sola consulta. Cada motor recupera sus mejores resultados y un re-ranker los mezcla con pesos dinámicos según la naturaleza de la query. Captura lo mejor de ambos: precisión exacta + comprensión de intención.

Búsqueda semántica

Semantic search

La búsqueda semántica es una técnica que utiliza embeddings vectoriales para entender la intención y el significado detrás de una consulta, en lugar de coincidir palabra por palabra. En e-commerce permite que consultas como 'abrigo barato para invierno' devuelvan productos relevantes aunque ningún título contenga esas palabras exactas.

CLIP

Contrastive Language-Image Pre-training

CLIP (Contrastive Language-Image Pre-training) es un modelo multimodal de OpenAI publicado en 2021 que embebe imágenes y textos en el mismo espacio vectorial. Permite buscar imágenes por descripción textual o productos similares a una imagen de referencia con una sola línea de código.

Embeddings vectoriales

Vector embeddings

Un embedding es una representación numérica de un texto (palabra, frase, producto) como un vector de cientos o miles de dimensiones, donde la cercanía entre vectores indica similitud semántica. Es la pieza fundacional de la búsqueda semántica moderna.

Faceted search

Filtros facetados

Faceted search (búsqueda facetada) es la técnica de filtrar resultados por atributos múltiples calculados dinámicamente sobre el conjunto recuperado: marca, talla, color, rango de precio, valoraciones, atributos custom. Los recuentos se actualizan en tiempo real conforme el usuario selecciona filtros.

RAG

Retrieval-Augmented Generation

RAG (Retrieval-Augmented Generation) es una técnica que combina un sistema de búsqueda (retrieval) con un modelo generativo (LLM) para producir respuestas fundamentadas en información concreta. El LLM no genera de memoria: primero recupera los documentos relevantes y luego responde citándolos.

Vector search

Búsqueda vectorial

Vector search (o búsqueda vectorial) es la técnica de recuperar los documentos cuyos embeddings son más similares al embedding de una consulta, normalmente mediante algoritmos de Approximate Nearest Neighbor (ANN). Es la infraestructura que hace viable la búsqueda semántica a escala con latencias < 50 ms.

Whisper

OpenAI Whisper

Whisper es el modelo de reconocimiento automático de voz (ASR) publicado por OpenAI en 2022. Soporta 99 idiomas, transcripción y traducción, y es el estándar de facto para búsqueda por voz en interfaces web. Su precisión en español rural y acentos es notablemente superior a la de los ASR comerciales clásicos.