Qué es vector search y cómo se aplica a ecommerce

Vector search

Vector search (o búsqueda vectorial) es la técnica de recuperar los documentos cuyos embeddings son más similares al embedding de una consulta, normalmente mediante algoritmos de Approximate Nearest Neighbor (ANN). Es la infraestructura que hace viable la búsqueda semántica a escala con latencias < 50 ms.

¿Qué es vector search?

Vector search resuelve este problema: “dado un vector de consulta, encuentra los k vectores más cercanos en un índice de millones de vectores, en milisegundos”. La cercanía se mide normalmente con similitud coseno o distancia euclídea.

Calcular esto exactamente comparando con cada vector del índice es O(n) — inviable a escala. Los algoritmos ANN (Approximate Nearest Neighbor) sacrifican precisión perfecta (~99 % recall) por velocidad (~ms en millones de vectores).

Algoritmos ANN principales

HNSW (Hierarchical Navigable Small World): grafo jerárquico, el estándar de facto en 2026. Excelente recall y latencia.
IVF (Inverted File Index): particiona el espacio en clusters, busca solo en los más cercanos. Bueno con cuantización.
PQ (Product Quantization): comprime vectores para reducir memoria. Combinable con IVF (IVFPQ).
DiskANN: optimizado para almacenamiento en disco SSD, escala a miles de millones de vectores.

Bases de datos vectoriales populares

Producto	Tipo	Uso típico
Pinecone	SaaS managed	Producción rápida sin ops
Weaviate	Open source / cloud	Híbrido + multimodal
Qdrant	Open source / cloud	Filtros + payload rico
Milvus	Open source	Escala enterprise
pgvector	Extensión PostgreSQL	Stack Postgres existente
OpenSearch k-NN	Elasticsearch fork	Si ya usas OpenSearch

Vector search en APPROSEARCH

Bajo el capó usamos un índice HNSW optimizado para catálogos e-commerce, hospedado en infraestructura propia. Cada operación de búsqueda dispara en paralelo BM25 + vector search + re-ranker, con un budget de latencia total de 50 ms p95. La implementación está abstraída para el cliente: tú solo subes catálogo y consultas; nosotros nos encargamos del índice, la cuantización y el re-ranking.

Para implementaciones custom (Enterprise) podemos exponer endpoints específicos para tu pipeline (subir tus propios vectores, configurar dimensiones, elegir métrica de distancia).

Lecturas recomendadas

Malkov y Yashunin (2018). Efficient and robust approximate nearest neighbor search using HNSW.
Pinecone learning: Vector indexes.
Benchmark: ANN Benchmarks — compara latencia/recall de los algoritmos principales.

Última actualización: 2026-05-25

Vector search