Vector search
Vector search (o búsqueda vectorial) es la técnica de recuperar los documentos cuyos embeddings son más similares al embedding de una consulta, normalmente mediante algoritmos de Approximate Nearest Neighbor (ANN). Es la infraestructura que hace viable la búsqueda semántica a escala con latencias < 50 ms.
¿Qué es vector search?
Vector search resuelve este problema: “dado un vector de consulta, encuentra los k vectores más cercanos en un índice de millones de vectores, en milisegundos”. La cercanía se mide normalmente con similitud coseno o distancia euclídea.
Calcular esto exactamente comparando con cada vector del índice es O(n) — inviable a escala. Los algoritmos ANN (Approximate Nearest Neighbor) sacrifican precisión perfecta (~99 % recall) por velocidad (~ms en millones de vectores).
Algoritmos ANN principales
- HNSW (Hierarchical Navigable Small World): grafo jerárquico, el estándar de facto en 2026. Excelente recall y latencia.
- IVF (Inverted File Index): particiona el espacio en clusters, busca solo en los más cercanos. Bueno con cuantización.
- PQ (Product Quantization): comprime vectores para reducir memoria. Combinable con IVF (IVFPQ).
- DiskANN: optimizado para almacenamiento en disco SSD, escala a miles de millones de vectores.
Bases de datos vectoriales populares
| Producto | Tipo | Uso típico |
|---|---|---|
| Pinecone | SaaS managed | Producción rápida sin ops |
| Weaviate | Open source / cloud | Híbrido + multimodal |
| Qdrant | Open source / cloud | Filtros + payload rico |
| Milvus | Open source | Escala enterprise |
| pgvector | Extensión PostgreSQL | Stack Postgres existente |
| OpenSearch k-NN | Elasticsearch fork | Si ya usas OpenSearch |
Vector search en APPROSEARCH
Bajo el capó usamos un índice HNSW optimizado para catálogos e-commerce, hospedado en infraestructura propia. Cada operación de búsqueda dispara en paralelo BM25 + vector search + re-ranker, con un budget de latencia total de 50 ms p95. La implementación está abstraída para el cliente: tú solo subes catálogo y consultas; nosotros nos encargamos del índice, la cuantización y el re-ranking.
Para implementaciones custom (Enterprise) podemos exponer endpoints específicos para tu pipeline (subir tus propios vectores, configurar dimensiones, elegir métrica de distancia).
Lecturas recomendadas
- Malkov y Yashunin (2018). Efficient and robust approximate nearest neighbor search using HNSW.
- Pinecone learning: Vector indexes.
- Benchmark: ANN Benchmarks — compara latencia/recall de los algoritmos principales.
Última actualización: 2026-05-25
Lleva la teoría a tu tienda
APPROSEARCH implementa estos conceptos por defecto. Prueba 14 días gratis sin tarjeta.