APPROSEARCH APPROSEARCH
Glosario

Vector search

Vector search (o búsqueda vectorial) es la técnica de recuperar los documentos cuyos embeddings son más similares al embedding de una consulta, normalmente mediante algoritmos de Approximate Nearest Neighbor (ANN). Es la infraestructura que hace viable la búsqueda semántica a escala con latencias < 50 ms.

Vector search resuelve este problema: “dado un vector de consulta, encuentra los k vectores más cercanos en un índice de millones de vectores, en milisegundos”. La cercanía se mide normalmente con similitud coseno o distancia euclídea.

Calcular esto exactamente comparando con cada vector del índice es O(n) — inviable a escala. Los algoritmos ANN (Approximate Nearest Neighbor) sacrifican precisión perfecta (~99 % recall) por velocidad (~ms en millones de vectores).

Algoritmos ANN principales

  • HNSW (Hierarchical Navigable Small World): grafo jerárquico, el estándar de facto en 2026. Excelente recall y latencia.
  • IVF (Inverted File Index): particiona el espacio en clusters, busca solo en los más cercanos. Bueno con cuantización.
  • PQ (Product Quantization): comprime vectores para reducir memoria. Combinable con IVF (IVFPQ).
  • DiskANN: optimizado para almacenamiento en disco SSD, escala a miles de millones de vectores.

Bases de datos vectoriales populares

ProductoTipoUso típico
PineconeSaaS managedProducción rápida sin ops
WeaviateOpen source / cloudHíbrido + multimodal
QdrantOpen source / cloudFiltros + payload rico
MilvusOpen sourceEscala enterprise
pgvectorExtensión PostgreSQLStack Postgres existente
OpenSearch k-NNElasticsearch forkSi ya usas OpenSearch

Vector search en APPROSEARCH

Bajo el capó usamos un índice HNSW optimizado para catálogos e-commerce, hospedado en infraestructura propia. Cada operación de búsqueda dispara en paralelo BM25 + vector search + re-ranker, con un budget de latencia total de 50 ms p95. La implementación está abstraída para el cliente: tú solo subes catálogo y consultas; nosotros nos encargamos del índice, la cuantización y el re-ranking.

Para implementaciones custom (Enterprise) podemos exponer endpoints específicos para tu pipeline (subir tus propios vectores, configurar dimensiones, elegir métrica de distancia).

Lecturas recomendadas

  • Malkov y Yashunin (2018). Efficient and robust approximate nearest neighbor search using HNSW.
  • Pinecone learning: Vector indexes.
  • Benchmark: ANN Benchmarks — compara latencia/recall de los algoritmos principales.

Última actualización: 2026-05-25

Lleva la teoría a tu tienda

APPROSEARCH implementa estos conceptos por defecto. Prueba 14 días gratis sin tarjeta.