Has construido un sistema RAG. Entran documentos, se generan embeddings, la búsqueda de similitud devuelve fragmentos relevantes. Funciona. Entonces tu conjunto de datos crece de 100 documentos a 100.000. La latencia de búsqueda se dispara de 200 ms a 8 segundos. La instancia de Chroma que configuraste en tu portátil no escala. Ahora te preguntas: ¿realmente necesito una base de datos vectorial dedicada, o es una estrategia de ventas?
Lo que realmente hace una base de datos vectorial
Separemos la exageración de la función. Una base de datos vectorial es un sistema especializado optimizado para una tarea: almacenar vectores de alta dimensionalidad (embeddings) y devolver los k vectores más similares a una consulta en menos de un segundo. Eso es todo. Sin transacciones. Sin uniones complejas. Sin garantías ACID. Solo búsqueda rápida de vecinos más cercanos a escala.
Las bases de datos relacionales estándar pueden almacenar vectores. PostgreSQL tiene la extensión pgvector. Funciona. Pero