Vector database · Innotalent

Een vector database indexeert embeddings — de numerieke vingerafdrukken die de betekenis van een stuk tekst, beeld of audio vastleggen — en laat je in milliseconden vragen: "wat in mijn data lijkt het meest op dit?". Precies die ene capaciteit maakt retrieval-augmented generation mogelijk: wanneer een gebruiker een vraag stelt aan een large language model, zoekt de vector database de meest relevante snippets uit jouw eigen documenten op, zodat het model antwoordt op basis van die context in plaats van te gokken.

Bekende opties zijn aparte stores als Pinecone, Weaviate, Qdrant en Milvus, of extensies bovenop bestaande databases zoals pgvector op Postgres. Voor de meeste teams die al op Postgres zitten is pgvector de saaie en juiste keuze totdat de schaal anders eist.

De eerlijke kant is dat een vector database opnieuw een onderdeel is om te draaien, te monitoren en te betalen, en dat de kwaliteit van de resultaten sterk afhangt van het embedding-model en de chunking-strategie eromheen. Het is alleen de moeite waard wanneer je werkelijk semantische recall over je eigen data nodig hebt — een gewone full-text zoekindex volstaat vaak prima en is meestal sneller live te krijgen en makkelijker te debuggen.

Een team nodig dat levert op jouw klok?