Begrippen

Retrieval-augmented generation (RAG)

Retrieval-augmented generation (RAG) is een techniek die een taalmodel toegang geeft tot je eigen documenten of data op het moment van de vraag, zodat antwoorden zijn gegrond in jouw informatie en niet alleen in wat het model tijdens de training heeft geleerd. Het is de meest gangbare manier om een accurate, actuele AI-functie boven op een algemeen model te bouwen.

RAG werkt in twee stappen: eerst worden de passages uit je eigen kennisbank opgehaald die relevant zijn voor een vraag, daarna worden die passages als context aan het taalmodel gegeven, zodat het antwoord erop is gebaseerd.

Het is populair omdat het twee problemen tegelijk oplost: het vermindert hallucinatie door antwoorden te verankeren in echt bronmateriaal, en het laat een model private of recente data gebruiken waarop het nooit is getraind, zonder de kosten en het risico van fine-tuning. Voor de meeste producten die een AI-functie nodig hebben die gegrond is in hun eigen content, is RAG het eerste waar je naar grijpt.

Innotalent: curated, not placed

Een team nodig dat levert op jouw klok?