Begrippen

De termen, helder uitgelegd.

Geen jargon om het jargon. Heldere definities van de woorden waar onze markt op leunt, met de eerlijke versie waar dat telt.

Filter Alles 31 AI & engineering 17 Teams & samenwerking 9 Contracten & inkoop 5

Agentic workflow: Een agentic workflow is een proces waarin een AI-agent — niet een mens — de stappen plant, tools of API's aanroept, tussenresultaten controleert en stap voor stap naar een doel werkt. Wezenlijk anders dan een chatbot die enkel één vraag beantwoordt.
AI-agent: Een AI-agent is een systeem dat een taalmodel gebruikt om te plannen en acties te ondernemen richting een doel: tools, API's of andere stappen aanroepen in plaats van alleen tekst teruggeven. Agents kunnen workflows met meerdere stappen automatiseren, maar brengen uitdagingen rond betrouwbaarheid en toezicht met zich mee die je in productie moet opvangen.
Build vs buy: Build vs buy is de afweging om een capability zelf te bouwen of in te kopen bij een leverancier of SaaS-product. Het antwoord hangt af van of de capability je echte onderscheidend vermogen is, de totale kosten over de realistische levensduur, de time-to-market en de onderhoudslast die je daarna kunt dragen.
Context window: Context window is de hoeveelheid tekst — gemeten in tokens — die een large language model in één call kan lezen, inclusief zowel de input die je stuurt als de output die het genereert. Zodra het gesprek, de documenten en het antwoord samen boven dat budget uitkomen, moet er iets worden geknipt, samengevat of on demand opgehaald.
Dedicated ontwikkelteam: Een dedicated ontwikkelteam is een op zichzelf staande groep engineers die uitsluitend voor jou aan een hoeveelheid werk werkt, met zijn eigen dagelijkse coördinatie. Jij zet de richting en de prioriteiten; het team regelt de interne mechaniek van het leveren daartegen, dus je huurt resultaten in plaats van uren.
Embeddings: Embeddings zijn numerieke representaties — vectoren — van tekst, beeld of audio die vergelijkbare betekenissen dicht bij elkaar plaatsen in een hoogdimensionale ruimte. Ze vertalen vage menselijke concepten naar coördinaten, waardoor vragen als 'gaat deze alinea over hetzelfde als die andere' een meetbare afstand worden in plaats van een gok.
Evals: Evals zijn geautomatiseerde tests voor LLM-functionaliteit die nauwkeurigheid, veiligheid en regressie meten op een zorgvuldig gekozen set representatieve inputs. Ze zijn wat prompt engineering verandert in productie-engineering: zonder evals weet je niet of je laatste wijziging het systeem beter of slechter heeft gemaakt.
Fine-tuning: Fine-tuning is het verder trainen van een vooraf getraind AI-model op een kleinere, specifieke dataset, zodat het zich aanpast aan een bepaalde taak, toon of domein. Het is bewerkelijker dan prompting of retrieval-augmented generation, en voor de meeste producten lossen die twee het probleem op tegen lagere kosten en minder risico.
Foundation model: Een foundation model is een groot AI-model dat is getraind op brede data en kan worden aangepast aan veel verschillende taken. Foundation models bestaan voor taal, beeld, audio en multimodaal gebruik — de taalversies noemen we LLM's.
Function calling: Function calling is een mechanisme waarbij een large language model een door de ontwikkelaar gedefinieerd hulpmiddel — een functie of API — kiest en aanroept, in plaats van te antwoorden met platte tekst. Het is het wire format dat een taalmodel verandert in een agent die een database kan lezen, een e-mail kan sturen of een workflow kan triggeren.
Hallucinatie: Hallucinatie is wanneer een large language model met overtuiging informatie produceert die fout, verzonnen of bedacht is — namen, bronvermeldingen en feiten die kloppen lijken maar dat niet zijn. Het is geen bug, het is een eigenschap van statistische tekstgeneratie.
Human in the loop: Human in the loop is het zo ontwerpen van een AI-systeem dat een mens de belangrijke stappen beoordeelt, goedkeurt of bijstelt voordat ze effect hebben. Het is het eerlijke antwoord op de vraag hoe je een agentic systeem veilig genoeg maakt om te shippen: je houdt een mens op de risicovolle beslissingen en automatiseert de goedkope.
Inference: Inference is het draaien van een getraind model om een output te produceren, in tegenstelling tot het trainen van het model zelf. In productie-AI-features zit hier de runtime-kost — per token, per call, elke keer dat een gebruiker het systeem raakt.
IP-overdracht: IP-overdracht is het geheel aan contractclausules dat intellectueel eigendom op gecreëerd werk — code, ontwerpen, content — overdraagt van de leverancier en diens engineers naar de koper. Het is de 'work-for-hire'-uitkomst die kopers standaard verwachten, maar die in lang niet elk rechtsgebied vanzelf ontstaat.
Kennisoverdracht: Kennisoverdracht is het doelbewuste proces van kennis verplaatsen van het ene team of persoon naar het andere, zodat het werk de overgang overleeft — onboarding-sessies, documentatie, paired coding, vastgelegde beslissingen en een heldere kaart van wie wat weet. Het is het echte risico in elke outsourcing-samenwerking of personeelswissel, want het werk is alleen zo duurzaam als de kennis die het draagt.
Large language model (LLM): Een large language model (LLM) is een AI-model dat is getraind op enorme hoeveelheden tekst om taal te voorspellen en te genereren. Het drijft chatbots, code-assistenten en de AI-antwoordmachines aan die steeds vaker tussen mensen en websites in staan. De GPT-, Claude- en Gemini-families zijn bekende voorbeelden.
Managed services: Managed services is een outsourcingmodel waarbij de leverancier de uitkomst end-to-end bezit — mensen, proces en oplevering — in plaats van alleen engineers te leveren. Je koopt een resultaat tegen een afgebakende scope en SLA, geen uren, en de leverancier is verantwoordelijk om het te halen.
MLOps: MLOps (machine-learning operations) is de praktijk van het betrouwbaar uitrollen, monitoren en onderhouden van AI- en machine-learningmodellen in productie. Het omvat versiebeheer, evaluatie, kosten, latency en de pipelines die een model na de lancering werkend houden: het roemloze werk dat bepaalt of een AI-functie betrouwbaar is.
Model Context Protocol (MCP): Model Context Protocol (MCP) is een open protocol geïntroduceerd door Anthropic waarmee AI-agents op een gestandaardiseerde manier kunnen verbinden met tools, databronnen en applicaties. Het is in feite een gemeenschappelijke stekkervorm tussen taalmodellen en de wereld waarin ze moeten lezen en handelen.
Nearshoring: Nearshoring is het uitbesteden van softwarewerk aan een land in een nabije tijdzone, zodat de werkuren van het team overlappen met die van jou. Voor een Nederlands of Duits bedrijf betekent dat meestal Midden-Europese tijd, waar een vraag binnen hetzelfde uur wordt beantwoord in plaats van pas de volgende ochtend.
Offshoring: Offshoring is het uitbesteden van softwarewerk aan een ver land, doorgaans met een tijdsverschil van zes tot twaalf uur. Het kan uitstekend werk opleveren tegen een laag uurtarief, maar de tijdkloof maakt van elke verduidelijking een verloren dag, en kwaliteitsproblemen ontdek je meestal pas nadat het werk klaar is.
Onshoring: Onshoring is het bouwen of verplaatsen van softwarewerk volledig binnen het eigen land. Het is de duurste optie met de kortste afstand, geen tijdzoneverschil en geen cultuurverschil, en daarmee de standaard wanneer regelgeving, security of fysieke nabijheid bepalen waar het werk moet zitten.
Prompt engineering: Prompt engineering is het ambacht van het schrijven van instructies, voorbeelden en structuur voor een large language model, zodat het betrouwbare en bruikbare output levert. Het model ligt vast; de prompt is de hefboom, en daarom gebeurt het meeste productiewerk rond LLM's hier en niet in het model zelf.
Retrieval-augmented generation (RAG): Retrieval-augmented generation (RAG) is een techniek die een taalmodel toegang geeft tot je eigen documenten of data op het moment van de vraag, zodat antwoorden zijn gegrond in jouw informatie en niet alleen in wat het model tijdens de training heeft geleerd. Het is de meest gangbare manier om een accurate, actuele AI-functie boven op een algemeen model te bouwen.
Staff augmentation: Staff augmentation is het toevoegen van individuele externe engineers aan je eigen team. Ze doen mee aan je standups, pakken tickets van je board en worden aangestuurd door je tech lead, dus je huurt vaardigheid in terwijl je volledige controle houdt over hoe het werk wordt gerund.
Statement of Work (SoW): Een Statement of Work (SoW) is het document dat scope, deliverables, mijlpalen, acceptatiecriteria en aannames vastlegt voor een vaste opdracht tussen opdrachtgever en leverancier. Het is het artefact dat 'we hebben een contract' onderscheidt van 'we zien het onderweg wel'.
Tijdzone-overlap: Tijdzone-overlap is het aantal werkuren dat twee teams delen. Volledige overlap, zoals een nearshore-team op Midden-Europese tijd dat met een Nederlandse opdrachtgever werkt, betekent dat vragen binnen minuten worden opgelost en werk midden in de build kan worden bijgestuurd. Het is de grootste enkele voorspeller of een verdeeld team dichtbij voelt.
Time and materials: Time and materials is een prijsmodel waarbij de koper betaalt voor de daadwerkelijk gewerkte uren plus eventueel gebruikte materialen, in plaats van een vaste prijs voor een vaste scope. Het past bij werk waarvan de vorm nog uitkristalliseert — onderzoek, doorlopend onderhoud, AI-features waar de onbekenden groter zijn dan de bekenden.
Time to hire: Time to hire is het aantal kalenderdagen tussen het moment dat een team besluit dat het een vaardigheid nodig heeft en het moment dat een productieve engineer daadwerkelijk aan het werk is. Het is de verborgen kost van in-house werven, want elke maand dat een rol openstaat is een maand opportuniteitskosten op wat die engineer anders had gebouwd.
Total cost of ownership: Bij softwareuitbesteding is total cost of ownership de werkelijke kost van een opdracht voorbij het uurtarief: onboarding en inwerktijd, managementoverhead, herwerk door miscommunicatie, en verloop. Het uurtarief is meestal maar 65 tot 75 procent ervan, dus een handige vuistregel is om 25 tot 35 procent op te tellen bij een opgegeven blended tarief.
Vector database: Een vector database is een database die geoptimaliseerd is voor het opslaan en bevragen van embeddings, zodat semantische gelijkenis een query wordt die je kunt draaien. Het is de opslaglaag onder retrieval-augmented generation en semantische zoekopdrachten, waar de dichtstbijzijnde betekenis vinden belangrijker is dan exact dezelfde woorden matchen.

Een team nodig dat levert op jouw klok?

Praat met ons Voor opdrachtgevers