Een getraind model op nieuwe inputs draaien om outputs te maken. Elk gevolg (krediet, hiring, klantantwoord) gebeurt hier.
→Retrieval-Augmented Generation: gronden in externe documenten die bij inference worden opgehaald → minder hallucinatie, maar een extra retrieval-laag.
→LLM plant & voert multi-step taken uit (web, code, API's, files) met weinig/geen goedkeuring per stap. Hoogste governance-complexiteit van nu.
Bij een geërfd AI-systeem: verifieer alle vier vóór je voortzetting goedkeurt.
Wie mag het model bevragen en onder welke voorwaarden? Authenticatie, autorisatie, role-based access.
Prompts screenen vóór verwerking: injection-patronen, gevoelige data, out-of-scope use.
Doorlopend (niet enkel bij deployment) op accuracy, bias, policy en schadelijke content.
Voorkomt runaway-gebruik → operationele of financiële exposure.
RAG bestrijdt hallucinatie door te gronden in opgehaalde documenten — maar de retrieval-laag heeft eigen verplichtingen.
| Control | Waarom |
|---|---|
| Document access controls | Welke documenten/bronnen mag het model ophalen? Zonder dit toont RAG documenten die de gebruiker niet mag zien — een data-access-gap, niet enkel een AI-gap. |
| Data freshness controls | Zijn opgehaalde docs recent geverifieerd? RAG die compliance-vragen met verouderde docs beantwoordt = compliance-risico, zélfs als het model correct werkt. |
| Source attribution | Welke docs informeerden een antwoord? Nodig voor auditeerbaarheid en onderzoek; zonder is een fout antwoord nauwelijks te traceren. |
| Standaard inference | Agentic AI | |
|---|---|---|
| Flow | Gebruiker prompt → model antwoordt → mens beslist | Model krijgt doel → plant & voert acties uit zonder goedkeuring per stap |
| Begrenzing | De menselijke beslislaag begrenst gevolgen | Gevolgen propageren over meerdere systemen vóór review |
| Focus governance | Input-validatie & output-kwaliteit | Action-level controls, scope-grenzen, human checkpoints |
Welke acties/systemen/files/API's mag de agent? Scope creep → unauthorized-action-risk dat opstapelt.
Goedkeuring vóór onomkeerbare acties, externe communicatie, grote uitgaven. Vooraf in de architectuur ontwerpen.
Elke actie loggen met genoeg detail voor forensisch onderzoek. Zonder logs geen incident-onderzoek mogelijk.
Documenteer welke acties omkeerbaar zijn; bouw extra autorisatie specifiek voor onomkeerbare acties.
Aanvaller manipuleert gebruikersinput. In chat → een slecht antwoord. In agentic → ongeautoriseerde acties.
Instructies verstopt in een document/webpagina die de agent ophaalt. Het model leest ze als legitieme content en volgt ze. Live vector bij agents die externe content ophalen.
| Drijver | Effect |
|---|---|
| Model size | Meer parameters → meer compute per query → schaalt met volume |
| Context length | Langere prompts + meer opgehaalde docs kosten meer (context-budget telt, ook bij groot window) |
| Output length | Langere antwoorden kosten meer om te genereren |
| Agentic complexiteit | Kosten schalen niet-lineair: één complexe taak triggert tientallen inference-calls |
Stel KRI's voor inference-kost in bij deployment, met alert-drempels die review triggeren vóór het een operationeel incident wordt.
Risico dat een systeem een echte-wereld-actie neemt zónder review op het moment van handelen. Schaalt met autonomie én omkeerbaarheid: aanraden < uitvoeren.
Output van één model = input van het volgende. Fouten stapelen en versterken → de pipeline-foutmarge ligt hoger dan die van elk afzonderlijk model.
Design-pattern: menselijke review op gedefinieerde checkpoints vóór ingrijpende outputs. De mate van betrokkenheid is een risk-treatment-beslissing.
Autonomieniveau + omkeerbaarheid van acties bepalen samen hoe zwaar de governance-overlay moet zijn. Volgende les: de 7 AI-risicocategorieën.
Klik op je antwoord voor directe feedback.