Groot model, voorgetraind op brede, diverse data → herbruikbare basis voor veel taken. Herbruikbaarheid = efficiëntiewinst; systemic risk = de governance-uitdaging.
→Eerste trainingsfase: leert algemene patronen uit een enorme dataset. Hier ontstaat de meeste capability — én de meeste risico-exposure. Bias in pre-training → bias overal downstream.
→Voorgetrainde kennis toepassen op nieuwe taken met minimale extra training. Efficiënt — maar bias & kwetsbaarheden reizen mee downstream.
Een handvol foundation models drijft een groot deel van enterprise-AI → één falen heeft buitenproportioneel bereik.
Een bias- of data-poisoning-event raakt élke downstream-app tegelijk — vóór iemand het detecteert en indamt.
Bij third-party modellen kun je de internals niet inspecteren. Due diligence loopt via indirecte signalen.
Foundation models dragen systemic risk zoals cloud-infrastructuur — governeer ze navenant.
De governance-houding ligt dichter bij third-party risk management dan bij klassieke software-development controls.
| # | Control | Wat het inhoudt |
|---|---|---|
| 1 | Vendor due diligence | Vraag model cards, training-data-documentatie en bekende bias-disclosures vóór deployment-goedkeuring. |
| 2 | Output monitoring | Doorlopend outputs nakijken op accuracy, bias en policy-schendingen — met vooraf gedefinieerde escalatiedrempels. |
| 3 | Contractuele controls | SLA's over versiewijzigingen, incident-notificatietermijnen, data-handling én een opzegrecht bij onaanvaardbare wijziging. |
| 4 | Substitution planning | Contingency voor terugtrekking, deprecatie of onaanvaardbare gedragsverandering van het model. |
Multimodaal = accepteert/produceert meer dan één datatype (tekst, beeld, audio, video, code) in één model. Scope groeit in twee richtingen:
Tekstvalidatie alleen volstaat niet als het model ook beeld/audio accepteert. Elke modaliteit vermenigvuldigt het aantal validatie-frameworks en content-policies — niet enkel de hoeveelheid werk.
Een aanvaller kan instructies in een beeld- of audiobestand verstoppen → een prompt-injection-vector die tekstfilters missen. Dit heet de cross-modal attack surface.
| Modaliteit / risico | Bedreiging | Vereiste control |
|---|---|---|
| Beeld-input | Visual prompt injection: instructies in beeld die het model leest maar reviewers missen | Input-validatie op visuele content, niet alleen tekst-metadata |
| Audio-input | Voice cloning & audio-injectie tegen voice-enabled systemen | Authenticatie-controls + anomaly detection op audio |
| Code generation (output) | Gegenereerde code kan kwetsbaarheden introduceren bij uitvoeren zonder review | Output governance met security-testing vóór productie |
| Data-exfiltratie | Model kan worden geprompt om gevoelige content te herhalen → omzeilt klassieke DLP | Content governance op output |
Het primaire transparency-artefact om een foundation model te beoordelen dat je niet direct kunt inspecteren. Een goede model card geeft:
| Onderdeel model card | Wat het je geeft |
|---|---|
| Intended use & out-of-scope toepassingen | Of jouw geplande deployment matcht met de design-intentie |
| Training-data-bronnen, bekende biases, evaluatieresultaten | Baseline voor je bias-risicobeoordeling |
| Prestatie op fairness-benchmarks per demografische groep | Wat regelgevers steeds vaker eisen in high-stakes domeinen |
| Bekende limieten & aanbevolen human oversight | Input voor je human-in-the-loop control-ontwerp |
Niet wegstoppen onder losse applicatie-entries — registreer ze als distincte categorie, elk met eigen KRI's vóór het risico materialiseert.
De org leunt op een model dat van gedrag verandert of wordt stopgezet.
Pre-training-biases propageren door alle apps → discriminatie-aansprakelijkheid in gereguleerde domeinen.
Meerdere apps delen één third-party model → grotere blast radius bij een vendor-event.
Stille model-updates wijzigen gedrag zonder bericht → eerdere risk-assessments ongeldig, compliance-gaps.
Klik op je antwoord voor directe feedback.