AI-hallucinaties afvangen: waarom AI dingen verzint

Een collega vraagt een chatbot om jurisprudentie voor een bezwaarschrift. Het antwoord bevat drie uitspraken, compleet met zaaknummers en datums. Netjes geformuleerd, precies wat nodig was. Eén probleem: twee van de drie uitspraken bestaan niet. Dit verschijnsel heet hallucineren: een AI-systeem produceert informatie die er overtuigend uitziet maar verzonnen is. Het is geen zeldzame storing, maar een direct gevolg van hoe de techniek werkt — en dus iets waar je op moet rekenen.

Waarom verzint AI dingen?

Een taalmodel voorspelt telkens het meest plausibele volgende woord, gebaseerd op patronen uit zijn trainingsdata. Het raadpleegt geen feitendatabase en heeft geen mechanisme dat waarheid van verzinsel onderscheidt. (Hoe dat precies zit, lees je in Hoe werkt een taalmodel?)

Voor een taalmodel is een goed antwoord dus een antwoord dat er goed uitziet. Vraag je om jurisprudentie, dan weet het model perfect hoe jurisprudentie eruithoort te zien — de opbouw van een zaaknummer, de naam van een instantie, een plausibele datum. Ontbreekt de echte kennis, dan vult het patroon zichzelf in: het model genereert iets dat naadloos in het sjabloon past. Niet omdat het “liegt” — het model heeft geen intentie — maar omdat plausibel produceren nu eenmaal is wat het doet, ook als de feitelijke basis ontbreekt.

Daar komt bij: een hallucinatie voelt voor jou als lezer niet anders dan een correct antwoord. Zelfde vloeiende toon, zelfde stelligheid, zelfde nette structuur. Je kunt verzonnen output dus niet herkennen aan de vorm — alleen aan de inhoud, door te controleren.

Wanneer is het risico het grootst?

Hallucinaties zijn niet gelijk verdeeld. Het risico piekt in herkenbare situaties:

Specifieke, verifieerbare feiten. Namen, cijfers, datums, prijzen, telefoonnummers, artikelnummers van wetten. Hoe preciezer het gevraagde feit, hoe makkelijker het mis kan gaan.
Bronnen en citaten. Verzoeken als “geef bronnen” of “citeer het onderzoek” zijn berucht: het model genereert moeiteloos titels, auteurs en publicaties die niet bestaan, of koppelt echte auteurs aan verzonnen werk.
Nicheonderwerpen. Over jouw lokale verordening, kleine leverancier of interne procedure stond weinig in de trainingsdata. Dunne data betekent meer gokwerk.
Recente gebeurtenissen. Het model kent alleen zijn trainingsperiode. Zonder live zoekfunctie krijg je bij actuele vragen verouderde of ingevulde informatie.
Lange documenten en lange gesprekken. Bij samenvattingen van grote stukken kan het model passages “aanvullen” die er niet staan, en in lange chats raakt eerdere context buiten beeld.
Suggestieve vragen. Vraag je “waarom is X beter dan Y?”, dan krijg je argumenten — ook als X helemaal niet beter is. Het model spreekt je aanname zelden uit zichzelf tegen.

Omgekeerd is het risico het kleinst bij taken waar jij het bronmateriaal aanlevert: herschrijven, structureren, samenvatten van meegestuurde tekst. Dan hoeft het model niets uit eigen “kennis” op te diepen.

Vuistregel: hoe meer een antwoord leunt op feiten die het model zelf moet aandragen — en hoe specifieker, recenter of zeldzamer die feiten zijn — hoe groter de kans op hallucinaties. Plan je controle daarop.

Controleworkflows voor op het werk

Controleren hoeft geen uren te kosten, als je het maar gericht doet. Drie workflows, oplopend in zwaarte.

Workflow 1: de snelle check (laag risico, intern gebruik)

Voor conceptteksten, brainstorms en interne mails waar geen beslissingen aan hangen:

Lees de output volledig — niet scannen, lezen.
Markeer elke concrete bewering: elk cijfer, elke naam, elke datum, elke verwijzing.
Vraag jezelf per markering af: weet ik zelf dat dit klopt? Zo nee, verwijder het of check het.
Twijfelgeval zonder tijd om te checken? Formuleer het weg of maak het generiek.

Workflow 2: bronverificatie (alles wat naar buiten gaat)

Voor teksten richting klanten, burgers, patiënten of publicatie:

Elke bron handmatig opzoeken. Bestaat de publicatie? Klopt de auteur? Zegt de bron werkelijk wat de AI beweert? Een bron die je niet kunt terugvinden, behandel je als onbestaand.
Elk citaat terugzoeken in het origineel. AI parafraseert regelmatig en presenteert dat als letterlijk citaat.
Cijfers herleiden tot de oorspronkelijke bron, niet tot een website die het cijfer ook maar ergens vandaan heeft.
Juridische en medische beweringen altijd verifiëren bij de officiële bron (wetten.overheid.nl, EUR-Lex, richtlijnendatabases) of een deskundige collega.

Workflow 3: het vier-ogen-principe (beslissingen over mensen en geld)

Gebruik je AI-output als input voor een besluit — een offerte, een beoordeling, een advies aan een klant — dan is zelfcontrole niet genoeg:

Laat een collega met inhoudelijke kennis de output beoordelen, met de expliciete vraag: wat klopt hier niet?
Documenteer wat AI-gegenereerd was en wat er is gecontroleerd. Dat is geen bureaucratie: bij AI-systemen met een hoog risico verwacht de AI-verordening menselijk toezicht, en ook daarbuiten wil je kunnen laten zien dat je zorgvuldig werkte.
Spreek binnen het team af welke soorten output áltijd deze route volgen.

Slimme gewoontes die hallucinaties voorkomen

Naast controleren achteraf kun je het risico vooraf verkleinen:

Lever bronmateriaal aan. “Vat dit document samen” is veiliger dan “wat weet je over dit onderwerp?”.
Geef een uitweg. Voeg toe: “Als je iets niet zeker weet, zeg dat dan expliciet.” Geen garantie, wel een verbetering.
Vraag om onzekerheden. “Welke beweringen in jouw antwoord zou ik moeten verifiëren?” levert vaak een bruikbare checklist op.
Gebruik tools met bronvermelding waar mogelijk — en klik die bronnen ook echt aan, want ook een keurige bronvermelding kan verkeerd samengevat zijn.
Ken je eigen valkuil. Het grootste risico is niet de AI, maar tijdsdruk plus een antwoord dat er goed uitziet. Juist als het antwoord precies is wat je hoopte, is checken het belangrijkst.

Verantwoordelijkheid ligt bij de mens

Wie een verzonnen zaaknummer in een bezwaarschrift zet, kan niet naar de chatbot wijzen. Jij ondertekent, jouw organisatie is verantwoordelijk. Dat is ook de geest van de AI-verordening: AI mag ondersteunen, maar mensen moeten het overzicht houden — en daarvoor moeten ze weten waar de techniek faalt. Precies daarom hoort het herkennen en afvangen van hallucinaties tot de kern van AI-geletterdheid, en daarmee tot wat artikel 4 van medewerkers vraagt. Hoe je dat als organisatie aantoonbaar regelt, lees je in Aantoonbaar AI-geletterd en op onze pagina voor werkgevers.

Wil je testen hoe goed jij verzonnen output herkent? Doe de gratis quiz. In onze cursus AI-geletterdheid oefen je deze controleworkflows met praktijkvoorbeelden.