Hallucinaties — waarom AI dingen verzint

De eerste keer dat een AI iets verzint dat overtuigend klinkt maar gewoon niet klopt, wil je het systeem wegsmijten. Ik snap dat gevoel. Maar als je begrijpt waarom het gebeurt, verandert dat je relatie met het ding.

Wat een hallucinatie eigenlijk is

De term "hallucinatie" is misleidend. Hij suggereert dat het model iets ervaart, dat er een bewust proces is dat de plank misslaat. Dat is niet zo.

Een LLM genereert tekst token voor token, op basis van waarschijnlijkheidsverdelingen over de volgende mogelijke woorden. Het model heeft geen toegang tot de wereld. Het heeft alleen zijn trainingsdata en de context die jij hem geeft. Als de vraag buiten die context valt, of als de trainingsdata onvolledig was, maakt het model de meest plausibele gok.

Die gok klinkt vaak overtuigend. Dat is het probleem.

Waarom het zo overtuigend klinkt

Het model is getraind om coherente, vloeiende tekst te produceren. Niet om waarheidsgetrouw te zijn. Waarheidsgetrouwheid is een bijproduct van goede trainingsdata en fine-tuning, geen fundamentele eigenschap van de architectuur.

Een model dat "ik weet het niet" zegt is beter getraind op onzekerheid. Een model dat twijfelachtige claims met hetzelfde zelfvertrouwen presenteert als zekere feiten, heeft dat bijgeleerd uit voorbeelden die hetzelfde deden.

De modellen worden beter in het herkennen van hun eigen onzekerheid. Maar het probleem is niet opgelost. Het is verminderd.

Drie typen, oplopend in gevaarlijkheid

Feitelijke fouten zijn het minst verraderlijk, omdat je ze kunt controleren. Het model noemt een datum, een naam, een statistiek die gewoon niet klopt. Soms subtiel genoeg dat je het mist als je niet oplet.

Bronverzinsels zijn erger. Het model citeert een onderzoek, een artikel, een boek dat niet bestaat. De verwijzing ziet eruit als een echte verwijzing — juiste opmaak, plausibele titel, geloofwaardige auteur. Als je hem niet opzoekt, weet je het niet.

Redeneerfouten zijn het lastigst. Het model volgt een redenering die intern consistent lijkt, maar op een verkeerde stap gebaseerd is. De conclusie klinkt logisch. De premisse klopt niet.

Wanneer de kans het grootst is

Bij obscure of specifieke informatie: hoe minder de trainingsdata over iets zegt, hoe meer het model improviseert. Bij recente feiten: de trainingsdata heeft een cutoff, alles daarna weet het model niet. Bij gevraagde precisie: "geef me het exacte aantal" dwingt specificiteit af waar misschien geen basis voor is. Bij lange redeneringen: hoe meer stappen, hoe groter de kans op een fout ergens in de keten.

Hoe ik er in de praktijk mee omga

Ik controleer wat ik kan controleren. Sleutelfeiten, namen, datums, statistieken — die ga ik na. Niet alles, maar de dingen die het meest schade kunnen doen als ze fout zijn.

Ik ben sceptischer bij specifieke claims. Hoe specifieker de bewering, hoe meer ik controleer. "AI is populair" kan ik laten staan. "ChatGPT bereikte 100 miljoen gebruikers in twee maanden" — nakijken.

Ik geef het model een ontsnappingsroute. "Als je het niet zeker weet, zeg het dan" helpt bij modellen die goed zijn getraind op onzekerheid. Niet waterdicht, maar het helpt.

En ik gebruik het voor de juiste taken. Voor schrijven, brainstormen, structureren zijn hallucinaties zelden catastrofaal. Voor medische informatie, juridische details, financiële feiten: verifieer bij primaire bronnen. Altijd.

Wat dit niet betekent

Hallucinaties zijn een reden voor voorzichtigheid, niet voor afwijzing. Een rekenmachine maakt ook fouten als je hem verkeerd gebruikt. Het verschil: de rekenmachine faalt consistent en transparant. Een LLM faalt soms overtuigend.

Dat maakt het lastiger. Maar het maakt bewust gebruik noodzakelijk, niet gebruik onmogelijk.