Wat is een LLM eigenlijk? Een eerlijke blik op het ding waar ik dagelijks mee werk

Een paar weken geleden vroeg ik Claude om een Nederlandse vertaling van een Engelse zin. Hij gaf een vertaling, klonk overtuigd, maar één woord erin bestond niet. Geen typo, geen vreemde dialect-keuze, gewoon een woord dat hij ter plekke had verzonnen. Toen ik dat aanwees zei hij "je hebt gelijk" en gaf een ander woord. Ook fout.

Dat is een moment waarop je beseft dat het ding dat je gebruikt geen woordenboek raadpleegt en geen taalexpert is. Het is iets anders, en als je niet weet wát het is, raak je in de war als het dingen doet die op het eerste gezicht niet kloppen.

In deze post probeer ik uit te leggen wat een LLM eigenlijk is. Niet wetenschappelijk diep, want ik ben geen onderzoeker. Wel precies genoeg dat je begrijpt waarom een LLM doet wat hij doet, en waarom hij soms verbluffend goed is en soms volstrekt onzin uitkraamt met diezelfde overtuigingstoon.

Wat de afkorting betekent

LLM staat voor Large Language Model. Drie woorden die elk iets vertellen:

Large: het model bevat een enorme hoeveelheid getallen (de "gewichten"). Voor moderne grote modellen praat je over tientallen tot honderden miljarden van die getallen, hoewel veel vendors zoals OpenAI de exacte aantallen niet meer publiceren.
Language: het is getraind op tekst. Miljarden teksten van internet, boeken, code, artikelen.
Model: het is een wiskundige functie. Tekst gaat erin, tekst komt eruit, ertussenin gebeurt rekenwerk.

Geen van die drie woorden suggereert "kennis", "begrip" of "redeneren". Dat is geen toeval. Een LLM heeft die dingen niet in de zin waarop wij ze hebben.

Wat een LLM eigenlijk doet

Dit is de kern, en hij is verrassend simpel. Een LLM doet één ding: hij voorspelt het volgende stukje tekst.

Geef hem als input "De hoofdstad van Frankrijk is", en hij produceert als output "Parijs". Niet omdat hij Parijs heeft opgezocht in een database. Hij heeft tijdens zijn training zo vaak gezien dat na "De hoofdstad van Frankrijk is" het woord "Parijs" volgt, dat die voorspelling met hoge zekerheid uit zijn berekening rolt.

Een conversatie met een LLM is precies hetzelfde proces, herhaald. Jij typt iets, het model voorspelt het volgende woord, dan het volgende, dan het volgende, totdat hij denkt dat het antwoord af is. Elke nieuwe voorspelling neemt alle eerdere tekst mee als input.

Een paar implicaties die hieruit voortvloeien:

Het model "weet" niets in de zin van opzoeken. Hij voorspelt wat statistisch waarschijnlijk volgt op basis van wat hij heeft gezien tijdens training.
Hij heeft geen idee van waarheid. Hij heeft een idee van waarschijnlijkheid. Dat is iets fundamenteel anders.
Hij kan niets verifiëren. Hij produceert tekst die klinkt alsof hij gefactcheckt is, maar dat is een eigenschap van zijn schrijfstijl, niet van zijn kennis.

Waarom dat verzonnen woord uit mijn intro logisch is

Terug naar mijn voorbeeld. Ik vroeg een Nederlandse vertaling. Het model wist niet "wat is de correcte vertaling van X". Hij produceerde de woorden die statistisch het meest waarschijnlijk volgden op een typische "vertaal dit naar Nederlands" prompt. Voor de meeste woorden levert dat het juiste resultaat op, want hij heeft die vertalingen miljoenen keren gezien.

Maar bij een woord dat zeldzaam was of waarvan hij geen sterke statistische aanwijzing had, produceerde hij toch een Nederlands-klinkend woord. Niet omdat hij loog. Omdat zijn taak is om plausibele tekst te genereren, en een plausibel Nederlands woord verzinnen voelt voor het model hetzelfde als een bestaand Nederlands woord opnoemen.

Dit is geen bug. Zo werkt het ding. Het wordt vaak "hallucinatie" genoemd, maar dat woord suggereert dat het model in de war is. Dat is niet zo. Het model doet altijd hetzelfde. Soms valt zijn output samen met de waarheid, soms niet.

Hoe een LLM wordt gemaakt

Heel kort, op hoog niveau:

Pre-training: het model krijgt enorme hoeveelheden tekst voorgeschoteld en leert te voorspellen welk woord volgt op welke context. Dat is het zware werk, weken tot maanden rekentijd op gigantische clusters van GPU's. Hier wordt het "begrip" van taal opgebouwd.
Fine-tuning: het basismodel wordt bijgeschaafd om nuttig gedrag te vertonen. Dit gebeurt met voorbeelden van goede antwoorden, en met menselijke beoordelaars die zeggen welke antwoorden ze beter vinden.
Veiligheids- en gebruikstraining: het model wordt verder bijgesteld om geen gevaarlijke dingen te zeggen, om instructies op te volgen, om beleefd te blijven.

Wat aan het eind van die pipeline komt is wat jij gebruikt als je ChatGPT, Claude of Gemini opent.

Waarom moderne LLM's veel beter zijn dan twee jaar geleden

In 2023 was GPT-4 voor mij al goed bruikbaar. Inmiddels (2026) is Claude Opus 4.7 een ander beest. De verschillen zitten in een paar dingen:

Schaal: meer parameters, meer trainingsdata, meer rekenkracht. Dat klinkt suf, maar het werkt.
Betere training-data en methodes: niet alleen méér data, maar ook betere data, en slimmere manieren om het model te leren.
Architecturen voor langere context: een LLM kan tegenwoordig honderdduizenden woorden tegelijk in zijn werkgeheugen houden, waar dat eerst hooguit een paar duizend was. Strikt genomen meet je dat in tokens (stukjes woord), en de grootste modellen halen inmiddels één tot twee miljoen tokens.

Dat laatste verandert wat je ermee kunt doen. Een paar duizend woorden context betekent: één e-mail samenvatten. Honderdduizenden woorden betekent: een hele codebase laten analyseren of een heel boek bespreken.

Wat een LLM níet is

Dit is misschien wel het belangrijkste deel. Een LLM is geen:

Database. Hij kan dingen verkeerd onthouden of verzinnen, en hij heeft geen "zoekfunctie" intern. Wat hij produceert is het resultaat van een voorspelling, niet van een lookup.
Rekenmachine. Hij is verbazingwekkend slecht in rekensommen, behalve als hij externe tools mag gebruiken. Tien keer tien gaat goed; 8.347 keer 421 gaat regelmatig fout.
Bewuste entiteit. Hij heeft geen ervaring, geen mening, geen voorkeur. Wat hij produceert dat klinkt alsof het wel zo is, is een gevolg van het feit dat hij is getraind op menselijke tekst, waarin mensen wel die dingen hebben.
Stabiel. Dezelfde vraag twee keer stellen kan twee verschillende antwoorden opleveren, want er zit randomness in de voorspelling van het volgende woord.

Een LLM is wel: een ongelooflijk goede tekst-completer, met genoeg statistische patronen onder de motorkap om over heel veel onderwerpen iets bruikbaars te genereren.

Waarom het toch werkt

Met al die kanttekeningen blijft het de moeite waard om je af te vragen waarom het ding zo nuttig is. Mijn beste antwoord is: omdat een groot deel van wat wij "intelligent" noemen eigenlijk neerkomt op het herkennen van patronen in taal.

Een advocaat schrijft een contract door honderden contracten te hebben gezien en het patroon na te bouwen. Een arts stelt een diagnose deels door symptomen te herkennen die hij eerder heeft gezien. Een programmeur schrijft code door bekende constructies te combineren. Een LLM kan dat patroonherkennen verbazingwekkend goed nadoen, omdat dat precies is waarvoor hij is opgeleid.

Wat een LLM mist is de buitenwereld. Hij kan niet meten, niet observeren, niet checken. Hij heeft alleen tekst. Voor taken die volledig in taal te beschrijven zijn, zoals een mail schrijven, code genereren, of een document samenvatten, is dat genoeg. Voor taken waar werkelijkheidstoetsing nodig is, niet.

Wat dit betekent voor hoe ik er dagelijks mee werk

Dat ik weet wat een LLM is, verandert hoe ik 'm gebruik. Een paar voorbeelden:

Ik verifieer altijd cijfers, namen, datums en citaten die hij produceert. Voor mijn portfolio coaching gebruik ik live data uit IBKR en TradingView, niet wat het model "denkt" te weten over een aandeel.
Ik laat hem code schrijven, maar draai die code daarna echt om te zien of hij werkt. Een LLM die zegt "dit zou moeten werken" heeft die code letterlijk nog niet getest.
Ik vraag hem niet "wat is het juiste antwoord" maar "geef me een paar mogelijke benaderingen". Dat speelt in op zijn sterke kant (variaties genereren) en niet op zijn zwakke (één goed antwoord garanderen).
Ik gebruik hem als gesprekspartner, niet als orakel. Hij is goed in meedenken, slecht in beslissen.

Voor wie net begint met LLMs is dat misschien de meest praktische les. Behandel het ding als een verbazingwekkend taalvaardige collega die ongelooflijk veel heeft gelezen, maar die je nooit alleen op een belangrijke beslissing zou laten. Dat is wat het is. Niet meer, en al helemaal niet minder.

In een volgende post ga ik in op de andere helft van de vergelijking: jouw kant van het gesprek. Als de LLM een voorspeller is, dan is de prompt waaróp hij voorspelt. En dat is veel belangrijker dan de meeste mensen denken.