WETENSCHAP

Oorzaak en gevolg: is het de haan die de zon oproept?

null Beeld Hollandse Hoogte / Dirk Visbach
Beeld Hollandse Hoogte / Dirk Visbach

Draaien aan de barometer verandert het weer niet. Dat weet iedereen. Maar een computer weet dat niet. Hij zal het toch moeten leren, wil hij ooit gaan denken als een mens.

Toen de mens de statistiek ontdekte, ruilde hij causaliteit in voor correlatie. Het ging alleen nog om het statistisch verband tussen twee grootheden. Het oorzakelijk verband, causaliteit, was slechts een ondersoort van dat grote geheel. Onderzoek doen naar oorzaak en gevolg wezen de statistici van een eeuw geleden van de hand als subjectief en dus onwetenschappelijk. De mens zou de werkelijkheid leren kennen in data, en niets dan data.

Dat je hiermee de mist in kunt gaan, laat een simpel voorbeeld zien. Als je in een grote groep mensen kijkt naar lichaamslengte en kaalheid, vind je een sterke correlatie: hoe langer, hoe kaler. Je wordt verleid tot de conclusie dat lichaamsgroei leidt tot haaruitval. Tot je de groep mensen die je hebt onderzocht splitst in mannen en vrouwen. Tussen die twee is er een duidelijk verschil in lichaamslengte én in kaalheid. Maar bínnen die groepen is de correlatie tussen lichaamslengte en kaalheid verdwenen. Kaalheid wordt veroorzaakt door geslacht en hormoonhuishouding, niet door lichaamslengte.

Om causaliteit in ere te herstellen was een wetenschappelijke revolutie nodig. Die is enkele decennia geleden in gang gezet, maar nog altijd niet voltooid, betoogt Judea Pearl, een Israëlisch-Amerikaanse computerwetenschapper. Om het verschil tussen correlatie en causaliteit duidelijk te maken schreef Pearl, samen met wetenschapsjournalist Dana Mackenzie, enkele jaren geleden ‘The Book of Why’, dat nu in het Nederlands is vertaald: ‘Het boek waarom’.

Verkeerde been

Het boek zet je soms op het verkeerde been, omdat Pearl suggereert dat er in de afgelopen eeuw helemaal niet naar causaliteit is gekeken, dat de wetenschap blind was voor oorzakelijke verbanden. Dat is niet zo. Iedereen die een beetje wetenschappelijk is geschoold, heeft geleerd dat een statistisch verband niet volstaat, dat een correlatie nog geen causaal verband is. Je kunt een relatie meten tussen fijnstof in de lucht en longklachten, maar om aan te tonen dat fijnstof longklachten veroorzaakt moet je meer doen.

Je moet om te beginnen aantonen dat het statistisch verband niet door andere factoren wordt verklaard. Er is een perfecte correlatie tussen ijsconsumptie en criminaliteit. Niet omdat een ijsje misdadig maakt, maar omdat beide worden beïnvloed door het weer.

Heb je andere verklaringen uitgesloten, dan moet je nog een plausibel werkingsmechanisme hebben, je moet op zijn minst een vermoeden hebben hoe fijnstof longklachten kan veroorzaken. Bij fijnstof en longklachten is dat niet zo’n probleem, maar vermoedens van een werkingsmechanisme zijn er niet altijd. En de verleiding is groot om in bakken met data te zoeken naar om het even welke correlaties, en dan terug te redeneren naar een mogelijk oorzakelijk verband. Die verleiding is groter geworden omdat er bergen met data zijn, én computers die de bergen aankunnen, daar heeft Judea gelijk is. Maar het resultaat is gewoon slechte wetenschap.

Je kunt van dit verkeerde been terugkomen op het goede, door te beseffen dat Judea uit de computerwetenschappen komt. Hij heeft een leven lang gewerkt aan kunstmatige intelligentie. En in die tak van wetenschap is causaliteit een groot probleem. Dat komt doordat je te maken hebt met computers, en die weten niet wat causaliteit is. Pearl heeft een treffend voorbeeld: de barometer en het weer. Er is een duidelijke relatie tussen de barometerstand en het weer. Maar iedereen weet dat je het weer niet kunt veranderen door aan de barometer te draaien. Een computer echter weet dat niet; die ziet wel het verband, maar heeft geen idee van oorzaak en gevolg.

Haangekraai

“Het is niet de haan die de zon te voorschijn roept”, zegt Pearl in een van zijn lezingen (te vinden op YouTube). “Dat kun je je realiseren, je kunt erover praten, het aan een kind uitleggen, maar je kunt het niet combineren met data. In data kraait de haan en komt de zon tevoorschijn. Om te weten dat de haan kraait omdat de zon opkomt en niet andersom, heb je naast data een model nodig van de wereld.”

Dat model vertelt welke variabele (haangekraai) wordt beïnvloed door welke andere variabele (stand van de zon), het ordent de relaties tussen oorzaken en gevolgen. En je kunt dat model niet halen uit bergen statistische data. Het is, benadrukt Pearl, de grootste dwaling die de statistiek de wetenschap heeft bezorgd: het idee dat statistische data vertellen hoe de werkelijkheid in elkaar steekt. Een model dat oorzaken en gevolgen ordent, moet je uit andere bronnen van kennis halen.

Dit is het pad van de causale inferentie. Klinkt ingewikkeld, maar het is de mens eigen, hij doet de hele dag niet anders. En het heeft hem groot gemaakt; het vermogen causaal te denken heeft de mens evolutionair succes opgeleverd en hem in staat gesteld samen te leven in grote groepen, betoogt Pearl.

Ladder

Pearl onderscheidt drie niveaus van causatie, drie treden op een ladder. De onderste trede is die van het zien, het observeren van regelmatige patronen, ofwel de associatie. Het is wat de hond van Pavlov doet kwijlen als hij de bel hoort, en wat de muis doet vluchten als hij een schaduw voelt overkomen. Maar ook de weerman, die de huidige verdeling van gebieden van hoge en lage druk ziet en nakijkt wat die in het verleden voor weer heeft opgeleverd. Op dit niveau wordt heel veel statistiek bedreven omdat het gaat om patronen en verbanden tussen data, zonder iets te zeggen over oorzaak en gevolg.

Het tweede niveau is dat van het doen, van interventie. Gaat mijn hoofdpijn weg als ik een paracetamol neem? Als we 80 procent van de bevolking vaccineren zijn we dan beschermd tegen die infectieziekte? Data spelen hier een rol in de bewijsvoering, maar in de vragen steekt kennis die daar niet vandaan komt. De kennis dat paracetamol een pijnstiller is en dat vaccins beschermen tegen virussen.

Goed, die hoofdpijn is over. Maar kwam dat nou door die paracetamol, door dat biertje of doordat je het winnende lot trok? Die vraag zit op de derde en bovenste trede van de ladder, de trede van voorstellingsvermogen, of

zoals Pearl het noemt, het denken in contra-feitelijkheden: wat was er gebeurd als ik die paracetamol niet had geslikt? Hoe zou het zijn als niemand meer zijn vaccin komt halen?

Je kunt allerlei vragen bedenken, en vele ervan hebben misschien geen antwoord, maar het gaat hier om het vermogen je een andere werkelijkheid voor te stellen.

Moederziel alleen

De mens is moederziel alleen op dit niveau; voor zover bekend is geen dier in staat tot contra-feitelijkheden. Je kunt een aap allerlei trucs leren, zegt Pearl, maar je krijgt een aap niet zo ver dat hij zijn banaan inlevert in ruil voor de belofte dat hem oneindig veel bananen wachten in de apenhemel. Bij een mens kan dat wel; die ziet die hemel al voor zich.

De machines die de mens bouwt komen nog niet verder dan de onderste trede, die van patroonherkenning en associatie. Er wordt al decennia gewerkt aan kunstmatige intelligentie, en met succes, maar verder dan die eerste trede komt die nog niet. Voor zover bekend dan. Er worden grootse prestaties geleverd met zelflerende algoritmes voor allerlei complexe toepassingen. Maar omdat ze zelflerend zijn, weten ook hun programmeurs niet precies waarom die computers het zo goed doen. En de computer zelf kan het niet vertellen.

Kunstmatige intelligentie verdient pas die naam als de machine kan denken als een mens, tot op de hoogste trede van de ladder van causatie, en daarover ook kan communiceren, zegt

Pearl: “Als een voormalig roker in de verleiding komt om een sigaret op te steken, moet hij goed nadenken over de redenen achter dat voornemen en zich afvragen of een tegengestelde handeling niet zal leiden tot een betere uitkomst. Dit vermogen om zich een voorstelling te maken van zijn voornemens en die te gebruiken bij een causale redenering is een niveau van zelfbewustzijn dat bij mijn weten nog geen machine heeft gehaald. Ik zou het prachtig vinden om een machine in verleiding te brengen en hem dan alsnog te horen zeggen: nee.”

Een positieve uitslag

Het Boek Waarom, is de titel van de Nederlandse vertaling van het boek van computerwetenschapper Judea Pearl en wetenschapsjournalist Dana Mackenzie (uitg. Maven). Een belangwekkend boek, maar niet eenvoudig. Lezen vergt een behoorlijke inspanning, en je moet niet schrikken van diagrammen en formules. Diagrammen zijn Pearls belangrijkste middel om causale relaties te vertalen naar wiskunde. Formules voor waarschijnlijkheden zijn hun vulling.

Hoewel het boek eindigt met de vraag of we ooit machines zullen bouwen die denken als mensen, gaat het voor een groot deel over statistische methoden en technieken. Het is een cursus causale inferentie, of zoals Pearl het noemt: werk maken van de waarom-vraag.

De statistische route naar gevolg naar oorzaak kan resultaten opleveren die niet overeenkomen met de intuïtie. Voorbeeld is bevolkingsonderzoek naar borstkanker. Als een vrouw een positieve testuitslag krijgt, hoe groot is dan de kans dat zij inderdaad borstkanker heeft? Die kans is zo groot als de nauwkeurigheid van de test, zou je denken. En die is groot: 80 procent van de borstkankers wordt door de test gezien.

Maar zo groot is de kans niet dat die geteste vrouw inderdaad borstkanker heeft. Dat komt doordat de test soms ook een positieve uitslag geeft terwijl er geen kankercel aanwezig is.

Je moet terugrekenen van gevolg (positieve testuitslag) naar oorzaak (borstkanker). De methode gaat terug tot de Britse dominee en wetenschapper Thomas Bayes (1702-1761), die liet zien hoe je het antwoord vindt op de vraag: hoe groot is de kans dat een vrouw borstkanker heeft, gegeven het feit dat zij een positieve testuitslag heeft? Je kunt die kans schatten op basis van bekende feiten.

Neem een populatie van 10.000 vrouwen. Bekend is dat van hen ongeveer 20 borstkanker zullen hebben. De test heeft een nauwkeurigheid van 80 procent. 20 gevallen van borstkanker zullen dus 16 positieve testuitslagen opleveren.

Er is ook een kans van 10 procent dat de test positief uitvalt terwijl daar geen grond voor is. Bij 9.980 vrouwen die geen borstkanker hebben levert dat 998 positieve uitslagen op.

Je krijgt in totaal 1014 positieve testuitslagen. En 16 daarvan zijn correct. De kans dat een positief geteste vrouw werkelijk borstkanker heeft is dus 16/1014, of wel 1,6 procent.

De getallen zijn fictief, het is maar een rekenvoorbeeld. Niet om aan te tonen dat mammografie, het testen op borstkanker, onzin is, maar om te laten zie dat de testuitslag iets anders zegt dan je zou denken.

Voor wie dit leuk vindt, en wil leren werken met causale diagrammen en formules, is ‘Het Boek Waarom’ een aanrader.

Lees ook:

Robots kunnen over duizend jaar alles beter dan wij. Dat vinden deze experts geen rampscenario

Zelflerende computersystemen streven de mens aan alle kanten voorbij. En doen dan ineens heel domme dingen. De grenzen van kunstmatige intelligentie? Nee hoor, zeggen deskundigen. ‘Geef ons nog een paar jaar.’

Bij nader inzien is het toeval

‘Significant’, zeggen onderzoekers als hun rekenwerk uitwijst dat er meer aan de hand is dan toeval. Maar ze zondigen nogal eens tegen de regels van de statistiek. En dan blijft er van hun studies weinig over.

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden