Anders rekenen met Lucy

Het statistisch bewijs tegen de Haagse verpleegster Lucy de B. leek overweldigend: een kans van 1 op 342 miljoen dat ze toevallig dienst had tijdens de elf verdachte sterfgevallen. Maar of dat de schuld van Lucy bewees, wist de statisticus niet. Aart de Vos wel: ,,Als de statistiek het enige bewijs is, is de kans 80 procent dat ze onschuldig is.''

Stel, u raakt op een feestje met iemand aan de praat en deze persoon begint een heel verhaal af te steken over Lucy de B., de Haagse verpleegster die ervan wordt verdacht elf gehandicapte baby's en hoogbejaarde patiënten te hebben vermoord. Omdat niemand Lucy de B. ooit op heterdaad heeft betrapt, is haar verdenking vooral gebaseerd op een statistisch vermoeden. Alle slachtoffers stierven, juist als zíj dienst had en dat was het OM te toevallig.

Uw gesprekspartner kraakt deze statistische analyse. Hij rekent u haarfijn voor waarom die conclusie niet deugt.

Een vraag: u kent deze persoon niet, maar wat denkt u? Spreekt hier een wiskundige of een jurist?

Een wiskundige natuurlijk, denkt u, juristen staan niet bekend om hun rekencapaciteiten.

Fout! Denk nog eens na. Er zijn in Nederland veel meer juristen dan wiskundigen, misschien wel honderd keer zoveel. En stel dat maar 5 procent van de juristen goed kan rekenen, dan staan er tegenover elke wiskundige nog altijd vijf rekenkundige juristen. 5 tegen 1 dus dat u met een jurist staat te praten.

Veel mensen hebben soortgelijke denkfouten gemaakt bij de statistische analyse in de zaak Lucy de B. De getuige-deskundige, de statisticus Henk Elffers, herhaalde eind januari tijdens het hoger beroep tegen Lucy de B. zijn verklaring dat de kans dat Lucy's aanwezigheid tijdens de vele sterfgevallen op louter toeval berustte, 1 op 342 miljoen was. Elffers beweerde dus, concludeert de leek, dat het zo goed als zeker is dat ze de patiënten heeft vermoord.

Fout!, zegt Aart de Vos, econometrist aan de Vrije Universiteit. ,,Elffers heeft de vraag hoe groot de kans is dat Lucy de B. de moorden heeft gepleegd, helemaal niet beantwoord. Daar gaat zijn statistiek niet over. Zijn statistiek zegt alleen hoe onwaarschijnlijk een gebeurtenis is als er verder niets aan de hand zou zijn.''

Het feit dat zoveel sterfgevallen in de aanwezigheid van één verpleegster voorkomen, zegt op zichzelf niets. Om er iets zinnigs over te kunnen zeggen, moet je de kans van zo'n toevalstreffer vergelijken met de kans van de alternatieve verklaring voor de gebeurtenissen, namelijk dat er in Nederland een moordlustige verpleegster rondloopt.

Dat doen statistici als Elffers niet. Aart de Vos doet dat wel. En komt tot een opmerkelijke conclusie: ,,Met het voorbehoud dat ik mij niet tot in detail in deze zaak heb kunnen verdiepen: als de informatie die Elffers gebruikt heeft om tot zijn 1 op 342 miljoen te komen de enige informatie zou zijn waarop Lucy de B. is veroordeeld, is de kans volgens mij ongeveer 80 procent dat dit ten onrechte is gebeurd.''

Om verwarring te voorkomen heeft De Vos zijn berekeningen toegelicht aan de hand van een fictief voorbeeld: Lucy Klomp, een verpleegster die elf sterfgevallen meemaakt in een periode waarin gemiddeld één sterfgeval voorkomt. Volgens de rekenmethode van Elffers, die hij in het Nederlands Juristenblad heeft toegelicht, is de kans dat die elf sterfgevallen toevallig zijn, 1 op 100 miljoen.

Daar stelt De Vos tegenover dat er in Nederland 40000 verpleegsters zijn en schat hij dat eens in de tien jaar een verpleegster aan het moorden slaat. ,,Ik hoop dat dat een overschatting is'', voegt hij eraan toe. Daarnaast schat hij dat er een kans van 50 procent is dat zo'n moordlustige verpleegster elf moorden pleegt en dan wordt aangehouden.

Elke twintig jaar is er dus een schuldige Lucy Klomp, maar in die periode hebben 800000 verpleegsters (20 maal 40 duizend) die kans van 1 op 100 miljoen gehad om toevallig bij elf sterfgevallen betrokken te raken. Om daar wat hanteerbare cijfers van te maken zou je naar een periode van 20000 jaar moeten kijken. In dat tijdsbestek komen er duizend schuldige Lucy's langs, maar ook acht onschuldige Lucy's. Oftewel, de kans is 8 promille -8 op 1008- dat Lucy Klomp onschuldig is.

Het aardige van deze aanpak is, vertelt De Vos, dat je aanvullende informatie aan de analyse kunt toevoegen. Bijvoorbeeld: de politie houdt de verdachte Lucy Klomp aan, zoekt naar bewijzen tegen haar, maar vindt die niet. Als ze onschuldig is, is dat precies wat je verwacht, maar als ze schuldig is aan zoveel moorden, zou je toch denken dat de kans 80 procent was dat je iets tegen haar zou vinden. Dat is niet gebeurd, dus de optie schuldig wordt een factor vijf kleiner: 200 tegen 8 dat Lucy schuldig is. Van de 1000 schuldigen zijn er immers nog maar 200 over bij wie niets is gevonden.

De Vos kent nog een factor twee ten faveure van Lucy toe omdat ze na al die verhoren niet heeft bekend: 100 tegen 8. Maar de klapper moet nog komen. ,,Dat uitgangspunt van 1 op 100 miljoen is berekend, waarbij Elffers ervan uit is gegaan dat de kans op een sterfgeval bij een verpleegster bekend is. In werkelijkheid moet zo'n kans geschat worden en is er veel onzekerheid over de vraag of die kans voor alle verpleegkundigen hetzelfde is. Met mijn aanpak van de statistiek kan ik die onzekerheden meenemen. Het is ingewikkelde materie, maar het standaard resultaat is dat de kans op extreme gebeurtenissen veel groter is dan men meestal aanneemt. Op grond van mijn ervaring durf ik wel te stellen dat die kans eerder 1 op 2 miljoen is.''

Hoe ingewikkeld die materie is, blijkt wel tijdens het gesprek. De Vos heeft hieraan voorafgaand studenten opdracht gegeven om de kans van elf sterfgevallen met zijn methodiek te berekenen. Hij hoopt dat de studenten nog tijdens het interview met het antwoord komen. ,,Het zou me niet verbazen als de kans nog veel groter was. 1 op 100000 bijvoorbeeld.''

Maar helaas, de opdracht blijkt te veel gevraagd, de studenten komen niet meer opdagen. We houden het maar op 1 op 2 miljoen. Dat is nog altijd een factor 50 en daarmee keren de kansen voor Lucy Klomp: 8 tegen 2 dat ze onschuldig is, oftewel 80 procent.

De Vos: ,,Laat ik nog een keer benadrukken dat dit een theoretische exercitie is, uitgaande van de fictieve gegevens van Lucy Klomp. De gegevens van Lucy de B. ken ik niet voldoende. In haar geval zijn er veel meer gegevens dan het simpele feit dat zij telkens dienst had toen een slachtoffer onverwacht stierf.''

Zulke extra gegevens zou De Vos kunnen verwerken. Bij enkele overleden baby's zijn bijvoorbeeld gifsporen ontdekt. Het zijn geen harde bewijzen voor moord. In sommige lichamen is kalium gevonden dat als gif zou kunnen zijn gebruikt, maar dit element komt ook van nature in het lichaam vrij als iemand overlijdt. ,,Ik heb begrepen dat de rechter deze gifsporen wel heeft meegenomen in zijn overwegingen maar niet als overtuigend bewijs. Als een toxicoloog mij zou kunnen zeggen dat het voor 90 procent zeker een moordbewijs is, kan ik in mijn analyse een factor 9 ten nadele van Lucy invoeren. En met vijf van dit soort bewijzen heb ik een factor negen tot de macht vijf (9 maal 9 maal 9 maal 9 maal 9, is ongeveer 60000). Dan slaat de balans volledig door naar schuldig.''

De analyse die De Vos gebruikt, is de Bayesiaanse statistiek, een in Nederland niet veel beoefende, zelfs verketterde tak van statistiek. Het verschil met de 'klassieke' statistiek is fundamenteel. De klassieke statistiek gaat ervan uit dat er een waarheid is en dat die zich manifesteert in toevallige gebeurtenissen. Ze probeert een model te maken dat de waarheid beschrijft en toetst dat model aan de gegevens. Vaak ook aan gegevens die niet werkelijk zijn gebeurd. Men gooit als het ware nog een paar keer met de dobbelstenen om te zien wat er had kúnnen gebeuren.

Dat is de Bayesianen een doorn in het oog. In navolging van Thomas Bayes, een 18de-eeuwse dominee en statisticus uit Engeland, hangen zij hun kansbegrip op aan het feit dat mogelijke waarheden onzeker zijn. Daarbij gebruiken ze uitsluitend werkelijke gebeurtenissen. Terwijl de klassieke statisticus vaak alleen maar zegt wat de kans is dat een bepaalde reeks voorvallen zou kunnen gebeuren, berekent de Bayesiaan de kans van een mogelijke verklaring, gegeven die reeks voorvallen.

Dat is een veel zinniger antwoord, maar het heeft zijn prijs. De Bayesiaan moet bedenken welke kans hij aan een toestand zou hebben gegeven, voordat hij de gegevens heeft gezien. De Vos moest bijvoorbeeld schatten hoe vaak in Nederland verpleegsters gaan moorden en hoe groot de kans is dat het precies elf moorden worden. ,,Dat zijn subjectieve kansen en als je weinig weet, is de invloed van die subjectiviteit op het eindresultaat groot. En vanwege die subjectiviteit worden wij door andere statistici verketterd.''

Gegevens kunnen De Vos echter helpen. Een analyse van aantallen sterfgevallen in ziekenhuizen zou de rol van de subjectiviteit enorm kunnen terugdringen. Dat geldt ook voor de analyse van de kans dat er tijdens de dienst van een verpleegster elf doden vallen en dat ze dan wordt ontslagen. ,,Maar belangrijker is dat iedereen kan zien welke schattingen ik heb gebruikt en dat je daar hoogstens een factor vijf op af kunt dingen. Dat heeft op het eindresultaat niet zo'n grote invloed.''

De Vos heeft lang geaarzeld wat hij met zijn conclusies moest doen. De rechters of advocaten benaderen? Hij heeft zijn verhaal wel naar de rechtbank gestuurd, maar er verder niets van vernomen. Intussen verbaasde hij zich over de vreemde berekeningen en non-antwoorden van de getuige-deskundigen en over de wijze waarop de rechter die informatie verwerkte. ,,Het vonnis klonk in termen van waarschijnlijkheden, maar ik kon er geen brood van bakken.''

Na een tijdje lukte hem dat wel: zo onzinnig was het allemaal niet. De taal van de rechter was misschien onbegrijpelijk, maar het was zijn manier om met onzekerheden om te gaan en daarmee kwam hij toch redelijk in de buurt van de rekenkundige aanpak van De Vos.

Dat bezorgt de Bayesiaan een mooie toekomstdroom. Een toekomstdroom die hij deelt met enige vooraanstaande Bayesiaanse statistici in Engeland en de Verenigde Staten. De Bayesiaanse statistiek is eigenlijk de enige mogelijkheid relevante kansen bij dit soort onzekere processen in kaart te brengen. Vooral ook omdat nieuwe informatie gewoon aan de analyse kan worden toegevoegd.

De Vos: ,,Ik stel het me voor. Het jaar 2100. De rechter heeft een calculator op zijn bureau staan en telkens als de officier of de verdediging bewijsmateriaal inbrengt, schat hij hoeveel aannemelijker de naar voren gebrachte feiten zijn onder de hypothese 'schuldig' dan onder de hypothese 'onschuldig'. Aan het eind van het proces drukt de rechter op een knop en hij krijgt de uitslag: zoveel procent kans op schuldig. Vervolgens zouden we moeten afspreken welk percentage we een wettig en overtuigend bewijs vinden. 95 procent? 99 procent? Nog meer? Voor Lucy Klomp zou het in elk geval betekend hebben dat een veroordeling niet kan plaatsvinden zonder extra informatie. Voor Lucy de B. weet ik het niet, zij heeft meer dan de statistische schijn tegen zich. Maar de kans dat ze schuldig is, is in elk niet die vaak gedachte 341999999 om 342000000.''

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden