Niemand die zei: hier klopt iets niet

Onderzoeker Pim Levelt lichtte in opdracht van het universiteitsbestuur de vakgroep sociale psychologie in Tilburg door. Na ruim een jaar blijkt dat niet alleen Diederik Stapel zich misdroeg. Meer van zijn collega's bedreven 'slodderwetenschap' en veel vakgenoten en bestuurders verwaarloosden hun controlerende taak.

Hij wil er geen doekjes om winden, de ervaren hoogleraar die veertien maanden lang het werk van zijn collega Diederik Stapel onderzocht. "De ernstigste vorm van fraude die ik in die tijd heb gezien, bestaat uit het compleet verzinnen van onderzoeksgegevens", zegt Pim Levelt (74). "Dat hebben we geconstateerd in ten minste dertig publicaties. Dat vinden we schokkend veel."

Hoe dat ging, vertelde Levelt - zelf gespecialiseerd in de psycholinguïstiek, de psychologische kant van taal - vorig jaar al. Stapel tilde dozen met vragenlijsten en ander materiaal in zijn auto, vertelde zijn collega's dat hij dit op scholen zou uitdelen en kwam een tijdje later terug met verzonnen data. Het onderzoek was nooit uitgevoerd, de vragenlijsten lagen in de afvalcontainer.

In het eindrapport dat gisteren verscheen, staan een paar varianten. Soms ging het om echte data, was het experiment wél uitgevoerd en waren alle antwoorden van de proefpersonen keurig in de computer ingevoerd. Nadat Stapel ze door zijn computer had gehaald, zagen de cijfers er anders uit.

Waarom fraudeerde Diederik Stapel? En besefte hij niet dat hij zou worden betrapt? "Ik vermoed dat een intelligent iemand zoiets wel beseft", zegt Levelt. "Maar waarom, dat weet ik niet. Het was niet onze taak in de ziel van de heer Stapel te kijken. Dat moet een andere psycholoog maar doen. Er zijn er genoeg in Nederland."

U schetst het beeld waarin Stapel bij zijn aantreden in Tilburg zijn eigen vakgebied de 'koningin' van de wetenschap noemde. Dat suggereert hoogmoed.
"Wij vonden het citaat opmerkelijk omdat hij in die tijd stelt: de theorie is heilig, de data zijn ondergeschikt."

Het eindrapport, waarin het onderzoek van de commissie-Levelt over het werk van Stapel in Tilburg is gecombineerd met de resultaten van collega-commissies over de tijd dat de psycholoog in Amsterdam en Groningen werkte, sluit af met een uitroepteken: Stapel was zelf verantwoordelijk voor de fraude. Er is geen bewijs dat vakgenoten meededen met het verzinnen van data.

Maar daarmee is het goede nieuws voor de wetenschap ook direct op. "Wat ik zelf schokkend vond, was dat wij begonnen met het onderzoeken van het handelen van een individu", zegt Levelt. "Maar in de loop van de tijd werd steeds duidelijker dat de controlerende taak van de wetenschap, het systeem, in deze zaak op alle niveaus heeft gefaald."

Hij somt op: "Stapel had zeventig co-auteurs. Hij had naaste collega's op drie universiteiten. De tien proefschriften waarin wij fraude hebben gevonden, hadden tien leescommissies en tien promotiecommissies. De tijdschriftartikelen met fraude zijn allemaal gelezen door collega-wetenschappers. Alle publicaties zijn uiteraard zichtbaar geweest voor alle vakgenoten. Er is lange tijd niemand geweest die heeft gezegd: dit klopt niet. Terwijl je dat had moeten zien."

Hetzelfde geldt voor de zogeheten visitatiecommissies, collega-onderzoekers die de faculteiten waar Stapel werkte bezochten. "In de visitatierapporten werd Stapel op het schild geheven."

Ook de Tilburgse universiteit had Stapel hoog zitten. Bij zijn aanstelling kreeg hij veel vrijheid, voor zijn salaris werd een aparte constructie bedacht zodat hij - weliswaar werkzaam bij psychologie - via de economiefaculteit nog extra werd beloond. "Het was achteraf gezien niet verstandig iemand zo de hemel in te prijzen", zegt Levelt. "En ook niet om een vrijbrief te geven. Zelfs iemand die je beschouwt als toponderzoeker moet je laten werken in een ordelijk verband, waarin controle mogelijk is."

De loyaliteit aan Stapel ging ver, want ook na zijn ontslag kreeg hij via de faculteit nog faciliteiten - waaronder informatie over het lopende onderzoek. Iedereen noemde hem een fenomeen. En dat terwijl, als je het goed bekijkt, Stapels bijdrage aan de psychologische theorievorming niet uitzonderlijk was.

In de zogeheten citatie-index, die meet hoe vaak andere wetenschappers in gezaghebbende tijdschriften naar hem verwijzen, scoorde hij juist bescheiden. Zijn kracht was zijn uitstraling, het enthousiasme waarmee hij anderen meetrok en zijn gevoel voor onderzoeken die het goed deden in de media. Bijzonder detail: Stapel verzorgde in Tilburg ook de colleges wetenschapsethiek.

Levelt en de zijnen vonden een paar uitzonderingen. In de tijd dat Stapel in Groningen werkte, uitte een promovendus ooit tegenover een senior-collega twijfels: klopte het werk van Stapel eigenlijk wel? Later in Tilburg, hadden onder meer collega-hoogleraren dezelfde reserves.

Pas toen drie jonge collega's de zaak uitzochten en een melding deden die bij de Tilburgse rector terechtkwam, ging de zaak rollen. Toen werkte het systeem wel - maar veel te laat.

"De ernstigste schade van deze zaak ondervinden de jonge promovendi van Stapel", zegt Levelt. "Die zien een belangrijk deel van hun publicatielijst verdampen. Die lijst heb je nodig voor een vaste baan en voor onderzoeksfondsen. En anders dan ruim een jaar geleden is het nu geen aanbeveling meer om bij Stapel gepromoveerd te zijn."

Levelt houdt promovendi uit de wind: die zijn in opleiding en daarom kun je niet verwachten dat ze de hoogleraar op de vingers tikken - al helemaal niet wanneer deze zijn hartelijkheid afwisselt met reacties op kritische vragen als 'als je hier aangenomen wilt worden moet je laten zien dat je iets af kunt maken en de resultaten gewoon opschrijven'.

Vernietigend echter is het eindrapport over de senior-collega's van Stapel. Een deel van hen had weinig interesse in statistiek - ze gaven dat achteraf ook toe - en lazen over soms aantoonbare onzin heen. Een paar gingen verder. Die bedreven samen met de inmiddels ontslagen Stapel raren een praktijk die Levelt betitelt als 'slodderwetenschap' (zie kader). "Het gaat daar om ernstige schendingen van de wetenschappelijke integriteit", zo motiveert Levelt zijn keuze om de namen van deze betrokkenen te melden bij het Tilburgse universiteitsbestuur. Volgens hem was de verdediging van de collega's van Stapel 'zo doen wij die dingen nu eenmaal'. En 'er is enorme druk om te publiceren'.

Die druk om snel leuke onderzoekjes te doen, die is toch reëel?
"Ik blijf vinden dat die druk geen excuus voor wangedrag kan zijn. Ik denk wel dat publicatiedruk misschien op een andere manier een rol speelde. Want terwijl wij ervan uitgaan dat al die collega-wetenschappers elkaars werk lezen en controleren, kan het zijn dat ze daar te weinig tijd voor hebben. Omdat ze zelf moeten publiceren."

Is het niet makkelijk om achteraf te zeggen dat die collega's van Stapel een norm hebben overtreden?
"In de handboeken staat heel duidelijk dat je zo niet te werk moet gaan. Echt, de methodologie in de sociale wetenschap is prima."

De Tilburgse universiteit moet zelf bepalen wat er met de betrokken onderzoekers moet gebeuren. Er heeft al iemand ontslag genomen die veel met Stapel samenwerkte, maar of die onderzoeker tot het groepje namen behoort dat aan het universiteitsbestuur is doorgegeven, daarover wil Levelt niets zeggen.

Geeft u de loopbaan van die mensen in feite niet de doodsteek? Zoiets wordt toch bekend, en voor een wetenschapper is betrouwbaarheid cruciaal.
"Ik weet niet of het zo werkt. Maar wij vonden deze overtredingen ernstig genoeg. En een universiteit moet ervan uit kunnen gaan dat de onderzoekers die nieuwe lichtingen studenten opleiden, integer handelen."

Maar wie kan ik in Tilburg nou wel en wie niet vertrouwen?
"Dat is aan het universiteitsbestuur. Geloof me, er zijn in Nederland veel sociaal-psychologen die uitstekend werk doen. Ook in Tilburg. Wij zeggen wel dat het probleem ernstig is, omdat Stapel met velen heeft samengewerkt. Maar we zeggen niet dat de hele sociale psychologie niet functioneert. Laat staan de hele psychologische wetenschap."

Op uw fraudelijsten staan nu ook collega's van Stapel die zelf niet hebben bijgedragen aan wat u slodderwetenschap noemt. Maar zolang wij niet weten wie dat zijn, kijken we ze er wel op aan.
"Het is niet aan ons om over iedere persoon uitspraken te doen."

Als het systeem faalt, lopen er dan niet veel meer fraudeurs rond?
"Dat valt niet uit te sluiten."

U bent zelf emeritus-hoogleraar. Zou u kunnen garanderen dat, wanneer uw collega's zo grondig worden onderzocht als u zelf met Stapel en co-auteurs heeft gedaan, er geen slodderwetenschap aan het licht komt?
"Ik denk van niet. Ik kan mijn hand niet in het vuur steken voor elk artikel, ik heb niet alles gelezen. Ik weet dat ook bij mijn instituut er al veranderingen zijn. Wij houden nu bijvoorbeeld veel nauwkeuriger een logboek bij van experimenten."

Wat heeft deze zaak u persoonlijk gedaan?
"Ik ben mijn naïviteit verloren. Wetenschap is gebaseerd op vertrouwen, ook tussen collega's onderling. Dat had ik vroeger meer. Nu zet ik overal een rood vlaggetje bij. En ik denk dat ik zeker niet de enige ben die dat doe."

Is er nog redding mogelijk? We hebben de volgende mogelijkheden:
1) DE EXTREME SCORES
Onder de studenten zijn er vijf die blonde mensen een extreem hoge score voor sympathie hebben gegeven. Die scores hebben we eruit gelaten. Een heel plausibele aanpak, sommige mensen vullen niet al te serieus vragenlijsten in. Maar wat blijkt: als we deze personen alsnog toevoegen, wordt het verband tussen haarkleur en sympathie net sterk genoeg. Zo kunnen we alsnog een wetenschappelijk tijdschrift halen, en aansluitend ook de media. Uiteraard vermelden we niet op welke manier dit is gelukt. We kunnen deze ontsnappingsroute ook omgekeerd volgen: we stellen dat een aantal proefpersonen, die met hun scores ons dwarszitten voor een goed resultaat, er maar beter uitgegooid kunnen worden 'omdat ze gewoon maar wat invulden'.

2) DE HALVE WAARHEID
We kijken nog eens goed naar ons mislukte onderzoek. En we ontdekken: mensen met bruin haar worden wel degelijk onsympathieker gevonden dan blonde types. Alleen: tussen zwart en blond is er geen verschil. Weet je wat, we gooien al die foto's van zwartharigen eruit en bieden de rest aan voor publicatie: blond maakt populair. Zonder dat we natuurlijk vermelden dat ons mooie resultaat alleen maar werkt voor bruin haar. Een variant van de halve waarheid: we hebben eigenlijk twee experimenten uitgevoerd over haarkleur en sympathie, maar uit slechts een daarvan blijkt het verband. Dan voeren we alleen dat op in onze publicatie. Nog een optie: we hebben de variabele 'hoe sympathiek vind je de persoon op deze foto' gemeten met vier vragen en de antwoorden tot een score samengeknutseld. Als we achteraf twee vragen weglaten, vinden we hogere scores en ook ineens een verband met haarkleur.

3) DE HERHALING
Ons experiment is mislukt. Weet je wat, we doen het nog een keer! We stellen de vragen iets bij, zodat we nog steeds een verantwoord experiment overhouden. Met een beetje geluk vinden we nu wel verband tussen haarkleur en sympathie. En publiceren we alsnog. Dat kan acceptabel zijn, wellicht hebben we het de eerste keer niet goed aangepakt. Maar we vermelden gewoon niet dat het de eerste keer niet lukte. Lukt de tweede keer ook niet, dan kunnen we nog een herhaling wagen.

4) DE AFRONDING
We hebben wel een verband gevonden tussen haarkleur en sympathie, maar het zou ook toeval kunnen zijn. We rekenen uit dat de zogeheten p-waarde, die daar iets over zegt, uitkomt op het getal 0,056. En laat dat getal nou net 0,05 moeten zijn - en liefst nog lager - voordat we toeval mogen uitsluiten. Ach, dat ronden we dan af op 0,05.

Slodderwetenschap
Naast de overduidelijke fraude - het verzinnen of bijstellen van onderzoeksdata - hebben de drie commissies die het werk van Stapel onderzoeken ook andere laakbare praktijken gevonden. Doel van de fraudeurs was doorgaans om de eigen hypothese bevestigd te krijgen. Om deze 'slodderwetenschap' te verduidelijken, hieronder een voorbeeld. Het is volledig fictief en slaat dus niet op een onderzoek uit de Stapel-lijst.

Neem eens aan dat we een groep wetenschappers zijn op zoek naar een onderzoek dat 'leuk voor de mensen' is. We vergaderen daarover en komen op de volgende stelling: blonde mensen worden veel sympathieker gevonden dan anderen. Daar kan iedereen zich iets bij voorstellen. We testen dit op een groep studenten die we foto's laten zien van mensen met een blonde, bruine en zwarte haarkleur. We vragen ze een sympathiecijfer toe te kennen aan al die geportretteerden. We doen het precies volgens de regels. Maar helaas, we kunnen de hypothese niet bevestigen, onze proefpersonen vinden blonde mensen niet sympathieker dan anderen. Daar gaan onze publicatie en media-aandacht. En we waren zo overtuigd van onze theorie.

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden