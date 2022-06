Weg met de lijst meerkeuzevragen in de aula. Steeds meer opleidingen wagen zich aan ‘programmatisch toetsen’, een benadering waarbij het cijfer sterk aan invloed verliest.

Wie dit najaar begint aan de Empo, een nieuwe masteropleiding voor docent primair onderwijs aan de Erasmus universiteit, zal vergeefs zoeken naar het tentamenrooster. De opleiding kent er geen, ze gaan programmatisch toetsen, zegt Rob Kickert, een psycholoog en onderwijswetenschapper die de opleiding helpt opzetten. Programmatisch toetsen is een trend. Alleen al komend jaar beginnen tientallen opleidingen met deze benadering. Wat houdt het in?

Om te beginnen is het geen vastomlijnd concept, eerder een set uitgangspunten. Daarbinnen geldt veel variatie. Doorgaans worden studenten geacht een portfolio te verzamelen met bewijs dat ze de leerdoelen voor een jaar hebben behaald. Dat kan van alles zijn, een concrete opdracht die ze moeten afronden, feedback van de docenten of stagebegeleiders, en toch ook hier en daar een behaalde toets – er zijn vele varianten.

Bij de Empo worden studenten bovendien aangemoedigd om eigen bewijs voor hun portfolio verzamelen. Een les die ze hebben voorbereid bijvoorbeeld, oppert Kickert. “Maar ik kan me ook voorstellen dat een student een mooi gesprek met een leerling als bewijs inzet. Studenten mogen daar creatief in zijn.”

Een marathon zonder finishtijd

Ook het gebruikelijke vinklijstje voor verschillende vakken wordt bij programmatisch toetsen veelal losgelaten: het portfolio wordt in samenhang beoordeeld. Is de beoordelingscommissie overtuigd van het kunnen van de student, dan kan die door naar het volgende jaar. Dat kan gepaard gaan met een cijferlijst, maar in een ‘strikte’ variant van programmatisch toetsen blijven cijfers zelfs geheel achterwege.

“Geen cijfers geven voelt voor sommigen alsof je een marathon rent en niet kijkt wat je finishtijd was”, zegt Kickert. “Dat voelt haast onmogelijk. Maar als je wilt leren hardlopen kan een focus op je finishtijd negatief uitpakken, je kan beter kijken naar je looptechniek.”

Kickert vergelijkt de huidige praktijk van toetsen per vak met een ander onderdeel van atletiek, een hordeloop. De toetsen zijn de hordes en als een student ze allemaal heeft genomen krijgt die een diploma. Dat wringt: “Toetsen zijn momentopnames die een onvoldoende beeld geven van de student. En die bekijken we ook nog eens in isolatie. Dat houdt geen rekening met de ontwikkeling die iemand doormaakt, en dus moedig je groei ook niet aan.”

Leren voor de toets

De wetenschappelijke basis van de toetsonvrede is iets dat iedere docent bekend voor zal komen: hoe meet je of de student het aangeleerde beheerst? De mate waarin een toets dat kan, of zuiverder gezegd, níet kan meten, wordt misalignment genoemd. Hoe matiger het beeld dat een toets geeft van de vaardigheden, hoe hoger die misalignment.

Kickert schreef er mede een theoretisch artikel over: “Als je toets fantastisch aansluit bij je leerdoelen, is er eigenlijk niets aan de hand. Alleen is dat zelden tot nooit het geval. Je kunt de vaardigheden die je aanleert immers zelden vangen in goede en foute antwoorden. De werkelijkheid is veel complexer dan dat. Alleen kun je op die misalignment geen cijfer plakken. Je kunt niet meten welk percentage van je curriculum je niet toetst.”

Dit zou geen ramp hoeven zijn, míts er niet zoiets bestond als het terugslageffect. Dat wil zeggen: de inhoud van een toets heeft invloed op wat studenten leren. Kickert gebruikt het voorbeeld van meerkeuzevragen. Die zijn notoir ongeschikt om te testen of een student nieuwe verbanden kan leggen. En aangezien een student wordt afgerekend op toetsresultaten, wordt die daarmee impliciet ontmoedigd om te leren wat niet wordt getoetst.

Selectie en competitie

Die analyse wordt breed gedeeld. “We vervangen nieuwsgierigheid door prestatiedruk”, vat hoogleraar onderwijskunde Rob Martens het bondig samen. “Je komt op deze manier niet tot de kern”, zegt Karen Heij, een toetsexpert die vorig jaar promoveerde op de eindtoets in het basisonderwijs.

“De huidige manier van toetsen leidt ertoe dat studenten en leerlingen vooral op zoek gaan naar de voldoende. Daarmee wordt de toetsing leidend voor het curriculum, in plaats van andersom. En dan krijg je dat studenten zeggen: ‘is dit nou hoger onderwijs? Ik zit hier alleen maar te reproduceren.’”

Daar komt bij, benadrukt Heij, dat toetsen nu vooral worden ingezet als selectiemiddel. Aan die onvolkomen toetsen wordt door het hele onderwijs heen een competitie gekoppeld, waarbij de beste zoveel procent door mag naar de hoogste vervolgopleiding, of naar het volgende jaar. “Daardoor zijn we heel ver afgedreven van de vraag wat we willen dat die leerlingen en studenten leren.”

Dat is de spiraal die programmatisch toetsen probeert te doorbreken. De benadering zoekt een constante koppeling met de leerdoelen, het programma. Dat is dan ook de grote voorwaarde voor deze methode: je moet weten wat je een student bij wilt brengen. De Empo heeft vijftien expliciete punten geformuleerd, vertelt Kickert: “Dit is wat wij verwachten dat je kunt aan het eind van de rit, en wat je dus moet kunnen om je diploma te krijgen.”

Durven subjectief te zijn

De verwachtingen concreet maken is bij deze toetsvorm des te belangrijker omdat er bewust een bepaalde vorm van subjectiviteit wordt toegelaten. De manier van beoordelen heeft niet de transparantie die we gewend zijn bij een meerkeuzetoets, waarbij de juiste antwoorden vooraf vastliggen. Maar, zegt Kickert, “het uitgangspunt dat jij en ik tot hetzelfde oordeel moeten kunnen komen is te belangrijk geworden. Het staat goede, uitdagende toetsen in de weg.”

Dat schept wel verplichtingen om andere vormen van transparantie terug te geven. In het concept voor de Empo is ingebouwd dat er in de loop van het jaar veel contact is met de student terwijl die de portfolio opbouwt. Daarnaast is er continu feedback is over de vorderingen. “Het oordeel mag nooit als een verrassing komen voor de student”, zegt Kickert. “Maar uiteindelijk beslissen wij. Die beslissing is inderdaad niet tot cijfertjes gereduceerd, maar we kunnen wel degelijk onderbouwen waarom een student dit diploma verdient.”

Een programmatische benadering doet juist goed recht aan de complexe werkzaamheden waarvoor studenten worden opgeleid, stelt Liesbeth Baartman. Zij is bijzonder lector toetsing en beoordeling in beroepsonderwijs bij Hogeschool Utrecht. Ook is ze een van de initiatiefnemers van het leernetwerk programmatisch toetsen, een netwerk waarin geïnteresseerden in het fenomeen hun ervaringen delen.

“Je kunt bij zulke complexe vaardigheden geen objectieve criteria vaststellen”, zegt zij, “maar er is uiteindelijk wel een brede consensus van wat goed werk is. Alleen, je kunt het op veel verschillende manieren goed doen.”

Snelgroeiende hype

Niet voor niets is programmatisch toetsen relatief populair bij opleidingen geneeskunde in binnen- en buitenland. Universiteiten als Maastricht en de Vrije Universiteit werken er in de masterfase al mee. Van een dokter wil je immers niet zozeer weten welk cijfer die haalde voor een willekeurig onderdeel van de opleiding. Je wilt weten of het alles in ogenschouw nemend een goede dokter is. Dat eindoordeel lijkt bij programmatisch toetsen meer geborgd.

Baartman heeft de ontwikkelingen in korte tijd razendsnel zien gaan. Toen ze twee jaar terug een boek schreef over programmatisch toetsen, was het zoeken naar praktijkvoorbeelden in Nederland. Dat is totaal omgeslagen. Ze weet nu alleen al op het hbo van veertig opleidingen aan negentien verschillende hogescholen die programmatisch toetsen het komende collegejaar willen invoeren. En ook in het mbo en wo groeit het flink.

Wel waarschuwt Baartman voor een hype. “Het moet een keuze zijn die past bij waar je als opleiding voor staat. Het concept past niet als je er niet klaar voor bent.” Heij heeft ook reserves. “Het begrip is nog lang niet uitgekristalliseerd en niet iedereen verstaat er hetzelfde onder”, waarschuwt ze. “Ik wil altijd het deksel van de pan tillen en kijken wat erin zit. Soms is het toch een verkapt selectiemiddel, of wordt er zo vaak getoetst dat de toetsdruk alsnog omhoog gaat.”

Betrouwbare beslissingen?

Maakt een programmatisch getoetste student ook een betere arts, onderwijzer of manager? Iets dat zo snel zo hard gaat, is moeilijk te meten, zeker als je het hebt over effecten die zich in de komende decennia in de beroepspraktijk moeten voordoen. Baartman weet het antwoord dan ook niet, maar ze ziet aanmoedigende eerste tekenen. Van stagebedrijven hoort ze dat programmatisch getoetsten zelfstandiger zijn en beter om feedback vragen.

Uiteindelijk draait het er voor Baartman om of programmatisch toetsen leidt tot wat ze noemt een valide en betrouwbare beslissing: voorspelt een diploma goed welke vaardigheden iemand heeft en wordt dat ook breed geaccepteerd? Dat heeft tijd nodig. “Over tien jaar kun je misschien in de beroepspraktijk horen hoe tevreden men is met deze lichting afgestudeerden”, denkt Karen Heij.

Intussen neemt de aandacht toe. Is het voor iedereen geschikt? De consensus is dat goede toetsing makkelijker wordt naarmate je studenten meer voor een specifiek beroep opleidt. Dat kan een reden zijn dat het hbo een voorloper is in programmatisch toetsen.

Voor jong en oud

Maar volgens Kickert is het uitgangspunt om niet elke toets apart te beoordelen overal toepasbaar, net als een focus op het groeiproces van de student. Dat kan voor alle opleidingen en alle leeftijden.

De zelfstandigheid die je van jonge kinderen kunt vragen, is wel kleiner dan die van studenten. Basisschoolleerlingen zie je niet gauw een eigen portfolio verzamelen. “Maar een blik die is gericht op het leerproces in plaats van alleen de uitkomsten zou vaak een veel rijker oordeel kunnen geven.”

Met een opleiding voor basisschooldocenten heeft Kickert wat dat betreft een mooie springplank, beseft hij. “We hopen dat we in de opleiding studenten meegeven hoe je anders kunt toetsen, en dat dit invloed gaat hebben op de toetscultuur op basisscholen.”

