EssayMieke Boon

Etniciteit mag en kan een rol spelen bij opsporen fraude Belastingdienst, zegt deze hoogleraar

Als ze het fatsoenlijk doet, mag de overheid etniciteit als factor gebruiken bij het opsporen van fraude.

Bol.com, Amazon en Wehkamp doen het. Maurice de Hond, Motivaction en de Kieswijzer doen het: gebruik maken van profielen op basis van data-analyse. Dat is nuttige kennis voor bedrijven en diensten om kansen en risico’s in te schatten. Waar zitten de wanbetalers en retourzenders? Wat willen consumenten en wat niet? Ook de overheid doet het. Wie lopen de grootste risico’s in de coronacrisis? Waar is de grootste kans om fraudeurs en belastingontduikers aan te treffen? En dat laatste wringt, ook al gebeurt dat met de beste technieken voor data-analyse.

Het gebeurt op grote schaal. U en ik doen het. Binnen een paar tellen plaatsen we andere mensen in een vakje: man, vrouw, vreemd, vertrouwd, verdacht, buitenlander, betrouwbaar, saai, charismatisch. Als het positief voor ons uitpakt hebben we er geen moeite mee, maar niemand vindt het prettig om negatief geprofileerd te worden. Ook niet op basis van de data-analyses die bedrijven en organisaties hanteren. Kortgeleden schafte ik een luisterapp aan voor het beluisteren van artikelen en boeken tijdens mijn fietsritten naar de universiteit. Opeens kreeg ik reclames voor rollators. Kennelijk was ik geprofileerd als gehandicapte.

Dat wekte hilariteit in mijn omgeving. Schadelijk wordt het als mensen op basis van hun profiel worden uitgesloten. Of erger, als je wordt verdacht van fraude omdat je in een specifiek risicoprofiel past. Verdacht worden voelt als een aanslag op je integriteit. Mensen die door de douane zijn ‘gevisiteerd’ hebben daaraan een vernederende, zo niet traumatische herinnering. Een morele grondregel voor de overheid is de integriteit van haar burgers te respecteren. Het maken en gebruiken van risicoprofielen door de politie, veiligheidsdiensten, het UWV en de belastingdienst lijken daarmee in strijd. Maar de overheid heeft ook de morele verplichting om fraude en belastingontduiking tegen te gaan. Het voelt onrechtvaardig als mensen die het niet zo nauw nemen met de wet daarmee wegkomen. Ook dat wordt ervaren als miskenning van de eigen integriteit, en wekt woede en frustratie.

Het  overheidsdilemma: effectief maar omstreden

Hier staat de overheid voor een dilemma. ­Risicoprofilering op basis van data-analyse is effectiever en efficiënter dan willekeurige steekproeven – maar staat op gespannen voet met de integriteit van individuen die op basis van zo’n profiel worden gecontroleerd.

Neem de recente commotie rond etnisch profileren bij de Belastingdienst (het dilemma speelt net zo goed bij douane en politie). Om die te beoordelen kies ik twee invalshoeken, namelijk de ethiek en de technologie.

Een centrale vraag is: mag het juridisch en moreel wel, het opstellen van een risicoprofiel? En, zo ja, mag in zo’n profiel iemands nationaliteit of etniciteit een rol spelen? En als etniciteit (of een ander politiek gevoelig kenmerk, zoals gender, seksuele geaardheid of leeftijd) daarin een rol speelt, is er dan noodzakelijkerwijze sprake van etnisch profileren in de zin van discriminatie en racisme? Onderzoek moet uitwijzen of dit inderdaad het geval is.

Hoe een risicoprofiel wordt opgesteld en toegepast kan het verschil maken. Het is goed mogelijk dat de manier waarop belastingambtenaren omgegaan zijn met controles, slechts werd geleid door vooroordelen. Het zou niet de eerste keer zijn dat een overheidsdienst – politie, justitie, gemeente, veiligheidsdienst – verwordt tot een zieke, corrupte of geweld­dadige cultuur. Diensten die macht kunnen uitoefenen over burgers lopen dat risico. Daarom is zorgvuldig toezicht nodig, zoals door de Autoriteit Persoonsgegevens, evenals wetgeving om als overheid te voorkomen dat zaken uit de hand lopen.

Een ambtenaar met vooroordelen is verwerpelijk

Trouw berichtte dat de Belastingdienst een afdeling data & analytics heeft. “Een data-analist vertelt dat het ‘een kick’ geeft om de juiste dataselecties boven water te krijgen.” Voor het opsporen van die patronen beschikt de Belastingdienst over een ongekende hoeveelheid gegevens.

Wat is de rol van deze afdeling? Er zijn twee mogelijkheden. Als ambtenaren op basis van eigen vooroordelen individuele burgers selecteren voor controle, dan is dat volstrekt verwerpelijk. Maar wat als de Belastingdienst op een statistisch deugdelijke manier naar risicoprofielen speurt door patronen op te sporen in data?

Deze meer objectieve vorm van data-analyse maakt tegenwoordig steeds vaker gebruik van artificiële intelligentie en zelflerende algoritmes (machine-learning technologie). Die technologie is alom aanwezig. Dicht bij huis wordt ze gebruikt bij de gepersonifieerde reclames die je ontvangt wanneer je op Google surft, films kijkt bij Netflix, of boodschappen doet bij Bol.com. Daar zit gewoonlijk geen mens achter, maar een lerend computersysteem, dat jouw gegevens gebruikt om in te schatten door welke producten of diensten jij je laat verleiden. Machine-learning technologie maakt ‘zelf’ profielen aan op basis van grote hoeveelheden gegevens van gebruikers in combinatie met hun keuzes voor bepaalde producten of diensten. Vervolgens zoekt de machine met gebruikmaking van jouw persoonlijke gegevens (leeftijd, gender, hobby’s) welk profiel het beste bij jou past. En koppelt daar vervolgens allerlei aanbod aan vast.

Zonder ooit te vertellen dat je een verwoed motorrijder bent, leidt het Google-algoritme dit af uit jouw surfgedrag, en krijg je in de Weeronline-app motorrijdproducten aangeboden. Iemand met een Stella e-bike profiel krijgt in die app een heel ander aanbod.

Schulden, leeftijd, geslacht, nationaliteit

Hoe zou deze technologie behoren te werken bij de Belastingdienst? Om een machine ‘zelf’ risicoprofielen te laten ontdekken maakt de data-analist eerst een gegevensbestand met informatie uit belastingformulieren, zoals inkomen, schulden, bezittingen, leeftijd, gender, gezinssamenstelling, postcode en nationaliteit. Deze informatie is – binnen de grenzen van de privacywetgeving – te koppelen aan gegevens uit andere databases, zoals beroep, bestedingspatroon, giften, liefhebberijen, familieachtergrond, ziektegeschiedenis, politieke oriëntatie, abonnementen, wapenvergunning, reisgedrag, verzekeringsclaims en strafblad.

Voor het opsporen van risicoprofielen heb je daarnaast een trainings-set nodig. Deze bestaat uit de deel-set van de personen die eerder werden gecontroleerd, en waar al dan niet belastingfraude werd geconstateerd. Deze set vormt de input. Ieder individu in die trainingsset krijgt een waarde toegekend, bijvoorbeeld 1 voor ‘fraude’ en 0 voor ‘geen fraude.’ Dit is de output die het algoritme moet berekenen. In de training ontwikkelt de machine zelf een algoritme dat de fraudegevallen in de trainingsset zo goed mogelijk voorspelt – of omgekeerd, de ‘geen-fraudegevallen’. Dit algoritme wordt vervolgens gebruikt om nieuwe gevallen te voorspellen.

Deze aanpak is te vergelijken met de schaakcomputer die leerde schaken door vele partijen tegen zichzelf te spelen en zodoende zelf een algoritme ontwikkelde waarmee de schaakgrootmeester werd verslagen.

Kunstmatige intelligentie

Een risicoprofiel in deze technologie is een specifieke combinatie van persoonlijke gegevens die correleert met een significant hogere kans op fraude in de trainingsset. Cruciaal is de kwaliteit van de trainingsset. Daar kunnen vooroordelen zijn ingebouwd. Bijvoorbeeld doordat belastingambtenaren stereotypisch bepaalde groepen grondiger hebben gecontroleerd en zodoende vaker fraude opspoorden, terwijl ze anderen op voorhand vertrouwden en het stempel ‘geen fraude’ gaven. De technologie vereist daarom deugdelijke trainingsdata, goed geschoolde data-analisten, en transparantie voor belanghebbenden en externe experts in de ontwikkeling en het gebruik ervan.

Momenteel zijn artificiële intelligentie en machine-learning technologie voor allerlei toepassingen nog volop in ontwikkeling. De Nederlandse overheid zet daar zwaar op in. Binnen afzienbare tijd kennen zulke zelflerende systemen ons misschien wel beter dan wijzelf.

Dit toekomstperspectief maakt de gestelde vragen nog dringender. Mag iemands nationaliteit of etniciteit een rol spelen in het opstellen van een risicoprofiel? En is het sowieso moreel acceptabel om risicoprofielen op te stellen? Ik zal het dilemma schetsen vanuit een ethisch perspectief.

Mieke Boon is hoogleraar wetenschapsfilosofie in praktijk aan de Universiteit Twente. Samen met Peter Henk Steenhuis publiceerde zij de serie Filosofie van het Kijken in Trouw. Momenteel werkt zij samen met studenten aan het thema Man and Machine - Learning in the Digital Society waarover zij in september 2020 een tentoonstelling opzetten bij Museum Tetem in Enschede. 

Politieke ideeën over zaken zoals belastingfraude worden veelal geleid door twee ethische theorieën die in hun conclusies vaak haaks op elkaar staan, namelijk de deontologie, ofwel beginselethiek, en het utilisme, ofwel gevolgen-ethiek. De beginselethiek werd in de tweede helft van de achttiende eeuw theoretisch verwoord door de Duitse filosoof Immanuel Kant. Deze theorie paste in de tijdgeest: de aanloop naar de Franse revolutie waarin werd gestreden voor de gelijkwaardigheid en gelijke rechten voor alle mensen, of je nu rijk, machtig en van adel bent, of een arme man van de straat. Het basisbeginsel tegen discriminatie berust op deze ethiek, en is juridisch vastgelegd in Artikel 1 van de grondwet. Morele verontwaardiging over etnisch profileren door overheidsdiensten resoneert hiermee.

In diezelfde tijd ontstond ook het utilisme. In deze ethische theorie stelt de Britse filosoof David Hume het geluk van mensen centraal. Dit werd door denkers zoals Jeremy Bentham en John Stuart Mill uitgewerkt tot een politieke filosofie die is gericht op het bevorderen van algemeen welzijn, en behelst als algemene regel dat de overheid dient te streven naar zoveel mogelijk geluk voor zoveel mogelijk mensen. En omgekeerd, zoveel mogelijk lijden te voorkomen. De overheid handelt utilistisch als zij het algemeen belang centraal stelt en efficiënte middelen aanwendt voor ons welzijn. De overheid dient de integriteit van individuele burgers te beschermen en hen met respect te behandelen via wetgeving en privacyregels. Maar sommige burgers gedragen zich alsof er voor hen andere wetten gelden – ze voelen zich minder gelijk dan anderen, en menen zich niet te hoeven houden aan regels zoals het eerlijk invullen van het belastingformulier. Zulke freeriders schaden het algemeen belang. Daarom dient de overheid recht te doen aan gevoelens van eerlijkheid, rechtvaardigheid, loya­liteit en gemeenschapszin.

Privacy als hoogste goed - of toch fraudebestrijding?

De een verdedigt privacy als hoogste moreel beginsel, de ander vindt ieder middel geoorloofd om freeridergedrag te bevechten. Die twee posities wringen. En ze versterken elkaar. De een vindt het idee dat nationaliteit of etniciteit een factor kan zijn in een risicoprofiel, discriminerend. Voor de ander – die toch al dacht dat mensen met een dubbele nationaliteit niet deugen – is het koren op de molen.

Media zouden helderheid moeten verschaffen over zulke precaire kwesties, maar de sfeer is nu dat er etnisch wordt geprofileerd.

Als het gebruik van risicoprofielen op basis van statistische data-analyse effectiever en efficiënter is dan willekeurige steekproeven, dan is dat vanuit een utilistisch perspectief wenselijk. De vraag vanuit de deontologische ethiek is vervolgens hoe je nadelige effecten voor individuele burgers, zoals voor hen die worden uitgekozen om te worden gecontroleerd, voorkomt of compenseert. 

Woorden doen ertoe: een nieuw frame

Daarbij moeten overheidsinstellingen blijven benadrukken dat risicoprofielen gaan over verhoogde en verlaagde kansen in een groep, niet over specifieke individuele burgers. Bovendien gaat het meestal om nog steeds kleine kansen. Binnen die risicogroep deugen nog steeds, zeg maar, 95 van de honderd mensen. Toch voelt het behoren tot ‘risicogroep fraude’ als een beschuldiging, en die kwetst, ook al ben je geen verdachte.

Maar woorden doen hier heel veel. Laten we het daarom anders framen. ‘Ik pas in een profiel waar een verhoogde kans op belastingfraude is aangetoond’ – dat klinkt al anders.

Het is mogelijk om neutrale risicoprofielen op te stellen zonder etnisch profileren, terwijl niettemin kan blijken dat etniciteit een rol speelt in sommige van die profielen. De Belastingdienst kan zo fraude opsporen, zonder dat daar vooroordelen aan te pas komen.

Als de uitkomst van zo’n aanpak is dat in een bepaald risicoprofiel nationaliteit of etniciteit risicofactoren blijken te zijn, dan is daar naar mijn idee geen sprake van racisme, discriminatie of etnisch profileren. Net zomin als er sprake is van vrouwen- of leeftijddiscriminatie als blijkt dat gender en leeftijd risicofactoren in een bepaald profiel zijn. Noch wanneer er een profiel blijkt te zijn waar juist nagenoeg geen fraude voorkomt, bijvoorbeeld bestaande uit echtparen met dubbele nationaliteit, ouder dan 70, enzovoort.

Wie  bewaakt de bewaker?

Voor overheidsinstellingen is het daarom van het grootste belang om de aard van risico­profielen én de risico’s van vooringenomenheid te begrijpen en in acht te nemen. Hiervoor zijn protocollen en scherp formeel toezicht cruciaal – namelijk op hoe risicoprofielen worden gemaakt, en op hoe burgers worden behandeld die worden uitgekozen om te controleren.

Hoe zorg je ervoor dat deze mensen niet worden beschadigd? Hoe voorkom je dat in die controles vooringenomenheid van de controleur een rol kan gaan spelen? Wie bewaakt de bewaker?

Ik zou graag weten hoe dit bij de Belastingdienst is georganiseerd. 

Lees ook:

Belastingdienst erkent: toch sprake van etnisch profileren

De Belastingdienst heeft erkend dat de wijze waarop ze fraudeurs trachtte op te sporen,  als etnisch profileren kan worden gekwalificeerd.   

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden