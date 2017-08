Het meest gebruikte woord in het Nederlands is 'de'. Het komt in teksten tweemaal zo vaak voor als nummer 2 op de lijst: 'van'. En 'van' komt weer tweemaal zo vaak voor als 'en', nummer 3 op de ranglijst.

Volgens sommige taalkundigen zou de wet van Zipf ook tevoorschijn komen als je een aap achter een typemachine zet

Enzovoorts, enzovoorts, er zit op de ranglijst iedere keer een factor 2 tussen.

En niet alleen in het Nederlands, maar in álle talen. Die wiskundige wetmatigheid werd een eeuw geleden ontdekt door linguïst George Kingsley Zipf. De wet van Zipf is talloze malen bevestigd, maar nooit verkláárd.

Volgens sommige taalkundigen is de wet niet meer dan een statistisch spookverschijnsel dat zich vertoont in iedere berg letters die je in groepjes (woorden) verdeelt. Hij zou ook tevoorschijn komen als je een aap achter een typemachine zet. Anderen hebben verklaringen gezocht in de lengte van woorden, of in hun betekenis, of in de menselijke neiging een woord dat in deze zin wordt gebruikt in een volgende zin te herhalen. Zonder succes.

Verklaring Taalwetenschapper Sander Lestrade van de Radboud University in Nijmegen denkt nu een goede verklaring op het spoor te zijn. In een uitgebreid rekenmodel laat hij zien dat het wiskundige verband van Zipf zichtbaar wordt als je zinsbouw (syntaxis) combineert met een maat voor semantiek, de betekenis van woorden. Het gebruik van een woord heeft te maken met zijn functie én met zijn betekenis. Dat 'de' in het Nederlands bovenaan staat, is geen verrassing. Het is een lidwoord, en die gebruiken we veel. Binnen soorten woorden wordt het verschil vooral gemaakt door ruime betekenis. Van de zelfstandige naamwoorden, bijvoorbeeld, wordt 'dag' meer gebruikt dan 'woensdag'. Het meest gebruikte zelfstandige naamwoord in het Nederlands is erg ruim: 'mens'.

