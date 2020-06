De 112-storing van KPN van een jaar geleden kwam door een softwarefout die ook Boeing, de Europese luchtvaart en YouTube al eens parten heeft gespeeld.

Een klassieke fout in de software van KPN zorgde ervoor dat het telefoonnetwerk vorig jaar op tilt sloeg. Op 24 juni 2019 konden gebruikers van het KPN-netwerk niet meer bellen. Hierdoor was ook alarmnummer 112 onbereikbaar. De chaos was groot: mensen gingen de straat op om een politiewagen of ambulance aan te houden.

De directe aanleiding voor de storing was een metertje in het telefoniesysteem van KPN. Dat heeft een maximum, een plafond, en bij overschrijding ervan ontstonden grote problemen. Dat blijkt uit het donderdag verschenen onderzoeksrapport van onder meer Agentschap Telekom.

De situatie was uniek, vanwege de schaal ervan. Maar dat een teller of meter in de software storingen veroorzaakt bij een te hoge waarde, gebeurt wel vaker. Vliegtuigbouwer Boeing, videoplatform YouTube en de Europese luchtvaart kunnen erover meepraten. Soms heeft het onschuldige en soms rampzalige gevolgen.

Geheugenprobleem: overflow

Wat was er bij KPN aan de hand? Bij een telefoonoproep moet het netwerk contact leggen met een nummer dat zich bij iedere telefonieaanbieder kan bevinden, in binnen- of buitenland. Informatie over de route naar dat nummer heeft KPN opgeslagen in een database. Bij elk telefoontje zoekt het netwerk die route op. Een teller registreert hoe vaak dat in totaal gebeurt.

Maar daarbij geldt zoals gezegd een maximum. Net zoals bij een kilometerteller in de auto. Na 999.999 gereden kilometers zal de teller doordraaien naar 000.000. De miljoenste kilometer past niet op het meterkastje in het dashboard. Zo moeten ook computerprogrammeurs vooraf bedenken tot hoe hoog ze willen tellen. Hoeveel geheugen ze dus moeten vrijhouden.

Bij KPN kon de teller maximaal oplopen tot 2.147.483.647‬. Ruim 2,1 miljard dus. Toen kon er geen telefoontje meer bij, want meer ruimte was er niet. Een overflow heet zo’n storing. Het gevolg was een lawine aan foutmeldingen die het systeem overbelastten. Telefoneren ging niet meer.

KPN heeft drie onafhankelijke back-upsystemen. Maar alle systemen kenden hetzelfde probleem; de vier tellers liepen namelijk gelijk. Door een fout waren ze bij een software-update samen op nul gezet. En alle vier bereikten ze op 24 juni dat digitale ravijn. Was er geen alarm, voor als de maximumwaarde nabijkwam? Zodat de teller weer kon worden teruggezet? Dat was er wel, maar het werkte niet.

Problemen in de lucht

Boeing heeft volgens de Amerikaanse Federal Aviation Administration een vergelijkbaar probleem met de 787 Dreamliner. In dit vliegtuig zit een klokje dat in honderdsten van een seconde telt. Ook hier is 2,1 miljard het maximum, oftewel 248 dagen. Als het vliegtuig niet op tijd wordt herstart, waardoor de teller op nul komt, kunnen er problemen ontstaan met de energievoorziening. Ook in de lucht.

Rampzalig was de ontploffing in 1996 van de Ariane-5-draagrakket, ontwikkeld door de Europese Ruimtevaartorganisatie. 37 seconden na de lancering ging het mis doordat er een bepaalde waarde niet in het computergeheugen paste.

En YouTube? Dat had bij de bouw van het videoplatform geen rekening gehouden met de mogelijkheid dat een video 2,1 miljard likes zou krijgen. Toen de hit ‘Gangnam Style’ steeds dichterbij kwam, is gauw de geheugenruimte vergroot.

De situatie bij KPN verergerde doordat ook alarmmiddel NL Alert diezelfde dag haperde. Uit het onderzoek blijkt dat de maatschappelijke gevolgen werden vergroot doordat overheid, hulpdiensten en KPN onvoldoende waren voorbereid op de uitval van 112.

