Wie een hongersnood ziet aankomen heeft de kans maatregelen te treffen, maar onze huidige inschatting daarvan is niet zo best. Een algoritme kan daar verandering in brengen, door te letten op nieuwsberichten.
Op ieder gegeven moment zijn meer dan een half miljard mensen op aarde ondervoed. En wie afwacht tot een voedselcrisis een gegeven is, is te laat. Hulporganisaties steken daarom veel tijd en moeite in analyses die een voedselcrisis kunnen voorspellen. Een centrale rol daarin speelt het Famine Early Warning Systems Network, een door de Amerikaanse ontwikkelingssamenwerking gesponsorde organisatie die de tekenen van voedselschaarste bijhoudt.
Op zich zijn die tekenen bekend. Het weerbericht, de kwaliteit van de oogst, gewapende conflicten en het lichaamsgewicht van burgers zijn allemaal voorspellende factoren dat er iets mis is of kan gaan in de voedseldistributie. Maar meten is een ander verhaal. Veel van de benodigde informatie voor een goede voorspelling is juist uit de geïsoleerde gebieden waar voedselcrises vaak plaatsvinden moeilijk te krijgen, en al helemaal in de regelmatige datastroom die je zou willen hebben om een trend te kunnen waarnemen. Probeer maar eens in een conflictgebied maandelijks de bevolking te wegen.
Wat stond er in de krant?
Wiskundigen van New York University zochten daarom een oplossing in informatie die wél volop voorhanden is: het nieuws. Zij bouwden een zelflerend algoritme dat ze los lieten op zo’n elf miljoen nieuwsartikelen uit de afgelopen veertig jaar. Al dat nieuws ging over landen waar geregeld voedselschaarste optreedt, zoals Ethiopië, Somalië of Zuid-Soedan. De machine werd aanvankelijk verteld te letten op de termen ‘voedselonzekerheid’, ‘voedselcrisis’ en ‘hongersnood’ en te zoeken naar woorden en woordgroepen die daarmee samenhingen. Zo werd de set alarmwoorden gaandeweg uitgebreid, met termen als ‘voedselprijzen’ en ‘humanitaire ramp’. Maar zoals vaker met dit soort big data studies, vond de machine ook termen waar je niet zo gauw zelf op zou komen: ‘het offensief’ of ‘marteling door de politie’.
Met een model van uiteindelijk 167 termen keken ze of ‘het nieuws’ in staat was om een voedselcrisis te voorspellen. Nogal, stellen zij in een artikel in het blad Science Advances. Van 1852 gedocumenteerde voedselcrises in 21 landen in de periode 2009 tot 2020 zag het model er 3 maanden van tevoren 1432 aankomen, ruim driekwart. Dat stak vooral goed af bij het traditionele model van voorspellen, dat op 1180 uitkwam, en al helemaal bij de inschatting van experts, die met 923 koud de helft haalden. En nog beter nieuws, die drie voorspelmethodes bleken te kunnen worden gecombineerd om een nog hogere score te halen. Samen hadden ze 1694 van de 1852 voedelcrises goed.
Een real-time voorspelling
Ook op wat langere termijn, tot wel twaalf maanden van tevoren, bleek de nieuwsanalyse een drastische verbetering van bestaande methodes. En dat zou nog verder kunnen worden verbeterd als het model wordt doorontwikkeld met andere talen. Nu is nog alleen gekeken naar Engelstalige media. Deze benadering kan worden gebruikt om in real-time twaalf maanden vooruit te kijken, denkt Samuel Fraiberger, een van de auteurs.
Een ander groot voordeel dat hij ziet is dat het model, in tegenstelling tot veel andere semantische modellen gebaseerd op big data, simpel is, en gemakkelijk uit te leggen aan beleidsmakers. Humanitaire organisaties kunnen deze voorspellingen gebruiken om te bepalen waar ze hulpprogramma's opzetten. Ook zien de auteur volop toepassingen op andere terreinen waar harde data lastig te krijgen zijn, van het monitoren van ziektes tot de gevolgen van klimaatverandering.
Lees ook:
De vergeten hongersnood in Somalië. ‘Door de droogte zijn we alles kwijtgeraakt’
Hulpverleners waarschuwen voor een hongersnood in Somalië vanwege de aanhoudende droogte. Meer dan 500.000 Somaliërs zijn ontheemd. Journalist en fotograaf Joost Bastmeijer reisde met hulporganisatie Save the Children naar een vluchtelingenkamp en ziet kinderen die vel over been zijn.