Uw profiel is aangemaakt

U heeft een e-mail ontvangen met een activatielink. Vergeet niet binnen 24 uur uw profiel te activeren. Veel leesplezier!

Met Wikipedia is verspreiding griep 'bijna real-time' te volgen

Home

Stephanie Engel

© thinkstock

Wat Google niet is gelukt, kan volgens wetenschappers van de Harvard Medical School met Wikipedia wel: griep voorspellen aan de hand van big data. Dankzij een nieuwe methode voor zoekopdrachtanalyse is het aantal nieuwe gevallen van griep 'bijna real-time' te volgen. Vooralsnog alleen in de Verenigde Staten.

Voor de algemene volksgezondheid is het belangrijk om de omvang van seizoensgriep en pandemische griep nauw te volgen. De traditionele methode die door Amerikaanse gezondheidsinstanties wordt gebruikt, is gebaseerd op meldingen van artsen. Maar deze griepcijfers zijn door de trage en arbeidsintensieve werkwijze bijna twee weken oud wanneer ze worden opgenomen in de wekelijkse rapportage.

Ongewenste vertraging in de ogen van wetenschappers, omdat de snelheid waarmee de informatie kan worden verwerkt cruciaal is om goed zicht te krijgen op de verspreiding van griep, een ziekte waar in de VS elk jaar nog 3000 tot 50.000 mensen aan overlijden.

De methode die Harvard Medical School in Boston heeft geïntroduceerd, kan het aantal gevallen van griep in het land veel sneller, 'bijna real-time', in kaart brengen. Aan de basis van deze nieuwe werkwijze ligt Wikipedia. En wel door dagelijks de pageviews van een bepaalde reeks artikelen over griep in Wikipedia te volgen.

Zoekopdrachten en officiële cijfers
Het systeem van David McIver en John Brownstein, dat werd gepubliceerd in het wetenschappelijke tijdschrift 'Plos Computational Biology', analyseert elk uur de enorme hoeveelheid zoekopdrachten die mensen dagelijks in de online-encyclopedie invoeren. De gedachte er achter is simpel: wie ziek is, of een zieke in huis heeft, zoekt vaker op termen als 'griepseizoen', 'griep' of 'epidemie'.

De onderzoekers berekenden in de periode tussen december 2007 en augustus 2013 hoe vaak de Wikipedia-pagina's over griep werden bezocht, en vergeleken deze data met de officiële cijfers van Amerikaanse gezondheidsinstanties, de zogeheten Centers for Disease Control and Prevention (CDC).

Op die manier konden zij een voorspelling doen van het aantal griepgevallen die twee weken vooruit liep op de uitkomst van het CDC. Ook was de op Wikipedia gebaseerde voorspelling bijna exact hetzelfde als de officiële cijfers waar de gezondheidsinstantie twee weken later mee kwam. De data, die over een periode van 294 weken was genomen, vertoonde slechts een verschil van 0,27 procent met de officiële informatie van Centers for Disease Control and Prevention.

De methode bleek ook bestand tegen ongewoon grote aandacht voor griep in de media, zoals bij de Mexicaanse griep in 2009 en grote griepgolven in de VS in 2012 en 2013, die een verkeerd beeld kunnen schetsen, zoals eerder bij Google het geval was. Mede door deze periodes met explosieve aandacht voor influenzagerelateerde aandoeningen bleek de analyse van 'Google Flu Trends', dat al sinds 2008 griepcijfers via zoekopdrachten onderzoekt, niet te kloppen.

Griepproject Google
Het griepproject van Google kreeg vorige maand zware kritiek na een publicatie in het wetenschappelijke tijdschrift Science waaruit bleek dat het systeem veel minder accuraat was dan gedacht. Een viertal wetenschappers somde de tekortkomingen van 'Google Flu Trends' op in het Science-artikel 'The Parable of Google Flu: Traps in Big Data Analysis'.

De griepverspreiding in de VS was door 'Google Flu Trends' twee keer zo groot in kaart gebracht dan in werkelijkheid het geval bleek te zijn. Vooral in de piek van het griepseizoen 2012-2013 zat Google er helemaal naast.

Een van de problemen waar het big data-project van Google tegen aan liep, was het feit dat Google steeds zijn zoekalgoritmes vervangt, dat voor een deel te maken heeft met de advertentiebelangen. Hierdoor konden de zoekresultaten voor en na een aanpassing van de zoekalgoritmes eigenlijk niet met elkaar vergeleken worden.

McIver en Brownstein lieten het niet na om de mislukking van Google te noemen in hun rapport. Ze stelden dat ze 17 procent vaker de week van de grieppiek wisten te voorspellen en nauwkeuriger waren in het bepalen van de intensiteit van de griepgolf.

Lees verder na de advertentie
© wikipedia



Het e-mailadres bij dit profiel is nog niet bevestigd. Een link om te bevestigen kunt u vinden in uw inbox.
Bent u de link kwijt? Vraag hier een nieuwe aan.

Wachtwoord is niet correct

tonen

Wachtwoord komt niet overeen

tonen

U moet akkoord gaan met de gebruiksvoorwaarden


Deel dit artikel

Advertentie