Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 38 reacties

Wetenschappers van het Amerikaanse Los Alamos National Laboratory hebben een methode bedacht om door middel van Wikipedia te voorspellen wanneer de griep heerst in een bepaald gebied. Het idee doet denken aan Googles griepvoorspellingstool Flu Trends.

De onderzoekers deden mee aan een wedstrijd van een Center for Disease Control and Prevention, een regionaal instituut in de Verenigde Staten dat zich in een staat bezighoudt met het opsporen, behandelen en voorkomen van ziekten. De bedoeling was dat de deelnemers met gegevens die op internet zijn te verkrijgen, probeerden te voorspellen wanneer de griep zou uitbreken. Het instituut staat namelijk te springen om een nieuwe meetmethode. De huidige, die is gebaseerd op tellingen van vrijwilligers, zou te beperkt zijn.

De wetenschappers van Los Alamos National Laboratory gebruikten voor hun methode realtime-statistieken van Wikipediapagina's over griep en griepverschijnselen. Zij kozen voor die data, omdat die vrij beschikbaar zijn. Door middel van machine learning en logs van voorgaande jaren schreven de wetenschappers een programma dat patronen in het uitbreken van de griep leerde herkennen.

Het experiment toonde significant aan dat het programma kan voorspellen wanneer de griep uitbreekt, schrijft MIT Technology Review op basis van het onderzoek. De cijfers die afkomstig waren van het programma, kwamen namelijk overeen met de griepgegevens van het Center for Disease Control and Prevention, die het centrum twee weken later publiceerde aan de hand van de meetmethode met de vrijwilligers.

Perfect is de methode alleen nog lang niet, benadrukken de onderzoekers. Het programma kan onder andere nog niet 'zien' wanneer een epidemie voorbij is, omdat dit lastiger te herkennen is. Dit is wel noodzakelijk: 'pieken' van toekomstige virusuitbraken baseert het script op gegevens die het van voorgaande jaren verzamelde. Daarnaast kan het programma nog niet twee of meer gelijktijdige uitbraken signaleren.

Overigens is het niet de eerste keer dat realtime-gegevens worden gebruikt voor het wetenschappelijk voorspellen van virusuitbraken. Onder andere Google doet dat al jaren met zijn griepvoorspellingstool Flu Trends. Het algoritme van de zoekgigant kijkt naar hoe vaak er wordt gezocht naar griepverschijnselen. Die gegevens koppelt Google aan een locatie, waarna te zien is waar de griep zou heersen.

De betrouwbaarheid van Flu Trends laat vooralsnog wel te wensen over: de voorspelling in 2012 en 2013 week tot wel 95 procent af. Dat kwam vooral doordat Google hogere griepaantallen liet zien dan er daadwerkelijk bekend waren. De zoekgigant zegt voor aankomend 'griepseizoen' een nieuw algoritme te gebruiken, maar heeft daarover nog geen technische details bekend gemaakt.

Moderatie-faq Wijzig weergave

Reacties (38)

Hebben we daar niet de griepprik voor?
Misschien te duur om iedereen een griepprik te geven?
Maar als principe misschien wel handig voor Ebola en dergelijke.

[Reactie gewijzigd door Soldaatje op 3 november 2014 20:36]

Het merendeel van de hits op de Wikipedia-pagina over "ebola" zijn mensen die bang zijn voor ebola, niet mensen die ebola hebben. Als je die hits zou optellen, dan zou volgens Google gans Europa in het ziekenhuis liggen.
De griepprik is vaak nutteloos. Het virus muteert meestal sneller dan de griepprik kan worden geupdate en geproduceerd.
Dus zou het lonend zijn de griep te voorkomen en te bestrijden ipv dure vaccins te ontwikkelen die lang niet altijd effectief blijken te zijn. De vraag is dus waarom dit niet gebeurt. Macht van de farmaceutische industrie die belang heeft bij de verkoop van vaccins?
Griep voorkomen is een kwestie van niet in contact komen met de dragers. Dus vooral je kinderen niet naar school sturen, en niet naar de kinder opvang. Niet naar het werk gaan, etc etc.
Wil je dat toch... Tja, dan kun je problemen met mondkapjes te werken, en iedere tien minuten je handen te wassen. 100% effectief is dat niet...

Maar natuurlijk, laten vooral doen alsof de farmaceutische industrie de schuld is dat je griep krijgt, en niet dat je gewoon rondom andere mensen bent! |:(
Het zou veel interessanter zijn als wetenschappers griep zouden kunnen voorkomen.
Leuk om te weten dat er een uitbraak heerst maar wat moet je daarmee?
Als we ook nog griep de baas kunnen, dan zal het niet goed met ons afweer systeem aflopen. Die heeft het nu al te "rustig" Er word al gedacht dat auto-immuun reacties zoals allergieŽn worden veroorzaakt door een "verveeld afweer systeem"
Onlangs heb ik deze interessante documentaire van Horizon (BBC) gezien: http://www.bbc.co.uk/programmes/b04g507y

Auto-immuunziektes en allergieŽn zouden veroorzaakt worden doordat onze darmflora erop achteruit gaat. Vooral antibiotica bij baby's zou heel slecht zijn. Contact met een hele resem goede bacteria zou dus goed zijn. Onze leefomgeving is gewijzigd en ook onze voeding. Voor de koelkast bestond, aten we vaker gefermenteerde voeding (bv. zuurkool). Ook een drastisch verminderd contact met darmparasieten zou de stijging van auto-immuunziektes en allergieŽn in de hand werken. Van virussen geen sprake...
Ah, dat wist ik niet , zeker nuttige info. Wat ik al wel wist is dat antibiotica letterlijk killig is voor onze darmflora en dat de gevolgen daarvan nogal onderschat worden.
Sowieso is het niet goed om alle ziektes op te willen lossen. Er is nu in bepaalde gebieden al (zware) overpopulatie dus ik wil niet weten wat er gebeurt als men niet meer dood kan gaan door een ziekte. Ik denk dat je juist door het genezen van dodelijke ziektes je vťťl grotere en ergere problemen creŽert.

@HoppyF: als je weet dat er een uitbraak heerst en jij bent zelf nog niet ziek dan kun je preventieve maatregelen nemen. Beter slapen, meer vitaminen, dat soort dingen. Op die manier voorkom je dat je zelf ook ziek wordt en Šls je dan alsnog een griepje te pakken krijgt dan is het vaak minder erg omdat je lichaam erop voorbereid is.
Rond 1900 had je vele erg grote gezinnen in onze streken. Door de medische vooruitgang is kindersterfte (ťn moedersterfte!) hier zo goed als uitgeroeid. Als je jouw redenering volgt, zou bijna elke vrouw vandaag misschien wel 20 kinderen doen opgroeien tot volwassen leeftijd. De realiteit leert dat bij een verhoogde levensverwachting en levenskwaliteit, het geboortecijfer sterk daalt. De maatschappij heeft dan immers minder kinderen nodig om voor de oudere generaties te zorgen.

Een mogelijk voorbeeld van wat dit zou kunnen betekenen in de toekomst. Stel dat men Alzheimer kan genezen. De maatschappij heeft dan geen jongere mensen meer nodig om voor Alzheimer-patiŽnten te zorgen. Meer nog: een 80-jarige gezonde bejaarde die nog een marathon kan lopen, zou zich nog perfect economisch/sociaal nuttig kunnen maken in de maatschappij...waarom zijn of haar bijdrage laten verloren gaan door hen verplicht op pensioen te sturen? Je hebt dan veel minder jonge handen nodig om de maatschappij draaiende te houden.
Let wel dat pensioen niet verplicht is; het is slechts dat je recht hebt op een AOW-uitkering vanaf je 65e (later 67 of 68, waarschijnlijk zal dit nog verder stijgen), en pensioenfondsen ook vanaf dan uit gaan keren.
Nu is nog de vraag wat we met een voorspelling gaan doen... De bevolking massaal oproepen om nu voldoende nachtrust te nemen?
Tja.. en als ik heel eerlijk ben weet ik niet of het zo geruststellend is dat we massaal een Wikipedia gebruiken voor het opzoeken van medische informatie.

Noem mij ouderwets maar mijn onderbuik geeft me dan toch een beter gevoel bij een site zoals deze van de overheid (RIVM).

Maar goed, dat geldt natuurlijk voor heel veel wat op internet te vinden is en niet alleen Wikipedia. Het feit dat men zo'n soort "group think" (of in dit geval "group search") gebruikt om bepaalde patronen te achterhalen is wel interessant. Het lijkt me echter ook interessant te onderzoeken wat de betrouwbaarheidsfactor is van hetgeen wat onderzocht wordt versus etnische afkomst, land, religie, etc. In een land als Nederland waarin elke laag van de bevolking goed vertegenwoordigd is op het internet, zullen de resultaten mogelijkerwijs heel anders zijn dan een land als Sierra Leone.

Daarnaast denk ik dat als je nu in Nederlandse zoekresultaten zou gaan zoeken naar "symptomen Ebola" er gezien het tijdsbeeld ook heel interessante uitkomsten zullen zijn, die (zo mag ik toch hopen ;)) niet acuut duiden op een epidemie.

M.a.w: in mijn ogen een mooi voorbeeld van Big Data en dataverzameling en -verwerking anno 2014.

[Reactie gewijzigd door Eagle Creek op 3 november 2014 20:29]

Hoewel ik je onderbuikgevoel begrijp is Wikipedia als bron voor feitelijke informatie juist wel aardig betrouwbaar (denk aan beta-omgeving en medische informatie).

OT: mooi om te zien dat big data voor zulke dingen worden gebruikt naast de negatieve dingen die je erover hoort. Jammere van big data is dat je allerlei links kan leggen puur omdat je zo'n immense hoeveelheid data hebt.
Een beetje wetenschapper of eigenlijk ieder weldenkend mens kan het verschil wel zien tussen een correlatie en een causaal verband, dus voor 'allerlei links' ben ik niet zo bang. Big data helpt veel, maar het zijn vaak slechts vage patronen die niet altijd echt iets inhoudelijks zeggen over oorzaak, gevolg en eventuele ingrepen om een gewenst effect teweeg te brengen.
Hmpf.... Vooral in de alfa wetenschappen zie ik constant dat er veel te gemakkelijk causale verbonden worden geclaimed, over zaken die niets meer dan correlatie zijn. Blijkbaar is dat toch heel moeilijk...
Ik studeer zelf politicologie (niet heel erg alfa, maar ook niet strict bŤta), en hoewel er vast slechte onderzoeken zijn, zie je wel dat daar vaak veel kritiek op komt en dat deze onderzoeken niet ver komen. Zelfs binnen de wetenschap zijn er mindere en betere uitoefenaars, natuurlijk.
Ik zou het niet "voorspellen" noemen aangezien het al aan de hand is wanneer mensen veel googlen. Meer.. "Op de hoogte stellen" zodra zoiets gaande is..
Maar als je genoeg data hebt kun je een schatting maken van wanneer de griep gaat komen. Als je weet dat griep een incubatietijd van de griep zo'n 2 Š 4 dagen is dan kun je (als je genoeg data hebt) meldingen gaan versturen een X-aantal dagen of weken voordat de griep zou moeten beginnen. Op die manier kunnen mensen preventief handelen nog voordat de griep de kop op steekt.

[Reactie gewijzigd door SomerenV op 3 november 2014 22:41]

Alleen jammer dat de symptomen van de griep nagenoeg gelijk zijn aan die van een veel voorkomende zware verkoudheid. En dus heb je er compleet geen snars aan om te voorspellen of er een epidimie is van griep of zelfs maar een bepaald verkoudheidsvirus. Het enige wat ze zinvol kunnen voorspellen is een interesse in het onderwerp van de symptomen en het griep virus. Meer niet.
Dit is net zoiets als dat Google zijn zoekopdrachten gebruikte om dit te voorspellen, bleek dat ze met hun resultaten er volledig naast zaten. Veel zoeken op griep betekend nog niet dat het ook veel voorkomt. Betekend hoogstens dat er een verhoogte interesse in is. Denk bijvoorbeeld aan Ebola, iedereen zoekt erop, betekend dit dat heel nederland plat ligt van de Ebola nee, hoogstens dat er een verhoogde interesse in is.
maar als je 'ik heb vlekjes, help!' zoekt ben je een goede kanshebber. Het is meer dan een simpele accumulator.

[Reactie gewijzigd door analog_ op 4 november 2014 01:02]

Kleine correctie: de onderzoekers gebruikten niet zoekopdrachten op Wikipedia (zoals Google Flu Trends doet), maar de "access logs" van pagina's (ofwel statistieken van hoevaak en wanneer pagina's werden bezocht). Helaas zijn de zoekopdrachten op Wikipedia niet vrij beschikbaar :-).

[Reactie gewijzigd door dvdgrs op 3 november 2014 21:31]

Als ze de rauwe access logs krijgen kunnen ze ook de zoekopdrachten daaruit extrapoleren, typ maar eens iets in het zoekveld en kijk wat de URL doet.
Nu heb ik het op moeten zoeken, en ze kijken alleen naar bezoekers-aantallen (voor een klein aantal pagina's). Zoekopdrachten zou je inderdaad op Wikipedia kunnen reconstrueren (als je de hele access log hebt -- wat ik betwijfel, aangezien die niet openbaar is zoals de bezoekerstatistieken per pagina wel zijn), maar niet als het vanaf buitenaf (Google) komt, bijvoorbeeld.

Hoe dan ook, dit artikel lijkt de Google aanpak (hoeveel mensen zoeken) te verwarren met deze paper (hoeveel mensen bezoeken), en nu draag ik bij aan de verwarring :-p.
Zelf doe ik al jaren mee met https://www.degrotegriepmeting.nl/, die hebben inmiddels data zat, volgens mij.
Zij doen het al 12 jaar en zijn niet van die groentjes als google of MIT, die voornamelijk voor de p.r. gaan ;)
Wat ook in het artikel aangegeven wordt is dat die data puur op basis van vrijwilligers is; het is niet verplicht te melden dat je ziek bent (iit Ebola), dus de meldingen die daar komen zullen lang niet zo precies zijn als 100% melding. Natuurlijk zal er wel genoeg zijn om statistisch significante cijfers te krijgen.
Het publiceren van dit onderzoek veroorzaakt een griepgolf. :-)
Ik weet het nog niet..... als ik de griep heb blijf ik toch in bed liggen in plaats van op wikipedia over de griep gaan lezen...
Laat een zware verkoudheid nou net dezelfde verschijnselen hebben als de griep, maar vaker voorkomen. Grote kans dat veel personen geen griep hebben maar zwaar verkouden zijn. Dan kun je wel leuk uit de statistieken proberen te herleiden of er een griepepidimie is, maar dat is dan compleet flauwekul omdat de personen die naar de symptomen zoeken dus zelfs niet eens weten wat ze nu voor ziekte hebben. En nee, dan kun je dus niet herleiden of er een griepepidimie is. Hooguit of er een piek is in de verschijnselen.
Het probleem daarmee is dat mensen het verschil ook niet meer weten tussen verkouden en griep (en ze zich dus ziek melden als ze slechts verkouden zijn, of niet als ze griep hebben).
Voor degene die ziek is, is het verschil ook niet zo relevant...
Maar dit gaat over patronen/trends, en niet over individuele gevallen. Daarbij speelt ongetwijfeld mee dat griep in epidemieŽn komt, i.t.t. verkoudheid. Als je zo'n piek in activiteit (bezoek van griep-pagina) ziet, en die kun je correleren met de "echte" data, dan ben je klaar.

Het werkt op grote schaal schaal, niet op individuele gevallen. Het is natuurlijk niet zo dat -- na het bewijzen van correlatie tussen griep en bezoek griep-pagina -- je griep hebt wanneer je een griep-pagina bezoekt :-).

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True