CBS gebruikt Twitter om sociale onrust in Nederland te meten

Het Centraal Bureau voor Statistiek heeft een eerste versie van zijn 'sociale spanningen-indicator' online gezet. De tool analyseert Twitter-berichten van Nederlanders en kan daarmee spanningen of onrust in de samenleving herkennen. In de toekomst moet de tool ook realtime werken.

Op dit moment analyseert de tool alleen berichten die in het verleden zijn geplaatst. Het CBS heeft daarvoor alle openbare Nederlandse tweets sinds 2010 verzameld. Het statistiekenbureau analyseert deze berichten op woorden die over onrust of onveiligheid gaan. Daarvoor is een lijst opgesteld van ongeveer 350 woorden.

Berichten over sportevenementen en politiek worden gefilterd omdat deze een verstorend effect hadden vanwege de grote hoeveelheid negatieve inhoud. Ook heeft het CBS pieken in de indicator gevalideerd door te analyseren welke gebeurtenissen rond de piek plaatsvonden. Daarna is handmatig een lijst van de meest gebruikte woorden in de berichten bekeken om te controleren of deze ook daadwerkelijk over de gebeurtenis gingen.

Volgens het CBS zegt de tool iets over spanningen, beleving van terrorismedreiging en gevoelens van onbehagen die leven in de maatschappij. Het statistiekenbureau stelt dat sociale media zich bij uitstek lenen voor het meten van het sentiment in Nederland, omdat mensen daar hun mening over maatschappelijke kwesties delen en gevoelens uitspreken. In de laatste jaren is de sociale spanning volgens de tool in het algemeen licht gedaald. Tussen 2010 en 2013 was er een stijging te zien.

Tegenover nos.nl zegt het CBS dat er is overwogen om ook Facebook-berichten te analyseren, maar die zouden minder geschikt zijn omdat ze minder vaak openbaar worden gedeeld en minder vaak over nieuws gaan.

De indicator is gebaseerd op tweets van individuele dagen. Het CBS stelt dat de tool daarom in de toekomst doorontwikkeld kan worden naar een indicator die bijna realtime laat zien hoe sterk de sociale spanning in Nederland is. Het statistiekenbureau denkt dat beleidsmakers daar gebruik van kunnen maken, door te kijken wat er in de samenleving speelt en hoe er gereageerd wordt op beslissingen.

IT-banen

Reacties (79)

MenN 24 maart 2017 16:01

Een betere kop zou zijn dat het CBS sociale onrust op Twitter onderzoek. Dat is opzich niets nieuws, er wordt al vele jaren analyses gedaan op de emoties die een tweet in zich heeft.

Wat ik wel 'eng' vind is dat dit soort tooltjes die nu als beta voor erbij gemaakt zijn, zich langzaamaan als waarheid gaat ontpoppen. En dat men hier veel waarde aan hecht. Maar aangezien de data afkomstig is van een zeer beperkte groep Nederlanders geeft dat sowieso een vertekend beeld.

Daarnaast is het ook niet een heel betrouwbare statistiek aangezien je of heel uitgesproken meningen krijgt van mensen die op de flanken aan het schreeuwen zijn, of je hebt een grote groep mensen die niet meer uitgesproken wil zijn op social media om daar niet achteraf last van te krijgen.

Zo zou menig Nederlander na bijv een terroristische aanslag geen onpopulair standpunt in nemen omdat je dan een enorme backlash kan verwachten. Ook al kunnen die standpunten goed onderbouwd zijn, op dat soort momenten "mag" je niet anders reageren dan hoe de grote groep doet. Je zult niet de eerste zijn die zijn baan verliest na wat ongelukkig getwitter.

Dus al met al is het een leuk speeltje, maar zegt het in principe niets over de mening van 'de Nederlander'

Tk55 @MenN • 24 maart 2017 16:15

Grotendeels mee eens, maar:

Maar aangezien de data afkomstig is van een zeer beperkte groep Nederlanders geeft dat sowieso een vertekend beeld.

Een steekproef kan toch prima representatief zijn? Dan neem je ook een beperkte groep. Maar je weet in dit geval natuurlijk niet of de groep zich goed afspiegelt tegen de gehele bevolking. Als dat zo zou zijn heeft de data veel meer waarde.

MenN @Tk55 • 24 maart 2017 16:18

Alleen het leuke is van Twitter en internet in het algemeen is dat veel mensen zich niet onder hun echte naam zich uitspreken. Het is dus niet erg realistisch om te denken dat je een echt representatieve steekproef kunt maken zoals je dat bijv met exit polls doet tijdens een verkiezing.

familyman @MenN • 25 maart 2017 15:21

Wat eng is, zijn de bedrijven die de waargenomen werkelijkheid veranderen via bv botnets die erop los tweeten.

(Google Cambridge Analytica maar eens)

En dan gaat het CBS meten, waardoor de door hun geschetste werkelijkheid, ineens de echte wordt....

Kriekel @familyman • 26 maart 2017 18:26

Een goed argument om de programma's en gebruikte woorden lijsten niet open source te maken.

Of je moet van alle gebruikers waar je de statistiek op baseert eerst op echtheid controleren en dan maar zien hoe je dat beter kunt doen dan Twitter.

swhnld

24 maart 2017 17:10

Leuk idee, maar doet me denken aan het Google Flu debakel, waarbij Google op basis van zoekresultaten voorspelde of er een griep epidemie was of niet. Dat ging lang goed, maar opeens klopte het voor geen meter (140 procent naast de werkelijkheid).
https://www.wired.com/201...ailure-google-flu-trends/

Rubens83 24 maart 2017 14:31

Ik vraag me af in hoeverre het CBS hier het wiel opnieuw uit probeert te vinden. Er zijn social media monitoring tools die dit al lang kunnen over meerdere social media platforms. Sommigen hiervan hebben een omvangrijk archief van alle openbare berichten van Twitter, Facebook, etc. tot jaren terug en kunnen daarnaast ook realtime het sentiment analyseren. Gebruiken ze die of zijn ze geld aan het wegpissen vraag ik me dan af.

kozue @Rubens83 • 24 maart 2017 16:08

Gebruiken ze die of zijn ze geld aan het wegpissen vraag ik me dan af.

Alle tijd en moeite die in het analyseren van social media wordt gestopt is geld wegpissen imho. Social media worden overspoeld met mensen die zichzelf belangrijk vinden (alsof iemand iets geeft om de mening van een nobody), niets te doen hebben ("wat heb je vandaag gegeten?"), of iets te klagen hebben (want het blijven Hollanders, die zijn goed in klagen). Social media is voornamelijk een grote bak met ruis in een wereld die al overspoeld wordt door informatie.

Rubens83 @kozue • 26 maart 2017 10:22

Alle tijd en moeite die in het analyseren van social media wordt gestopt is geld wegpissen imho.

Dit kun je inderdaad vinden. Maar ik bedoel meer geld wegpissen door een product te ontwikkelen terwijl het product al bestaat.

Social media worden overspoeld met mensen die zichzelf belangrijk vinden (alsof iemand iets geeft om de mening van een nobody) (...)

Het artikel en de links geven diverse redenen waarom het cbs er wel iets om geeft. Ik heb daar geen waardeoordeel aan gegeven van mijn kant.
Btw erg uit de hoogte. Jij geeft hier ook je mening. Wie bepaalt er wiens mening er toe doet, jij?

Edit: mooi trouwens dat je +2 krijgt maar als je het leest blijkt er geen enkel inhoudelijk punt te zijn gemaakt over het artikel icm mijn reactie erop.

[Reactie gewijzigd door Rubens83 op 23 juli 2024 08:27]

Anoniem: 902273 @kozue • 26 maart 2017 11:13

[...]

Alle tijd en moeite die in het analyseren van social media wordt gestopt is geld wegpissen imho. Social media worden overspoeld met mensen die zichzelf belangrijk vinden (alsof iemand iets geeft om de mening van een nobody)

Deze "nobodies" zijn voor veel bedrijven (potentiële) consumenten, ambassadeurs of influencers van hun product.

[...]

of iets te klagen hebben (want het blijven Hollanders, die zijn goed in klagen). Social media is voornamelijk een grote bak met ruis in een wereld die al overspoeld wordt door informatie.

Dus mensen die klagen op social media zijn niet relevant en hun klachten moeten gezien worden als ruis? Dus het meten van sentiment en het reageren op klachten is zonde van het geld?

Jij bent duidelijk geen ondernemer. In ieder geval niet eentje in 2017.

Oh ja, de competente social media monitoring tools beschikken over filters waarmee je échte ruis kan weghalen. Dit is behoorlijk effectief. Vraag maar aan bedrijven zoals, nou ja, noem er maar eentje en ik vertel je met welke tool ze werken.

kozue @Anoniem: 902273 • 26 maart 2017 20:53

Jouw verhaal is alleen vanuit het oogpunt van een bedrijf geschreven. Maar welke consument wil bewust een melkkoe van een bedrijf worden? Ik denk niet dat er 1 persoon op social media zit vanwege de bedrijven. Al die aanwezigheid van bedrijven (en jouw opmerkingen hierover) is voornamelijk een goed voorbeeld van hoe bedrijven iets kapot maken door het te gebruiken als reclamezuil. TV zenders hebben hun langste tijd al gehad, steeds meer mensen doen hun TV-abbo weg, en hoofdzakelijk vanwege de overdaad aan reclame, en social media is al jaren die kant op aan het gaan. Zonder adblocker was het hele internet tegenwoordig nauwelijks meer uit te houden.

Anoniem: 902273 @kozue • 27 maart 2017 19:44

Jouw verhaal is alleen vanuit het oogpunt van een bedrijf geschreven. Maar welke consument wil bewust een melkkoe van een bedrijf worden?

Nou en? Mijn reactie is gebaseerd op jouw bericht, waarin jij aangeeft dat tijd en moeite steken in het analyseren zonde van het geld is. Ik geef je een reden waarom dat niet zo is.

Al die aanwezigheid van bedrijven (en jouw opmerkingen hierover) is voornamelijk een goed voorbeeld van hoe bedrijven iets kapot maken door het te gebruiken als reclamezuil. TV zenders hebben hun langste tijd al gehad, steeds meer mensen doen hun TV-abbo weg, en hoofdzakelijk vanwege de overdaad aan reclame, en social media is al jaren die kant op aan het gaan. Zonder adblocker was het hele internet tegenwoordig nauwelijks meer uit te houden.

Wat moet ik hier nou weer mee? Een totaal irrelevante conclusie die mijn standpunt niet weerlegt.

oscar82 @Rubens83 • 24 maart 2017 14:50

Waarschijnlijk gebruikt het CBS toch precies zo'n bestaande tool hiervoor?

Er is alleen wel een verschil tussen jaren terug kijken in een archief en realtime monitoren. Bijvoorbeeld omdat Facebook ermee gestopt is om externe tools alle berichten te laten binnenslurpen.

Er zijn ook tools waarmee je hyves kan analyseren, maar daar heb je weinig aan voor real time monitoring

Daar hebben alle tools evenveel last van, lijkt me.

Rubens83 @oscar82 • 24 maart 2017 15:00

Waarschijnlijk gebruikt het CBS toch precies zo'n bestaande tool hiervoor?

Dat vroeg ik me dus af.

Er is alleen wel een verschil tussen jaren terug kijken in een archief en realtime monitoren. Bijvoorbeeld omdat Facebook ermee gestopt is om externe tools alle berichten te laten binnenslurpen.
Er zijn ook tools waarmee je hyves kan analyseren, maar daar heb je weinig aan voor real time monitoring Daar hebben alle tools evenveel last van, lijkt me.

Ik begrijp niet echt wat je hiermee probeert te zeggen. Het artikel gaat niet over real time monitoren maar ik noemde het om aan te geven dat bestaande tools meer kunnen dan alleen terugkijken.

Jermak 24 maart 2017 13:49

Dit gaat over oud nieuws, geen voorspellend vermogen.

na de aanslagen in londen werden de nieuws sites waarschijnlijk ook vaker bezocht dan normaal.

als je iest nieuws wilt ontwikklen is een tool die spanning meet voor de gebeurtenis, dan kan je nog ingrijpen. of sturen of voorzorgsmaatregelen treffen.

[Reactie gewijzigd door Jermak op 23 juli 2024 08:27]

kazz1980 @Jermak • 24 maart 2017 14:03

Dat is ook precies waar dit over gaat...
Tool is nu ingezet op historische data om aan te tonen dat spanningen daadwerkelijk correct (of niet) gemeten kunnen worden. Als dat goed blijkt te werken kan het realtime ingezet worden. Twitter leent zich hier uitermate goed voor omdat tweets snel gepost worden en vaak over actuele gebeurtenissen/gevoelens gaan. Dat Twitter op zijn retour is is daarbij niet zo heel relevant. Sterker nog: mogelijk maakt dat de tool juist wel krachtiger aangezien er nu meer inhoudelijk relevant getweet wordt in plaats van hetgeen waar Twitter voorheen vooral bekend om stond: nutteloze tweets in het kader van 'kijk mij eens...'.

supersnathan94

Economie en maatschappij

@kazz1980 • 24 maart 2017 15:31

Daarvoor is een lijst opgesteld van ongeveer 350 woorden.

Ben ik dan de enige die dit nogal een kleine lijst vind? Ik neem aan dat er machine learning wordt gebruikt voor het identificeren van de tweets. Waarom dan een lijstje van 350 en niet een berg relevante tweets uit t verleden en die dan goed taggen.

kazz1980 @supersnathan94 • 24 maart 2017 15:50

Als ij die bak met data blijkt dat je aan 350 woorden genoeg hebt? Ik zou ook meer verwachten, maar ze zullen vast weten wat ze doen

supersnathan94

Economie en maatschappij

@kazz1980 • 24 maart 2017 16:07

Nouja met machine learning op woorden filteren is een beetje dom. Context is key namelijk.

Dus of ze gebruiken een heel basaal algoritme wat net zo goed via de # tags kan. Of ze doen statistisch hele rare dingen.

Anoniem: 477666 @Jermak • 24 maart 2017 19:25

Klopt mijn ouders, opa en oma en de meeste mensen in mijn familie gebruiken geen twitter. laat staan hun gevoelens te uiten elke minuut op een social media.
Het is eigenlijk heel moeilijk om deze dingen via social media meten het praktijk is heel anders dan in impuls reactie op iets of overdreven reageren op een gebeurtenis

Zelfs ik gebruik geen social media om mijn gevoelens te uiten en mijn meningen te geven.
Overheid en politie vind ik moet met andere dingen bezighouden dan onze geld verspillen aan dit soort dingen.

[Reactie gewijzigd door Anoniem: 477666 op 23 juli 2024 08:27]

AOC 24 maart 2017 13:51

Op Twitter vind je voornamelijk extremisten qua uitlatingen. Vooral op politiek gebied. Persoon x in de kamer is nazi, xenofoob, racist. Persoon y is landverrader, cultuurvernieler. Een filter op joden levert een hoop antisemitisme op etcetc

Ben benieuwd in hoeverre dit een afspiegeling van de samenleving is. Bij bpaalde nieuwszender merk je laatste tijd dat ze Twitter als leidraad gebruiken voor wat heel Nederland vindt

Anoniem: 388974 @AOC • 24 maart 2017 13:57

Pfff weet niet wie jij volgt, maar dat soort extremisme kom ik weinig tegen, en dat is ook de reden dat de CBS dit uitfiltert, dus alleen "algemene" onrust "meet"

Jermak @Anoniem: 388974 • 24 maart 2017 15:18

we zullen wel zien hoe ze de tweets gaan catagoriseren

Anoniem: 420148 @Anoniem: 388974 • 24 maart 2017 14:29

Scroll voor de grap eens naar beneden bij een tweet van een politiek figuur

SebLo_ @AOC • 24 maart 2017 13:57

Mee eens. Ik krijg sterk de indruk dat social media (c.q. Twitter) wordt gebruik om hele negatieve of juiste hele positieve posts te plaatsen. Er is weinig gematigdheid, zeg maar.

Mavamaarten @SebLo_ • 24 maart 2017 15:02

Tja. Maar de hoeveelheid positieve vs negatieve tweets kan wel degelijk een objectief beeld geven van de werkelijkheid.

kozue @Mavamaarten • 24 maart 2017 16:02

Nee, want mensen die iets te klagen hebben zoeken een plek om dat te doen en vinden dan social media als uitlaatklep, terwijl mensen die tevreden zijn niet zo snel behoefte hebben om social media lastig te vallen met hun leven. Een beetje zoals met die online reviews: er staan relatief vaak 1'en en 10'en tussen, want mensen die iets gekocht hebben en er erg ontevreden mee zijn gaan daar klagen over hoe slecht het wel niet is en de gemiddelde score omlaag helpen.

Mavamaarten @kozue • 24 maart 2017 18:15

Maar als er opeens nog veel meer negatieve reacties zijn dan anders, valt er toch af te leiden dat er iets is dat deze golf van nog negatievere reacties veroorzaakt?

Phelix @Mavamaarten • 25 maart 2017 11:32

Zeker. Maar het CBS gebruikt Twitter om dit

iets

meetbaar te maken.
Zoals door velen boven vermeld wordt Twitter (en social media in het algemeen) als opinieplatform vooral gebruikt om extreem positieve/negatieve meningen te uiten. Genuanceerde meningen worden weinig geuit want je krijgt er minder aandacht mee.
En dus zal het CBS vooral de extremen meten. Niet alleen is dit geen betrouwbare afspiegeling van de bevolking als geheel, ook kan het gevaarlijk zijn omdat het CBS de publieke opinie ook beïnvloedt. Men heeft zo zijn meningen over statistieken.

Anoniem: 659271 @SebLo_ • 26 maart 2017 00:01

In 160 tekens kan je ook niet heel veel nuance aanbrengen. Je hebt gelijk dat door die beperking meningen nogal zwart/wit worden.

Hoppa! @SebLo_ • 24 maart 2017 14:34

Inherent aan het medium. Met zo weinig karakters is nuance aanbrengen vrij lastig.

Het is een kut-medium wat kenmerkend is voor de teloorgang van onze samenleving.

MRNX 24 maart 2017 13:38

Piekjes meten dus. Kan je net zo goed hashtags lezen lijkt me. Lange termijn spanningen (werkloosheid, integratieproblemen) ga je daar echt niet mee meten hoor.

robvandenhoogen 24 maart 2017 14:06

weet ik iedergeval zeker dat de jeugd in mijn omgeving geen twitter meer gebruikt. Ikzelf ook niet.

Snap niet dat maar 1 dienst als officieel meetpunt genomen word.

scrappy.doo 24 maart 2017 14:07

Dit lijkt me een gevalletje open deur toch? De spanningspieken zullen uiteraard liggen rondom bijvoorbeeld een terroristische aanslag. Dat de spanningen in zo'n geval toenemen lijkt me niet meer dan logisch en het onderzoeken niet waard.

Cave_Boy 24 maart 2017 14:26

Meen me juist te herinneren dat Twitter steeds minder gebruikt wordt. Ikzelf heb heel kort Twitter gehad (aangemaakt om contact te krijgen met een Klantenservice omdat ze niet reageerden en daarna weer verwijderen)

Heb wel eens gevraagd in lessen maar leerlingen hebben ook nooit Twitter. Vinden ze dom

XRayXI 24 maart 2017 20:24

Tja als ik rottigheid wil lezen en met #hastags dan kan ik de stemming ook zien:
Bijvoorveeld "London is a planned attack and only to cause fear to people" of ergere. Of dat Jan zijn appeltaart weer verbrand heeft en zijn pan uit het raam heeft gesmeten. "Goed" plan om te filteren, not.

Op dit item kan niet meer gereageerd worden.

CBS gebruikt Twitter om sociale onrust in Nederland te meten

Lees meer

IT-banen

Reacties (79)

Sorteer op:

Weergave: