Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 73 reacties

Onderzoekers van de Universiteit Twente zetten een methode voor 'begrijpend lezen' van tekst door computers in voor de 'meldkamer van de toekomst'. Door hiermee Twitter te monitoren, komen hulpdiensten er sneller achter dat er iets aan de hand is. In de komende maanden komen er tests.

Het inzetten van de software maakt onderdeel uit van het project TEC4SE. Bij dit initiatief zetten overheidsorganisaties, bedrijven en onderwijsinstellingen in de regio Twente hun kennis in om mensen, hardware, informatie en diensten met elkaar te verbinden via een netwerk. Doel is om de informatiestromen voor hulpdiensten te verbeteren.

De Universiteit Twente zet hierbij zijn kennis in om computers beter begrijpend te laten lezen. "We passen de software toe in de meldkamer van de brandweer en de politie in de regio Twente", verklaart Maurice van Keulen, universitair hoofddocent Data Management Technology aan de Universiteit Twente. De politie is vooral geïnteresseerd in de toepassingen voor Twitter als informatiebron, zegt hij tegen Tweakers: "Bij grootschalige evenementen zoals voetbalwedstrijden willen de hulpdiensten graag zo snel mogelijk op de hoogte zijn als er iets gebeurt en wat er dan aan de hand is." Van Keulen noemt als voorbeeld een opstootje: "Op een kanaal als Twitter kun je zien wat mensen er dan over zeggen."

De software van de UT kan de informatie die hulpinstanties willen hebben geautomatiseerd uit tweets halen, niet alleen op basis van de inhoud, maar ook op basis van hashtags en de auteur. In eerste instantie zal eerst handmatig een schifting op basis van bijvoorbeeld hashtags gemaakt moeten worden; de analyse wordt dan op die stroom berichten losgelaten, waarbij bijvoorbeeld ook de locatie op basis van coördinaten meegenomen wordt.

"In Enschede heb je bijvoorbeeld een brasserie die De Kater heet. Als daar wat gebeurt is het handig als hulpdiensten weten dat het in tweets om dat café gaat en niet om een kat, en dat ze direct over de locatie kunnen beschikken. "We werken eraan om het systeem te verbeteren", zegt de hoofddocent, "zoals het kunnen analyseren van alle tweets in een bepaalde regio." In de komende maanden starten tests waarbij de software in de praktijk toegepast wordt.

De bestaande technieken voor 'begrijpend lezen' maken gebruik van een oppervlakkige analyse van woorden, waarbij veel tekst nodig is om van te leren. De methode van de UT kan ook efficiënt werken als er maar weinig tekst aanwezig is, zoals bij tweets, en daarnaast werkt ze niet alleen voor Nederlandse teksten, maar voor alle talen.

De techniek maakt gebruik van het herkennen van zogenoemde 'named entities'. Dit kunnen namen van bijvoorbeeld personen, plaatsen of organisaties zijn. De betekenis is afhankelijk van de context waarin de naam gebruikt wordt. De methode van de UT laat de computer niet alleen herkennen welk deel van de tekst een named entity is, maar analyseert de context om te bepalen wat er met de entiteit bedoeld wordt.

De werking verloopt in een paar fasen. Eerst bepaalt de software op basis van het stukje tekst alle mogelijke kandidaten voor named entities, legt Van Keulen uit. "Het verschil met andere methodes is dat we in eerste instantie niet naar de beste kandidaten, maar naar zoveel mogelijk kandidaten zoeken." Die collectie wordt gebruikt om een grote database met entiteiten te raadplegen, waarbij matches verrijkt worden met nog meer kandidaten. "Op de enorme hoeveelheid informatie die dit oplevert wordt machine learning losgelaten om te kijken welke mogelijkheden bij elkaar passen", zegt Van Keulen. Het systeem kan onder andere onderscheiden wanneer een ambigu woord als 'you' als named entity beschouwd moet worden, en wanneer niet.

Van Keulen geeft verder als voorbeeld de named entity 'Paris Hilton' :"Wordt hiermee in een stuk tekst een hotel in Parijs, de beroemdheid of de parfum bedoeld? Een ander voorbeeld is 'rijksmuseum'. "Het hangt af van de context welk rijksmuseum er bedoeld wordt. Dit kan te maken hebben met de auteur, het discussieonderwerp, wat ervoor of erna is gezegd en soms zelfs met de locatie of de tijd. Woont de afzender in Enschede, dan doelt hij of zij waarschijnlijk op het rijksmuseum in Enschede. Maar het kan ook over één van de talrijke andere rijksmusea in Nederland gaan."

Moderatie-faq Wijzig weergave

Reacties (73)

Los van het wetenschappelijke deel van dit project, is het volgens mij is goedkoper en efficienter om dit gewoon door een paar mensen te laten doen.
Het is heel naief om te denken dat dit alleen voor twitter gebruikt gaat worden. Wanneer dit systeem af is, kan het gebruikt worden voor alle soorten media. Dat wordt alleen niet verteld. Je zou het zelfs kunnen koppelen aan Whatsapp. Vervolgens kan de data omgezet worden in bruikbare gegevens.
Er wordt iets ontwikkeld voor een specifiek doel, vervolgens wordt er gegeken waarvoor het nog meer gebruikt kan worden.

Ik ben er persoonlijk niet blij mee omdat ik het idee heb dat de overheid me nu letterlijk aan het volgens is.
Vroeger lachten we om de ict projecten van de overheid. Het faalde toch altijd. Nu krijg ik er echt geen goed gevoel bij.
Tsja, als het technisch mogelijk is gebeurt het sowieso, of wij het weten of niet. Dan heb ik liever dat (ook) open en voor een goed doel wordt gebruikt. Voor Twitter is het een no-brainer: dat is juist informatie die men expres publiek heeft gemaakt.

Het geeft de mensen ook de kans om eraan te wennen en na te denken over de wenselijkheid. Genoeg voorbeelden van tweets waarvan de maker zich niet realiseerde dat de hele wereld mee kan lezen. Dan is het helemaal lastig om zo'n surveillancestaat tegen te houden.
Het is ook niet zo moeilijk om dit in elkaar te zetten, de Twitter API maakt het mogelijk om zulke dingen te maken. Verder ook niet bijzonder aangezien iedereen die verstand heeft van webdevelopment dit kan maken. Maar als je van te voren "dreigende tweets" op Twitter zou zetten ben je toch ook niet slim bezig? Aangezien het een openbaar medium is.
Hoe gaat men dit toepassen bij whatsapp? Die berichten zijn niet online beschikbaar in bijvoorbeeld een API, toch zeker?
Ik gaf het als voorbeeld. Het is wel mogelijk om ziets te doen. Nu heeft Whatsapp nog geen API, het zou zomaar kunnen dat dit in de toekomst wel zo is. Wat doen we dan? Stoppen met Whatsapp? Gaan we dan massaal weer smsen? Oh wacht, daar werkt het systeem ook op ;)
Ik ben er persoonlijk niet blij mee omdat ik het idee heb dat de overheid me nu letterlijk aan het volgens is.
De overheid volgt je niet, jij gooit dingen openbaar op het internet. Dat die data vervolgens door partijen gebruikt wordt is dan toch niet heel erg vreemd? Als je niet wil dat iets openbaar wordt, dan moet je het initieel zelf niet op deze manier online zetten.
Je hebt blijkbaar geen idee wat big data inhoud...

Heb je 100 tweets per uur dan is het handiger om het met mensen te doen, heb je 100.000 tweets per uur dan is het niet meer met mensen te doen.

Waar dit soort software voor wordt ingezet is juist om van die 100.000 tweets naar 100 "belangrijke" te gaan en dan die aan mensen te tonen. Zodat de mensen weer van die 100 "belangrijke" tweets er 99 weg kunnen gooien. En dan houd je 1 belangrijke tweet over uit 100.000 tweets, wil je dat met mensen gaan doen dan praat je over geestdodend werk waar niet tegenop te werken valt.
Big data... Het nieuwe "cloud" en "internet of things" :X
Je hebt enigszins gelijk, het is op het moment het buzz-word binnen de IT wereld, met IT onderzoek voorop. Maar je moet toegeven: het cloud idee is in de tussentijd gemeengoed geworden, het is uit de academische wereld gestapt en wordt (technisch in ieder geval) toegepast binnen bedrijven (dat er juridisch nu problemen de kop opsteken is natuurlijk een ander aspect). IoT wordt nog steeds volop onderzoek in gedaan, maar met de huidige trends die op het gebied van domotica te zien zijn is het een veld dat ook steeds meer gemeengoed begint te worden. En zo nu ook big data.
Vergeet niet dat mensen hun aandacht heel snel verliezen en mogelijk die ene, belangrijke, tweet net over het hoofd zien. De kans is aanzienlijk kleiner bij software.
Ik denk niet dat je een paar mensen nodig hebt. Ik denk dat je ongeveer 800-1200 man nodig hebt fulltime. Lijkt me erg duur. Mensen hebben bewezen standaard genomen niet efficienter te werken dan een computer.

En als laatste, hoe kun je dit wetenschappelijke nieuwbericht "los willen zien van het wettenschappelijke deel"
Ik kan me voorstellen dat wanneer er iets in brasserie De Kater gebeurt, deze weinige tweets hieromtrent verloren gaan in de massa. Sowieso hoop je dat mensen hun gezond verstand gebruiken, en niet eerst gaan tweeten in plaats van de hulpdiensten te bellen.
Klopt, maar bijvoorbeeld bij een verkeersongeval, zoals vorige week in BelgiŽ met twee brandende vrachtwagens, worden druk foto's gedeeld op twitter. Deze foto's en de bijbehorende commentaar, kan de meldkamer extra informatie geven over de magnitude van het ongeval en de impact op het verkeer. Ook kan bijkomend gevaar worden ingeschat (stel dat de melders spreken van twee vrachtwagens, maar niet melden dat ťťn ervan, ik zeg maar, een tankwagen is).
Bij bijvoorbeeld voetbal hooligans kun je uit Twitter wellicht wel herleiden wie/wat er willen gaan rellen, het gaat denk ik meer om voorspellen dan dat er herkend moet worden dat er al iets gebeurt is.
Ik kan me daarnaast voorstellen dat je ook bij bijvoorbeeld rellen de aanstichters uit een datastream kunt herleiden.
Ik zou liever een officiŽle 112 app zien, die wanneer je belt gelijk je GPS positie doorgeeft aan de meldkamer. Je zou zelfs belangrijke informatie kunnen meesturen met een druk op de knop (bloedgroep / aandoening / belangrijke contactpersonen / etc). Die je van te voren hebt ingevoerd.
Naarmate we meer digitaliseren gaan we ook meer gebruik van de dienst maken. Zo wordt een gedigitaliseerd dossier 15% meer geopend dan voorheen. Hoe zou dit met een 112-app zijn geregeld?

Daarnaast is dit product gericht op crowd control, een 112 app is persoonlijk.
Dat zou geen app moeten zijn maar een standaard onderdeel,, Elke telefoon met GPS, en/of andere locatie bepaling zou bij het bellen naar het alrmnummer minimaal de locatie en het eigen telefoon nr moeten meesturen.
Zo gauw het belangrijk is om je bloedgroep te weten, twitter je niet zo veel meer, hoor
Waarom zelf uitvinden wanneer bedrijven al sinds jaar en dag software gebruiken om de stemming in tweets te meten? Zelfs de Twitter API zelf heeft al een indicator van de emotie van een tweet.
Omdat die techniek in feite niet bestaat en draait het slechts om aannames. Een lapje tekst bevat namelijk geen emotie, ook niet inhoudelijk. Het is slechts een stukje tekst die je op duizenden manieren kan interpreteren.
Die techniek bestaat juist wel. Ik werk bij een enorme multinational waar het gewoon gebruikt wordt. De software weet accuraat het sentiment en de stemming van een tweet, Facebook post e.d. te analyseren, zodat een webcare team er meteen op kan reageren wanneer nodig.

Raar om simpelweg te ontkennen dat dit bestaat.
Het is helemaal niet interessant of je voor een multinational werkt en het gebruikt wordt. Maar een computer kan niet redeneren zoals mensen en heeft totaal geen benul wat iemands zijn gedachte is. Computer doet hooguit 'als dit dan dat' op basis van vooraf ingevoerde regeltjes en opgegeven data. Kortom het zijn aannames (het zou kunnen dat .... ).

[Reactie gewijzigd door BoringDay op 15 mei 2014 18:46]

Ach zo ja. Dus AI en patroonherkenning bestaan niet, en de accuraatheid van de stemming analyse van een stuk tekst is in zijn geheel niet vast te stellen. En natuurlijk is het helemaal niet interessant wanneer zowat ieder groot bedrijf al in de praktijk listening software gebruikt die dit allemaal kan. Voice recognition systemen die steeds beter worden bestaan ook niet, natural language search bestaat niet, de schaakcomputers bestaan niet en AI in gaming bestaat niet.

Is vast leuk, zo'n alternatief universum in je hoofd.
"Piet steelt een auto"
Software kan hier niet vanuit op maken:
- Is het letterlijk of symbolisch;
- Is het geciteerd uit een text;
- Is het gerelateerd aan een ander stuk tekst;
- Is het gewoon een verzonnen stuk tekst die geheel inhoudsloos is;
- Wat is de voorgeschiedenis;

Zelfs als mens kan je zo'n zin compleet verkeerd opvatten laat staan dat het AI/Patroonherkenning het wel kan. Het ontbreekt aan relevante gegevens die niet verborgen in het stukje tekst zit. Je komt simpelweg niet verder dan een aanname. En als mensen straks niks meer mogen typen omdat ze meteen verdacht worden van iets wat totaal niet aan de orde is, dan moet je heel goed oppassen met dit soort constructies.

[Reactie gewijzigd door BoringDay op 16 mei 2014 07:31]

Lijkt me dat de meeste mensen pas gaan twitteren na het "incident" ? Meestal gaan ze eerst foto's en video's schieten, en dan pas uploaden....

@dfr0st Erg goed idee! en dan een uitbreiding met, "welke hulpdienst heb ik nodig" spoed* aanrijding wild* verloren goederen* wegbeheer* etc...
Wellicht kunnen de betrokken partijen bij IBM aankloppen? Die hebben niet al te lang een systeem gebouwd die behoorlijk goed speelde in Jeopardy.
Computers en begrijpend lezen? Sinds wanneer kan een computer teksten interpreteren en in de juiste context plaatsen van wat iemand vermeld? Gevaarlijke systemen die je in feite niet zou moeten willen.
Yep, hang dat systeem maar eens aan mobieltjes, koppel er een spraakherkennings api aan en voila, je hebt een robot die de overheid heet. Niemand is hiervoor verantwoordelijk want het is een computer, een systeem. Een ingevoerd systeem wordt niet eenmaal teruggedraaid. Zeker niet als de overheid de vruchten ervan heeft kunnen plukken.

Je kan de burgers lekker dom houden door dan nieuws uit te brengen hoeveel criminaliteit er wel hiet tegengegaan is. Hoeveel kinderporno er opeens gevonden is.
Dan kun je wel zoals vaak genoemd gordijnen thuis hangen maar dat gaat niet helpen.

Ik hoorde nog wel eens mensen zeggen: 'De overheid heeft wel iets beters te doen dan iedereen te volgen'. Computersystemen kunnen dat wel doen en met een handjevol mensen kan deze data geanalyseerd worden.
Het is immers big data wat al genormaliseerd is door het systeem en er waarschijnlijk een soort puntensysteem bestaan. Denk hierbij aan spamfilters die mail controleren en beoordelen. Zo'n systeem van de overheid kan dan op dezelfde manier werken.

Maargoed, ik ben zelf niet zo optimistisch over 'The second machine age' dus dat zal wel een rol spelen hierin.
Wordt Twitter zoveel gebruikt? :o
In mijn vriendenkring heb ik slechts 1 (van de 400 of zo FB contacten) die ook van Twitter gebruik maakt voorzover ik kan zien.

Edit:
Betere vrienden? Zucht.
Wat ik bedoel is dat ik verwacht dat mensen veel eerder FB gebruiken dan Twitter en er dus ook veel meer data is waar wat uit te halen zou kunnen zijn. Er is ook (bijna) geen limiet aan de posts lengte, dus het is veel eenvoudiger te analyseren dan vage afkortingen voor insiders.

Edit 2:
Damn! First post, dus gedownmod. ;(

[Reactie gewijzigd door ADQ op 14 mei 2014 22:22]

Ga maar eens zoeken tijdens een calamiteit, je kan er vaak eerder dingen vinden dan het op tv is.
Probleem is alleen wel dat er ook heel veel niet volledig juiste informatie opkomt tijdens echt grote rampen e.d.
Maar als ze het voor elkaar krijgen om daar een goed filter op te zetten dan kan dat alleen maar positief werken lijkt me.
Veel twitteraars zetten alles van het feit dat ze geslaagd zijn voor het een of ander tot dat ze naar bed gaan op twitter in tegenstelling tot een fb'er.
ik denk dat twitter zich daardoor goed leent voor het verbeteren van de informatiestroom naar de meldkamer.
Twitter heeft denk ik veel actuelere informatie erop staan.

Zoals je aangeeft, iedere zucht en scheet wordt op twitter gezet, dat terwijl er voor facebook echt een soort van post gemaakt wordt.

Zie twitter als een chatdienst en facebook als een messageboard.
Ik denk dat die juist de goede vrienden heeft.
Ik denk dat mensen eens moeten worden beoordeeld op wat voor mens ze zijn, en niet op het feit of ze wel of niet Twitter gebruiken.
De meeste actieve twittergebruikers zijn kanslozen die niets nuttigs te melden hebben.
dat geldt tegenwordig ook voor tweakers.net gebruikers als ik jouw opmerking zo lees :+

ontopic; ik vraag me behoorlijk af, of twitter lang genoeg populair blijft om dit soort investeringen goed te houden, kun je er wel vanuit gaan dat over 5 jaar nog iemand zin heeft om elke scheet op twitter te poepen,

om toch maar een voorbeeld te geven, als ik door de binnenstad loop en ik zie iemand een paar ruiten in slaan ga ik daar echt niet over twitteren, .. nee of ik mep zoiemand de kop in, of ik loop een blokje om, maar erover twitteren is echt onzinnig wat mij betreft.

[Reactie gewijzigd door i-chat op 15 mei 2014 06:59]

De ontwikkelde algoritmes zullen ook wel op andere bronnen toepasbaar zijn. Twitter is een gewoon een gemakkelijk platform om aan te beginnen.

Moest de NSA dit nog niet hebben (wat ik sterk betwijfel) zullen ze er zeker in geÔnteresseerd zijn.
Ik vind dit niet heel bijzonder qua techniek. SAP heeft via NetBase ook een Natural Word Processor binnengehaald die sentiment kan herkennen (positief, negatief).

Dus niet echt wereldschokkend dat dit kan...
Ik denk niet dat er software bestaat die gedachten kan lezen. Wat als ze allemaal nep berichten gaan plaatsen? dan worden ze aardig op een dwaalspoor gezet.
Sarcasme zal vast een probleem zijn, dat gaat op T.net al vaak genoeg fout.
Nepberichten zou natuurlijk hier wel door hooligans geplaatst kunnen worden, 'we gaan Ajacieten meppen bij locatie X' kan wel de politie verwarren.
Het probleem is dan ook dat men een oplossing komt waarbij vaste statements worden toegepast die refereren naar mogelijke gevolgen. De realiteit is dat we als mensen op een andere manier communiceren. De kans is denk ik dan ook groter dat eerder de informatie uit zijn verband wordt gehaald. Misschien hebben persoon A en B wel vooraf ergens met elkaar gepraat en plaatsen nog even een opmerking via internet. De computer mist dus volledig de voorgeschiedenis.

Ik geloof dan ook nooit in dit soort systemen, te mooi voor woorden. En wat te mooi voor woorden is, is gewoon niet waar.

Dat de politie beter hun taken willen uitvoeren ben ik helemaal voor maar niet met dit soort software.
Ah de kater bestaat nog .. naja toch nog wat opgestoken van dit bericht :p
Dentergems pullen staan hier nog in de kast :X
Misschien is het niet slim om voor iedereen leesbaar te posten dat je iets gestolen hebt, Sander!

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True