RTL Nieuws gebruikt software om lokale artikelen te maken

Het Nederlandse medium RTL Nieuws heeft software in gebruik genomen om op basis van cijfers artikelen te schrijven die zijn toegespitst op een lokale situatie of een woonplaats. RTL heeft de software zelf gemaakt en noemt hem ADAM.

ADAM staat voor Automatische Data Artikel Machine, schrijft RTL. De software maakt het mogelijk om teksten te publiceren per plaats. Donderdag zijn 2400 artikelen verschenen op basis van cijfers over verkeersongelukken. De in Python geschreven software zet de cijfers bij elkaar in grafiekjes, bekijkt of er een stijging of daling is en past daar de tekst op aan.

RTL wil de software in de toekomst ook gaan inzetten voor nieuws op basis van cijfers over bijvoorbeeld criminaliteit, scholen en ziekenhuizen. Het medium publiceerde al langere tijd visualisaties waarbij gebruikers hun woonplaats kunnen opzoeken, zoals bij verkiezingen. Het verschil is dat de software daarbij een template met enkele variabelen invult. In een vergelijking van diverse artikelen met Diffchecker blijkt dat de software in veel gevallen met dezelfde zinnen en informatie werkt, maar de voor die woonplaats relevante getallen invult en mogelijk een zin toevoegt met informatie of het gaat om een toename of niet.

Het medium heeft de software, door het bedrijf zelf 'redactierobot' genoemd, in eigen beheer ontwikkeld met geld van Google Digital News Initiative. RTL kreeg 200.000 euro van Google voor de ontwikkeling van ADAM.

RTL Nieuws Adam

Door Arnoud Wokke

Redacteur Tweakers

14-11-2019 • 14:23

62

Reacties (62)

62
53
29
2
0
14
Wijzig sortering
Ben erg benieuwd naar de kwaliteit van de artikelen!
Heeft iemand toevallig hier al links van? :)

[Reactie gewijzigd door MrManuel op 23 juli 2024 04:23]

https://www.rtlnieuws.nl/...oonplaats-zoek-ongelukken

Een klein stukje naar beneden scrollen en even een plaatsnaam invullen!

[Reactie gewijzigd door brammes01 op 23 juli 2024 04:23]

Voor de artikelen gebruiken ze een aantal templates die ze vullen met de data. Als ik even snel kijk zijn er bij de verkeersongelukken bijvoorbeeld: Plaats X heeft gevaarlijkste kruispunt van de provincie, en X blackspots in Plaats Y.

Als je het artikel van Amsterdam en Almere vergelijkt is de tekst nagenoeg hetzelfde, alleen de cijfers zijn anders.
Qua automatische verwerking ben ik hier inderdaad niet van onder de indruk, het is in feite niets anders dan de aanhef van een gepersonaliseerde brief in Word, hoe lang hebben ze die feature al wel niet ?

Echter als ik het vergelijk met het artikel in mijn regionale dagblad op basis van deze cijfers dan kan het artikel heus de journalistieke toets der kritiek doorstaan. Dat artikel bevat ook weinig anders dan het schriftelijk presenteren van de data-bevindingen. Met enige aanpassingen en toevoegingen van enkele "kolommen" aan ADEM zou je zelfs al wat complexere vergelijkingen kunnen maken (steden van gelijke omvang, verhouding totale stijging, verhouding fietsers/auto, rurale gebieden etc.)

Grappig vind ik dan wel weer dat de 'echte' journalist daar de bewering doet dat Enschede de gevaarlijkste stad is van de regio Twente (mijn thuisregio dus) met "bijna 1 op de 4 ongelukken met letsel (162 totaal) gebeurde in de grootste stad van de regio", iets dat mij dan weer niet verwondert aangezien ongeveer 1 op de 4 mensen ook in Enschede wonen (en nog iets meer werken). Dat doet vrezen voor de kwaliteit van de analyse naar aanleiding van dit soort getallen. In dat kader vroeg "onze" journalist aan een expert in Delft (n.b.) ook nog naar een verklaring voor de toename, conclusie van de specialist: "Dat weet ik niet".

Ik denk dat ADEM en dergelijke systemen een aardige aanvulling kunnen zijn, maar dan moet de rest van de media dat wel beschouwen als een startpunt en niet als paginavulling. Op dat punt heb ik een hard hoofd.

[Reactie gewijzigd door FilipSP op 23 juli 2024 04:23]

ADEM
FYI: het heet ADAM (Automatische Data Artikel Machine).

Wat bij mij de associatie met Amsterdam opwekt.
Grappig vind ik dan wel weer dat de 'echte' journalist daar de bewering doet dat Enschede de gevaarlijkste stad is van de regio Twente (mijn thuisregio dus) met "bijna 1 op de 4 ongelukken met letsel (162 totaal) gebeurde in de grootste stad van de regio", iets dat mij dan weer niet verwondert aangezien ongeveer 1 op de 4 mensen ook in Enschede wonen (en nog iets meer werken). Dat doet vrezen voor de kwaliteit van de analyse naar aanleiding van dit soort getallen. In dat kader vroeg "onze" journalist aan een expert in Delft (n.b.) ook nog naar een verklaring voor de toename, conclusie van de specialist: "Dat weet ik niet".
Lies, damned lies and statistics.

Het irritante is dat niet alleen journalistiek tekortkomingen kent op dat gebied heeft,
de politiek heeft daar ook een blinde vlek ipv correcties door te voeren. Stikstof discussie is een mooi voorbeeld waarbij iedereen getallen de lucht in smijt maar waar niemand echt weet waar de problemen liggen en waar oplossingen gezocht moeten worden.

Of RTL daar zelf ook toegevoegde waarde wil hebben betwijfel ik.
Even ter verduidelijk dat ik nergens de journalist, noch de expert belachelijk probeer te maken. Het gaat mij echt om de beperking van het systeem. RTL spuit er 2.000+ artikelen uit, daar moet de lokale journalist en een expert in de continue nieuwscyclus eigenlijk wel direct (aanvullend) op reageren en dat gebeurt dan op onvoldoende wijze.

Ik denk dat een vorm van datajournalistiek echt een toegevoegde waarde kan zijn, maar dan moet er binnen de verwerking voldoende tijd, geld en aandacht zijn om op de juiste wijze met de data aan de slag te gaan op (hyper-)lokaal vlak.

Die stikstofdiscussie laat ik wat aan mij voorbij gaan, maar daarin zal RTL gewoon de rol spelen van journalistiek medium. De controle op het gebruik van de juiste cijfers en relevante getallen door experts, politici en maatschappelijk in zowel de probleemschets als de oplossing is volgens mij juist een belangrijk onderdeel van de journalistieke berichtgeving. Ik denk niet dat ADEM daar al een toegevoegde waarde heeft, maar wellicht dat andere datamethoden en -visualisaties daarbij kunnen helpen.
Ik denk dat het veel meer te maken heeft met personificatie van berichten.
Als je 1 hoofdartikel kunt maken en op basis van 'locatie' van browser of gekozen streek/gemeente het artikel 'on the fly' kunt aanpassen naar een lokaal artikel, dan kan het wel toegevoegde waarde hebben denk ik.
Toch zou ik hier wel mee oppassen, want data is vaak zwart wit en kan overlappingen hebben die een computer niet 1, 2, 3 overziet.
't komt, als ik het zo lees, in feite idd neer op een stukje merging van een standaardartikel met wat variabele teksten erin met een query die op de achtergrond een specifieke locatie gebruikt...lijkt me, als dat de enige toepassing is, iets wat vrij makkelijk te maken is.
De eerlijkheid gebiedt ook te zeggen dat ik een meer uitgebreidere analyse van de cijfers voor mijn woonplaats las in de papieren versie van mijn regionale krant, inclusief een reactie van de gemeente die keurig aangaf over een nog uitgebreidere dataset te beschikken. Iets van mijn eerdere vrees blijkt dus eenvoudig weerlegd te zijn.
Ik vind het wel knap dat ze hiervoor 2 ton hebben weten te vangen van Google.
Hetzelfde als ik Rotterdam bekijk de “gevaarlijkste kruispunten” zijn gewoon de drukste en helemaal niet gevaarlijk tenzij je door rood rijdt en is dus net zo gevaarlijk als een flat wanneer je uit het raam springt.

Zo zijn er veel gevaarlijke kruisingen waar je gewoon geen zicht hebt en blind de weg op moet met gevaar op een auto die met 50km/h aankomt (vaak ook harder) welke je pas op maximaal 4-5 meter afstand kan zien nadat je de weg op bent, maar die kruisingen zijn dan rustiger omdat mensen die vermijden. Resultaat is dat ze niet te boek gaan als gevaarlijk en nieuwsberichten die puur op statistieken gebaseerd zijn, zijn daarmee in ieder geval niet onomstotelijke waar.

[Reactie gewijzigd door HakanX op 23 juli 2024 04:23]

Gaat lekker!
Meerdere locaties opgegeven.

De enige resultaten welke ik telkens krijg:
"error
Er is een fout opgetreden, probeer het later opnieuw"

Lijkt erop dat het nu al stuk is ;)
Even van je kantoornetwerk af, hielp bij tenminste :P

[Reactie gewijzigd door Melkunie op 23 juli 2024 04:23]

Net zo populair als Disney+. Die hadden ook moeite bij de introductie.
Dit is dus gewoon een web-based mail-merge functie... welkom in 2005...
iemand heeft een mooie 200k gemaakt voor een template parser zeg ik dan maar!
Belabberd. De software kan grafieken en data overschrijven en in artikelvorm gieten. Geen context, geen verklaringen, gewoon puur data in tekst gieten.

Dat is geen journalistiek, dat is gewoon vulling.
Niet als advocaat van de duivel, maar 99% van 'nieuws' is opvulling.

Immers kopiëren alle nieuwskanalen maar klakkeloos wat van elkaar met woordspelingen. Er zijn maar weinig die iets tot de bodem uitzoeken, zo ook dit programma. Het past dus aardig in het moderne jasje van 'nieuws'.
Het is eigenlijk gewoon een nieuwe vorm van Facebook, waar ook iedereen 'de waarheid' weet maar 99% geen flauw idee heeft waar ze het over hebben

[Reactie gewijzigd door DutchKevv op 23 juli 2024 04:23]

Een zeer succesvolle manier om de 'narrative' van de eigenaren te pushen. De 'feiten' worden op zo'n grote schaal verspreid dat alles wat daar tegenin gaat gelijk als 'fake news' kan worden afgeschreven. "Iedereen weet immers dat..."
Net als met de cholesterolmythe die ons jarenlang door de strot is geduwd en waarvan we er nu beetje bij beetje achter komen dat het de (overmatige--en vooral frequent geconsumeerde) koolhydraten zijn die hartziektes veroorzaken.
Fake news is op die manier ook fake news.

Er zit soms echt wel een kern van waarheid in, al dan niet omdat Janneke een tikkeltje scheef in haar panty zit.

Net anderhalve maancyclus terug hart ziekte overleeft op de minuut.., (,no shit). En zoals verwacht is short,,-term 'Trump-style' nieuws geknetter simpelweg 'obster-naadje'

Maw .. Liever harde cijfers dan 4 alinea showbizz shit
Past in ieder geval bij de manier van nieuws rapporten die RTL handhaaft. Kopiëren, plakken, weinig effort.
Belabberd. De software kan grafieken en data overschrijven en in artikelvorm gieten. Geen context, geen verklaringen, gewoon puur data in tekst gieten.

Dat is geen journalistiek, dat is gewoon vulling.
Een soort ANP (lees: Talpa) copy/paste machine, maar dan anders.

Sja... Journalistiek in Nederland...
Beetje generaliserend. RTL heeft zeker wel een hoop ANP artikelen, maar dat is nou eenmaal het Nederlandse persbureau waar nieuws vandaan komt.
RTL heeft een best grote redactie die veel in-depth artikelen schrijft en RTLZ is een en al eigen content. Dit artikel over de ongelukken is gemaakt door de researchredactie en ze zijn daar best wat tijd mee kwijt om alle data op een rijtje te krijgen.

Op de vorige website werden dit soort dingen ondergebracht in de buurtfacts. Dat was relatief hetzelfde, ook met templates. Dat hebben ze nu herbouwd op een wat modernere manier, maar vernieuwend is dit allebehalve als je het mij vraagt.

Zoiets als dit: https://www.rtlnieuws.nl/verkiezingen?electionCode=PS19 is ook gewoon een template met data die allemaal unieke URLs per gemeente bevat, alleen zijn ze minder SEO vriendelijk.
Flinke SEO-url, kan wel lekker gebruikt worden voor clickbait:
https://www.rtlnieuws.nl/...7c5ff88633ecf2a/leimuiden

[Reactie gewijzigd door Skit3000 op 23 juli 2024 04:23]

Gezien de kwaliteit van de door stagiaires getikte artikelen kan dit alleen maar een verbetering betekenen. God wat zitten daar vaak bias en taalfouten in.
Ik vind de kwaliteit van door *mensen* geschreven artikelen vaak bedenkelijk,
waar een kranten artikel slechst een top-zoveel lijstje berschrijft. :+
.
Dat gaat plm zo:.
"De lijst wordt aangevoerd door A, op afstand N gevoldg door B.
Open de derde plaats vinden we C. H is pas terug te vinden op de achtste plaats.
bla, bla, bla, enz..... "
Dit soort artikelen zijn er legio. Vaak zelfs zonder te lijst zelf weer te geven.
Heel frusterend, ondhandig en informatie-wijs niets toevoegend.

[Reactie gewijzigd door Geekomatic op 23 juli 2024 04:23]

Lijkt mij geen goed plan, dan ga je wel erg in een bubble leven, Ik wil niet weten wat er alleen in Amsterdam speelt, maar ook in het rest van het land.

Andersom lijkt mij wel beter, meer diverse artikelen en dat ik zelf kan browsen naar Hilversum bijvoorbeeld. Maar niet dat ik alleen maar nieuws krijg over de plek waar ik woon.
Van de andere kant wordt het nieuws hier dan wel gepresenteert op feiten en niet op onderbuikgevoelens.
Dat lijkt me toch ook wel wat waard.
De tool lijkt me ook erg handig voor mensen die een huis zoeken. Men nemen de tool, voert PC+huisno in en krijgt direct de gegevens waar je naar opzoek bent.
Samenstelling wijk (percentage jonge gezinnen/ouderen, maar wellicht ook werkende/niet werkende mensen)
Afstand tot scholen (en de kwaliteit van deze scholen)
Luchtvervuilingscijfers
Criminaliteitscijfers (t.o.v. de wijken er omheen)
Gemiddelde woning waarde

Dat zijn nu gegevens die je allemaal op verschillende locaties moet opzoeken en waar je als huizenkoper toch erg in geinteresseerd zult zijn.

En een dergelijke tool zou ook erg handig zijn voor de landelijke dagbladen (AD/Telegraaf/etc.) die op hun website zo eenvoudiger en beter regionaal nieuws kunnen plaatsen.
Van de andere kant wordt het nieuws hier dan wel gepresenteertd op feiten verzamelde data en niet op onderbuikgevoelens.
Fixed. 'In Amsterdam wonen 0 mensen' is geen feit, maar een conclusie gebaseerd op verkeerde data.

Dat is dan ook een reden waarom je altijd argwanend moet zijn naar een nieuwsbericht dat met cijfers gooit zonder goede bronvermelding en zonder nuances van de verzamelde data. Elk onderzoek heeft zijn beperkingen, en die moeten ook meegenomen worden in artikelen die conclusies trekken uit verzamelde data. Tevens is nuance belangrijk voor legitimiteit.

[Reactie gewijzigd door The Zep Man op 23 juli 2024 04:23]

Er bestaan al tientallen van dit soort websites, oa:
https://allecijfers.nl/gemeente/amsterdam/
https://www.oozo.nl/cijfers/amsterdam

Overigens zit deze "nieuwe" functionaliteit al jaren in Microsoft Word. Echter heeft het daar geen hippe naam, maar heet het gewoon mail merge waarbij je gebruik kunt maken van conditional formatting ;)

[Reactie gewijzigd door basvd op 23 juli 2024 04:23]

Dit is toch vrijwel allemaal informatie die je gewoon kan opzoeken op diverse sites. Ik weet nu even niet of een site als Funda of een andere huizenaanbieder hier al gebruik van maakt, maar er zijn wel degelijke informatieve websites waar je veel van deze informatie (vaak tegen een geringe vergoeding via SMS-code o.i.d.) zonder enige moeite kan achterhalen. Een Amerikaanse huizensite als Zillow verwerkt dit soort gegevens al vrij lang in zijn presentatie-template. Bovendien hebben ook lokale overheden tal van open data-initiatieven.
Die bubbelvorming is helaas allang aan de gang. De nieuwe verzuiling.
Dat ligt niet aan dit soort initiatieven, maar meer aan algoritmes die alles op jou aanpassen. Of dat nou advertenties, mogelijke contacten of nieuwsartikelen zijn, het is op jou aangepast. Dus je krijgt effectief te zien op internet wat jou toch al interesseerde. En je gaat op internet (forum of andere vormen van netwerken) vaak om met gelijkgestemden.
Die bubbelvorming is nu anders, maar voor het internet leefde je ook gewoon in bubbels, de mensen waarmee je omging, de mensen waarmee je werkte, de buurt waarin je leefde, de kerk waar je naar toeging, de krant die je las. Nu gebeurt dat ook, maar breid je die bubbel uit naar gelijkgezinden op het internet.

Een gedeelte van de Tweakers weet dit, maar is niet veel meer dan een onderbuikgevoel en doet geen (of heeft ooit) onderzoek gedaan naar hetzelfde nieuws dat verschillende media rapporteren (buiten je eigen bubbel). De verschillen, afhankelijk van het onderwerp, kunnen enorm zijn.

Dit is absoluut geen nieuwe ontwikkeling!
Maar het kan toch allebei? Het AD heeft ook lokaal nieuws naast landelijk nieuws.
Zoals ik het artikel vandaag zag was het een algemeen artikel met het algemene verhaal, waar ik aan het einde een keuze kon maken uit verschillende gemeente om daar specifieke info over te krijgen.
Ik zie nog wel wat ruimte voor verbetering.
Als ik Zoetermeer invul staat er: "Zoetermeer telt 5 zogeheten blackspots"
En vervolgens als toelichting "Dat zijn plekken waar in drie jaar minimaal tien ongelukken zijn gebeurd. Ook plekken waar minstens zes ongelukken met een ziekenhuisbezoek als gevolg zijn geweest, worden meegeteld."

Vervolgens staat er een tabel onder, en daar staat 1 kruispunt met 7 ongelukken en 1 met 6 ongelukken. Gevolgd door 4 ongelukken en twee met 3 ongelukken.
Volgens mij voldoen die niet aan de omschrijving 'blackspots'.
Het kan zijn dat er een discrepantie zit tussen de tijdsspannes. M.a.w. dat die grafiek maar één jaar betreft hoewel de tekst over drie jaar spreekt, terwijl dat niet duidelijk (of liever: helemaal niet) wordt aangegeven. Of de tekst is gewoon fout natuurlijk. ¯\_(ツ)_/¯

https://www.rtlnieuws.nl/...1d06adba09f5cd/zoetermeer
Volgens mij is het meer een standaard opzet met een paar aangepaste cijfers. Net als de meeste brieven/ Automatisch invullen mat eigen data.
Het lijkt meer op een soort template welke vervolgens wordt gevuld met de cijfers uit jouw woonplaats. Het is dus niet zo dat deze "robot" zelf een heel artikel schrijft.
Dit zie je al gebeuren bij andere nieuwssites. Zal in de praktijk vermoedelijk een templating-achtig systeem zijn en een mogelijkheid om artikelen te kopiëren.

Vooral handig bij generiek nieuws, zoals inderdaad inbraken/ongelukken per plaats, weerberichten, etc
Pas een site gezien die dit deed met P2000 informatie. Eigen sausje eraan geven, paar generieke links erbij en hoppa, weer een content generator erbij op het internet.
Of sites die automatisch de beste oplossing(en) verzameld (die anderen geschreven hebben) voor de meest irrelevante problemen.
Een mooie manier om je site van google te krijgen, of in ieder geval een stukje lager. ;)

Wel erg vreemd dat Google Digital News Initiative hier dan weer geld aan wil geven, lijkt mij juist vervuiling van zoekmachines, of men moet de gegenereerde "lokale" pagina's niet laten indexeren.
Wat een verschrikkelijke ontwikkeling. Soms als ik informatie opzoek kom ik op een mij onbekende website waar een artikel op lijkt te staan waarbij bijvoorbeeld twee camera’s vergeleken worden. Met zinnen als “de Nikon D7500 heeft een lagere schermresolutie terwijl de D7300 het met minder focuspunten moet doen”. Pas na een paar zinnen kwam ik er achter dat dit geen persoonlijke review was, maar een computer die een tabel heeft omgezet in zinnen. Als ik dan moet kiezen tussen een overzichtelijke tabel, of een zogenaamd goed-lezend artikel dat toch net niet lekker loopt, dan heb ik vele malen liever die tabel.
Dit is bijna net zo kwaadaardig als websites die automatisch vertaald zijn.
Als belg kan ik enkel jaloers zijn op de grote technologische vooruitgang die jullie maken. In België zijn we te vasthoudend aan oude principes en gewoonten waardoor dit een achteruitgang begint te vormen. Voor dit soort journalistiek is het nog een jaartje of 20 te vroeg in het arme zuiden.

Anderzijds zie je dat het waarschijnlijk om een pilot gaat. Onderstaand artikel zegt dat veel voetgangers de dupe zijn. Ik ben al veel in Sluis geweest en laat dit mijn inziens nu eens weinig verwonderlijk voor een gemeente met een compleet verkeersvrij centrum en enkel met een goede reden kom je erin aan max 10km/h (vb. Voor een levering). Ik denk dat er hier misschien een extra parameter kon geplaatst worden.

https://www.rtlnieuws.nl/...5a8467ddf899ed19014/sluis
Ontwikkeld met geld van Google? Hier zit zeker nog een staartje aan..
Nee hoor, Google heeft gewoon een potje beschikbaar gesteld om dit soort ontwikkelingen te stimuleren. Ze verwachten niet dat je daardoor ineens allemaal diensten van ze af gaat nemen. Er zijn zo veel partijen die dit soor dingen doen. De X-prize is net zoiets overigens.

Op dit item kan niet meer gereageerd worden.