Uitgever Nederlandse kranten zet sportsite online met door GPT-4 gemaakte koppen

De Belgische uitgever Mediahuis, eigenaar van onder meer Telegraaf en NRC Handelsblad, heeft een sportsite online gezet, waarbij het boven de ANP-berichten door GPT-4 gegenereerde koppen zet. OpenAI's chatbot voorziet de artikelen ook van onder meer categorieën en tags.

Mediahuis Resport
Melding onder artikel van Mediahuis Resport

Mediahuis laat voor de site Resport GPT-4 twee koppen maken, meldt het bedrijf. De ene kop is voor boven het artikel en de andere is voor gebruik op sociale media. De inhoud van artikelen komt van persbureau ANP. Mensen checken de koppen wel, zo claimt de uitgever. Onder elk artikel staat wat AI heeft gedaan. Als een menselijke redacteur een kop aanpast, staat dat er ook bij.

Het maken van de koppen werkt vermoedelijk via een api-call naar OpenAI's GPT-model met in de prompt vooraf ingestelde elementen, zodat het antwoord vanuit de api een bruikbare titel is voor het artikel.

In de toekomst wil Mediahuis de artikelen uitbreiden met door GPT-4 gegenereerde trivia, klassementen bij vermeldingen van competities en biografieën over sporters die in de artikelen staan. Het is onbekend hoe Mediahuis dat wil implementeren. GPT-4 en ChatGPT hebben normaal gesproken alleen data tot 2021 en kunnen dus niet bij actuele standen van competities. Daarnaast maken ze vaak fouten in biografieën of ze geven veel informatie niet weer.

Door Arnoud Wokke

Redacteur Tweakers

15-08-2023 • 15:40

80

Reacties (80)

80
79
37
3
0
33
Wijzig sortering
klein dingetje wat me opvalt: de afbeeldingen komen ook van ANP, denk ik.
Die krijgen wel een edit, de (C)-tekst wordt er af gesneden. Die komen wel terug als tekst onder de afbeelding in het artikel.
Website versie:
https://img.resport.nl/im...%2F08%2FANP-475460335.jpg

En die bevat een link naar het origineel:
https://resport.nl/wp-con...2023/08/ANP-475460335.jpg
Word waarschijnlijk gewoon automatisch gecropt voor de banner

Overigens staat het al in de naam.
Het begint bij sport of ander nutteloos nieuws, maar eindigt straks bij een uitgebreid artikel over de geopolitieke situatie in de wereld.

Ik zit daar niet op te wachten.
Ik denk persoonlijk niet dat het zover komt. Je ziet al heel lang, ook ver voor de GPT-revolutie, dat media experimenteren met bepaalde vormen van automatisering in bepaald nieuws dat vrij makkelijk te automatiseren is. Er waren een paar jaar geleden voorbeelden van media die beurs- of sportnieuws automatiseerden, omdat dat nieuws is waar je vooral wat data in moet gooien (een jaarrekening, een wedstrijdanalyse) en de tekst daarop kan worden gebaseerd. Dan hou je juist meer tijd over om moeilijker, tijdrovender nieuws goed te kunnen coveren en te duiden.
Het is al zo ver, ik heb een abonnement op het Brabants dagblad en iedere dag komt er een nutteloos bericht wat gegenereerd is. Dit weet ik omdat niemand bij ons de gemeente naam gebruikt en AI dus wel (dorpen liggen ver uit elkaar). Het begint sowieso met een nieuwsbericht over het weer, daarna komt er een over hoeveel fietsen er gestolen zijn of hoe veel airco’s er hangen.

Echt totale onzin en ik ga deze dus ook niet meer verlengen

[Reactie gewijzigd door GrooV op 22 juli 2024 22:37]

Geen van de artikelen waar je aan refereert wordt met behulp van AI gemaakt. AD heeft voor alle gemeenten in Nederland een regiopagina waarop al het nieuws over die gemeente wordt verzameld/gepubliceerd. Sinds geruime tijd wordt daar inderdaad iedere dag een geautomatiseerd weerberichtje aan toegevoegd. Dit proces is helemaal geautomatiseerd, maar werkt op basis van templates. Hetzelfde geldt voor geautomatiseerde voetbalverslagen waarmee ook al enige tijd wordt geëxperimenteerd. Daarnaast heeft DPG geïnvesteerd in een dataredactie. Dit zijn dus redacteuren die daadwerkelijk zelf onderzoek, hoor- en wederhoor etc doen en dan een verhaal maken. Dit 'moederbericht' kan vervolgens met behulp van software per gemeente worden gepubliceerd en voorzien van de juiste waarden, nuances, etc.

Jammer dat je het onzin vindt, niet alleen omdat dit het project is waar ik mijzelf afgelopen 1-2 jaar mee heb beziggehouden maar ook omdat we uit de reacties en statistieken juist merken dat veel lezers het wel interessant en relevant vinden. We zijn er uiteraard nog niet, maar met vallen en opstaan proberen we het elke week beter te doen.
Heb je daar ook bewijs voor? Want dat is een vrij serieuze claim en serieuze claims hebben serieus bewijs nodig. Ik durf als journalist die toch al behoorlijk lang meeloopt er ve geld om te verwedden dat BD geen AI gebruikt zonder dat zomaar te zeggen in een disclaimer.
BD, Brabants Dagblad valt ook onder DPG media. Uit dezelfde groep komt de PZC die iedere dag het weerbericht voor mijn gemeente presenteert. Een slecht geschreven stukje, maar wel met disclaimer: Dit bericht is geautomatiseerd samengesteld op basis van actuele weerdata, verstrekt door Weerplaza.

Ik ben wel benieuwd welke andere berichten GrooV nog heeft en of die ook die disclaimer hebben?

[Reactie gewijzigd door Wouter2403 op 22 juli 2024 22:37]

Ik ben bekend met het Nederlandse uitgeverslandschap ja. Maar een weerbericht is geen artikel dus ik vraag me erg af of dat is wat @GrooV bedoelt.
Het wordt wel degelijk iedere dag als headliner geplaatst per regio. Dus het is een artikel en het staat tussen de artikelen
Heb je een voorbeeld?
https://www.bndestem.nl/b...n-breda-vandaag~a1dc5d2c/

En inderdaad regelmatig artikelen gebaseerd op data. Kan er zo snel geen vinden, maar laatst eentje over aantal EV’s. Puur op data gebaseerd, per gemeente een vergelijkbaar artikel met enkele termen vervangen en duidelijk niet gecheckt. In Breda reden er heel veel rond, maar uit de data bleek dat te gaan om iedere gemeente met een grote leasemaatschappij (Alphabet zit in Breda). Geen idee of het gegenereerd was of luie journalistiek. Kan hem niet meer vinden, er komt alleen een ander artikel boven.

[Reactie gewijzigd door ep667 op 22 juli 2024 22:37]

Deze pagina kan niet worden gevonden? Plots verwijderd?
Bijzonder. Blijkbaar worden die dagelijks verwijderd? https://www.bndestem.nl/b...n-breda-vandaag~a2e91cee/

Dat kan dan ook het geval zijn met dat artikel over EV’s.
Het geautomatiseerde weerbericht staat maximaal 24 uur online :)
Zo bijv: https://www.bd.nl/dongen (op mobiel)

Als het nog geen nieuws die dag is dan staat die in de header
Ik snap dat dit voor een journalist 2 verschillende zaken zijn maar voor mij als consument niet echt. Naast het weerbericht ook van die "artikelen" o.b.v. CBS cijfers (voor heel NL is het dit. Voor jou gemeente is het dit). Je weet gewoon dat dr een scriptje ergens draait die dit genereerd.

Ik kan me voorstellen dat teveel van der type berichten iemand zal wegjagen. In dat geval maakt het niet zoveel uit dat het voor mensen in het vak 2 compleet verschillende dingen zijn
Inderdaad, AI en dus kunstmatige intelligentie in het algemeen kan ervoor zorgen dat mensen zich alleen met belangrijker zaken en dingen bezig kunnen houden doordat er meer tijd vrijkomt en voor andere terugkomende zaken doordat allerlei dingen geautomatiseerd kunnen worden.
In theorie ja. In de praktijk is dit het werk wat nu door beginners / studenten wordt uitgevoerd. Meer tijd onderhouden gaat alleen op als ze hetzelfde aantal fte houden. Of dat gebeurd valt te bezien
Onder sport valt alleen ook moeilijker en tijdrovender nieuws. Dus of de uitgever stelt dat de AI dat ook wel kan doen, of ze hebben er geen moeite mee dat ze vooral 'makkelijk' nieuws brengen. Maar in geen van de situaties is het dus maar alsof je kan verwachten dat dat gedrag alleen bij sport blijft. Het herhaaldelijk maar proberen dat AI in te zetten is lijkt zo vooral te gaan om zo goedkoop en makkelijk mogelijk nieuws brengen, niet alleen bij sport.
"Sport" is in deze context inderdaad vooral een wedstrijdverslag. Dat is meestal een simpele invuloefening als je de data hebt (al stel ik het dan ook wel wat simplistisch voor). Als sportjournalisten die tijdrovende stukken niet meer zelf hoeven te maken, kunnen ze zich richten op sportverslaggeving die meer traditioneel journalistiek handwerk vereist.
Zoals ik de aankondiging, het nieuws er over en de website zelf lees staat er nergens dat de context wedstrijdverslagen zijn of alleen simpel is. Een groot deel van het nieuws wat er nu al staat is juist al divers en gaat zelfs wat de diepte in. Dus zolang niemand van de medewerkers of het bedrijf een duidelijke grens trekt lijkt het me eerder redelijk dat het ze juist niet vooral gaat om de mogelijkheden die verslaggevers dan behouden, eerder de mogelijkheden die AI het bedrijf geeft om hun eigen doel van experimenteren en hoofddoel meer winst na te streven. Dat is nog altijd inclusief het wel prima vinden dat tijd besparen ook geld besparen op collega's/medewerkers mag zijn om die doelen te behalen en behouden. Maar misschien kan een wat diepgaande verslaggeving daar meer uitsluitsel over geven, zodat het niet blijft bij overnemen van waarschijnlijk zorgvuldig verwoorde marketingverhaal en de onduidelijkheid die het zo laat bestaan over de doelen en toekomst. Investeren in herhaling is niet zomaar uit op eerder resultaat dat voldoet aan andermans wensen.
Ik denk dat het punt van deze site is dat er juist 3 of 4 feiten te zeggen zijn over een sportwedstrijd, en de rest vulling is. Het is not done om een kort artikel te schrijven.

Ik word persoonlijk niet goed van al die vulling, en zie liever korte feitelijke dingen (hulde aan tweakers voor testen met korte nieuws berichten). Een uitgebreid artikel over x of y bevat hopelijk geen vulling.
Mee eens, vaak ook een click bait titel en dan meerdere alinea's vultekst als soort van intro voor SEO doeleinden. Dan de laatste alinea slaat op de click bait titel, echter op zo'n kromme verdraaide manier dat je meteen door hebt dat je je tijd hebt verdaan met het lezen ervan.
ChatGPT is afhankelijk van input. Er blijft dus een mens achter de schermen werken die ChatGPT van de juiste input moet voorzien en moet controleren of het resultaat prettig leesbaar is en geen onjuistheden bevat.
De actuele geopolitieke situatie is door professionals al nauwelijks in te schatten. Er zijn meestal meerdere opvattingen die plausibel klinken. ChatGPT is geen analyse-tool en kan alleen een overzicht geven van de situatie in de landen die de mens erachter vraagt.
Voor geopolitieke situaties in het verleden kan ChatGPT putten uit talloze bronnen en daar zullen best aardige analyses uit kunnen komen, maar er is een kans dat ChatGPT de plank volledig mis slaat omdat het bronnen uit het alternatieve circuit heeft gebruikt.

Voor de media zal ChatGPT vooral een hulpmiddel zijn om sneller een aantal feiten in een leesbare tekst te gieten.
"en geen onjuistheden bevat. "

Of onwelkome feiten.
Er zijn nu al sites die volledig AI gegenereerd zijn en dat levert een hoop troep op in zoekmachines. Zie:
https://www.google.com/se...africa+that+starts+with+k

Voor wanneer dit straks weggehaald is - bovenaan de pagina staat momenteel:
While there are 54 recognized countries in Africa, none of them begin with the letter "K". The closest is Kenya, which starts with a "K" sound, but is actually spelled with a "K" sound. It's always interesting to learn new trivia facts like this.
Complete onzin natuurlijk.
En als ik die vraag zelf invoer krijg ik onderstaand.


Actually, that's not accurate. There are three countries in Africa that start with the letter "K":

1. Kenya
2. Kingdom of Eswatini (formerly known as Swaziland)
3. Kiribati

However, it's worth noting that the Kingdom of Eswatini and Kiribati are not often referred to by their "K" names, and Kiribati is not even located in Africa (it's in the central Pacific Ocean). The common and recognized "K" country in Africa is Kenya.
Tja, dat is dan weer een ander soort onzin want Kiribati ligt helemaal aan de andere kant van de wereld :+
Maar het probleem is dus meer wanneer sites dit soort onzin geautomatiseerd gaan uploaden.
Internet over 3 jaar, totaal onbruikbaar geworden.
Als het zorgt voor betere en logische koppen is het winst. Ook op tweakers zie je af en toe koppen die op meerdere manieren zijn te lezen en vaak achteraf moeten worden aangepast. De toekomst zal leren of AI dat beter kan doen.
LOL, over nu.nl zullen we het dan maar niet hebben....
Een voorbeeldje wat wij doen, we genereren een aantal headlines via chatgpt, vervolgens selecteer ik er 2 a 3, we AB(C)'en die op een sample van onze target customers waarvan we zeker zijn dat zij onze gewenste klanten zijn en sturen dat vervolgens op een kleine honderdduizend man via wechat.

Het is niet zo dat chatgpt alles doet, we hebben een "woord-smit" in dienst maar met chatgpt zeker op snelle low positioned social media is het een uitkomst om snel varianten te generen, samenvattingen, headers enz.
Voor wat voor media is dat?
Ik zit daar niet op te wachten.
Je zit waarschijnlijk ook niet op de huidige situatie te wachten waar nieuws gemanipuleerd wordt voor politieke en commerciële belangen... Daarom krijg je weer van die sites als https://ground.news/

Blijkbaar zijn mensen totaal blind voor het echte probleem: mensen...
Wordpress website met AI content. Dat kan dus iedereen wel maken, benieuwd hoe ze hier mee scoren. En ben benieuwd naar wat de input is voor AI content. Want geef mij dan alleen de AI input maar ipv een lulverhaal.

[Reactie gewijzigd door moonlander op 22 juli 2024 22:37]

In het artikel staat gewoon dat de input ANP is. Als de lezers toch alleen maar koppen snellen, snap ik wel dat redacteuren worden wegbezuinigd…
Wordt de complete inhoud gekopieerd, of steekwoorden... Want waarom zou ik ANP niet lezen dan?
ANP is de feitelijke gebeurtenis, je leest op nieuws sites eigenlijk altijd het "lulverhaal" er omheen (die leveren meestal context, of geven hun eigen draai eraan, afhankelijk van welk platform het is.)

Ik heb een tijdje bij een mediahuis gewerkt en had toen inzicht in wat er binnenkomt in het nieuwsoverzicht vanuit de "telex" zoals ze dat noemen, dat is echt 3 regels tekst en bevat eigenlijk alles wat interessant is aan een artikel, de rest wat redacteuren leveren is fluff en context.
De hele artikelen zelf op Resport IS de content van ANP. Daar wordt niks mee gedaan door GPT, en ook geen "lulverhaal" omheen geleverd.

> GPT4 is gebruikt om de kop, metatags, url, categorieën, belangrijke personen en social-koppen te genereren en/of labelen.

Dus niet het artikel zelf.

EDIT:

> Want waarom zou ik ANP niet lezen dan?

Omdat je niet direct op ANP kan lezen, die verkopen de berichten door aan andere nieuws outlets.

[Reactie gewijzigd door cornedor op 22 juli 2024 22:37]

Omdat je als eindgebruiker dat dus niet kan lezen anders had ik dat inderdaad ook gedaan, want in die artikelen staan alleen feiten en geen speculatie of iets dergelijks en het verhaal eromheen.
Je hebt er dus alleen wat aan als je al bekend bent met de materie. De duiding voor leken heeft extra werk nodig.
Precies, dus bij algemeen nieuws blijven menselijke journalisten nog hard nodig. Sport is vaak al veel data voor de ingewijde, dus dan kom je idd weg met korte berichtjes met de kern.
Staat in het artikel.
De inhoud van artikelen komt van persbureau ANP.
Wordpress website met AI content. Dat kan dus iedereen wel maken, benieuwd hoe ze hier mee scoren. En ben benieuwd naar wat de input is voor AI content. Want geef mij dan alleen de AI input maar ipv een lulverhaal.
Correctie; deels AI content. Het artikel zelf is nog steeds door een mens geschreven. Zoals op hun site ook staat:
GPT4 is gebruikt om de kop, metatags, url, categorieën, belangrijke personen en social-koppen te genereren en/of labelen.
Maar met GPT4 kan je natuurlijk zelfgeschreven artikelen ook zo laten opleuken dat het fijner wegleest een SEO geoptimaliseerd werkt.
Dit vind ik nou lollig. Het ziet er zo op het eerste gezicht leuk uit en het leest prettig. Ik kan me ook niet voorstellen dat er iemand rouwig is over z'n baan die nu verloren is. Als je dit de hele dag moet typen zou ik gillend gek worden.
Ik kan me ook niet voorstellen dat er iemand rouwig is over z'n baan die nu verloren is. Als je dit de hele dag moet typen zou ik gillend gek worden.
Zat mensen hebben liever verveling of eentonigheid dan honger.
Er zijn al verschillende voorspellingen dat binnen nu en een jaar of tien het overgrote deel van alle online content kunstmatig gegenereerd zal zijn. De Dead Internet Theory wordt werkelijkheid. Tijd voor een 'Butlerian Jihad'?
Ik denk persoonlijk niet dat het 10 jaar gaat duren. ik gok op iets minder dan de helft daarvan. Generatieve AI is vandaag al goed genoeg om een volledige werkende, goed uitziende site te bouwen en te voorzien van thematische context. en het vervuilt nu al in ernstige mate sociale media. in de strijd om aandacht en adverteer opportuniteit is kwantiteit nog steeds een krachtig wapen. maar het meest verontrustende in mijn ogen is dat met generatieve AI kan koppelen aan een feedback systeem o.b.v. de hoeveelheid aandacht die een artikel kan wegkapen. Laat dit ongecontroleerd zijn gang gaan en je hebt op een bepaald moment een "zombie generator" gecreëerd. Stem het af op bepaalde bevolkingsgroepen en je hebt een oorlogswapen.

[Reactie gewijzigd door manuarmata op 22 juli 2024 22:37]

Thou shalt not make a machine in the likeness of a human mind.
Het lijkt op het eerste gezicht op een goed opgezette website, leest inderdaad ook prettig weg.
Even wat koppen gesneld en ze zijn allemaal heel factueel, het hoofdpunt uit de lede van het persbericht.

Allemaal niks mis mee, maar daarmee is het dan ook wel nogal bloedeloos.

Weinig van het drama en verhalende van sport op deze manier.

Dit berichtje bijvoorbeeld:
https://resport.nl/2023/0...rhalfen-mist-wk-atletiek/

Daar zit wel iets meer in dan het feit zelf. Dat is zowel een persoonlijk drama, als ook een verhaal over het slopende van topsport.

[Reactie gewijzigd door Keypunchie op 22 juli 2024 22:37]

Mediahuis is een Belgische uitgeverij, niet een Nederlandse. DPG is dat ook. De Belgen hebben flink wat acquisities gedaan met dank aan de subsidies die ze van de Belgische overheid hebben gekregen. Niet alleen in Nederland maar ook in Scandinavië.
subsidies voor overnames? hoe dan? staatssteun is in de EU aan stricte regels gebonden.
In België worden kranten niet door krantenbezorgers bezorgd maar door BPost, wat door de Belgische belastingbetaler wordt gefinancieerd. Het geld dat Mediahuis en DPG hiermee hebben bespaard gebruikten ze om media in het buitenland over te nemen. Het gaat hier dus om indirecte staatssteun.

https://www.nporadio1.nl/...an-belgisch-belastinggeld
Opvallend genoeg ontbreekt voetbal als onderwerp op de site.. hmmm wat zal daar de achterliggende reden van zijn?
Een site voor het meer ontwikkelde deel van de bevolking? ;-)
Nee hoor: https://resport.nl/darten/ is er ook.
En https://resport.nl/voetbal/ ook, maar staat (nog?) niet in het menu

[Reactie gewijzigd door driekske op 22 juli 2024 22:37]

Wel opvallend dat ze geen voetbal nieuws hebben, bij uitstek het meest clickbaiterige nieuws wat er is.
Het is er wel:
https://resport.nl/voetbal/
De AI is overigens niet zo van die clickbait titels lijkt het, die geven juist de inhoud goed weer.

[Reactie gewijzigd door dutchgio op 22 juli 2024 22:37]

Je hebt gelijk inderdaad. Wel gek want je kan er niet komen via de frontpage of via het menu bovenin.

Op dit item kan niet meer gereageerd worden.