TNO gaat het Nederlandse AI-model GPT-NL trainen op nieuwsartikelen van NDP Nieuwsmedia. De organisaties sluiten een samenwerking waarbij NDP een deel van zijn archief beschikbaar stelt aan het Nederlandse onderzoeksinstituut. Ook persbureau ANP sluit zich aan bij het collectief.
In een persbericht schrijft TNO dat NDP Nieuwsmedia een 'omvangrijk deel' van zijn archief van meer dan dertig landelijke en regionale nieuwstitels beschikbaar stelt om het model te trainen. In totaal gaat het om 20 miljard tokens. Daardoor verdubbelt de hoeveelheid hoogwaardige Nederlandse data waarop het model wordt getraind, verwacht TNO. Onder meer De Telegraaf, NRC Handelsblad, het Algemeen Dagblad, Het Parool, Trouw, de Volkskrant, NU.nl, RTL Nieuws en De Groene Amsterdammer zijn lid van de brancheorganisatie.
TNO claimt dat het de eerste keer is dat nieuwsuitgevers op deze manier samenwerken met een organisatie om een AI-model te ontwikkelen. De onderzoeksorganisatie belooft dat gebruikers artikelen niet zomaar 'via een technische weg' uit het model kunnen halen. Zodra het model op de markt komt, ontvangen de uitgevers 'een passende vergoeding'. Hoeveel dat precies is, is niet bekend.
GPT-NL is een initiatief van de non-profitorganisaties TNO, het Nederlands Forensisch Instituut en SURF. De organisaties ontwikkelen het model met subsidie van de Nederlandse overheid en zijn in juni begonnen met de training van GPT-NL met de Nederlandse supercomputer Snellius. Het taalmodel wordt specifiek ontwikkeld om teksten te kunnen samenvatten, versimpelen en er informatie uit te halen.