Verschillende Canadese nieuwsorganisaties hebben OpenAI aangeklaagd voor het schenden van hun auteursrecht. Ze vinden dat het bedrijf hun content misbruikt voor het trainen van ChatGPT. De uitgevers eisen een schadevergoeding en willen dat OpenAI hun artikelen niet langer gebruikt.
Canadese nieuwsorganisaties als Postmedia, The Canadian Press en CBC stellen in hun gezamenlijke aanklacht dat OpenAI 'regelmatig' auteursrechten en gebruikersvoorwaarden schendt door het 'scrapen van grote hoeveelheden content van Canadese media'. Ze schrijven dat het bedrijf geld verdient met hun artikelen, zonder dat ze daarvoor toestemming hebben gegeven of een vergoeding ontvangen.
Ze eisen een schadevergoeding en een deel van de winst die OpenAI heeft gemaakt door het gebruik van de artikelen van de uitgevers. Ze stellen onder meer een vergoeding van 20.000 Canadese dollar (ongeveer 13.500 euro) per artikel dat OpenAI onrechtmatig heeft gebruikt. Ook willen ze dat het AI-bedrijf een permanent verbod krijgt opgelegd om de content van de organisaties zonder vooraf verkregen toestemming te gebruiken.
Een woordvoerder van OpenAI zegt tegen onder andere The Guardian dat de AI-modellen van het bedrijf zijn getraind met openbare informatie en dat dat valt onder fair use. Ook zegt het bedrijf dat nieuwsorganisaties zich hier 'eenvoudig' voor kunnen afmelden als ze dat willen.
Het trainen van machinelearningmodellen op auteursrechtelijk beschermd materiaal is juridisch grijs gebied waar tot op heden nog geen jurisprudentie voor is. In december vorig jaar klaagde The New York Times OpenAI als eerste nieuwsorganisatie aan voor het schenden van zijn auteursrecht. Eerder dit jaar besloten verschillende Amerikaanse nieuwssites en kranten ook een rechtszaak tegen de ChatGPT-maker aan te spannen. Enkele aanklachten zijn al geseponeerd omdat de uitgevers niet konden bewijzen dat ze schade hebben geleden door de vermeende auteursrechtenschendingen. Met verschillende andere nieuwsorganisaties heeft OpenAI overeenkomsten gesloten zodat het bedrijf hun content mag gebruiken voor het trainen van zijn modellen.