Dat er betaald moet worden voor copyright sure,
Maar wetende dat the Guardian waarschijnlijk minder dan ~0.00001% van alle trainingsdata is, is wat ze betaald krijgen erg onredelijk.
Hoe kan je dat nou zeggen als je niet weet hoeveel ze daadwerkelijk krijgen. Of heb je inside knowledge?
Vind het een beetje vergaan dat al deze media conglomeraten (want het zijn echt geen kleine spelers die het doen voor persvrijheid hoor, het is puur business) zoveel blijven vragen en zoveel mogelijk de moderne wereld in de weg zitten, zo ook toen ze miljoenen van Google en meta begonnen te eisen omdat hun nieuws "gebruikt" werd terwijl dat ze alleen maar in de hand speelde.
Ze dwingen niemand toch om te betalen? Je hoeft hun product toch niet te gebruiken? Hoe zitten ze de moderne wereld, of jou bijvoorbeeld in de weg? Als hier de media-conglomeraten te veel vragen van de grote AI-reuzen (die natuurlijk op hun beurt nog véél groter zijn dan die media, haha) voor hun product, dan kunnen die AI-reuzen toch prima hun eigen nieuws-content proberen te maken om hun modellen mee te trainen? Daar zitten die media-conglomeraten de moderne wereld toch niet mee in de weg?
Of vind je dat de media-conglomeraten gewoon gratis horen te werken?
Voor mij is dit van the Guardian weer een poging om toch nog wat geld eruit te persen terwijl ze langzaam verdrinken
Nou ja prima toch, laat ze lekker. Heb jij er last van?
Als die AI-reuzen er niet zo onder de indruk van waren geweest, hadden ze natuurlijk niet betaald.
en van OpenAI een soort van copyright washing waarbij ze nu net kunnen doen alsof ze legitieme data gebruiken terwijl > 99.9999% geen cent zal zien voor het gebruik van hun data.
Ja misschien wel. Dit is een heel ander onderwerp natuurlijk opeens. Al schept deze overeenkomst tussen ChatGPT en the Guardian misschien wel een precedent en zullen er steeds meer trainingsdata-makers betaald krijgen voor hun werk in de toekomst.
Mijn vraag is legitiem wat copyright voor LLMs nou redelijkerwijs zou moeten kosten
Iets wat jouw werk niet is geloof ik haha. Of als je dat hier in de commentsectie van Tweakers voor je werkgever probeert te achterhalen, dan gaat er ergens iets fout denk ik.
Ik zou die vraag vooral aan de daadwerkelijk belanghebbenden overlaten (the Guardian en ChatGPT in dit geval).
want ikzelf zie echt geen wereld waarbij copyright houders betaald krijgen wat ze denken dat hun data waard is en AI trainen minder dan honderden miljarden kost.
Oké? Niet per se jouw probleem denk ik?
Juist voor de toekomst is dit heel belangrijk. Die media-conglomeraten zoals jij ze noemt zijn hele grote bronnen van nieuwe informatie (daarom heet het ook 'nieuws'). Elke dag weer. Elke AI die wordt bevraagt over een nieuwtje in de wereld, is voor een heel groot deel afhankelijk van die media-conglomeraten. Waar halen ze anders hun info vandaan?
Ik denk dat ChatGPT het daarom ook helemaal niet erg vindt om iets te betalen aan the Guardian. Zonder het product van media-conglomeraten kan zo'n AI immers nauwelijks een interessant of accuraat antwoord geven op vragen over wat er nu in de wereld gebeurt. ChatGPT zou dan simpelweg minder waard worden.