Google bevestigt licentiedeal met Reddit voor trainen AI

Google erkent dat het een licentiedeal met Reddit heeft gesloten voor het trainen van kunstmatige intelligentie op basis van content op het forumplatform. Er gaan al een week geruchten rond over een onbekend 'AI-bedrijf' dat in zee zou zijn gegaan met Reddit.

In een blogpost erkent Google dat er een 'verdieping van het partnerschap' met Reddit heeft plaatsgevonden, maar noemt geen financiële details over de deal. Eerder zeiden anonieme betrokkenen dat een bedrijf 60 miljoen dollar had betaald in ruil voor trainingsdata voor AI-modellen. Diezelfde bronnen noemden Google bij naam.

Het bedrijf licht toe dat Reddit gebruik gaat maken van het Vertex AI-cloudplatform van Google om verbeterde zoekfunctionaliteit te kunnen bieden. Tegelijkertijd krijgt Google toegang tot Reddits Data-api waarmee het bedrijf 'in real time gestructureerde en unieke content' van het platform binnenkrijgt. Het bedrijf geeft verder weinig details over wat het met deze gegevens gaat doen: "Met toegang tot de Data-api van Reddit kan Google (...) op basis van verrijkte informatie Reddit-content beter begrijpen en de content tonen, hierop trainen en anderzijds gebruiken." De zoekgigant benadrukt dat de licentiedeal niets verandert aan de huidige manier waarop het openbaar toegankelijke crawlbare content indexeert, gebruikt voor training en toont in Google-producten.

Reddit kondigde in april vorig jaar aan dat partijen voortaan moesten gaan betalen voor het gebruik van de api. Op die manier wilde het platform voorkomen dat er gratis veel data van het platform gehaald kon worden, bijvoorbeeld om AI-modellen te trainen. Vanwege de verhoogde kosten moesten sommige thirdpartyapps noodgedwongen stoppen. Het nieuwe api-beleid ontketende een grote hoeveelheid protesten vanuit gebruikers, app-makers en moderators van het platform.

Door Yannick Spinner

Redacteur

22-02-2024 • 21:08

66

Reacties (66)

Sorteer op:

Weergave:

Mooi voor Google, maar geen winst voor de privacy.

Wat willen ze eigenlijk met de user content van Reddit? Het zijn voornamelijk verhalen over prive zaken, memes, video en audio en p0rn.

Er zal best wel iets bijzitten, maar de zoekmachine verbeteren, is zoals Google dat zegt Advertentie features in de Privacy settings toebehoren.
Ze willen hun AI trainen.
Die leidt nu soms tot behoorlijk bizarre resultaten.
Bijvoorbeeld als een 'Diversiteits-instelling' (oid) erg strak is opsgechroeft en een gebruiker dan vraagt om een afbeelding van; "Duitse soldaten 1943" of "Viking".
Lees;
https://www.theguardian.c...after-ethnicity-criticism

[Reactie gewijzigd door Baserk op 22 juli 2024 20:12]

Klopt, maar op pauze wilt niet zeggen stoppen.

Ze gaan door met het trainen van het AI model, en over een paar jaar kan het echt wel goed/beter koppelen.

Niet alleen Google, ook Microsoft gaat vol voor dit model. Het is semi gebaseerd op een echt profiel, en dan mag het opeens. Dus inplaats van je eigen, kiezen ze uit de beste drie met overeenkomsten van je eigen eigenschappen.

Het is best eng en vooruitstrevend. Zo zou je ziektes eerder kunnen opsporen, of makkelijker groepen eruit kunnen halen. Maar ja, uiteindelijk heb je daar altijd mensen die het gebruiken voor minder leuke doeleinden.
Ik denk niet dat dit door een doelbewuste actie is ontstaan, om te kijken of je zo ranzige of weird mogelijke zooi kan creëren.
Jack Krawczyk, a senior director on Google’s Gemini team, had admitted on Wednesday that the model’s image generator – which is not available in the UK and Europe – needed adjustment.

“We’re working to improve these kinds of depictions immediately,” he said. “Gemini’s AI image generation does generate a wide range of people. And that’s generally a good thing because people around the world use it. But it’s missing the mark here.”
Dit lijkt me gewoon een brute 50/50 man/vrouw verhouding aanhouden, en de gemiddelde wereldbevolking verdeeld over 4 personen tonen. Met dus een Afrikaanse en Aziatische Duitse soldaat. En 2 vrouwen. In 1943.
Of je krijgt een 'Polynesische viking'.
So much for any intelligence.

[Reactie gewijzigd door Baserk op 22 juli 2024 20:12]

Dat komt doordat AI nog niet zo goed weet wat ermee te doen.

AI werkt doordat je er steeds data in blijft pompen. Vergelijk het met een baby die gaat lopen. Het krijgt daarbij hulp, maar uiteindelijk leert het lopen.

Er is een filmpje op YouTube waar je dit principe heel erg goed ziet, ook hoelang het duurt (nog erg lang), maar uiteindelijk gaat het model zelf lopen en kan het zelfs trappen lopen, zonder dat iemand hem ooit heeft gezegd hoe.

Dus ja, nu nog hopeloos, maar straks niet meer. Het leert vanzelf, dat is het idee.

[Reactie gewijzigd door HollowGamer op 22 juli 2024 20:12]

Dat komt doordat AI nog niet zo goed weet wat ermee te doen.
AI heeft hier geen probleem mee. Het zijn de instellingen van het overdreven 'inclusieve' Google die er een zootje van maken.

Nog niet zo lang geleden hadden we een artikel over hoe 'stereotyperend' en vooral niet-divers de resultaten van onspecifieke prompts met bijv. een nationaliteit wel niet waren.
Uiteraard is het lichtelijk idioot om een resultaat te verwachten dat realistische statistieken weerspiegelt als een model getraind wordt op datasets die die informatie niet bevatten.
Als er bij een totaal ongenuanceerde prompt als 'een Amerikaan' een realistische doorsnede van de Amerikaanse bevolking wordt verwacht dan is het niet alleen een kwestie van 'data pompen' maar van de juiste, specifieke data pompen.

Duitse soldaten in 1943 waren blanke mannen en er is geen dataset die iets anders beweert en geen mogelijkheid dat een AI 'niet zo goed weet wat ermee te doen' omdat er simpelweg geen keus is.
De 'diversiteit' is er keihard in geprogrammeerd net zoals zoekresultaten niet consequent de werkelijkheid weerspiegelen als die een specifieke bevolkingsgroep negatief belichten.
Ik weet niet waarom je een min stem hebt.
De reden dat dit mis gaat is inderdaad een geforceerde inclusiviteit. Ze hebben gewoon hard er in gezet dat iedere generatie verschillende huidskleuren/etniciteiten moet hebben en ja, dan zie je gelijk dat dit geen denkende AI is maar gewoon een slimme tool.

Wat ze/we in werkelijkheid nodig hebben is een fatsoenlijke en inclusieve dataset zodat het aan de voorkant rechtgetrokken wordt.
Die Jack heeft nogal witte mensen haat, dus of het toeval is..
https://x.com/SmirkingJoseph/status/1760652254925705264?s=20

Edit: ik stond tot net nog op +1 en de comments onder mij op -1. Nu heeft iedereen onder mij 6x +1 er bij en ik 6x-1 er bij. Dit is geen toeval meer.

[Reactie gewijzigd door Rogers op 22 juli 2024 20:12]

Hoezo haat? Er staat geen gelogen woord bij. Het zegt eerder iets over jou dat je dit witte mensen haat noemt.
Erkennen dat er een problematiek is, zeker in de VS, is hetzelfde als witte mensen haten?
Wat een vreemde comments onder de tweet, de poster lijkt wel een aardig anti woke publiek aan te trekken. Terwijl er niks mis is met het erkennen dat als blank persoon (zeker man) je het systematisch beter hebt.

Gaat dat gemini biased maken, nou niet hierdoor. Eerder door wat er op internet geroepen wordt.
Dat is helemaal niet meer zo... Als je als blanke man acteur wil worden heb je nu al duidelijk veel minder kansen. En op sommige plaatsen is dit op de werkvloer ook al zo.
Past perfect bij reddit dan.
Als je gewoon naar de homepage gaat, wat ik overigens niet aanraadt, krijg je veel bagger te zien. Maar op vele subs vind je wel vaak handige antwoorden op vragen die men in het verleden van ouderwetse fora, quora, stack exchange ed had gehaald. Ikzelf i.i.g. wel.

Overigens zal het mij een worst wezen wat Google ermee doet, maar tot dusver kun je denk ik wel stellen dat ze een inhaalslag te maken hebben als we kijken naar wat de concurrentie biedt.

Verder nog als toevoeging, ben zelf Reddit een stuk minder gaan gebruiken sinds het hele api gebeuren. Niet dat ik daar nou zo wakker van lag, maar vond het eigenlijk wel een goede manier wat minder rond te hangen op die site. Gewoon nooit de app geïnstalleerd. Kom er nu nog zo nu en dan via de browser direct, paar specifieke communities, of soms via Google. Als iemand overigens ook gek wordt van die melding de app te installeren, dan moet je gewoon request desktop site kiezen in je browser en dat die dat onthoudt, ben je ervan af. Wellicht lichtelijk afgedwaald hier maar kwam er zelf achter onlangs en dacht wellicht handig te delen.

[Reactie gewijzigd door i7x op 22 juli 2024 20:12]

Ja, snap ook wat je bedoelt.
Als je op Google iets intypt, bijvoorbeeld met een vraag over iets, dan staat daar vaak Reddit als suggestie achter.

Bijvoorbeeld: best cat food reddit

Alleen krijg je dan user data in je AI model. Zowel goede als slechte suggesties.

Ik vergelijk het met Google en YouTube, veelal loop ik rondjes of duurt het even voordat ik de juiste behulpzame antwoord te zijn krijgt.

Snap de opzet, alleen weten grote groepen het niet altijd beter. Daarmee doel ik vooral op de gevoelige onderwerpen (medisch, oorlogen, actualiteit, etc.). Dus of het uiteindelijk iets oplevert of juist vervuilend werkt, wil ik nog wel zien.
Wat zijn de privacy gevolgen in dit geval? Of welke impact heeft het? Reddit is een open platform waar alles publiekelijk toegankelijk is. Is de verwachting dat ze usernames en profielen gaan koppelen aan hun Google profielen van gebruikers bijvoorbeeld?
Dit zouden ze kunnen doen, of iemand anders zou dat mogelijk kunnen.

Je moet niet vergeten dat AI erg slim en efficiënt werkt. We hebben bijvoorbeeld allemaal een soort van schrijfstijl, sommige gebruiken woorden vaker of juist niet/, leestekens gebruik, tekst opbouw, emojis.. , dus ik verwacht dat AI bijvoorbeeld uit een groep van 10 mensen, redelijk goed kan voorspellen wie iets zogenaamd anoniem heeft geschreven.

In theorie zouden ze dus dit wel achter de schermen kunnen doen, of fake profielen kunnen maken, die wel veel overeenkomsten hebben met je eigen karakter. Alles onder het mom van aanbevelingen en verdienen, en dat is best eng.
Alles wat je op Reddit zet is openbaar, dus hoezo privacy?
Je kunt op Reddit aangeven dat je niet gevonden wilt worden, zowel op hun eigen platform en via Google. Uiteindelijk bepaald de bot of je geïndexeerd wordt, voor OpenAI boeit het niet zoveel. ;)

Met privacy bedoel ik, dat Google mogelijk een profiel/model van iets kan opbouwen om daar connecties makkelijker mee te leggen.

Dat betekent minder privacy, want Google krijgt ook door je gedrag op Reddit, een beter beeld van hoe jij mogelijk bent of wat je interessant vind.

Vergeet niet dat we pas gaan zien wat er met AI allemaal kan. Het is nu nog redelijk kinderspel (zacht uitgedrukt), maar Google (en al die andere) hebben grote ideeën met deze/onze data, die ook op andere platforms staan.
Ik snap wat je bedoelt, maar zolang je dingen publiekelijk online plempt, is er überhaupt geen sprake van privacy, AI of niet. Als privéberichten ook mee zouden worden genomen in de data die naar Google gaat zou het iets anders zijn, maar volgens mij is dat niet het geval.
Oh, daar ben ik het helemaal mee eens.

Iets als anonimiteit online bestaat niet. De netwerken die dat beloven, neem ik met een korreltje zout. Er wordt altijd wel iets gelogd, als is het iets waar je zelf geen controle op hebt.
Mooi voor Google, maar geen winst voor de privacy.
En wat is er juist anti-privacy? Reddit is sowieso al publiekelijk toegankelijk. Elke crawler is er al doorgegaan. Als ze uw data wilden scrapen is dat al lang gebeurt. Niets nieuw onder de zon.

Wat Google hier exact mee wil bereiken is natuurlijk lastig te achterhalen maar er is veel te doen rond AI training en licenties. Het is aannemelijk dat Google een licentie op trainingsdata wil afnemen om geschillen te voorkomen.
Er zit heel veel vraag/antwoord content op reddit en dat is belangrijk voor taalmodellen. Van dialoog in publiek domein boeken en wikipedia gaat het lang niet zo veel leren voor vraag/antwoord toepassingen.

Reddit, quora, stackoverflow, facebook en twitter zijn de belangrijkste licenseerbare datasets op het internet.
Is er een manier hoe Google hier effectief de goede/juiste data en bronnen uit kan filteren in plaats van simpelweg alle data over te nemen of niet?
Is er een manier om goede/juiste info te vinden? Ik vrees er voor...
Het verklaart wel waarom Gemini zo racistisch is. Het hoofd van Gemini is een Reddit gebruiker die veel racistische posts heeft gemaakt. Hij heeft zijn Linkedin geblokkeerd vanwege alle opmerkingen van andere mensen over zijn racistische uitlatingen.

Gemini is echt gigantisch fout. Niet alleen door gigantisch racistisch te zijn, maar ook om de geschiedenis te verdraaien waardoor je niet meer kunt vertrouwen dat wat de bot zegt, waar is. Er zijn regels voor de bot ingesteld die openlijk racisme promoten. Combineer dat met het nieuws dat Google News alle betrouwbare nieuwsbronnen weg haalt en bijna alleen nog extreem partijdig nieuws laat zien, vol met foute berichtgeving, laat zien wat Google aan het doen is. Ook heeft YouTube aangegeven dat ze journalisten van het platform gaan weren.

Ik snap wel dat ze met hun oude lijfspreuk "don't be evil" gestopt zijn. Vooral het "don't" is weg.
Wat? Ik ben niet critisch genoeg als het gaat om google, vast en zeker!

Geef meer details alsjeblieft!
Ze hebben Gemini doelbewust geprogrammeerd (als je het vraagt, zegt de bot het ook) om bepaalde "rassen" naar voren te zetten en andere rassen weg te halen uit de resultaten. Als je vraag om Vikingen te laten zien, krijg je mensen van Afrikaanse afkomst, als je vraagt om nazi's te laten zien, krijg je Chinese vrouwen in Nazi uniformen. De tekst resultaten zijn ook gigantisch fout, weigert werkelijke resultaten te geven, alles is bewust verziekt zodat je nooit realistische resultaten krijgt. ChatGPT deed dat al in mindere maten, maar Gemini is echt gigantisch fout.
Kortom Google heeft een grote klap aan data gekocht van Reddit om te gebruiken en vervolgens weer door te verkopen aan klanten die deze data zelf gegenereerd heeft zonder daar een vergoeding voor te ontvangen. Volgens mij gaat hier iets goed fout.
Wat gaat er fout? Niemand heeft belooft dat je vergoed kan worden voor het plaatsen van comments op Reddit, Youtube or zelfs hier op Tweakers. Het was allang bekend dat je internet aanwezigheid volkomen nutteloos is voor je zelf (tenzij je een e-celeb bent natuurlijk).
Dat dergelijke transacties überhaupt kunnen plaatsvinden zonder ondubbelzinnige, expliciete toestemming van de mensen die deze data gegenereerd hebben. Wat mij betreft wordt dergelijke handel gewoon verboden.
Tweakers verdient toch ook geld op content die jij, ik en iedereen maakt? Van gebruikersreviews, forum posts tot reacties.

Als Tweakers straks verkocht wordt aan een andere mediagroep gaan ze weer langs de kassa zonder dat jij daar ooit 1 cent van ziet, zonder toestemming van mensen die de data hebben gegenereerd.

Wat is het verschil? Juist. Geen.
Ik vind dan ook dat ook Tweakers een ereschuld heeft. Niet per se op individueel niveau, maar wel de community als geheel. Ik vind ook dat ze daar invulling aan dienen te geven. Helaas doen ze dat naar mijn mening onvoldoende.
Net als in alle voorwaarden voor websites die ik altijd accepteer zonder uberhault maar te lezen, staat er voor reddit in dat ze een licentie voor onbeperkte tijd krijgen voor de content gegenereerd door gebruikers voor niet nader te bepalen doeleinden.

Bovenstaande zou sarcastisch zijn, mits het niet de waarheid was.

edit: het is de waarheid: https://www.redditinc.com...ent-september-12-2021#EEA
You retain any ownership rights you have in Your Content, but you grant Reddit the following license to use that Content:

When Your Content is created with or submitted to the Services, you grant us a worldwide, royalty-free, perpetual, irrevocable, non-exclusive, transferable, and sublicensable license to use, copy, modify, adapt, prepare derivative works of, distribute, store, perform, and display Your Content and any name, username, voice, or likeness provided in connection with Your Content in all media formats and channels now known or later developed anywhere in the world. This license includes the right for us to make Your Content available for syndication, broadcast, distribution, or publication by other companies, organizations, or individuals who partner with Reddit. You also agree that we may remove metadata associated with Your Content, and you irrevocably waive any claims and assertions of moral rights or attribution with respect to Your Content.

[Reactie gewijzigd door Dorank op 22 juli 2024 20:12]

Precies, dergelijke voorwaarden hebben wat mij betreft dan ook geen enkele waarde. Vrijwel niemand leest die juridische onzin en als iemand een poging waagt is het vaak niet eens fatsoenlijk te begrijpen.
Omdat niemand het leest is het waardeloos? Juridische onzin? De tekst is toch heel duidelijk. Heb je een bron die jouw standpunt jurdisch ondersteund?

Gebruikers gaan er expliciet mee akoord en dienen aan te geven dat ze het gelezen hebben. Reddit krijgt daarmee rechten om de door jouw gegenereerde content te gebruiken zoals bv voor AI training doeleinden door derden.
Wat mij betreft wel. Persoonlijk hecht ik er gewoon geen waarde aan, daar heb ik verder geen bron voor nodig, want dat ben ik zelf. Dat dat juridisch anders zit en dat Reddit en Google daar dan ook een slaatje uit slaan dat mag duidelijk wezen.

Ik heb gewoon een héél ander idee bij ergens akkoord mee gaan. Mensen die (vaak zelfs doormiddel van dark patterns) op een knop drukken om die ook in hun ogen juridische onzin weg te klikken gaan in mijn ogen helemaal niet akkoord. Ik zou ze eerder ontoerekeningsvatbaar noemen om in enigszins juridische termen te blijven. Bovendien is er mijns inziens ook geen gelijkwaardige onderhandelingspositie over de voorwaarden waarop een overeenkomst tot stand komt en is dat voor mij ook een reden om het niet serieus te willen nemen.

Ik betreur dat er geen wet en regelgeving bestaat die een consequentie vrije opt-in vereist voor het mogen verhandelen van dergelijke data. Dat lijkt mij meer redelijk dan hoe het nu gaat.
Dus volgens jou is een contract dat je niet leest, ook al verklaar je dat je het wel gelezen en goedgekeurd hebt, niet geldig.
Op die manier ondergraaf je wel elke overeenkomst, en kan je niets of niemand meer vertrouwen, en is niemand meer veilig voor allerlei oplichting en fraude.
Als er sprake is van dergelijke ongelijke machtsverhoudingen en er een overduidelijk gebrek is aan regulering wel.

Een overeenkomst met gelijkwaardige partijen vind ik een héél ander verhaal. Er is ook niet voor niets consumenten recht, maar de wet en regelgeving lopen altijd achter de feiten aan.
Google verkoopt geen data, dat is zo niet waar. Googles business draait om data maar ze verkopen dat niet want dan zou iedereen kunnen doen wat zij doen.

Google verkoopt advertenties, en gebruikt data voor personalisatie van hun producten. Die data wordt gebruikt voor hun profielen.
Ik bedoelde dat ook op een indirecte wijze. Vrijwel iedereen die er zich enigszins in heeft verdiept weet wel hoe Google dergelijke data inzet.

Nu moet ik wel zeggen dat dergelijke AI toepassingen mogelijk een behoorlijk ander business model krijgen als andere meer reguliere producten en diensten van Google.
Helaas, ook Reddit wordt verknald. Dag Reddit
Hoe zo?

Vergeet niet dat Reddit een commerciële partij is, zo’n financiële injectie is daar vast welkom. Persoonlijk vind ik 60 mio, “peanuts” voor deze data/info, maar dat is andere kwestie.

De info/data was al inzichtelijk voor Google (eva), maar nu wel netjes dat het in overleg gaat. En dat bedrag is echt een schijntje.

De data van Reddit (of x) is zeker erg waardevol voor een “AI”-projectje :+

De weerstand tegen de kosten voor gebruik api vind ik begrijpelijk, ook de actie om “op zwart” te gaan.

Echter onderaan de streep, heb niet de indruk dat er (voor mij als regular $user) iets concreet veranderd is. Zelfde “tendens” lees je over Twitter/x, ook daar lijkt de impact van een “klein” clubje beperkt.

Maar zie niet direct in hoe Google (of andere toko) welke publieke data van Reddit gebruikt resulteert in een “verknald” platform.
https://youtu.be/48AOOynnmqU - als je dit filmpje eens bekijkt, dan zie je hoeveel Google leunt op Reddit.

Het is best gek dat Reddit dus akkoord gaat met maar 60 miljoen, want ze zijn Google al flink aan het inhalen met traffic.

Voor Reddit kan het twee kanten opgaan:
- Meer traffic, want mensen zien hoe goed Reddit je antwoorden geeft
- Ten onder gaan, aangezien Google dit gebruikt in hun eigen zoekmachine of platform.

Ik ben bang voor het laatste. Google is niet meer dat schattige internet bedrijf, ze zijn groot en willen overleven.
Google mist community zou ik dan denken?
Ja, dat is hun grootste probleem en uitdaging inderdaad.

Ze hebben de groepen die hun diensten gebruiken en apparaten van hun kopen, maar de communicatie vind niet meer alleen plaats op een gastenboek of forum, maar op social media als Instagram, Reddit, Twitter/X, .. die daarom ook steeds vaker vereisen dat je eerst een account maakt voordat je content ziet, met daarin bepaalde voorwaarden dat je niet scraped bijvoorbeeld.

Ze hebben nog genoeg andere manieren, maar niet zoals Facebook/Meta en Reddit dat bijvoorbeeld wel hebben. Die zelf opbouwen heeft geen zin, dat hebben ze al te vaak geprobeerd.
Was al verknald. Kan de meeste content die er op verschijnt niet echt hoogwaardig noemen, zelfs in subs over doodnormale dingen als flightsim doen mensen vervelend als een eenvoudige vraag wordt gesteld. Kijk er ook nooit meer op
Hoe lang voordat alle reacties, reviews en andere data op Tweakers verkocht gaat worden aanbig tech voor AI?
Al die data is al openbaar, en DPG (het moederbedrijf van T.net) staat ook niet stil. Ze verkopen nu al leuk je data met tracking (zie recent plan) en ik verwacht nog meer integratie met hun moederbedrijf onder een paraplu.
Bestaad A.I niet al since DVD of CD of Floppy ?

[Reactie gewijzigd door jofrie op 22 juli 2024 20:12]

ja ai bestaat al heel lang en krijgt elke zoveel jaar weer een heropleving (want het is lekker vaag dus je kan er veel geld voor vragen)
Los van het hele aspect privacy denk ik dat je een model niet zou moeten trainen met de kwaliteit data die er op Reddit staat.
Daar krijg je wel originele gedachtenpatronen mee gegenereerd aan de andere kant.
Even een braindump, maar volgens mij onderschat ik hoe groot en belangrijk Reddit is?

Ik kom er bijna alleen via dumpert en nooit echt de sub reddits ingedoken.

Ik sta van zo’n deal dan ook te kijken maar er zal wel wat voor ze inzitten. Is het niet dat OpenAI dit al jarenlang gratis gedaan heeft?
Jarenlang is iedereen in de online industrie te laf geweest om hun tech bro vriendjes in de AI industrie af te rekenen op hun kopieren. Tot op zekere hoogte is dat nog steeds zo, maar als NYT wint is dat over.

Of OpenAI het gratis deed of het onmogelijk duur gaat worden achteraf is nog te bezien.
Best bijzonder aangezien Sam Altman (van OpenAI) grootaandeelhouder is van Reddit. Blijkbaar hoeft OpenAI zelf geen gebruik te maken van die data.
OpenAI zet in op fair use in Amerika, met een gokje dat de EU daar dan wel achteraan hinkt als het VS hoofdgerechtshof hun uitspraak doen. Dan kunnen ze op het moment niet echt licenties nemen, dat laat zwakte zien.

Google doet waarschijnlijk een gokje met het opbouwen van een gelicenseerd taal model (zoals Adobe dat doet voor beeld generatie). Als OpenAI verliest hebben ze dan de markt.

[Reactie gewijzigd door Pinkys Brain op 22 juli 2024 20:12]

Op dit item kan niet meer gereageerd worden.