Ontwikkelaar haalt taalmodel GEITje offline na verzoek Stichting Brein - update

Het Nederlandse AI-taalmodel GEITje is offline gehaald op 'dringend verzoek' van Stichting Brein. GEITje zou volgens Brein deels getraind zijn op documenten uit de dienst Library Genesis, die afgelopen zomer is geblokkeerd.

Brein zegt dat het model is getraind met tienduizenden Nederlandstalige boeken die afkomstig zijn uit een illegale bron, namelijk Library Genesis, die afgelopen zomer op verzoek van Brein is geblokkeerd door Nederlandse accessproviders. De illegaal verkregen documenten en e-books waren waarschijnlijk terug te vinden in Gigacorpus, de dataset die afgelopen zomer door de maker zelf offline is gehaald. Gigacorpus bevatte naast boeken ook andere Nederlandstalige data, zoals wetsartikelen en uitspraken van Rechtspraak.nl.

"Brein is niet tegen het trainen van AI, maar vindt wel dat de auteurs van al die muziek, boeken etc. daarvoor een eerlijke vergoeding moeten krijgen. Indien de oorspronkelijke makers niet willen dat hun materiaal voor het trainen van AI wordt gebruikt, dan moet dat ook gerespecteerd worden", schrijft de stichting.

De ontwikkelaar van GEITje verweerde dat tekstdatamining is toegestaan voor wetenschappelijke doeleinden en dat het model door wetenschappers wordt gebruikt, volgens Brein. De stichting wijst er echter op dat het model ook voor commercieel gebruik openbaar werd aangeboden op Huggingface.co. "De AI Act schrijft voor dat wetenschappers rechtmatig toegang moeten hebben tot materiaal om het te mogen gebruiken voor het trainen van AI. Dat is niet het geval als bij het trainen van een model gebruik is gemaakt van evident illegale bronnen", aldus Brein.

GEITje-maker Edwin Rijgersberg, op Tweakers bekend als E_Rijgersberg, bevestigt in een eigen post dat het taalmodel eind 2023 getraind is op gedeelten van het Nederlandse Gigacorpus. Brein heeft tegen Rijgersberg gezegd dat volgens de geldende wet- en regelgeving GEITje daarom offline gehaald moet worden.

"Ik ben door auteursrechtenexperts ervan verzekerd dat dit niet zo zwart-wit is als gesteld, maar ze vertellen me ook dat er nog veel juridische vragen in Europa hierover onbeantwoord zijn. Ik kan het me niet veroorloven om een lange en vooral zeer dure rechtszaak te voeren om die vragen wel beantwoord te krijgen. GEITje is immers een niet-commercieel, wetenschappelijk hobbyproject. Daarom voldoe ik aan het verzoek van Brein.(...) Ik had gewild dat GEITje voor wetenschappers beschikbaar bleef om de wetenschappelijke reproduceerbaarheid van hun onderzoek te kunnen garanderen. Maar helaas: gesprekken daarover met Brein zijn op niets uitgelopen", verklaart Rijgersberg.

Aanpassing, 11.00 uur - In een eerdere versie van het artikel stond dat Gigacorpus door de rechter als onrechtmatig werd bevonden en door accessproviders is geblokkeerd. Het ging echter om Library Genesis, niet om Gigacorpus. Gigacorpus is door de maker zelf offline gehaald afgelopen zomer. Daarom is het artikel aangepast.

Door Loïs Franx

Redacteur

28-01-2025 • 10:15

191

Reacties (191)

Sorteer op:

Weergave:

Ik ben nu heel erg benieuwd wat Brein aan het doen is tegen OpenAI, Anthropic etc die duidelijk ook getraind zijn met auteursrechtelijk beschermde gegevens.

En om dan ook nog even verder te redeneren - Europa moet heel snel iets gaan verzinnen om te bedenken hoe ze dit gaan regelen. Want nu worden we op kunde gebied voorbij gestreefd door de VS en China (of dat zijn we allang), maar we hebben geen strategie om er iets aan te doen. Je kan het er mee eens zijn dat dit materiaal niet gebruikt mag worden maar aan de overkant de de plas gebruiken ze wel degelijk onze data. Dus of het moet wel mogelijk worden of Europa met OpenAI etc verbieden onze gegevens te gebruiken en / of een dikke rekening presenteren.

Zoals het nu is is er geen "level playing field" en schiet Brein, met een ietwat dubieuze aanwijzing, Europa keihard in de voet. M.a.w. we helpen ons zelf om zeep.
De daadwerkelijke vraag is een morele:

Hechten we meer waarde aan onze normen, waarden en wetten, dan aan een kapitalistische wetteloosheid om technische vooruitgang na te streven?
Nee dat ben ik niet met je eens. De vraag is hoe houden wij onze normen, waarden en wetten in stand terwijl we ons ook ontwikkelen. Europa zou b.v. kunnen zeggen: een faire vergoeding voor het gebruik voor training van AI is X. Dit moeten alle partijen betalen die een dergelijke training doen. Versimpel het model: het moet gestort worden in Y en rechthebbenden kunnen er daar aanspraak op maken. Zoiets. Dat zorgt dat wetenschappers nog steeds aan de gang kunnen en ondernemers kunnen ondernemen.

Nu komt het clubje als Brein die zegt je overtreed auteursrechten (al dan niet terecht) dus je moet stoppen. GEITje doet dat, maar OpenAI niet. Moreel verliezen we dus, want OpenAI deelt onze normen en waarden niet, maar genereert wel de kennis en wij nu niet. Ook niet de kennis hoe we dit goed moeten doen binnen onze normen en waarden.
Hangt af van je normen en waarden. Copyright kan je ook zien als onderdeel van een kapitalistische dictatuur (om het even dik aan te zetten), en het omzeilen daarvan als moreel rechtvaardig.
Auteursrechten waren oorspronkelijk bedoeld om de maker van iets financieel te belonen. Om het helemaal af te schaffen worden uitvinders en dergelijke gestraft, het moet eigenlijk helemaal op de schop en er moeten limieten aan zitten.
Dat weet ik. Dat is het model van kunstmatige schaarste. Een werk kan je kopieren en zeker digitaal is het dus in theorie overvloedig. Maar door daar een beperking op te zetten wordt het schaars, en dan kan je geld vragen voor toegang. Een soort tol betalen. Is dat rechtvaardig? Misschien. Is het kapitalistisch? Absoluut. Zou het afschaffen van copyright tot makersarmoede leiden en een stagnatie van creatieve werken? Geen idee, ik kan me voorstellen dat er ook andere verdienmodellen mogelijk zijn en veel makers zich niet zullen laten tegenhouden.

Ik wil niet eens beargumenteren dat copyright slecht of immoreel is. Waar het me om gaat, is dat je een weldenkend en ethisch mens kan zijn met normen en waarden, en tegelijk tegen het bestaan van copyright en patenten zijn. De hele FOSS beweging is op een vergelijkbaar fundament gebaseerd en gemotiveerd door waarden. Dat is iets anders dan 'wetteloze piraterij' uit egoisme.
Tsja, omdat de huidige AI de technieken nog niet heeft om je "normen en waarden" en copyrights te kunnen respecteren, moeten we het meteen dichtgooien.

Of....... zou Brein in plaats daarvan, samen kunnen werken naar een mooi toekomst om deze mogelijkheid te kunnen realiseren? Dit zou een gat in de markt kunnen vullen en je kan met mooie voorbeelden, iets moois aan de wereld kunnen presenteren om dan vervolgens iets te kunnen veranderen.

Nee, zo menselijk denken ze niet en ze zijn zeker niet vooruitstrevend op de techniek. Het moet gaan zoals zij dat willen, en zo niet, dan weg ermee!

[Reactie gewijzigd door izamani op 30 januari 2025 11:39]

Veruit de meeste Nederlanders die ik zie reageren onder bijvoorbeeld gerelateerde NU.nl-artikelen zijn inmiddels pro China wat betreft goedkope producten en AI tools. Die geven dus inderdaad geen moer om onze regels en zijn er inmiddels van overtuigd dat China gewoon veel "slimmer" is, in plaats van dat het maling heeft aan kwaliteitseisen en auteursrecht. Best een zorgelijke trend.
De wereld hangt aan elkaar van zorgelijke trends tegenwoordig. Helaas moeten we in grote lijnen constateren (IMHO) dat het westen ten onder aan het gaan is aan het kapitalisme, het morele faillissement is ook al niet meer af te wenden en het hoge paard waar we opzitten is ten dode opgeschreven - maar puur als entertainment trekken we er nog even aan. Goed voor de kijkcijfers.
Alsof Amerika zo geweldig is. Ik vraag me af waar we bnger voor moeten zijn. Voor China of Amerika. En dat er bij ons zo makkelijk een heel leuk en leerzaam project zoals Geitje de nek wordt omgedraaid is minstens zo zorgelijk.

Tot zover het vrije westen dus.
Ik volg niet goed hoe "kapitalistische wetteloosheid" zo belangrijk zou zijn.
Kapitalisme beperkt al eeuwen vooruitgang door absurde restricties o.b.v. auteursrecht, patenten, enz..
Wat boeit het de schrijver van een boek of zijn werk één keer meer wordt afgenomen bij een winkel, uitgever of online dienst?
Een winkel, uitgever of dienst die gebruikt wordt voor AI zal er financieel iets vrolijker van worden omdat het een grotere verzameling betreft. Maar alsnog is dat eenmalig.
Waar men werkelijk bang voor is is het potentieel van AI om op basis ervan alles te reproduceren waarmee het verdienmodel van de hele keten omver valt.
Het probleem zit 'm niet in het leren van AI. Er moeten grenzen en regels opgesteld worden over wat AI kan produceren.
"één keer meer wordt afgenomen"
Het punt is dat alles dat digitaal gecreëerd wordt zonder auteursrecht (of patenten) slechts één keer kan worden uitgegeven (en dus verkocht) en daarna wordt het gekopieerd en in AI opgenomen. Dus een journalist spendeert 800 uur om een boek te schrijven. Eenmaal uitgebracht heeft hij/zij geen inkomsten, geen vergoeding meer voor zijn/haar werk omdat het niet beschermd wordt. Het loont dan niet meer om een boek te schrijven tenzij zo'n boek verkocht kan worden voor 40.000,- als reële vergoeding voor het gedane werk.

Auteursrecht is belangrijk voor alles dat digitaal gecreëerd wordt. Er wordt zo makkelijk gedaan over digitale content, maar dat zijn vast alleen stemmen van mensen die niets digitaals creëren en niet weten wat voor investering vooraf gaat aan het uitbrengen van literatuur, journalistiek, grafische kunst of muziek. Het zelfde geldt voor AI.

Op den duur zal het alleen nog maar rendabel zijn om met AI digitale content te genereren, het einde van originele creaties.
Het wordt tijd dat BREIN een andere naam kiest...... volledig eens met smooc. De verhoudingen liggen verkeerd, en BREIN is niet bepaald een hulp in de goede richting.
Brein is in mijn ogen een stichting die vooral bestaat om zichzelf in stand te houden. De slag tegen het verspreiden van materiaal hebben ze toch allang verloren en dus vechten ze nog wat tegen laaghangend fruit. Dat levert blijkbaar een mooi salaris op en hier en daar wat geld voor rechthebbenden.

[Reactie gewijzigd door MornixRS op 28 januari 2025 14:58]

Stichting, maar volledig mee eens.
Dank. Ik heb het aangepast.
Ik ben nu heel erg benieuwd wat Brein aan het doen is tegen OpenAI, Anthropic etc die duidelijk ook getraind zijn met auteursrechtelijk beschermde gegevens.
Die hebben een heel leger van advocaten en dergelijke dan moet Brein een afweging maken en jaren procederen, oftewel dikke pech voor ze.
Mistral is een van de grote spelers op AI gebied, open source en van Europese bodem. Hier moet gewoon meer funding naar toe. Maar om nou te zeggen dat we er in Eu niets aan doen om concurrerend te zijn...
Ik denk dat als iemand zich niks van auteursrechten of iets aantrekt dat China wel is. En als je niet beperkt bent door enig moraal besef dan kun je snel stappen maken. Het kost blijkbaar ook een stuk minder geld als je gewoon het internet leegtrekt, of die data nou van een opensource wiki afkomt of vanaf een database die één of ander bureautje in een land als illegaal bestempeld, daar maken ze zich daar niet druk om.

Dat zal met de grotere jongens van OpenAI, google of microsoft vast wel wat beter geregeld zijn. Maar als je maar diep genoeg in de brondata kijkt zal daar ongetwijfeld materiaal tussen zitten welke niet op een 'eerlijke' manier zijn verkregen.
Waarom mag ik als mens wel boeken en naslagwerken lezen en die informatie commercieel inzetten om adviezen te geven, maar mag AI dit niet? Ik heb er alle begrip voor dat auteurs graag verdienen aan hun werken, maar dit onderscheid is wel vreemd.
Ed Newton-Rex van stichting Fairly Trained heeft daar een mooie reactie op, vinnik:
People often say AI should be able to train on everything, without consent, because that’s how humans learn. Why should copyright stop AI learning, but not humans?

This is a false equivalence for at least two reasons.

First, AI scales. A single AI, trained on all the world’s content, can produce enough output to replace the demand for much of that content. No individual human can scale in this way.

Second, human learning is part of a long-established social contract. Every creator who wrote a book, or painted a picture, or composed a song, did so knowing that others would learn from it. That was priced in. This is definitively not the case with AI. Those creators did not create and publish their work in the expectation that AI systems would learn from it and then be able to produce competing content at scale. The social contract has never been in place for the act of AI training.

AI training is a different proposition from human learning, based on different assumptions and with different effects. It should be treated as such.
Vooral de eerste redenering vind ik sterk. Een AI heeft na training en aankoop hardware alleen elektriciteit nodig en daarna kan het, vergeleken met een mens, een duizelingwekkende hoeveelheid content produceren die concurreert met de makers van de originele AI-trainingsmaterialen, terwijl die makers nul vergoeding hebben gekregen. Dat kan je niet eerlijk noemen.

https://x.com/ednewtonrex/status/1733187760847274197
Vooral de eerste redenering vind ik sterk.
Dat vind ik totaal geen sterk argument. Dit is een Calimero-redenering. "Als ze dat mogen dan winnen ze".
Dat klopt. Ik denk dat de fabrikanten van koetsen destijds ook wel gewild hadden dat automakers er geen motorblok in mochten leggen, terwijl het concept van een karretje met wielen al heel oud is. Dat heet innovatie en concurrentie.
Voor de productie van auto's waren koetsen niet nodig. Voor de productie van AI zijn menselijke contentmakers en hun content wel nodig.
Krijgen alle Nederlandse artiesten niet al jaren geforceerde subsidies van de NL overheid zoals via de thuiskopieheffing, stichting kijk en luistergeld, radioafdrachten van NPO enzo?

Als je product (deels) met publiek geld gesponsord wordt vind ik het ook meer dan terecht dat anderen erop voort mogen bouwen.
Al die bestaande systemen, regelingen en afspraken zijn niet ingericht met inachtneming van de schaal van concurrentie die AI mogelijk heeft gemaakt, omdat die simpelweg nog niet bekend was. Zie ook argument 2 van Newton-Rex.
Zijn hele argument staat erop dat "AI" zogenaamd iets fundamenteel anders is dan "computers".

Er zijn de afgelopen tientallen jaren al heel veel beroepen minder geworden of helemaal vervangen door computers.

Dat je nu met één druk op de knop een plaatje kan genereren is heel kut voor mensen die zichzelf photoshop geleerd hebben maar het is natuurlijk onzin om al die innovatie tegen te houden om een paar banen te beschermen.

Artiesten zijn gewoon gewend dat elke daling van inkomsten gewoon eventjes met subsidie en regeling wordt gecompenseerd voor ze. In elke andere beroepsgroep bestaat die mindset uberhaupt al niet.
Als die photoshoppers' output gebruikt wordt om een AI te trainen, verdienen ze daar compensatie voor.
Ben ik het zwaar mee oneens. Die artiesten bouwen zelf ook voort op eerdere werken en inspiraties.

Betalen zij dan ook voor dat recht? Nee denk het niet.

Dit is gewoon een cash-grab van een sector die al tientallen jaren gewend is dat ze door de overheid beschermd en vertroeteld worden.

Ze willen compensatie als ik een harde schijf koop, als ik in de winkel een radio hoor, stichting BREIN bedreigt iedereen die niet dokt.

En nu willen ze óók weer compensatie van AI bedrijven. Hou op hoor.
Ik vind het opvallend dat dit opnieuw en opnieuw gezegd moet worden: de schaal waarop AI kan concurreren met de menselijke makers van de trainingsmaterialen is A: nieuw en B: problematisch. Dat vergt nieuwe afspraken. In de verste verte niet te vergelijken met bestaande taferelen als inspiratie en kunstjes afkijken, thuiskopieën en copyrighted muziek draaien in het openbaar. Dat is klein bier vergeleken met deze software die makers totaal kapot kan concurreren.

Maar goed, ik parafraseer Newton-Rex volgens mij nu al een tijdje hier.
Sorry maar je presenteert hier continu een mening als een feit.

Ja AI schaalt. Maar computers schalen ook, dat is absoluut niet nieuw.

Waar zijn alle mensen aan de telefoon om vragen van OV reizigers te beantwoorden? Oh ja die zijn grotendeels vervangen door 9292 app, want die schaalt.

Waar zijn de duizenden mensen die 'koerier' als baan hadden? Nergens meer want een computer schaalt.

Waar zijn alle cassieres? Oh het zijn er nog maar 3 want de zelfscankassa schaalt.
Computer die schalen zijn niet nieuw. Dat was al zo voor LLMs en dat is nu ook nog zo.

Het enige punt is dat een computer nu competatief wordt in een sector die gewend is beschermd te worden. En dat is ook absoluut niet problematisch, dat is wederom een mening niet een feit.
Het enige punt is dat een computer nu competitief wordt in een sector die gewend is beschermd te worden. En dat is ook absoluut niet problematisch, dat is wederom een mening niet een feit.
Er is echter wel een verschil tussen het principe van auteursrechtelijk beschermd werk om het feit dat het geld oplevert en het principe dat AI het potentieel heeft in zeer korte tijd oneindig veel 'creatief' werk te creëren en daarmee niet alleen op dit moment al regelmatig in het nieuws is omdat hele beroepsgroepen vrezen voor hun niet alleen hun baan maar hun vak, talent en de mogelijkheid dat uit te oefenen, maar dus ook het potentieel verdwijnen van de behoefte aan menselijke creativiteit in het algemeen.

Creativiteit is een van de kernmerken van een intelligent brein. Het stimuleert ons om te leren, te ontdekken.
Ik zie op het werk al mensen aan ChatGPT vragen een formule voor Excel te maken of standaard formulieren, logo's en afbeeldingen genereren i.p.v. zelf te leren hoe en hun eigen creativiteit gebruiken.
Het vervangen van persoonlijke, emotionele, menselijke creativiteit voor iets onidentificeerbaars dat op afroep door een AI geproduceerd kan worden is op geen enkele manier hetzelfde als het vervangen van simpele taken door computers.
Berschermd en vertroeteld? In Nederland? Heb je ook maar enige ervaring in de brede creatieve sector? Het gros werkt daar keihard voor een hongerloontje omdat vooral in Nederland er een minieme fractie van de begroting aan wordt uitgegeven (vergeleken met onze buurlanden, direct en indirect), terwijl de omzet en belastinginkomsten ervan juist relatief hoog zijn. Subsidies zijn er amper, private fondsen ook steeds minder, ondernemerschap is bijna ongezond geforceerd, maar je kan zeker niet zeggen dat er luiheid, handje ophouden of enorme subsidiesteun is. En de dingen die je opnoemt zoals thuiskopieheffingen, die gaan vooral naar bedrijven als Sony/BMG, Disney, Paramount, etc. Niet naar artiesten. Prima dat je boos bent op BREIN, maar leg de boosheid dan wel even neer waar die hoort.
Dit. Graaien waar je maar graaien kan. En die auteurswet van 150 jaar geleden en die even oude copyrightwet mogen ook wel eens een keer op de schop. We leven nu in een tijd dat alles nu wel is uitgevonden en je met niets nieuws meer kunt komen, omdat er altijd wel ergens iemand opstaat en roept dat ie geld wil hebben. En zo'n roversbende als dat Brein spint hier garen bij en vraagt meteen al om geld, voordat de echte eigenaar hier uberhaupt al van op de hoogte is. Dat klopt gewoon niet.
En die auteurswet van 150 jaar geleden en die even oude copyrightwet mogen ook wel eens een keer op de schop.
Ik verwacht dat dit binnenkort gaat gebeuren onder invloed van AI, maar ik denk niet dat gewone burgers er beter uit gaan komen. De lobbyisten van de AI-bedrijven zijn vast al hard aan het lobbyen om dd wet aan te passen in hun belang en kunnen daar miljoenen of miljarden aan uitgeven. Er is geen lobby voor burgerrechten die daar tegenop kan. De overheid zou die rol moeten vervullen maar ik zie dat in het huidige politieke klimaat niet gebeuren.
Ondertussen zijn die 'photoshoppers' weer heel erg druk met het genereren van content waar ze dan zelf nog even een brush en een stamp overheen gooien, mooi fontje erbij en weer een nieuwe festivalposter gemaakt. Vlekjes in de huid, net die ene wolk die je niet wil zien, dingen op de achtergrond wegfilteren.. Als je vandaag de dag nog pixel voor pixel dingen aan het oppoetsen bent ben je gewoon blijven hangen in een tijd die al voorbij is.

Betalen al die 'photoshoppers' de AI bedrijven vervolgens ook weer terug? Of zitten die in de 'Jullie hebben getrained op jaren van gratis verkregen informatie, nu gaan wij die output van jullie ook weer gratis gebruiken'-modus?

Uiteraard kosten de meeste programma's gewoon geld, maar dat betaalde ze daarvoor ook en toen was er nog geen 'AI' zoals we dat nu kennen.
Voor decennia bestonden auto’s uit omgebouwde koetsen met een motor er in. Voor de productie en ontwikkeling van auto’s, zoals die is gegaan, waren koetsen wel nodig.
Ja, maar dan maak je geen onderscheid tussen concept en materiaal. Voor het concept van de auto is de koets nodig, voor de materialen niet. We hebben het hier over de materialen. Een automaker betaalt voor staal, glas, rubber, etcetera. OpenAI et al mogen betalen voor teksten.

De conceptzijde van het AI-verhaal, daar heb ik, op basis van wat ik van de hele kwestie weet, geen problemen mee.
Zeker wel. De productie van auto's ging in het begin met paard en wagen, er was simpelweg niets anders.
Wat een rare vergelijking.
Het is een doorontwikkeling. Mensen hebben een motor op de koets gezet. Mensen hebben algoritmes 'zelflerend' gemaakt.
Maar het gaat niet om wat mensen produceren maar om wat AI mogelijk kan produceren.
De geleidelijke ontwikkeling, acceptatie en inburgering van gemotoriseerde koetsen met daarmee het langzaam verdwijnen van 'ouderwetse' koetsen was wenselijk, positief. Het had praktische voordelen.
Desalniettemin zijn paarden nog koetsen volledig weg en hebben nog steeds hun waarde.
De vraag is nu of het massaal produceren van (wat door mensen beschouwd wordt als) creatieve werken door AI, met als mogelijk gevolg het verdwijnen van daadwerkelijke, al dan niet betaalde, menselijke creativiteit. Het antwoord zou volmondig 'nee' moeten zijn.

Het principe is niet zo moeilijk.
AI is als tool en hulpmiddel beter als er geen restricties zijn op de data waarmee het kan 'leren'.
Maar we moeten niet willen dat AI 'als een mens' volledige werken gaat produceren, laat staan publiceren, in een tempo dat theoretisch binnen een paar jaar tijd zou leiden tot complete verzadiging in een markt die sowieso al te lijden heeft aan een ernstig gebrek aan originaliteit.
Bovendien is er al genoeg ophef over AI die niet van 'echt' te onderscheiden is en voor vanalles misbruikt wordt.
Het minste wat we kunnen doen is wettelijk verplichten dat alles wat door AI uitgespuugd wordt voorzien is van een kenmerk.
Voor de productie van AI zijn menselijke contentmakers en hun content wel nodig.
Voor die contentmakers hadden ze ook contentmakers nodig, wat dacht je van school en boeken? En andere content van contentmakers voor inspiratie? Beter goed gejat dat zelf (helemaal) bedacht? Fair use?
Ik denk niet dat je dat zo simpel kan zeggen dat voor een AI dezelfde regels en principes gelden als voor een mens. Op de eerste plaats kan een AI zoals al benoemd dus duizenden bronnen tegelijk verwerken en op de tweede plaats is de output uit een AI toch heel anders dan hoe wij het als mensen doen.

Bovenal, we kunnen mensen verantwoordelijk houden voor de output die zij leveren en uiteraard is een individuele persoon vrij om te opereren zoals hij dat wilt. Een AI-model ondertussen verwerkt zoveel gegevens dat het al moeilijk te doorgronden is wat er allemaal in zit en de kennis die het heeft is niet onafhankelijk maar vol in handen van het bedrijf achter zo'n model.
Het zou wat minder zuur zijn als zo'n bedrijf dat al deze

Het is uiteindelijk ook zo dat een AI-model eigenlijk met niets nieuws kan komen vanuit zichzelf. Er zit zeker een hoop informatie in diens "geheugen" maar kan daarmee niet echt met een nieuwe insteek komen, het ratelt gewoon iets op wat het denkt dat het een "kloppend" antwoord is.
Ik vind de argumentatie eigenlijk niet zo sterk omdat er wat onderworpen verbonden worden.
People often say AI should be able to train on everything, without consent, because that’s how humans learn.
Mensen leren niet 'without consent'. Studieboeken zijn duur en geen mens heeft toegang tot alle bibliotheken of zelfs maar alle digitale content van de wereld. Als mensen zeggen dat ze AI net zo moet leren als mensen kun je niet concluderen dat ze bedoelen "zonder toestemming".
(Overigens vind ik ook dat mensen meer rechten zouden moeten hebben om te studeren en ben ik negatief over de trend om alle studiemateriaal te verbinden aan tijdelijke abonnementen, maar dat terzijde.)
First, AI scales. A single AI, trained on all the world’s content, can produce enough output to replace the demand for much of that content. No individual human can scale in this way.
Waarom is dat een probleem?
Het is toch prachtig als we een stuk software hebben dat net zo productief is al de hele mensheid samen?
Dat zou eens een hoop werk en tijd kunnen schelen en veel mooie content opleveren.
We zegt dat AI-content van mindere kwaliteit is die haalt de premise onderuit dat AI aan alle behoeftes voldoet.

Als het probleem is dat mensen hun inkomsten kwijt raken dan moeten we daar iets aan doen.
Er is ook geen mens die het wint van een dieselmotor of kernreactor, daar zetten we ook geen beperkingen op ook al schalen die ver voorbij menselijke kracht. Zo'n beetje iedere moderne fabriek heeft gemotorizeerde machines.
Vooral de eerste redenering vind ik sterk. Een AI heeft na training en aankoop hardware alleen elektriciteit nodig en daarna kan het, vergeleken met een mens, een duizelingwekkende hoeveelheid content produceren die concurreert met de makers van de originele AI-trainingsmaterialen, terwijl die makers nul vergoeding hebben gekregen. Dat kan je niet eerlijk noemen.
Ik vind het wederom niet relevant. Precies dezelfde redenatie kun je opvoeren over een bulldozer die alleen maar wat diesel nodig heeft en het werk van honderden mensen uitvoert. Niemand die nog zegt dat het niet eerlijk is voor mensen die met de hand graven. Het is jammer voor de mensen die het nu als beroep hebben maar op termijn kun je niet vasthouden aan de oude manier van werken, de economische belangen zijn te groot.

Naar mijn mening hebben de meeste makers overigens nooit een eerlijke vergoeding gehad en wordt het meeste geld opgesnoept door overhead en tussenpartijen. Dat is ook de groep die het meeste te verliezen heeft van AI want hun werk is helemaal makkeljk te vervangen omdat het vooral uitvoerend en adminstratief is. Ik hoop dat AI er voor kan zorgen dat je als individuele creator weer kan overleven zonder je te verbinden aan allerlei bedrijven die meeprofiteren.
Second, human learning is part of a long-established social contract. Every creator who wrote a book, or painted a picture, or composed a song, did so knowing that others would learn from it. That was priced in. This is definitively not the case with AI. Those creators did not create and publish their work in the expectation that AI systems would learn from it and then be able to produce competing content at scale. The social contract has never been in place for the act of AI training.
Sinds wanneer heeft de (copyright)industrie respect voor een "sociaal contract"? Juist als het gaat om copyright is het sociale contract al decenniageleden ontbonden. Het sociale contract was namelijk ook dat copyright kort zou duren waarna het werk in het publieke domein zou komen zodat iedereen het voor álle doelen kan inzetten. Dus ook onvooorziene doelen zoals AI. Dat copyright tegenwoordig duurt tot lang na de dood van de dood heeft dat sociale contract al lang vernietigd. Walt Disney is in 1966 overleden maar het meeste van zijn werk is nog beschermd. Daar heeft hij niks aan, dat is puur voor bedrijven, niks sociaal contract.
Verder waren er voor het uitvinden van de drukpers ook al schrijvers en verhalenvertellers die zich niet konden voorstellen dat hun werk meer dan een paar honderd mensen zou bereiken, laat staan miljarden. Toch denk ik dat de meerderheid zou willen dat de hele wereld hun werk kent.

Het klinkt misschien alsof ik enorm pro-industrie ben en anti-mens maar dat is niet zo. Ik verzet me alleen tegen het idee dat het huidige systeem zo geweldig is en dat we AI moeten tegenhouden om de artiesten/makers te helpen, terwijl dat systeem vooral in het belang van de industrie.

Het probleem is niet de techniek maar de industrie er om heen. Als we daar niks aan doen is verzet tegen aan AI zinloos, als we er wel iets aan doen dan is het niet nodig.
Het is toch prachtig als we een stuk software hebben dat net zo productief is al de hele mensheid samen?
Tenzij de productiviteit van de mensen het enige is wat hun de mogelijkheid geeft om te blijven bestaan....
We krijgen op dit moment voornamelijk inkomsten zodat we onze levensbehoeftes kunnen inkopen als we productief zijn. Als de AI dat vervangt, hoe zie je dat dan voor je?
Het stomme is dat de incentive om AI te gebruiken niet is: "goed voor de mensen" maar wel (zoals altijd): meer inkomsten voor bepaalde partijen. Wel nu: die inkomsten zijn irrelevant als niemand meer wat kan verdienen......
Een kapitalistisch stelsel sterft uit als slechts 1 partij alle middelen bezit....
En creatieve kennis verwerving/vergaring (dus iets bedenken) wordt ook onnodig...
terwijl dat systeem vooral in het belang van de industrie.
Nee, het is (op dit moment) alleen in belang van de subset die er extreem veel geld mee verdient. Dat anderen het gebruiken als took dat is verder niet zo'n probleem. De verbetere productiviteit is mooi. Maar als alle verdiensten van creatief werk naar slechts een kleine groep toevloeit, dan kun je niet stellen dat het is in belang van 'de' industrie.
Het probleem is niet de techniek maar de industrie er om heen
Nee dat klopt - de techniek is prima. Maar idee dat je een groot deel (en argumenteerbaar het belangrijkste deel: de bedenkers/makers van 'input'), niet hoeft te belonen, dat is onjuist.

Die trend zie jeook met boeren en supermarkten gebeuren; als je de boeren niet meer beloont voor hun harde werk en zelf alle winst opslokt dan kappen de boeren er op een gegeven moment mee...
Tenzij de productiviteit van de mensen het enige is wat hun de mogelijkheid geeft om te blijven bestaan....
Maar dat is nog niet zo en hoeft ook niet zo te zijn. We moeten er inderdaad niet voor kiezen om al het geld te concentreren in een machtig bedrijf en de burgers niks te geven, maar dat heeft niks met AI of techiek te maken.
We krijgen op dit moment voornamelijk inkomsten zodat we onze levensbehoeftes kunnen inkopen als we productief zijn. Als de AI dat vervangt, hoe zie je dat dan voor je?
Mensen bevrijden van de noodzaak om werk te doen wat ze eigenlijk niet willen doen vind ik alleen maar goed. Als we iedereen een basisinkomen kunnen geven omdat de AI al het werk doet en met hulp van robots alles produceert dat we nodig hebben dan zie ik het probleem niet. Maar ik denk niet dat het ooit zal gebeuren, ik denk dat mensen vanzelf wel manieren vinden om hun tijd te vullen en zichzelf nuttig te maken door dingen te doen die (financieel gezien) nu niet de moeite waard zijn.
Realistisch gezien zou dat in kleine stapjes gaan, eerst hoeven iets minder belasting te betalen of een uurtje minder te werken en later wordt dat steeds meer. De 40-urige werkweek is ook maar een recent verschijnsel. Als we van 80 uur werken in de week naar 40 uur kunnen dan kan er vast nog wel wat meer af.

Voorlopgi is het allemaal niet aan de orde. Overal is een schreeuwend tekort aan personeel. De zorg en het onderwijs zouden enorm veel meer mensen kunnen gebruiken. Ik denk dat zorg ook een gebied is waar mensen de meeste meerwaaarde hebben ten opzichte van techniek. Sociaal contact en menselijke gevoelens zijn ook een belangrijk deel van zorg maar daar is nu eigenlijk geen tijd voor.

Oftewel, ik hoop dat we tijd krijgen om voor onze kinderen en ouderen en zieken te zorgen, zodat we aan hun bed kunnen zitten en hun hand vast houden in plaats van dat zorg alleen bestaat luiers vervangen en ééns in de week onder de douche. Tegen de tijd dat we dat hebben opgelost zijn we denk ik een paar generaties verder en zijn we aangepast aan de nieuwe werkelijkheid.
Een kapitalistisch stelsel sterft uit als slechts 1 partij alle middelen bezit....
Yup, eens, de vraag is alleen welke conclusie we daar aan verbinden. Is het mogelijk om het kapitalistische systeem te redden? Is het wenselijk? Is het onvermijdelijk dat AI één partij enorm machtig maakt en daarmee ook het kapitalistische systeem onderuit haalt?

Ik denk dat laatste. Leg dat niet uit als anti-kapitalisme of zo iets, ik beschrijf wat ik denk dat er gaat gebeuren, niet wat ik zou willen. Hoe dan ook, ik denk dat AI zo krachtig wordt dat het ons sociociaal-economische systeem zal veranderen net zoals de stoommachine dat heeft gedaan. Daarom is mijn insteek is dat we beter kunnen meebewegen met wat technisch mogelijk is, dan proberen technisch vooruitgang tegen te gaan om het oude systeem te beschermenn.
Nee, het is (op dit moment) alleen in belang van de subset die er extreem veel geld mee verdient. Dat anderen het gebruiken als took dat is verder niet zo'n probleem. De verbetere productiviteit is mooi. Maar als alle verdiensten van creatief werk naar slechts een kleine groep toevloeit, dan kun je niet stellen dat het is in belang van 'de' industrie.
Misschien heb ik me niet goed uitgedrukt want volgens mij denken we hier precies hetzelfde over. In mijn ogen is het nu al zo dat de verdiensten naar een hele kleine groep toevloeit en dat vooral de zakelijke kant goed verdient en makers zelf er bekaaid vanaf komen. Met 'industrie' bedoelde ik vooral die handvol grote mediabedrijven en niet de makers zelf, dat was misschien wat verwarrend.
Nee dat klopt - de techniek is prima. Maar idee dat je een groot deel (en argumenteerbaar het belangrijkste deel: de bedenkers/makers van 'input'), niet hoeft te belonen, dat is onjuist.
Ik vind de situatie nu totaal niet juist en dat heeft niks met AI te maken. De bedenkers/makers krijgen nu maar een schijntje en dat wordt steeds minder. Dat systeem hoef ik niet te beschermen.
Die trend zie jeook met boeren en supermarkten gebeuren; als je de boeren niet meer beloont voor hun harde werk en zelf alle winst opslokt dan kappen de boeren er op een gegeven moment mee...
Off-topic: Boeren die er mee kappen? Waar? De overheid biedt enorme uitkooppremies en nog willen de meesten niet stoppen.

Tenslotte, ik ben van mening dat AI onvermijdelijk is en dat we dus moeten nadenken over hoe we leven met de mogelijkheden van AI. Als één computer het werk van miljoenen makers kan vervangen dan is dat niet tegen te houden. De problemen die we voorzien hebben weinig te maken met de techniek zelf en meer met economie er om heen. We moeten niet proberen om die productiviteit af te remmen maar kunnen ons beter richten op hoe we de welvaart optimaal gebruiken voor de hele maatschappij.
Basisinkomen: ja, dat denk ik ook [als oplossing waar we naar toe moeten].
Ik vind de situatie nu totaal niet juist
Ik ook (ik schreef dat ik de situatie onjuist vond ;) ).
Off-topic: Boeren die er mee kappen? Waar?
Nou, ze kappen nu nog niet omdat ze zoveel schulden hebben - dus geen keuze maar het houdt een keer op. Ik bedoelde vooral de trend dat steeds meer van de winst niet naar de 'makers' vloeit. De uitkooppremies zijn nog te laag vermoed ik.
Tenslotte, ik ben van mening dat AI onvermijdelijk is
Ja, dat klopt wel. Maar nu wordt het (zoals zo vaak) omarmt door de immorele hufters van deze wereld... en weer zien we dat de mensen die voor een groot deel hebben bijgedragen aan de bruikbaarheid, nauwelijks worden beloond.
Even ingaande op het tweede argument:
Those creators did not create and publish their work in the expectation that AI systems would learn from it
Dat argument is met ingang van nu komen te vervallen. Iedereen die nu nog een tekst schrijft, of een schilderij maakt wéét van het bestaan van A.I.

Hij/zij weet dus ook dat het op grote schaal door A.I. als 'inspiratie' gebruikt kan worden.
De argumenten van Ed Newton-Rex worden op deze manier door de tijd ingehaald.
eh? Omdat je het weet - maar nog steeds niet mee eens bent, betekent dit toch niet dat het acceptabel is?

Er wordt soms ook op grote schaal ingebroken.... dus moeten de deur dan maar open laten staan? Of het huis volledig in beton gieten?

Raar idee.... een argument vervalt toch niet omdat een bezwaar eenzijdig genegeerd is?
Ik heb het niet over inbraken of open deuren. Je gebruikt een typische Whataboutism
Ed Newton-Rex stelt dat artiesten in het verleden niet konden weten van het bestaan van A.I. en dat daaruit volgt dat je hun werk niet mag gebruiken.
Artiesten van nu weten wél van het bestaan van A.I., dus verliest dat argument zijn kracht voor nieuw werk.

Ik stel niet dat de artiest het hier maar mee eens moet zijn, maar alleen dat dit argument an sich niet voldoende is. Een artiest, zich bewust van A.I., kan b.v. aangeven dat zijn werk wel/niet door A.I. gebruikt mag worden.

Persoonlijke aanvulling: wat doe je als er niets is aangegeven ? Ik vind ik dat het aan de wetgever is om hierin duidelijkheid te scheppen. Wat gaat de default worden ? Mijn persoonlijke voorkeur daarbij is dat A.I. niet zomaar op werk van anderen getraind mag worden. Maar daar mag een ander anders over denken. Ik hoop wel dat de duidelijkheid snel komt.
Je gebruikt een typische Whataboutism
Zeker niet - dat heet een analogie.... om aan te geven dat jouw argument "het gebeurt nu en op grote schaal en daarmee is het dus in orde" totaal onzinnig is.
Artiesten van nu weten wél van het bestaan van A.I., dus verliest dat argument zijn kracht voor nieuw werk.
Nee, ze stellen nu juist dat sinds het bestaan van AI, de regels lijken te zijn veranderd en zijn het daar (terecht) niet mee eens. Het argument is niet gebaseerd op "ik wist het niet", sterker nog: ze waarschuwden hiervoor al voordat het op grote schaal werd toegepast (dat het dus niet de bedoeling is dat hun werk zomaar wordt gebruikt). Voor iedereen zichtbaar is nooit geweest: voor iedereen en elk bedrijf vrij in te zetten.
Mijn persoonlijke voorkeur daarbij is dat A.I. niet zomaar op werk van anderen getraind mag worden.
Hier zijn we het eens. Maar het echte probleem komt vanuit bedrijven die iets gebruiken waar ze niet voor hebben betaald (zoals wel gebruikelijk en ook afgesproken is).
AI inzetten zonder winst oogmerk is al meteen een stuk minder bezwaarlijk. Maar zodra iets bedrijfsmatig gebeurd, is winst altijd het voornaamste doel.
...om aan te geven dat jouw argument "het gebeurt nu en op grote schaal en daarmee is het dus in orde" totaal onzinnig is.
Ik schrijf alleen (let op het woordje 'kan' !):
Hij/zij weet dus ook dat het op grote schaal door A.I. als 'inspiratie' gebruikt kan worden.
Ik schrijf nergens dat dat in orde zou zijn. (Want dat is het niet) Slechts dat dit argument niet valide (meer) is. Zoals ik in mijn andere reaktie ook schrijf, de artiest kan nu ook maatregelen nemen:
Een artiest, zich bewust van A.I., kan b.v. aangeven dat zijn werk wel/niet door A.I. gebruikt mag worden.
de artiest kan nu ook maatregelen nemen:
Waarom kan hij dat nu wel? Het was toch allang zo dat het welliswaar openbaar is maar niet vrij gebruikt mag worden. En zodra dit dan wel gebeurt dan dient hij/zij actie te ondernemen. Maar als dus onduidelijk is wie precies nu zijn intellectueel eigendom heeft gebruikt, dan wordt dit moeilijk.
En achteraf zeggen: dan haal ik het maar van het Internet af, is soms praktisch onmogelijk maar in dit geval ook nog eens onvoldoende om het misbruik te voorkomen. Want de data is al 'gestolen'.

En van te voren aangeven is leuk - maar als je niet kunt controleren of dat niet toch (stiekem) wel is gebeurd of als dit bewijs rond krijgen praktisch onmogelijk is, dan is dat toch ook niet bepaald een afdoende oplossing?
Waarom kan hij dat nu wel?
Omdat elke artiest nu van het bestaan van A.I. weet. Dat was tot voor kort niet het geval. Dat is het hele punt in het argument van Ed Newton-Rex:
Those creators did not create and publish their work in the expectation that AI systems would learn from it
Verwachten en (nu) weten zijn toch niet hetzelfde? Wat moeten ze dan doen? Het al eerder gepubliceerde materiaal eraf halen? Heeft weinig zin....
En zelfs al zou dat kunnen - een artiest moet/wil publiceren - maar dan is het nog steeds niet acceptabel als je werk automatisch wordt 'ingepikt'.
Volgens mij begrijp je me niet goed....
Het argument van Ed Newton-Rex, dus dat een artiest het bestaan van A.I. niet kon verwachten, gaat inderdaad op voor oud werk.
Mijn punt is nu net dat het voor nieuw werk niet meer geldt.

Nogmaals dat maakt het wat mij betreft nog steeds niet okee om het materiaal zomaar te gebruiken. (Anderen lijken daar anders over te denken, hier in de comments) Ik zeg alleen dat dit argument niet bruikbaar is voor die discussie.
Maar dat maakt toch niet uit?

Het was nooit toegestaan om zonder een vergoeding (niet voor een enkel persoon of een bedrijf), intellectueel eigendom, direct in te zetten om geld te verdienen.

Dus waarom maakt het uit dat ze nu weten dat de AI dit wel doet? Is het dan "Eigen schuld - dan moeten ze maar niet publiceren".

Dat ze weten dat nu de regels omtrent intellectueel eigendom, opzij worden gelegd maakt het toch niet minder fout?
Het was nooit toegestaan om zonder een vergoeding (niet voor een enkel persoon of een bedrijf), intellectueel eigendom, direct in te zetten om geld te verdienen.
Is dat zo ? Volgens mij is dan nou net de discussie die gaande is. Je hoort dan argumenten als: "A.I. leert van de input, maar kopieert het niet. Het resultaat is nieuw werk. Dat is niet anders dan wat mensen doen."

Moreel ben ik het met je eens, maar juridisch is die kous nog niet af, volgens mij.
En van te voren aangeven is leuk - maar als je niet kunt controleren of dat niet toch (stiekem) wel is gebeurd of als dit bewijs rond krijgen praktisch onmogelijk is, dan is dat toch ook niet bepaald een afdoende oplossing?
En daarom pleit ik ook voor een wetgever die duidelijkheid verschaft !
Ik vind ik dat het aan de wetgever is om hierin duidelijkheid te scheppen. Wat gaat de default worden ? Mijn persoonlijke voorkeur daarbij is dat A.I. niet zomaar op werk van anderen getraind mag worden.
Mee eens.

Maar inmiddels is duidelijkheid verschaffen alweer wat te laat - de data is al gebruikt....

Typisch... de overheid zat wel in de discussie omtrent de inzet van AI maar even vergeten dat die data waarmee ze [de AI makers] aan de gang gingen niet van henzelf was....
Het tweede argument valt iets voor te zeggen, maar vind ik uiteindelijk niet stand houden. Het eerste is uitermate zwak.

Een boek schrijf je om gelezen te worden. Het veronderstelt een lezer. Dat is het sociaal contract. Een boek zonder lezer is een stapel besmeurd papier.

Er is geen copyright of patent - of wat dan ook - op de feitelijk inhoud ervan. Die mag gereproduceerd worden, en indien dat niet het geval is spreken we van censuur. Sterker nog, dat is altijd de bedoeling geweest van boeken. Je schrijft een kookboek zodat lezers eruit gaan koken en leren, en wat ze leren ook weer doorgeven in gewijzigde vorm. Hetzelfde geldt voor alles. Dat is een soort langzaam gesprek, een conversatie. Als je dat heel duidelijk een expliciet doet gebruik je voetnoten. Zo kan kennis ontstaan.

Na de boekdrukkunst zijn er allerlei factoren geweest die de schaal en het tempo van die conversatie hebben vergroot, tot voor AI het internet bijvoorbeeld. Zoekmachines. Nu geeft AI er nog een flinke slinger aan. Maar er gebeurd niet iets wezenlijk anders. Het auteursrechten spasme zie ik zoals het protest tegen de nieuwssamenvattingen van google door kranten, die wel gevonden willen worden maar toch hun content achter een betaalmuur zetten. Het is het kunstmatig beperken van de verspreiding van kennis, om er een slaatje uit te kunnen slaan. Maar uiteindelijk niet slim, want je zet jezelf buiten spel.

Als je niet mee wil doen met AI, publiceer dan maar niets. Jouw content zal vanzelf wel in de vergetelheid geraken. Maar stop met het discrimineren van lezers.

Het enige illegale / immorele dat ik hier zie is dat er niet betaald is voor de trainingsdata. Dat is een probleem. Maar dat is wel een andere discussie, met andere argumenten.

[Reactie gewijzigd door Antipater op 28 januari 2025 13:53]

Als je niet mee wil doen met AI, publiceer dan maar niets
En dat is toch ook niet houdbaar?
Het enige illegale / immorele dat ik hier zie is dat er niet betaald is voor de trainingsdata.
Juist - dat is toch precies het argument?
Dat kookboek is gebruikt om kennis op te doen - juist. Maar daar is dan ook voor betaald.

Als we leven in een maatschappij waar kennis ook geld waard is dan moet je toch niet argumenteren dat de kennis gevers niet moeten zeuren als een (uiterst domme) AI i.c.m. een hebberig bedrijf, stelt dat het wel goed komt....? :?
De lijn van argumentatie waar ik op reageer is dat AI bedrijven hun model helemaal geen boeken mag laten gebruiken om op te trainen. Je zou als auteur dus moeten kunnen verbieden dat een AI jouw boek leest. Ook als daarvoor betaald is. Daar heb ik problemen mee.

Je mag ook niet zeggen dat mensen met een bepaalde huidskleur of met een bepaalde politieke denkrichting jouw boeken niet mogen lezen. Dat zouden we absurd vinden. Waarom mogen we dan wel AI verbieden om boeken te lezen? Maar er moet wel voor betaald worden, dat vind ik wel een redelijk argument, tenminste zo lang de wet dat vereist.
Je zou als auteur dus moeten kunnen verbieden dat een AI jouw boek leest.
Het gaat niet om 'de AI' - dat is geen echte entiteit: het bedrijf echter wel. Die gebruikt - zonder daarvoor te betalen - andermans kennis.
Ook al publiceert iemand een recept dan betekent dit nog niet dat een bedrijf dit zomaar mag gebruiken...intellectueel eigendom beschermde dat al, lang voor de AI ten tonele verscheen....

Een AI verbieden boeken te lezen is stellen dat een bedrijf [die die AI inzet] niet zomaar andermans intellectueel eigendom mag gebruiken. Een enkel persoon mag dat (tot op zekere hoogte) wel. Dat was het systeem wat we gebruiken en dat lijkt redelijk te werken.

Een AI noemen alsof je deze zou kunnen discrimineren is bijzonder. Een AI heeft geen gevoel en geen geweten. Het zou juist de enige 'fake-identity' moeten zijn die het niets kan schelen of deze iets niet mag doen.
Het gaat ook niet om AI in deze discussie; het gaat om bedrijven die zonder vergoeding profiteren van andermans harde werk.
> Ook al publiceert iemand een recept dan betekent dit nog niet dat een bedrijf dit zomaar mag gebruiken..

Jawel hoor, de enige beperking die jij een ander mag opleggen als auteur van een recept, is om significante delen van 'creative' onderdelen van het recept verbatim te reproduceren. Het mag niet gaan om een feiten, maar moet een unieke, creatieve uitdrukking zijn. Dus het recept zelf mag ik zelfs gewoon in een ander boek afdrukken, het inleidend gelul en de fotos niet. Dat is het. Een restaurant mag gewoon dit recept gebruiken om een maaltijd te maken, en jij hebt als auteur geen enkel recht om dat te beperken. Copyright wordt enorm overschat. Je hebt geen alleenrecht op ideeen en feiten. Dergelijke beperkingen zijn het terrein van censuur.

> het gaat om bedrijven die zonder vergoeding profiteren van andermans harde werk.

Ik mag een bedrijf starten op basis van wat ik leer uit een boek, dat heet opleiding. Je hoeft ook geen percentage van je inkomen af te dragen aan al je leraren op alle scholen waar je op hebt gezeten. Dat is mijn eigen 'harde' werk. Ik moet voor het boek betalen, en dan ben heb jij als auteur van het boek vergoeding gehad voor jou werk, dan is het ook wel klaar hoor. Als ik een succesvolle franchise opricht, gebaseerd op de recepten in het kookboek waar jij slechts enkele duizenden euro's mee verdiend heb, en zelfgenoegzaam geniet van mijn miljoenen euro's verdiend aan jouw hamburgerrecept, dan heb jij gewoon pech gehad en ik geluk. Of, zoals de meeste rijkaards zullen zeggen: ik heb harder en slimmer gewerkt.
Je hebt geen alleenrecht op ideeen
Wel toch als je deze vastlegt? Nu is een recept idd een slecht voorbeeld. Dat krijgt zelden een patent - een meer chemisch recept (als in: pharma) - bezit toch wel degelijk een 'copyright'?
Ik mag een bedrijf starten op basis van wat ik leer uit een boek, dat heet opleiding.
En voor die opleiding heb je (meestal) betaald - zelfs een autodidact heeft boeken gekocht (of via een betaald bibliotheek abonnement geleend). En inderdaad: je kan dan meer verdienen dan de schrijver/uitgever van een boek dat je hebt gebruikt.
Maar de hogere winst is niet relevant.
Als er maar een tussenstap is die dan wel een vergoeding richting de aanleveraar heeft opgeleverd. En omdat deze telkens weer nieuwe mensen kan opleiden / opnieuw het boek kan verkopen, werkt dit systeem.

Nu wordt die stap door de AI overgeslagen. En nu kan je wel stellen dat dit een typisch effect is van AI, maar dat is niet relevant voor het systeem wat we nu hebben; daar is vastgelegd dat inspanning van de 1, niet zonder meer mag worden gebruikt door een ander. Ruilhandel...
Net zoals digitale boeken niet zomaar gratis mochten worden gelezen door mensen mag de AI dit ook niet zomaar doen.

En het is niet dat ik de AI dat niet zou 'gunnen' maar het ondermijnt het systeem. De enige manier wordt dan: helemaal niet meer publiceren - zelfs achter een paywall die bedoeld is om een enkel persoon met 1 account dit te laten lezen is dan een enorm risico.
Dat lijkt me niet echt gewenst.
Waarom mogen we dan wel AI verbieden om boeken te lezen?
Dat A.I. boeken leest is geen probleem. Het probleem ontstaat pas wanneer de A.I. op basis van die data output genereert. Het is aan de copyrighthouder om te bepalen wat er met zijn, of haar werk gebeurt. Zodra die geen toestemming geeft voor gebruik door A.I. dan is dat het recht van de auteur.

Wanneer ik een boek koop betaal ik de auteur voor een aantal rechten. In dat contract zit besloten dat ik het boek in beperkte kring ook aan anderen kan geven. (Dat is wettelijk beschreven) Ik mag het b.v. niet zomaar in een openbare bibliotheek neer zetten. Daar gelden andere bepalingen voor.

A.I. is niet expliciet beschreven in de wet, dat maakt het een onduidelijk terrein, maar ik denk dat het in elk geval niet erg lijkt op de rol van een consument die een boek koopt en het een paar mensen laat lezen. Dat heeft met name met de schaal te maken waarop een A.I. opereert. Dus een vergelijking met een kok die een gerecht uit een kookboek maakt gaat niet op. Het lijkt meer op een DJ die samples neemt van verschillende platen en die in het groot verkoopt. Die DJ moet ook toestemming krijgen en betalen voor het gebruik van de samples.

[Reactie gewijzigd door T-men op 28 januari 2025 16:23]

Ik zou hier een derde punt aan toe willen voegen.

Een 'AI' 'leert' exclusief van de ingevoerde data, voornamelijk in de vorm van tekst. De AI zal dus alleen tekst produceren welke 100% gebaseerd is op de input, de regels van het programma, en een random seed om te voorkomen dat dezelfde vraag iedere keer exact dezelfde output oplevert.

Een mens heeft eigen ervaringen, met veel meer zintuigen vergaard, en zal dus het geleerde combineren met deze eigen, unieke, ervaringen en zo nieuwe informatie toevoegen.

Een AI kan dat niet. M.a.w. mensen voegen iets toe, AI's gebruiken alleen maar.
Een bottere beschrijving is "Mensen zijn symbiotisch, AI's parasitisch".

Misschien dat dat ooit veranderd, maar volgens mij heb je daar een AGI voor nodig die zelf in de wereld rond kan lopen. Zover zijn we voorlopig nog niet.
idd - deze LLM AI (even de neurale netwerken daargelaten) heeft statistische bevestiging nodig. Een mens heeft iets heel bijzonders: zelfs eens kind kan zonder zijn handen te hebben gebrand, verbanden leggen die zorgen dat dit niet voorkomt. Hij hoeft (gelukkig) niet eerst alles aan te raken om vast te stellen dat het pijn kan doen. Deels zit dat in instinct, intuitie, genetisch geheugen of weet ik wat.
Deze huidige AI wordt nogal overschat heb ik het idee. Dat het een deel van simpele werkzaamheden kan overnemen is zeker waar. Maar dat is niet het belangrijkste deel. En juist de aanleveraars van het belangrijkste deel, namelijk creatief werk, stellen nu dat ze het niet eens zijn met de huidige gang van zaken (en terecht).
Nee die redenering is niet sterk want
1) De klompen- en knopenmakers zijn ook allemaal falliet gegaan met de industriele revolutie, en dat vinden we ok blijkbaar
2) je kan in het westen de boel gaan afschermen, maar dat gaat de chinese modellen niet afremmen. Die trainen onder chinese regels (en aansturing) op alle data die ze kunnen pakken. Die modellen worden dus capabeler dan de onze, en onze consumenten gaan die modellen gebruiken, zelfs gratis want het is ook een tool om chinese waarden en waarheden te verspreiden.
Daar sta je dan met je BREIN vlaggetje, technologisch achtergebleven en voorbijgestreefd, temidden van sterke Chinese cultuurinvloeden- en waarden gebaseerd op de veelgebruikte output van die modellen, en nog steeds zonder 'inkomen voor artiesten'.

Eerlijk is niet relevant (zie 1). Moraliteit (in zoverre je aanneemt dat ieders moraal hetzelfde is) ook niet.
De technologie gaat voort ongeacht of je het wil of niet, met of zonder jou. Ik zie geen klompenmakerssubsidie (zelfs geen klompen meer), dus sabotage tegen technologische voortgang was niet de juiste keuze en zal het nu ook niet zijn.
Helemaal mee eens.

Feitelijk mag een mens ook niet zomaar stukken uit een boek reproduceren als hem een antwoord wordt gevraagd.... "Daar betalen we hem/haar tenslotte niet voor".

Maar helaas komt dan de AI, die dan ook weer antwoorden (quotes...) combineert zodat het een ander antwoord wordt (eigenlijk: lijkt) want de enige weging die de AI toevoegt is statistische verwijzing.

Andersom: steeds vaker blijkt dat antwoorden (of output in het algemeen) van AI zodanig herkenbaar is (vaak omdat het oeverloos gelul lijkt te zijn) of beelden die totaal onlogische elementen bevatten.
Precies dat maakt dus dat de mens blijkbaar in staat is om betere combinaties van data te maken. In ieder geval een betere beoordeling van zijn/haar output.

Maar helaas komt daar AI weer; die gaat steeds beter combineren maar nog steeds voert deze geen enkele echte beoordeling uit en past deze geen enkele achterliggende gedachte toe.

Maar goed: dat is alleen de discussie omtrent de input van AI. Het is simpel: een boek dat gekocht werd (!) was bedoeld voor 1 mens om deze te lezen (en derhalve te gebruiken), misschien een paar meer als het werd uitgeleend of zelfs veel meer als het via een bibliotheek werd uitgeleend - maar daar werd dan wel (indirect) voor betaald. Nu wordt het praktisch oneindig vaak 'gebruikt' [door de AI] en niemand betaalt ervoor....

We leven nog steeds in een kapitalistische wereld - dus moet er betaald worden (en juist de kapitalisten denken/willen dat dit niet nodig is.... :X )
Wat ik me ook afvraag is hoe we verdergaan nadat AI zijn roofbouw op de makers van de trainingsmaterialen compleet heeft gemaakt. En dan? Dan zijn er geen echte makers meer, misschien onbeduidend kleinschalige, dus waar wordt AI dan verder op getraind? Krijgen we dan een statische AI die alleen content kan produceren daterend tot het moment dat de makers van trainingsmateriaal uitstierven? Dus geen nieuwe muziekgenres meer? Geen innovatie? Teksten? Je moet AI niet trainen op AI-output: dat is vervuilde data. Weet iedere AI-bakker.

Misschien trek ik de 'oneerlijke concurrentie'-argumentatie te ver door hoor, maar ik vind het onverminderd roofbouw. Maar goed, wannabe-techmiljardair-oligarch Sam Altman boeit dat natuurlijk niet.
Wat ik me ook afvraag is hoe we verdergaan nadat AI zijn roofbouw op de makers van de trainingsmaterialen compleet heeft gemaakt. En dan? Dan zijn er geen echte makers meer, misschien onbeduidend kleinschalige, dus waar wordt AI dan verder op getraind?
Is het nog nodig om de AI verder te trainen als die al genoeg materiaal kan produceren om een heel mensenleven te vullen met gepersonaliseerde content?

Maar om even een technisch antwoord te geven: met genetische algoritmes en kijkcijfers van gebruikers.
1. Laat de AI 100 varianten van een boek of filmpje maken
2. Hou bij hoeveel mensen die boeken lezen en de filmpjes kijken.
3. Kies de drie meeste populaire varianten en vraag de AI om 100 nieuwe varianten te maken van die drie boeken/flmpjes.
4. Ga terug naar 1 en blijf herhalen.

Je kan het systeem efficienter maken door gebruikers in detail te tracken. Dus niet alleen welke filmpjes/boeken ze kijken/lezen maar ook hoe snel het gaat, waar ze pauseren, welke stukken ze overslaan of juist dubbel lezen, wanneer hun hart sneller slaat, wanneer ze opgewonden of juist verveeld raken, waar hun ogen precies naar kijken, etc...

De grote dataharken hebben al jaren informatie over ons verzameld om zich op te baseren.
Laat de AI 100 varianten van een boek of filmpje maken
Waarvan dan 90% rotzooi is en als de verdeling niet "eerst de goede 10% en dan pas de rest" is, haakt iedereen af....
Sommigen schijnen te denken dat wij [de mens] dom zijn (en deels is dat misschien waar) maar dat is echt geen typisch gedrag. We hebben een schrompelijke hekel aan herhaling die slecht bevalt. Dus 5 (arbitrair maar zeker geen 100) slechte films/boeken van deze studio => niemand kijkt er meer naar.

Dus niets geen optimalisatie....

Ik ben persoonlijk ook al flink zat teksten door te lezen die door een AI zijn opgesteld (en dat merk je helaas vrij snel). Of commentaar bij mini-documentaties die door een AI is bedacht (en soms ook wordt voorgelezen). Dat trek ik niet.... dus kijk/luister/lees ik niet verder.

Of foto's die zijn gemaakt bedacht door AI - zelfs al lijken ze de checkboxes te raken. Dan nog is het uitermate saai na vrij korte tijd.

Dus dat idee dat het 'steeds beter gaat worden door herhaling' - tja....dat denk ik toch niet....

Ook het hele idee dat oneindig herhalen werkt (zodat alle combinaties van 'check-points' uitgeprobeerd kunnen worden), is onjuist. Een goed boek/film/muziekstuk vind niet zijn oorsprong in herhaling maar in nuances. En die worden vaak niet benoemd door mensen - en dan kan de AI het ook niet...

We weten allang dat een verhaal (of muziekstuk) dat slechts een combinatie is van tropes snel vervalt tot alleen maar cliches. En dat geeft een absurde voorspelbaarheid.....en dat is precies wat het of ondragelijk dom maakt of ondragelijk saai.
Waarvan dan 90% rotzooi is en als de verdeling niet "eerst de goede 10% en dan pas de rest" is, haakt iedereen af....
Sommigen schijnen te denken dat wij [de mens] dom zijn (en deels is dat misschien waar) maar dat is echt geen typisch gedrag. We hebben een schrompelijke hekel aan herhaling die slecht bevalt. Dus 5 (arbitrair maar zeker geen 100) slechte films/boeken van deze studio => niemand kijkt er meer naar.
Het is niet de bedoeling dat één persoon al die varianten bekijkt.
Dit is gewoon precies hetzelfde als "A/B"-testen zoals dat nu al aan de orde van de dag is in de media.
Reclames en clickbait werken al lang op die manier. Tweakers doet het met de titels van nieuwsartikelen.
Ik ben persoonlijk ook al flink zat teksten door te lezen die door een AI zijn opgesteld (en dat merk je helaas vrij snel). Of commentaar bij mini-documentaties die door een AI is bedacht (en soms ook wordt voorgelezen). Dat trek ik niet.... dus kijk/luister/lees ik niet verder.
Dan is er dus gewoon nog een markt voor materiaal van menselijke makers.
Dus dat idee dat het 'steeds beter gaat worden door herhaling' - tja....dat denk ik toch niet....
Mensen doen precies hetzelfde. Mensen werken een leven lang aan hun vaardigheden en luisteren naar feedback van mensen om beter te worden. Een schilder leert van ieder schilderij weer iets nieuws. Een verhalenverteller probeert iedere vertelling nog beter te maken.
Ook het hele idee dat oneindig herhalen werkt (zodat alle combinaties van 'check-points' uitgeprobeerd kunnen worden), is onjuist.
Oneindig is niet nodig, dit is een gericht proces. Het is gewoon evolutie net zoals we die in de natuur zijn en daar werkt het prima.
Een goed boek/film/muziekstuk vind niet zijn oorsprong in herhaling maar in nuances. En die worden vaak niet benoemd door mensen - en dan kan de AI het ook niet...
Waarom moeten mensen iets benoemen voor de AI het kan leren? Zo werkt dat leerproces helemaal niet. LLMs en neurale netwerken zijn juist erg goed in ongeschreven regels volgen.

Herhaling is deel van het proces om een werk te (leren) maken, dat betekent niet dat het eindproduct vol herhaling zit. We maken al duizenden jaren brood en we worden er nog steeds beter in.
Het is niet de bedoeling dat één persoon al die varianten bekijkt.
Dat maakt ook niet uit. We zijn het soms best wel eens met elkaar als we rotzoot voorgeschoteld krijgen (en je krijgt ook een bias als steeds meer mensen iets wel/niet prettig vinden).
Daarom werkt het redelijk bij hoog volume / korte aandachtspan rommel (zoals dus TikToks). Maar voor langer durend materiaal werkt dat niet.
Mensen doen precies hetzelfde
Nee, die doen niet precies hetzelfde als deze AI - de kenmerken waarom 'iets' wel niet werkt worden niet alleen statistisch bedacht. Al voor de AI bestond het systematisch schrijven van boeken ("Bouquetreeks"). En toch zijn dat nooit meesterwerkjes geworden denk ik zo....dat komt omdat nuance en inzicht ontbreekt.
In sommige gevallen is de absurde voorspelbaarheid niet zo'n probleem maar het zal daardoor nooit meer worden dan 'pulp'. Precies was de huidge AI nu ook produceert (als we deze vragen iets creatiefs te leveren).
Het is gewoon evolutie net zoals we die in de natuur zijn en daar werkt het prima.
Maar duurt derhalve ook miljoenen jaren.... toch bijzonder dat we als creatieve mens een sneller resultaat wisten te behalen dan evolutie.... Niet dat alles nu dan ook even goed functioneert. Maar er is duidelijk een verschil in tijd te zien.
LLMs en neurale netwerken zijn juist erg goed in ongeschreven regels volgen.
Neurale netwerken wel - die leren zonder te weten waarom maar de taken die ze uitvoeren blijven beperkt. Wat ik vooral bedoel is dat input een cruciaal onderdeel is van de hudige AI. Je kan dat ding niet zomaar de wereld in sturen om ervaring op te doen....
We maken al duizenden jaren brood en we worden er nog steeds beter in.
Eigenlijk niet; de optimalisatie is inmiddels kostenbesparing en smaak en voedingswaarde zijn daarmee ondergeschikt geworden.

Ik ontken overigens niet dat herhaling geen onderdeel is van ons menselijke leerproces maar AI (gebaseerd op LLM) kan alleen maar herhaling gebruiken.
Dat maakt ook niet uit. We zijn het soms best wel eens met elkaar als we rotzoot voorgeschoteld krijgen (en je krijgt ook een bias als steeds meer mensen iets wel/niet prettig vinden).
Daarom werkt het redelijk bij hoog volume / korte aandachtspan rommel (zoals dus TikToks). Maar voor langer durend materiaal werkt dat niet.
Dat ligt er aan waar je mee begint. Die eerste 100 hoeven geen rommel te zijn, het kan nog steeds goed genoeg zijn om mensen te vermaken. Je hoeft ook niet beginnen met 3 uur durende speelfilms. Je ontwikkelt de techniek met korter materiaal en kan het dan opschalen.
Wat "rotzooi" is verschilt ook nog eens enorm per persoon.
Nee, die doen niet precies hetzelfde als deze AI - de kenmerken waarom 'iets' wel niet werkt worden niet alleen statistisch bedacht. Al voor de AI bestond het systematisch schrijven van boeken ("Bouquetreeks"). En toch zijn dat nooit meesterwerkjes geworden denk ik zo....dat komt omdat nuance en inzicht ontbreekt.
Ondanks dat zijn die boeken erg populair. Niet alles hoeft een meestewerk te zijn en de meningen over wat goed is en wat niet zijn heel persoonlijk.
In sommige gevallen is de absurde voorspelbaarheid niet zo'n probleem maar het zal daardoor nooit meer worden dan 'pulp'. Precies was de huidge AI nu ook produceert (als we deze vragen iets creatiefs te leveren).
Dan is er ook geen probleem en blijft er werk voor mensen.
Maar duurt derhalve ook miljoenen jaren.... toch bijzonder dat we als creatieve mens een sneller resultaat wisten te behalen dan evolutie.... Niet dat alles nu dan ook even goed functioneert. Maar er is duidelijk een verschil in tijd te zien.
Goed he! We bouwen ook vliegtuigen die na 100 jaar ontwikkeling sneller en groter zijn dan iedere vogel ooit.
Neurale netwerken wel - die leren zonder te weten waarom maar de taken die ze uitvoeren blijven beperkt.
Ik snap niet waarom je LLM's wegstreept want die maken gebruik van neurale netwerken en kunnen alles wat een NN kan.
Wat ik vooral bedoel is dat input een cruciaal onderdeel is van de hudige AI. Je kan dat ding niet zomaar de wereld in sturen om ervaring op te doen....
Zonder meer, maar dat is wat ik omschreef, een raamwerk om AI's bij te trainen op grond van ervaringen uit de "echte" wereld.
Eigenlijk niet; de optimalisatie is inmiddels kostenbesparing en smaak en voedingswaarde zijn daarmee ondergeschikt geworden.
Dat is jouw interpretatie van wat "beter" is. Goedkoper brood is beter voor de industrie. Het proces werkt.

Dat is overigens niet wat ik bedoelde, ik bedoel echt dat we nog steeds meer leren over het proces van brood bakken en het steeds beheersen. Maar dat is dan weer mijn interpretatie van wat "beter" is.

Maar het proces werkt, het is alleen de vraag wie kiest wat beter is.
Ik ontken overigens niet dat herhaling geen onderdeel is van ons menselijke leerproces maar AI (gebaseerd op LLM) kan alleen maar herhaling gebruiken.
Waarom is dat belangrijk? Wat doet het er toe hoe het leerproces precies werkt? Mensen hebben ook verschillende manieren van leren. Wat is belangrijker? Het proces of het resultaat?
Het maakt mij niet uit hoe een AI leert als het resultaat maar goed is. Als de AI dat kan bereiken met alleen maar herhaling, prima. Zo niet dan hebben we nog wat te verbeteren en zal de volgende versie beter zijn tot het resultaat wel goed genoeg is.
Wat "rotzooi" is verschilt ook nog eens enorm per persoon.
Toch is er wel een zekere concensus.
Ondanks dat zijn die boeken erg populair. Niet alles hoeft een meestewerk te zijn en de meningen over wat goed is en wat niet zijn heel persoonlijk.
Maar niet beter geworden. Natuurlijk heeft dat ook z'n plek in de maatschappin (wat breinloos vermaak). Maar je ziet het dus niet groeien - ondanks dat ze dus het systeem toepassen van herhaling en verbetering.
Dat is jouw interpretatie van wat "beter" is. Goedkoper brood is beter voor de industrie. Het proces werkt.
Maar niet in het voordeel van de mens - sturen op alleen de variabele 'goedkoper wordt meer verkocht' is niet zo moeilijk. Dus is het dan echt verbetering? Daar hebben we dan ook geen AI voor nodig - iets goedkoper maken => beter maken => dat gaat mis....
ik bedoel echt dat we nog steeds meer leren over het proces van brood bakken en het steeds beheersen.
We hebben het geautomatiseerd inderdaad. Maar echt geleerd op basis van veel meer dan de kosten variabele hebben nog niet, toch? Het proces is dan niet zozeer: leren van fouten en opnieuw proberen (zoals evolutie) maar puur interatief goedkoper maken (vaak door schaal vergroting).
Wat is belangrijker? Het proces of het resultaat?
Voor ons [als mens] is dat belangrijk. Als het tempo waarmee de AI leert, gelijk zou zijn aan de evolutie [dus sloom] dan zijn we allang uitgestorven voordat we er voordeel van hebben... :9
Het maakt mij niet uit hoe een AI leert als het resultaat maar goed is.
Maar daar zit dus het probleem toch? De enige beoordeling hiervan [de output van alle combinaties] kan beoordelen is de AI zelf. Maar die is te dom - dus hebben we mensen nodig maar die hebben een hekel aan eindeloze herhaling (zeker als er relatief veel 'misses' in zitten).

Dus de manier waarop AI leert dicteert het tempo zo lijkt het en het geeft een hoge foutkans - daarom is in mijn ogen de manier waarop wel deze 'leert' wel belangrijk.
Stiekem telt het wel degelijk hoe het doel wordt bereikt - ook een domme muis komt uit het doolhof maar doet daar langer over en gebruikt meer resources om het eindpunt te bereiken.
Het proces is niet fout - maar zeker niet optimaal. Niet alleen het resultaat telt dus.
idd. En vergeet niet dat oeverloos combineren welliswaar 'innovatie' kan opleveren maar omdat deze AI niet kan beoordelen is het vooral en bovenal ... onzin.

Dus de 'makers' uitbuiten is een uiterst domme zet - voor het korte termijn gewin gaat het even goed.

En het simpelweg combineren van bestaand spul hebben we overigens zelden bestempeld als 'creatief'....
(want ook zonder AI konde we dat al lang)
Stel, een AI kan hardware-design heel goed namaken en is getraind op Apple hardware. Vervolgens brengt het bedrijf achter de AI een Macb@@k uit die heeeel erg lijkt op de Apple Macbook en er vervolgens bakken geld mee verdiend. Denk je dan ook dat de originele auteur (Apple/Jobs) geen recht heeft op compensatie? Die hebben gewoon patenten die zijn geschonden. Artiesten hebben net zo goed patenten, dat heet copyright en die worden momenteel door al die AI aan de lopende band geschonden en de bedrijven er achter verdienen er geld mee.
Je verwart patent met copyright met trademarks.

Het staat iedereen vrij een laptop te maken die qua functie lijkt op een macbook, zolang je A) geen patenten schendt en B de consument jouw product niet met een macbook kan verwarren. Als dat niet zou mogen dan is de hele markt op slot.

Een AI mag dat ook, vooralsnog. Een AI mag het alleen geen macbook noemen, het mag niet visueel identiek zijn aan een macbook en het mag geen patenten schenden. Of laat ik het zo zeggen, mensen mogen dit doen met de hulp van AI, en die mensen hebben dezelfde rechten en plichten als anderen.

Je kan pas zeggen dat copyright wordt geschonden wanneer wat een AI genereerd voldoende identiek is aan een creatieve expressie van een artiest. Meestal is dat echter niet het geval. Bovendien lijkt mij, maar daar heb ik onvoldoende juridische kennis over, dat de expressie van een AI pas copyright kan schenden als het actief in de handel gebracht wordt. Als ik thuis een bestaand liedje zing, dan is er geen sprake van schenden van copyright. Pas als ik ermee optreedt of het op spotify uitbreng, gaan de tentakels van brein zich naar mij uitstrekken. Dus uiteindelijk is het altijd weer een mens die verantwoordelijk is voor de AI-creaties.

[Reactie gewijzigd door Antipater op 28 januari 2025 14:02]

Helemaal gelijk, pas als het een kopie of bijna-kopie is en je daarmee commercieel belang uit aan het halen bent, is het copyrightschending.
Omdat jij het koopt toch? Koopt AI het of niet? Als ze het kopen dan ben ik het met je eens.
Mogen we nu aannemen dat Brein ook de andere AI makers gaat aanklagen? De Googles, OpenAI’s en Apples?
In principe staat het je natuurlijk vrij om verzoeken van BREIN te negeren tot ze bij de rechter aankloppen. Ik snap wel dat GEITje hier geen zin in had en gewoon luisterde, maar deze rechtszaak zou op zich een mooi concreet antwoord geven op de vraag of een LLM-model nu wel of niet een afgeleid product is van de inputdata.
@The Zep Man @jesse! @AW_Bos @GertMenkel
Sorry voor het verkeerde begrip. Zal de vraag herformuleren.

Mogen we nu aannemen dat Brein ook bij andere AI makers een dringend verzoek gaat doen?
Misschien hebben ze dat al gedaan en was het antwoord: Nee
Ik denk niet dat OpenAI hun email opent.
OpenAI geeft ook geen transparantie over waar ze op trainen. Dan moet Brein ineens zien aan te tonen dat er uberhaupt auteursrechtelijk materiaal is gebruikt, het heeft er misschien alle wchijn van maar dat echt onomstotelijk bewijzen is weer andere koek.

Een ‘probleem’ met GEITje is de eerlijkheid van de ontwikkelaar. Daardoor bleef ‘enkel’ nog de vraag open of trainen op illegaal verkregen bronnen het model illegaal maakt. Als Brein eerst daar jurisprudentie op krijgt (wat ook eens een betere kans van slagen voor Brein heeft met een tegenpartij die geen miljoenen tegen de rechtszaak aan kan smijten), staan ze sterker in volgende zaken.
Ik hoop het persoonlijk eigenlijk wel. Facebook en OpenAI zullen bereid zijn om hiervoor tot de hoogste rechter te gaan als dat nodig is (al is het maar de vraag of BREIN dat wil). Dan weten we eens en voor altijd hoe de vork nu in de steel zit als het op AI aankomt. Of hier nu uitkomt dat modelmakers een vergoeding moeten betalen of dat modellen geen copyrightschending zijn, het geeft in elk geval duidelijkheid.

Ik denk alleen niet dat BREIN dat gaat winnen, en ik heb het vermoeden dat ze daarom liever achter de kleintjes aan gaan. Het zou niet de eerste keer zijn dat ze het bij het sturen van een boze brief laten.

Wat BREIN wel of niet doet staat ze overigens natuurlijk helemaal vrij. Als je als artiest/auteur/whatever vertegenwoordigd wordt door BREIN en wil dat ze iets aan de AI-situatie doen, moet je hier vooral op aansporen, maar als stichting kunnen ze zelf kiezen welke overtredingen ze wel of niet proberen te vervolgen. Ze zijn tenslotte slechts een privéclubje van de auteursrechtindustrie, geen wettelijk aangestelde waakhond die voor alle burgers op moet komen.
Nee, BREIN pakt enkel partijen aan die kleiner zijn dan zijzelf waardoor het nooit tot een proces komt. Misschien niet populair om dat hier te zeggen maar gelukkig zegt Rijgersberg dat zelf ook:
Ik kan het me niet veroorloven om een lange en vooral zeer dure rechtszaak te voeren om die vragen wel beantwoord te krijgen. GEITje is immers een niet-commercieel, wetenschappelijk hobbyproject. Daarom voldoe ik aan het verzoek van Brein
Zolang de entiteiten van die bedrijven die het model trainen niet hier gevestigd zijn zal dat vermoed ik lastig zijn, Brein is immers door de auteursrechthouders alleen voor Nederland gemachtigd om hun rechten te verdedigen. In ieder land hebben ze daar een andere auteursrechtenwaakhond voor.

Wat je echter wel ziet is dat soortgelijke partijen als Brein en / of de aangeslotenen ( https://stichtingbrein.nl/aangeslotenen/ ) bij Brein zelf in bijvoorbeeld de US wel bezig zijn met dat soort rechtszaken.
Ik neem aan dat Brein iedereen zal bedreigen die niet de middelen in huis heeft een rechtzaak te riskeren, zeker nu ze succes hebben bij deze hobbyist. Dat is het typische patroon.
Het probleem is dat BREIN hiermee effectief gezien regulatory capture in de hand werkt. Kleine jongens worden bang gemaakt met dreigende rechtszaken terwijl de grote jongens zich de ballen uit de broek lachen als een (vanuit hun perspectief) minieme organisatie als BREIN ze bang probeert te maken.

Maar goed, BREIN en BumaStemra zijn nooit organisaties geweest met een goed doordacht gedachtegoed, dus het valt wat dat betreft ook wel te verwachten |:(

[Reactie gewijzigd door Halfscherp op 28 januari 2025 10:53]

Volgens mij is dat precies wat BREIN moet zijn voor de uitgevers, ervoor zorgen dat concurrentie niet kan ontstaan. Daarom zie je ook vaak bij nieuwe wetgevingen rondom IT dat grote bedrijven erom staan te springen. Want hoe meer regeltjes waar je als start-up mee moet bezig zijn en in moet investeren voordat je naar de markt kan, hoe kleiner de kans is dat je als gigant onderuit gehaald wordt.

Maar goed, ik heb nogal een cynisch wereldbeeld, kan het ook fout hebben.

[Reactie gewijzigd door Zwarte_os op 28 januari 2025 11:05]

Dat is het nadeel van Brein.

Ze doen te veel alsof ze echt wat te zeggen hebben. Terwijl het eigenlijk gewoon een opgeklopte belangengroep is.

Helaas heeft Brein geld genoeg om de kleinere kapot te maken, door rechtszaken en zo. Waardoor hun beeld van wij hebben het echt voor het zeggen alleen maar groter lijkt voor een leek.

Ik vind het altijd bijzonder dat Brein zijn gevechten goed kiest. Er is maar weinig in het nieuws dat Brein een "boete" heeft opgelegd die hard afgestraft word door de rechter.

Zo heeft op een of andere manier Brein het zelfs voor elkaar gekregen dat bijvoorbeeld Ziggo, mee te werken in dat ze massadownloaders/uploader kunnen aanpakken. Al denk ik dat een goede massadownloader er wel voor zorgt hij of zij niet gepakt word.

Iets wat voor te zotten is als een belangengroep....
Ja, precies. En het wetenschappelijk gebruik van GEITje is nu ook van de baan terwijl het verder nog gewoon gebruikt kan worden - want je kunt het downloaden, het is “out there”. Dus dit is vooral effectief om de Europese it industrie verder te onderdrukken. Vinden die Amerikanen en Chinezen wel best natuurlijk.
Mogen we nu aannemen dat Brein ook de andere AI makers gaat aanklagen?
Brein heeft niemand aangeklaagd.
Nee, ze hebben een wetenschapper met een kleine portemonnee gedreigd met een rechtszaak.
Dat is hun hele verdienmodel. ik heb nul respect voor BREIN. Minder dan nul zelfs.
idd - misschien is dat een opstapje? Klein beginnen? Of is het zoals altijd; Brein pakt alleen het laaghangend fruit om toch over te komen als een 'goede plukker'?
Ze moeten inderdaad niet aanklagen. Afdreigen is genoeg.

Wie gaat er nu zijn/haar inkomen/huis/eigendommen als risico inbrengen?
Als ze kunnen bewijzen dat die met illegaal vergkregen content uit Nederland zijn getraind, dan mogelijk wel ja
Geloof je het zelf? Zelfs Brein 's zakken zijn niet diep genoeg om de grote techbedrijven aan te kunnen pakken. De grote mediabedrijven en opdrachtgevers van Brein sluiten liever een deal met die bedrijven dan dat ze een procedure beginnen.
Het betreft geen aanklacht in deze zaak, maar 'een dringend verzoek', wat uit zou kunnen lopen tot een rechtszaak.
Dat is allang bezig. Steeds meer uitgevers sluiten overeenkomsten met AI bedrijven.
Het is veel makkelijker om iemand aan te pakken waarvan je weet dat die geen midddelen heeft om zich te verdedigen.
Ik denk dat ze wel tweemaal zullen nadenken vooraleer ze het opnemen tegen multimiljardairs die zich kunnen veroorloven om rechtszaken jarenlang te laten aanslepen tot de middelen van de andere partij uitgeput zijn.
Gerechtigheid is grotendeels ook een kwestie van geld geworden, waarbij de partij die de grootste financiële middelen heeft, veel meer kans heeft om er goed uit te komen.
Indien de oorspronkelijke makers niet willen dat hun materiaal voor het trainen van AI wordt gebruikt, dan moet dat ook gerespecteerd worden
Ik zou het andersom verwachten. Tenzij de maker het expliciet toestaat mag het niet. Zo ook met bijvoorbeeld web content.

Het web indexeren kan om verschillende redenen. Door zoekmachines krijg je als eigenaar van de informatie nog iets terug (publieke informatie wordt vindbaar). Het trainen van modellen van anderen voegt niets toe.

[Reactie gewijzigd door The Zep Man op 28 januari 2025 10:23]

Bor Coördinator Frontpage Admins / FP Powermod @The Zep Man28 januari 2025 10:28
Het trainen van modellen van anderen voegt niets toe.
Dat voegt voor de gebruikers van het model zeker wat toe. Zo lang je gebruik maakt van openbare bronnen lijkt mij gebruik voor verschillende doeleinden geen probleem. Verbied je dat dan zou ook de door jou genoemde zoekmachine (overigens veelal een commercieel initiatief) ook niet mogen. Dat jij vindt dat een doel niets toevoegt wil niet zeggen dat dit voor anderen ook zo is.
Dat voegt voor de gebruikers van het model zeker wat toe
Ja zeg. Dat is uit zijn context gerukt; daar had The Zep Men het niet over. Het voegt in de context van The Zep Men inderdaad niets toe.
Zo lang je gebruik maakt van openbare bronnen lijkt mij gebruik voor verschillende doeleinden geen probleem.
De gebruiker heeft te controleren of en bron mag worden gebruikt. Dat iets op internet is gepubliceerd geeft niet zonder meer het recht voor eigen doeleinden te gebruiken laat staan voor commerciële doeleinden.
Verbied je dat dan zou ook de door jou genoemde zoekmachine (overigens veelal een commercieel initiatief) ook niet mogen.
Er is geen enkel probleem c.q. bezwaar om toe te staan dat een zoekmachine de door jou op internet gepubliceerde informatie te indexeren. Dat betekent echter niet dat deze informatie zomaar voor andere doeleinden mag worden gebruikt.

Anders mag zoekmachine 'The Lord' alle content zeker ook indexeren en bij beantwoording van een zoekopdracht dit als 'eigen' presenteren en hier direct geld aan verdienen.
De gebruiker heeft te controleren of en bron mag worden gebruikt.
De gebruiker moet dat controleren? :? Lijkt mij meer de taak van de ontwikkelaar van de LLM om dat eerst uit te zoeken voordat diens LLM met die data getraind wordt.
[...]
De gebruiker moet dat controleren? :?
De ontwikkelaar van de LLM is de gebruiker van de data in deze context.
Maar de context van @Bor zijn reactie is de gebruiker van het model, niet de ontwikkelaar.
Ongeacht de context; de gebruiker heeft het te controleren ja.

De entiteit welke een LLM van bron informatie voorziet moet dat controleren.

En als je als gebruiker, voor niet strikt persoonlijk gebruik, de output van een LLM gebruikt dan zul je dat ook moeten doen. Ergo, als de LLM dit niet ontegenzeggelijk juridisch hard maakt kun je het dus niet gebruiken.
Dat voegt voor de gebruikers van het model zeker wat toe.
Even de zin daarvoor lezen. Het gaat om als eigenaar van de data (en daarmee impliciet geen gebruiker van het model) dat het niets toevoegt.
Verbied je dat dan zou ook de door jou genoemde zoekmachine (overigens veelal een commercieel initiatief) ook niet mogen.
Ik ben er een voorstander van om het respectvol omgaan met robots.txt juridisch af te dekken.

[Reactie gewijzigd door The Zep Man op 28 januari 2025 10:55]

Dan moet er wel eenduidig worden vastgesteld, wát een "openbare bron" is.
Te veel denken dat als het vrij toegankelijk is op internet, het openbaar is . Dat is uiteraard een misvatting.

En hoe ga je dan om met bedrijven buiten Nederland, die het niet zo nauw nemen met de regels in Nederland/EU?
Een "no-index no-follow" houdt ze echt niet tegen.
Verbied je dat dan zou ook de door jou genoemde zoekmachine (overigens veelal een commercieel initiatief) ook niet mogen.
Verschil is wel anders met een zoekmachine. Want bij zoekmachines hebben ook de sites die door zoekmachines geïndexeerd zijn er wel degelijk baad bij: ze brengen immers bezoekers naar hun website.

Bij training van AI is het gewoon op zijn best onduidelijk of de auteur of uitgever baad heeft bij het afstaan van diens artikelen of wat dan ook aan data. Met andere woorden: welke baad ligt hier voor de uitgever of auteur, anders dan het helpen trainen van het AI model? Ziet het er iets voor terug, waar dat bij zoekmachines immers veel duidelijker is: mogelijk meer inkomsten, doordat de zoekmachine nieuwe bezoekers brengt met (mogelijk) advertentie inkomsten.

[Reactie gewijzigd door CH4OS op 28 januari 2025 11:42]

Tenzij de maker het expliciet toestaat mag het niet
Voor het hosten van een corpus kun je dat met zekerheid zeggen. Als het om een getraind model gaat, worden de lijntjes wat vager.

Zonder jouw toestemming mag ik prima jouw website scrapen, verwerken, samenvatten, noem maar op. Het wordt lastiger als ik dat werk online zet, maar dat is niet wat bijvoorbeeld ChatGPT doet: ze houden hun model en corpus bij zich en verspreiden daarmee niet jouw gecopyrighte inhoud (direct). Voor AI rest dan de vraag of de output van een model dat mede door jouw data is getrained, ook afgeleid werk van jouw werk is en daarom een auteursrechtschending is. Daar zijn de meningen nog over verdeeld.

De hele AI-industrie draait op grootschalig consumeren van gecopyrighte stukken. Als het inderdaad illegaal is om je model te trainen zonder voorgaande toestemming, kunnen Apple, Facebook, Google, Microsoft, OpenAI, en alle andere AI-bedrijven wel meteen hun Europese tak dichtgooien.

Ik ben bang dat het te laat is om hier nog wat aan te doen. Als de AI-industrie Nederland danwel Europa verlaat, scrapen en trainen ze nog steeds Europese inhoud, maar bieden ze die niet aan in Europa, waarmee we met zo'n beetje alles van spamwering tot automatisering achter zouden lopen op de wereld. Ik weet niet of dat nou wenselijk is, eerlijk gezegd.

Principieel ben ik het met BREIN eens dat zo'n model een afgeleid werk is en gewoon toestemming zou moeten hebben om getrained te worden, maar aan de andere kant vind ik ook dat dit voor wetenschappelijk gebruik gewoon moet kunnen, en dat ze maar eerst achter OpenAI en vrienden aan zouden moeten gaan.
Zonder jouw toestemming mag ik prima jouw website scrapen, verwerken, samenvatten, noem maar op.
Je kan het (proberen). Of het mag ligt aan mijn gebruiksvoorwaarden, hoe ik die afdwing (zoals een verplichte inlog), etc.
Natuurlijk, jij mag als privépersoon en meestal als bedrijf anti-scrapertechnieken inzetten, CAPTCHA's, remote attestation, wat je ook wilt, zolang het legaal is.

In de praktijk blijkt dat toch verdomd lastig zonder alle inhoud achter een login te zetten, iets dat niet ten goede komt van je Google-rankings of algemene gebruiksvriendelijkheid.

Ik heb zelf diverse bots op mijn website moeten blokkeren (vooral de Chinese bots zorgen voor overlast), maar ik kan ze niet direct aanklagen voor het scrapen van mijn website.

[Reactie gewijzigd door GertMenkel op 28 januari 2025 11:18]

Data voor de datasets t.b.v. AI training werd ook vergaard door abonementen te nemen op kranten en daara het archief leeg te trekken.

Gebruikersvoorwaarden werden gewoon genegeerd. Copyrights werden overtreden door de dataset zelf gewoon te verspreiden.

Allemaal onder het mom van de wetenschap. Daarna werd het afgeleidde werk, de LLM, gewoon commercieel verkocht om geld te verdienen.
GEITje is wel een leuke naam voor een AI taalmodel. Zie hier waarom die naam precies: https://goingdutch.ai/nl/posts/naming-geitje/

[Reactie gewijzigd door deSenna24 op 28 januari 2025 10:26]

"GEneratIeve Transformer" voor de luie mensen
Dat heeft hij er gewoon achteraf van gemaakt. Staat ook in dat artikel. Het is meer dat het dierenthema door Meta is gezet met hun LLaMa modellen, dus daarom is het logisch (en leuk) om in dat thema te blijven.
Ik was bekend met Geitje door Tweakers en denk dat het heel belangerijk is dat we goede nederlandse LLM's ontwikkelen. Je ziet nu ook bij Deepseek dat deze in andere talen dan chinees en Engels gewoon niet op niveau is. Het zou een nationale effort moeten zijn om hier iets voor te ontwikkelen. Er zijn zoveel toepassingen. Het liefst ook multimodal. Zodat je overal goede TTS kan toevoegen, nederlandse dialecten en talen kan bewaren, het kan gebruiken voor smart devices, misschien zelfs ouderen (met dementie) die kunnen praten/luisteren naar het Polygoonjournaal. De mogelijkheden zijn echt eindeloos.
De mogelijkheden zijn niet eindeloos. Dat is ook waarom je niet zomaar andermans gegevens kan gaan gebruiken om te doen alsof er 'gemakkelijk' genoeg valt te ontwikkelen terwijl de investering in tijd en moeite ieder moment kan verdampen.
De mogelijkheden zijn eerder beperkt, omdat het investeren in benodigde middelen zoals gegevens zeer kostbaar is. Terwijl het resultaat niet perse nodig is.
Er is ook veel minder Nederlands content om op te trainen.
Gaat brein dan ook achter alle forks aan? Zoals deze? of deze

[Reactie gewijzigd door Brantje op 28 januari 2025 10:43]

Toch wel even duiden dat Fietje helemaal niets met GEITje te maken heeft en ook niet op dezelfde data getraind is. Het is helemaal geen fork, wat je daar ook mee bedoelt.
Ik vind het hoog tijd dat BREIN, een gezichtsloze machtige stichting, keihard wordt aangepakt. BREIN doet voorkomen alsof ze opkomen voor die arme schrijvers en artiesten maar het tegendeel is het geval: het is een ordinaire maffia partij die derde kleine partijen afperst in het belang van de gevestigde orde in de industrie. Nu wordt er weer een innovatieve niet-commerciële hobbyproject met potentie de grond ingeboord: daarom innoveren wij nauwelijks meer in Nederland. Overal lopen we achter dankzij ordinaire hebzucht van naamloze multi-nationals die partijen als BREIN inschakelen.
Dus iemand er op wijzen dat ze de wet overtreden staat bij jou gelijk aan maffia praktijken?
Brein is een klokkenluider die zegt dat iemand iets niet mag doen. Ze gaan daarna als politieagent optreden, wat ze niet zijn.

Als Brein een door de overheid gekozen organisatie was die deze belangen kwesties allemaal oplost, dan begrijpt de Nederlander dat.

Maar nee, Brein komt door als een paar omhooggevallen mensen die ergens geld inzien volgens wat principe kwesties. Dat begrijpt de Nederlander niet.

EDIT: Als voorbeeld: Als ik mijn auto verkeerd parkeer, dan hoort de buurman de politie in te schakelen om het op te lossen. Niet mij een betalingsverzoek als persoon sturen dat ik iets verkeerd gedaan hebt.

[Reactie gewijzigd door kujinshi op 28 januari 2025 14:32]

Brein treed niet als politieagent op. Ze hebben dezelfde mogelijkheden die jij als persoon ook hebt.

En Brein is wel degelijk een door de overheid gekozen organisatie. De overheid wilde dat werk niet door de politie laten doen (waar het eigenlijk hoort) en heeft verteld dat er iets als Brein opgericht moet worden.
Wat een onzin. Brein is de buurman bij jou aanbelt en vraagt of je je auto als een fatsoenlijk persoon wil parkeren. Als jij dan niet luistert, belt buurman de politie/boa en die komt jou dan hopelijk een boete geven.

En hoe "zien ze er geld in"? Misschien moet je eens opzoeken wat een stichting precies inhoudt.
Ik vind ze wel handig. Elke keer dat ze ergens tegenaan schoppen dan weet je dat de bron wat voorstelt.
Het helpt bij het zoeken van goede data.
"Brein is niet tegen het trainen van AI, maar vindt wel dat de auteurs van al die muziek, boeken etc. daarvoor een eerlijke vergoeding moeten krijgen. Indien de oorspronkelijke makers niet willen dat hun materiaal voor het trainen van AI wordt gebruikt, dan moet dat ook gerespecteerd worden", schrijft de stichting.
Top, wanneer zorgt Brein ervoor dat ook ChatGTP, Gemini en aanverwanten offline worden gehaald? Die hebben namelijk ook ongevraagd en zonder vergoeding materiaal van mij gebruikt.
Het is niet hun taak om vergoeding te vragen voor jou.
Niks houdt jou tegen om zelf die vergoeding te vragen, of een vereniging te starten met lotgenoten om samen die vergoeding te vragen.
Correct, maar dat is toch ook niet wat ik vraag? Ze leggen druk op een kleine partij vanwege inbreuk op het auteursrecht. Ik wil alleen maar dat ze ook andere, grotere partijen die inbreuk hebben gemaakt op het auteursrecht aanpakken. Niet alleen de kleine spelers. Anders zie ik dat wel als een grote zwakte van Brein.
Ben jij de auteur van één van die boeken?
Heb jij informatie dat die andere grote partijen dezelfde bron hebben gebruikt voor het trainen?
Neen, voor zo ver ik weet niet in dat specifieke corpus. Wel zijn we er met gerichte vragen aan verschillende AI’s er achtergekomen dat ze auteursrechtelijk materiaal hebben gebruikt, van mij, maar ook van anderen.
Kijk, zo kennen we Brein weer.
Enkel achter de kleine onvermogende gebruikers aan gaan die zich geen dure rechtszaken kunnen permitteren.
Onvoorstelbaar dat een particulier bedrijfje op deze manier geld kan verdienen.
Dat is wel waar...
Google heeft ook een grootschalige contentroof gedaan jaren geleden en daar is volgens mij niet veel mee gedaan door Brein. Ze zijn wel rijk bij Brein maar niet Google-rijk ;-)
Genoeg parijen dagen Google. Kijk maar naar Frankrijk, Google betaald daar gewoon aan de content creators.
En wie zijn die partijen? Geen bedrijfjes zoals Brein.
Apple? Zeker. Overheden/landen... ook zeker. De EU absoluut, maar geen weldenkend bedrijf gaat procederen tegen Google. Sommeren wordt vaak genoeg gedaan, maar de stap naar de rechter door een bedrijf van de grootte van Brein, zelden tot nooit.
Bedoel je het project van Google om alle boeken op aarde te scannen?
Of waren het alleen wetenschappelijke boeken. Tijd gelden dat ik er over las.
Wel de ultieme basis voor een wetenschappelijk AI model.
Het ging om alle boeken. Je kon wel aangeven dat je niet wilde dat jouw content er in kwam, maar dan moest je dat zelf laten weten en dan nog wilden ze niet garanderen dat het ook niet gedaan werd. Uiteraard zonder vergoeding te betalen

Op dit item kan niet meer gereageerd worden.