Ondanks de indrukwekkende resultaten tot nu toe zou ik er niet meteen op rekenen dat dit inderdaad kan over een paar jaar. Allereerst, het proces dat je eerst beschrijft met genereren van een plot en dat vervolgens uitwerken in zinnen is ongeveer net zo omslachtig als het boek zelf schrijven. Er kan je wat werk uit handen genomen worden, maar cruciaal voor het slagen van het project is toch echt dat jij GPT zeer goed coached in wat je eruit wilt hebben. Achteraf kun je dan beter zeggen dat jij het geschreven hebt. GPT is dan een hypergeavanceerde typemachine met ingebouwde rubber duck. Een stuk gereedschap dus. De creatieve keuzes zijn nog namelijk nog steeds de jouwe.
Nu nog wel, maar GPT staat ook niet stil, GPT4 is onder andere veel beter in lange teksten schrijven.
GPT3 schrijft nu al een paar pagina's tekst met een samenvatting van Harry Potter die prima is, zowel inhoudelijk als wat betreft leesbaarheid.
Je kan GPT ook zien als een vorm van datacompressie. Je geeft een lange tekst aan GPT en vraagt om een compacte samenvatting. Vervolgens geef je de samenvatting weer aan GPT en vraagt om er een prettig leesbare tekst van te maken.
Het maken van een samenvatting van een werk zien we momenteel niet als overtreding van het copyright, dat is gewoon toegestaan en iedere middelbare schoolleerlingen heeft wel eens een boek moeten samenvatten.
Een samenvatting is je eigen creatieve werk. Als ik mijn samenvatting van HP dan aan GPT geef om uit te werken dan komt daar gewoon het verhaal van Harry Potter uit in iets andere woorden. Dan komt het toch weer erg dicht bij wel copyright schending. Maar ja, dan vertel ik GPT wel dat hij geen inbreuk moet maken op het copyright op HP. Ik ben er van overtuigd dat GPT dat kan. GPT heeft nu ook al een ethische module die je vertelt dat genocide niet lief is en GPT je daar niet mee wil helpen.
Dat is een van de punten waar ik denk dat we er niet uit gaan komen met onze huidige copyrightwetten. In grote lijnen is er nog steeds sprake van een creatief proces maar het gereedschap past niet meer in de hokjes van de wet. Net zoals de drukpers niks inhoudelijks heeft veranderd aan boeken, alleen het proces waarmee we ze maken. Toch is dat proces zo anders dan met de hand boeken overschrijven dat hedendaagse auteursrechten gedomineerd worden door copyright.
Zelfs als het zover komt dat er zo een kant en klaar boek uit GPT komt rollen dat de moeite van het lezen waard is ben je er nog niet. Met een druk op de knop komen er dan ook honderd boeken uit. Of duizend. Welke van die duizend ga je lezen? Allemaal kan niet. Meer AI ertegenaan, die leert wat wat je voorkeuren zijn en die je ook nog eens wat buiten je comfort zone voorschotelt om je uit te dagen?
Klinkt goed. Maar wie heeft dan het copyright op die boeken?
Ben jij dat? Het is immers op jouw voorkeuren gebaseerd.
Is de programmeur van de AI het? De programmeur heeft immers gekozen hoe de AI reaggeert.
Of is het de auteur van de trainingsdata waar de AI mee getrained is (oftwel miljoenen schrijvers)?
Ik heb het antwoord niet. Als ik de bot vertel welke boeken ik heb gelezen dan kun je zeggen dat ik creatieve keuzes heb gemaakt in welke boeken ik wel of niet lees of vermeld. Als de bot meekijkt met de boeken die ik lees ,is het dan nog creatief? Ik kies nog steeds welk boek ik uit de kast pak. Als ik iets kan kiezen is er sprake van een creatief proces.
(Voor de lol kun je deze gedachtegang ook doortrekken naar het tracken van mensen en hun keuzes online.)
Het is niet onvoorstelbaar hoor, maar het zijn nog wel wat stappen extra die gezet moeten worden. Tot die tijd is menselijke bemoeienis een stuk efficienter. En zodra mensen het resultaat gaan kleuren ben je ook weer terug bij het beroepen op intellectueel eigendom, enz.
Er zijn inderdaad nog wat stappen te nemen maar in mijn ogen is het een zekerheid dat we die gaan nemen, de enige vraag is wanneer. Nu GPT de wereld heeft laten zien wat er mogelijk is gaan de ontwikkelingen keihard. GPT3 is al weer 3 jaar oud en draait op een miljoenen kostende supercomputer. Inmiddels zijn er GPT-achtige modellen die op een gewone PC draaien al hele aardige resultaten geven. Nu we een keer gezien hebben wat mogelijk is en wat belangrijk is zijn we aan het optimaliseren geslaan waardoor de software duizenden keren sneller is geworden. Geef het nog drie jaar en ik ben er van overtuigd dat er GPT-achtige systemen zijn die op je mobiele telefoon draaien. Ondertussen denderen ook de supercomputers verder en profiteren ook van de vooruitgang in efficiëntie.
Of het nu 1 jaar duurt of 10 jaar maakt voor mijn boodschap overigens weinig uit. Het gaat nodig zijn om onze auteursrechten en copyright aan te passen aan de nieuwe techniek. Misschien is het nu nog te vroeg omdat we het eigenlijk nog niet kunnen overzien, maar wetende hoe traag het wetgevingsproces gaat kunnen we maar beter alvast beginnen met nadenken. Ik zou nu allerlei (doem)scenario's kunnen schetsen maar daar heb ik geen zin in want ik zie het optimistisch in. Mijn enige waarschuwing is dat we zelf het heft in handen moeten houden en voorkomen dat er onomkeerbare zaken gebeuren voor de wet kan reageren.
De een z'n doemscenario kan overigens de ander z'n droom zijn. Zo zijn er fors uiteenlopende meningen over Disney, dat een van de drijvende krachten achter het huidige copyright is. Grote groepen mensen zouden om uiteenlopende redenen heel blij zijn als ze het copyright van Disney kunnen omzeilen. Andere groepen denken daar heel anders over.