Als je met ChatGPT een artikel schrijft of met Midjourney een afbeelding samenstelt, wie heeft daar dan de auteursrechten op? Die vraag kreeg ik een aantal keer voorgelegd onlangs, en het antwoord is lastiger dan je denkt. De simpele reden is dat AI niet compatibel is met de aannames uit het auteursrecht zoals die in 1710, 1912 en daarna zijn vastgelegd. Maar dat mag in het recht geen belemmering zijn. Hoe gaan we nu verder?
Bescherming van creativiteit
"Het auteursrecht is het uitsluitend recht van den maker van een werk van letterkunde, wetenschap of kunst, of van diens rechtverkrijgenden, om dit openbaar te maken en te verveelvoudigen, behoudens de beperkingen, bij de wet gesteld", zoals artikel 1 Auteurswet het formuleert. Een maker van een werk krijgt dus rechten, maar moet bepaalde beperkingen respecteren.
Duidelijk. Maar wat is dan een 'werk'? Daarover heeft het Hof van Justitie zich uitgelaten: het moet een 'eigen intellectuele creatie' zijn, meer dan alleen een hoop dingen bij elkaar brengen. Je moet iets creatiefs, iets persoonlijks hebben ingebracht in het werk. Dat hoeft niet veel te zijn, ook bij simpel stockbeeld of een snel gemaakte vakantiefoto zou je al van creativiteit mogen spreken. Tegenvoorbeelden zijn schaars, maar in 2017 oordeelde de rechter dat een simpele foto van een dashboard niet voor auteursrecht in aanmerking komt:
De foto betreft een natuurgetrouwe zo duidelijk en correct mogelijke close-up van een temperatuurmeter in een auto. Dat daarbij variaties mogelijk zijn in de belichting, afstand en hoek, zoals door Masterfile en Mediapro ter zitting naar voren is gebracht, is naar het oordeel van de kantonrechter onvoldoende om te kunnen spreken van een oorspronkelijk werk.
Creativiteit bij AI
Hoe zit dat nu als je een AI-tool gebruikt in een schrijf- of ander ontwerpproces? Hulpmiddelen zijn natuurlijk van alle tijden, van checklists over wat er in een succesvolle blogpost moet tot sjablonen voor een contract of spelling- en grammaticacheckers. Maar met de huidige tooling gebaseerd op generatieve AI ga je wel een stap verder. Van de zomer publiceerde Tweakers nog dit artikel over Adobe Generative Fill, dat je beeld uitbreidt en aanvult zoals je maar wilt. Eerder kwamen al tools zoals de AI-Assistent van Notion langs (ik werk zelf met concurrenten Lex.Page en Typetone).
Waar komt de creativiteit vandaan bij AI?
Waar ligt het auteursrecht als ik met zo'n tool werk? De vraag blijft: waar komt de intellectuele prestatie, de creativiteit vandaan? Je zou kunnen zeggen: bij de mens die het proces in gang zet, de prompt engineer zoals dat soms heet. Alle resultaten zijn het gevolg van die prompt, dus de prompt is de creatieve inbreng en de resultaten zijn een rechttoe rechtaan invulling daarvan.
Met die redenering probeerde artiest Kris Kashtanova begin dit jaar diens werk vast te leggen bij het US Copyright Office. Een handeling die op zich niet nodig is: auteursrecht heb je zodra je het werk maakt. Maar in de VS levert registratie je diverse voordelen op, zoals het direct kunnen procederen en het eisen van statutory damages (duizenden dollars per inbreukmakende kopie). Formeel is dit een registratie; de USCO onderzoekt niet of je werk wel echt creatief is.
Bij het werk van Kashtanova, de graphic novel Zarya of the Dawn, deed de USCO dat toch, mede omdat Kashtanova publiek had gemeld het werk gedeeldelijk met Midjourney gemaakt te hebben. Dat gaf de formele aanleiding: 'uw formulier is niet volledig ingevuld' en daarmee kon het Copyright Office rustig uiteen zetten waarom alleen mensen creatieve werken kunnen maken in de zin van de wet:
Rather than a tool that [Mx]. Kashtanova controlled and guided to reach her desired image, Midjourney generates images in an unpredictable way. Accordingly, Midjourney users are not the 'authors' for copyright purposes of the images the technology generates. … A person who provides text prompts to Midjourney does not 'actually form' the generated images and is not the 'master mind' behind them. Instead, as explained above, Midjourney begins the image generation process with a field of visual 'noise', which is refined based on tokens created from user prompts that relate to Midjourney’s training database. The information in the prompt may 'influence' generated image, but prompt text does not dictate a specific result.
Oftewel: die prompt bij Midjourney is helemaal niet het startpunt van een rechtstreeks en lineair proces. Het initieert wel een en ander, maar het systeem van Midjourney genereert meerdere afbeeldingen met hooguit enige invloed van de prompt. Daarmee is er dus wel degelijk creatieve inbreng vanuit het systeem Midjourney aan te wijzen, zodat Kashtanova niet de enige maker kan zijn. Maar wie is dan de co-auteur, het bedrijf Midjourney Inc. of misschien wel de tool zelf?
Bescherming van de maker
De tweede eis om auteursrecht te krijgen, is dat je de 'maker' ervan bent. Hoofdregel uit de wet is dat dit de persoon is die het werk heeft gemaakt, maar dat hoeft niet: je werkgever is bijvoorbeeld de 'maker' van alles dat je als deel van je werk maakt.
Bij freelancers en andere creatievelingen die in opdracht werken, speelt vaak de discussie waar de rechten liggen. De opdrachtgever is vaak erg specifiek in wat hij wil, en ziet het werk als 'alleen maar maken wat ik omschrijf'. Toch komen die dan bij de rechter van een koude kermis thuis: ook het werken binnen bepaalde kaders of functionele eisen blijft 'creatief'. Pas wanneer je echt alleen maar invult wat de opdrachtgever wil en daarbij geen eigen keuzes kunt maken, dan kan het auteursrecht bij de opdrachtgever komen te liggen.
Je kunt ook samen met iemand anders een werk maken. Als de delen van dat werk dan niet te scheiden zijn, dan heb je één gezamenlijk auteursrecht. Denk aan samen programmeren; natuurlijk kun je achterhalen wie welke regel schreef, maar het resultaat is één programma, dus één auteursrecht. Schrijf ik het boek en maak jij de illustraties, dan zijn de twee wel te scheiden. Maar wat gebeurt er nu als een deel van de creativiteit van een niet-mens komt, zoals bij Kashtanova?
Apenselfie
Een mooie testcase is de bekende 'Monkey Selfie'-case van fotograaf David Slater. Deze was in Indonesië een fotoshoot van een groep makaken aan het voorbereiden, en tijdens het instellen van de camera sprong een van de apen voor de camera en drukte op het knopje. De foto is zonder meer creatief in de zin van het auteursrecht, maar wie heeft de rechten? Slater vond natuurlijk dat hijzelf de rechten had; Wikimedia, dat de foto hostte bij het lemma over de apensoort, meende dat er geen auteursrecht op de foto zat. Het Hof van Beroep besliste in 2017 dat apen geen auteursrecht kunnen hebben.
De instellingen van een foto zijn een creatieve inbreng.
Wat ik miste in die uitspraak, is de (mogelijke) creativiteit van Slater bij het instellen van de camera. Een goede foto maken met een professionele camera is heel wat meer werk dan richt de lens en druk op het knopje. Al die instellingen kiezen is voor mij een stukje creatieve inbreng. Ik kan zelfs een heel eind meegaan met de gedachte dat uiteindelijk 'op het knopje drukken' nauwelijks nog bijdraagt aan de creatieve kant van de foto. De knop legt alleen maar vast: wat je vastlegt is daarvoor al besloten. Vanuit dat gezichtspunt was Slater dus wel degelijk de maker van de foto, en de aap alleen een behaarde zelfontspanner.
Creatief proces
Deze insteek is zeer relevant als we AI-systemen erbij pakken. Ook daar zit een heel creatief proces dat voorafgaat aan het knopje, de promptinvoerregel, dat jij als behaarde typist gebruikt. Het statistisch model waarmee de AI de uitvoer genereert, is reeds eerder gebouwd. En als we de redenering van het USCO volgen, dan ligt er dus een (fors) stuk creativiteit in hoe dat model tot haar uitvoer komt. Daarmee zou dat model dus medeauteur moeten zijn. Alleen: dat kan niet, want per definitie moet dat dus een mens zijn.
Ook bij andere juridische rechten speelt dit probleem. In octrooiland maakt de AI van ene Stephen Taler furore: DABUS doet de ene uitvinding na de andere, maar krijgt bij octrooiverlenende instanties nul op het rekest met het argument dat alleen mensen uitvindingen kunnen doen. In november 2021 verklaarde het Europees Octrooibureau bijvoorbeeld de aanvraag van DABUS ongeldig: een 'uitvinder' is volgens het woordenboek een mens die dingen uitvindt, derhalve kan een algoritme zoals DABUS dat met uitvindingen komt, geen uitvinder zijn. Terzijde: de fictieve Donald Duck was wel ooit uitvinder.
We zijn echter nog een groep vergeten: de auteursrechthebbenden op de data die ten grondslag lag aan het statistisch model.
Bescherming van de brondatamakers
Een paar weken terug meldde OpenAI dat ze voortaan robots.txt gaan respecteren, het protocol waarmee je ongewenste crawlers buiten je site kan houden. Het is een ontwikkeling in het heftige debat over het al dan niet mogen gebruiken van beschermd werk om een AI mee te trainen. Internetrecht herhaalt zich niet, maar rijmt: bij de opkomst van zoekmachines speelde precies dezelfde discussie. Mag een 'crawler' of 'webspider' (toen nog met aanhalingstekens) zomaar je hele site downloaden en daar een zoekmachine mee voeden, moeten ze toestemming vragen of moet jij bezwaar kunnen maken? Daar is robots.txt als compromis voor gekomen: jij noteert waar de robots niet mogen komen, prima als je je hele site uitsluit, maar wie niets zegt, staat alles toe.
Diezelfde oplossing wordt nu aangehaald om het probleem van de AI-crawlerbots op te lossen. Noteer hun namen en zeg waar ze niet mogen komen, en dan beloven ze weg te blijven. Dat kan, en sluit zelfs aan bij de Europese benadering van auteursrecht rondom datamining (art. 15o Auteurswet):
Onverminderd het bepaalde in artikel 15n wordt een reproductie in het kader van tekst- en datamining niet als inbreuk op het auteursrecht op een werk van letterkunde, wetenschap of kunst beschouwd mits degene die de tekst- en datamining verricht rechtmatig toegang heeft tot het werk en het auteursrecht door de maker of zijn rechtverkrijgenden niet uitdrukkelijk op passende wijze is voorbehouden, zoals door middel van machinaal leesbare middelen bij een online ter beschikking gesteld werk.
In gewoon Nederlands staat hier dat je mag dataminen, en dus ook je taalmodel voeden, als je legaal bij de content kon en je geen opt-out hebt genegeerd. Een robots.txt-vermelding is een goede manier om zo'n opt-out aan te geven, dus dan komt het neer op 'je mag dataminen behalve waar de robots.txt jou weert'.
Rechtszaken
Een statistisch model is geen kopie of reproductie van een daarin opgenomen werk
Er zijn ondertussen al vele, vele rechtszaken aangespannen, zie het overzicht bij de Copyright Alliance, over de vraag of het trainen van een AI telt als auteursrechtinbreuk. Mijn gevoel is van niet: een statistisch model kan ik niet zien als een kopie of reproductie van een daarin opgenomen werk. Maar er zijn genoeg argumenten hier tegenin te brengen, zoals bij de technologie achter Stable Diffusion waar heel nadrukkelijk kleine, vage stukjes van bronbeeld worden samengevoegd. Vergelijk dat met hoe de GPT-taalmodellen teksten maken, daar wordt veel meer over teksten heen gegenereerd. En bij Copilot van GitHub komen er dan weer wel letterlijk bronteksten uit soms, wat volgens mij komt doordat je bij software sneller een specifieke kant op moet.
Als er stukjes van je bronwerk in de uitvoer terechtkomen, dan zou je al snel van inbreuk kunnen spreken. Of je dat nou met een AI doet of met ouderwets schaar-en-lijm knippen en plakken. De enige vraag is dan nog of je het creatieve van dat werk hebt overgenomen. Wie een losgeldbrief maakt door letters uit de krant te knippen, schendt geen auteursrecht op de krantenartikelen. Maar de openingsalinea’s van die artikelen onder elkaar plakken en dat een knipselkrant noemen is wél een auteursrechtelijk relevante handeling.
AI in stijl
Op stijlen zit geen auteursrecht.
Iets ingewikkelder wordt het wanneer je een AI dingen laat maken 'in de stijl van'. Op stijlen zit geen auteursrecht, dus als jij ook kubistisch wilt schilderen dan is dat helemaal prima. Maar bij AI gaat het vaak eerder om imitaties van een specifieke auteur: een verhaal in de stijl van Tomas Ross' bijvoorbeeld. Dit is auteursrechtelijk lastiger te duiden, wat komt omdat het voorheen gewoon niet speelde, dat mensen uitgebreid in andermans stijl werken gingen maken. Nou ja, behalve de echte vervalsingen: niet alleen in die stijl, maar valselijk ook diens naam erbij. Dat is natuurlijk makkelijker aan te pakken.
Voor veel auteurs en andere makers is ook dit zeer lastig te verteren. Dat een systeem wordt getraind op veel werk, waaronder het jouwe, om concurrerende kunst te maken, dat is één ding. Maar dat het specifiek op jouw werk traint en ook jou als inputfilter gebruikt om slappe aftreksels van jouw werk te maken, dat gaat nog wel even wat verder. De onvrede over AI in de artistieke gemeenschap gaat dus vooral hierover.
Hoe nu verder?
Vooralsnog lijkt er weinig te gebeuren in auteursrechtland. Die rechtszaken duren nog wel een paar jaar, en dat is een eeuwigheid voor ict. Die opt-out van OpenAI is leuk, maar ze hebben heel internet al gedownload, dus dat zal niet direct veel toevoegen, en of concurrenten (vooral de nieuwe) hetzelfde gaan doen, is voor mij een open vraag.