Je vergelijkt nu een mens met een hedendaagse 'AI'. Dat is appels met konijnen vergelijken.
Waarom?
Ik vind het een heel terechte vraag wat nu echt het verschil is tussen een mens en een machine?
Een hedendaagse 'AI' is niets anders dan een computer die data verwerkt. Niet alle data mag je zomaar (in bulk) verwerken.
Welke wetgeving heb jij in gedachte? Ik ken die term eigenlijk alleen vanuit de surveillance hoek (de sleepnetwet) maar ik vind die wet niet heel relevant in deze situatie, die wet gaat vooral over privacy en de relatie burger-staat.
De mooiste oplossing zou wetgeving zijn die de herkomst van elke AI-interactie inzichtelijk maakt, zodat duidelijk is welke data onder welke licentie gebruikt is.
Ik zie niet hoe dat zou moeten werken met LLMS. Bij ieder antwoord krijg je dan miljarden bronnen die allemaal voor 0.001% zijn gebruikt waarvan het allergrootste deel niks met het onderwerp te maken heeft.
We zien soms complete stukken trainingsdata uit LLMs komen die aan 1 bron te koppelen zijn maar dat zijn fouten in het systeem. Je kan er normaal gesproken niet van uit gaan dat de antwoorden van een LLM aan een bron te koppelen zijn.
Ik wil hier even een stapje terug doen naar de vraag waar ik mee begon: Wat is het verschil tussen een mens en een AI? En waarom doet dat er toe?
Onze wetgeving rond kennis, leren en copyright is deels gebaseerd op hoe mensen werken. Als we iets horen, zien of lezen dan onthouden onze hersenen dat vanzelf en kunnen dat deels reproduceren en dat mag. Het is niet mogelijk om het te verbieden of te reguleren want we hebben er geen controle over en kunnen ook niet in het hoofd van mensen kijken om te zien wat ze denken. We zijn zelfs jaren van ons leven bezig met lesboeken lezen en de kennis daarvan ons eigen maken en we geven er zelfs subsidie op. Je mag daarna zelf je eigen boeken schrijven met precies dezelfde kennis er in zolang je het maar in je eigen woorden doet. Waarom wordt het anders als een computer dat doet?
In het geval dat een LLM een exacte kopie van de bron geeft dan kunnen we dat wel beoordelen met de huidige copyrightwetgeving maar wat NYT wil gaat veel verder. NYT wil betaald krijgen omdat artikelen van NYT gebruikt zijn om de AI te trainen. Mijn eigen hersenen zijn ook getrained op krantenartikelen. In mijn leven heb ik er duizenden gelezen, geschreven door professionele journalisten en redacteuren die me niet alleen kennis over de wereld hebben gegeven maar ook over taal en communicatie.
Alles wat ik hier op Tweakers schrijf is op in zekere mate beinvloed door alles wat ik ooit heb gelezen. Gelukkig krijg ik geen rekening voor iedere post hier op Tweakers omdat ik in 1993 ooit een keer een Volkskrant heb gelezen.
Vanuit menselijk oogpunt is dat helemaal redelijk en normaal maar de logica is vooral gebaseerd op "zo werkt het menselijke lichaam nu eenmaal". Zodra techniek een rol begint te spelen wordt het lastiger. Dan wippen we heen en weer tussen de logica die gebaseerd is op het menselijke lichaam en andere (vooral financiele) belangen.
Als we zeggen "zo werkt de mens nu eenmaal" zouden we ook kunnen zeggen "zo werken computers nu eenmaal". Of dat redelijk of wenselijk is laat ik even in het midden maar ik vind dat er een hoop moeilijke vragen zijn die nog geen bevredigend antwoord hebben. (Even afgezien van circulaire redeneringen als: "computers zijn anders omdat de wet zegt dat er een verschil")
Vragen als:
Wat is het verschil tussen mens en machine?
Wat is het verschil tussen leren en kopieren?
Wat is het verschil tussen menselijk leren en machinaal leren?
Is er uberhaupt een verschil?
Wat is het verschil tussen iets zelf doen of iets met een hulpmiddel als een computer of een bril of een samenvatting te doen?
In welke gevallen is ons menselijke lichaam de maatstaf en wanneer/waarom niet?