Google krijgt Franse boete van 250 miljoen euro om nieuwsartikelen in Bard

Google heeft van een Franse toezichthouder een boete van 250 miljoen euro gekregen. Het bedrijf gebruikte artikelen van Franse media om Bard, nu Gemini, te trainen, zonder hiervoor media te informeren. Die media konden er ook niet zomaar voor kiezen toestemming hiervoor te weigeren.

Met Googles gedrag heeft het bedrijf eerdere afspraken geschonden, zegt de Autorité de la concurrence. Het gaat over afspraken uit 2022, waarmee het bedrijf onder meer aangaf media in Frankrijk beter en eerlijker te betalen voor hun content. Voor het trainen van de Bard-/Gemini-chatbot heeft Google echter content gebruikt van persagentschappen en uitgeverijen, zonder de rechthebbenden of de toezichthouder hierover te informeren.

Rechthebbenden konden er bovendien niet voor kiezen om toestemming hiervoor te weigeren, zonder dat dit gevolgen zou hebben voor de manier waarop Google omging met hun content op andere Google-diensten. Uitgevers konden Bard-crawlers alleen blokkeren door ook Search-, Discover- en News-crawlers te blokkeren. Rechthebbenden hadden daardoor onvoldoende vrijheid om juiste compensatie te krijgen, stelt de autoriteit.

Naast het gebruik van journalistieke content voor Bard en Gemini, was Google volgens de autoriteit niet transparant genoeg naar de rechthebbenden. Volgens de afspraken moet Google tijdig en transparant informatie delen over bijvoorbeeld hoe Google-diensten geld verdienen aan de content van de rechthebbenden. Zo moeten die uitgevers op een eerlijke wijze kunnen onderhandelen met Google over de juiste vergoedingen. Daarnaast was er een onafhankelijke autoriteit aangewezen die toezicht moest houden op de afspraken; Google communiceerde volgens de Autorité onvoldoende en te laat met deze autoriteit.

Google ging niet in beroep tegen de uitkomsten van het onderzoek van de toezichthouder en schikte. Daarom valt de boete lager uit. Het bedrijf heeft ook maatregelen aangekondigd om overtredingen in de toekomst te voorkomen. De Franse wet die Google heeft overtreden is een implementatie van een Europese copyrightrichtlijn.

Eerdere boetes en andere stappen van de Franse toezichthouder tegen Google
Eerdere boetes en andere stappen van de Franse toezichthouder tegen Google

Door Hayte Hugo

Redacteur

20-03-2024 • 13:29

33

Submitter: wildhagen

Reacties (33)

Sorteer op:

Weergave:

Wat ik me afvraag is of het gebruik van robots.txt met de juiste user agent (Google-Extended) niet de manier is om het crawlen van die informatie door Gemini tegen te gaan wel of niet van belang is bij de rechtszaak. Hebben die websites wel of niet een dergelijk robots.txt gebruikt? is dat van belang of niet?
Naar robots.txt kijken en je er aanhouden is een keuzen, die ze kunnen negeren. Is geen verplichting.
Google's common crawlers are used for building Google's search indices, perform other product specific crawls, and for analysis. They always obey robots.txt rules
Niet volgens hun eigen regels ;)
Een probleem is natuurlijk dat het bestaan en/of de risico's van zulke taalmodellen niet bekend was op het moment van scrapen. Zo'n robots.txt kun je dan alleen achteraf aanpassen, en dan mag je ook nog maar hopen dat die bot zich daaraan houd.

Ik weet uit ervaring dat sommige AI bedrijven zich daar vrij weinig van aantrekken.
Dit gaat niet om de risico's van taalmodellen maar de algemene risico's voor gebruikers als Google dat de maker van een werk er controle over en inzicht in het gebruik hoort te houden. Dat gaat in Frankrijk al terug tot 1791. De huidige Europese richtlijn is daar hooguit een variant op. Daarbij valt te betwisten dat de risico's van taalmodellen tijdens het scrapen niet bekend zouden zijn. Iedere vorm van gebruik van andermans werk geeft namelijk niet slechts voordelen maar ook risico's, bijvoorbeeld door verkeerd of ongewenst toepassen. Dat is ook precies een reden dat de rechthebbende inzicht en controle over het eigen werk hoort te hebben, zodat deze kan beslissen of de risico's duidelijk genoeg zijn en daarop wel of geen toestemming te verlenen. Het vermeende onduidelijk zijn van risico's kan juist een reden zijn om het te riscant te vinden het werk te laten gebruiken.
Jawel. Maar deze is pas beschikbeer gekomen op 28-09-2023. Daarvoor was er dus geen mogelijkheid anders dan alles blokkeren.
En belangrijk. Je moet dan wel duidelijk aan de wereld gaan vertellen dat je een nieuwe optie toe gaat voegen om de crawler tegen te houden. En wat de gevolgen, positief/negatief zijn bij gebruik.
Volgens Google doen ze dit natuurlijk wel, maar volgens de Franse bureaucraten was dit niet flexibel genoeg want als je robots.txt aanzet verlies je natuurlijk ook de vindbaarheid en dus het inkomen.

De EU in al die zaken wilt dus dat de grote EU bedrijven hun geld verdienen aan Google/Apple/… diensten maar een bedrijf mag zelf niet innoveren zonder dat geld af te staan aan grote EU bedrijven en/of de staat.
volgens de Franse bureaucraten was dit niet flexibel genoeg want als je robots.txt aanzet verlies je natuurlijk ook de vindbaarheid en dus het inkomen.
Misschien toch even de link lezen die ik in mijn post had. De user agent die je in Robots.txt zet is bepalend voor welke robot wel of niet bij je content mag. Het staat letterlijk dat bij het juist configureren dit geen effect heeft op vindbaarheid van de website:
Google-Extended is a standalone product token that web publishers can use to manage whether their sites help improve Gemini Apps and Vertex AI generative APIs, including future generations of models that power those products. Google-Extended does not impact a site's inclusion or ranking in Google Search.
Opnieuw, de uitgevers willen dat hun content gebruikt wordt. Als ze een anti-AI op de site zetten kunnen ze niet betaald worden.

Wat de staat wilt is dat de staatsmedia passief inkomen krijgt op de rug van innovatieve producten van andere bedrijven, niet meer, niet minder.

En als Google/Apple in de toekomst zegt dat ze dus zelf niet meer de Franse media gaan gebruiken (wat ze vroeger ook geprobeerd hebben) gaan ze ook klagen bij de EU dat ze hun machtspositie misbruiken. Er is dus geen positie die een bedrijf kan nemen zonder grote sommen af te dragen naar de EU. Dit zijn dezelfde tactieken die uiteindelijk tot de opkomst en de ondergang van de Sovjet en Duitse dictators geleid hebben.

[Reactie gewijzigd door Guru Evi op 22 juli 2024 14:04]

Opnieuw, de uitgevers willen dat hun content gebruikt wordt. Als ze een anti-AI op de site zetten kunnen ze niet betaald worden.
Je zegt wel opnieuw maar nu leg je het anders uit, ofwel dat de websites die gebruikt worden voor AI training geld willen verdienen hieraan. Je zei "verlies je natuurlijk ook de vindbaarheid en dus het inkomen", dat staat volledig los van AI training.

Prima argument overigens, maar je had het initieel anders verwoord en daar viel ik over.
Volgens het artikel komt er geen rechtszaak en is die 250 miljoen een schikkingsbedrag. Daarom is er niets meer verder van belang. Misschien wel als de Franse uitgevers compensatie van Google eisen en ze er samen niet uitkomen en daardoor toch naar de rechter gestapt moet worden.
Typisch Google. Het een zeggen en het andere doen. Boete betalen ze en ze gaan gewoon door
Als je het artikel van 2022 leest dan zijn dit 2 heel verschillende kwesties. Ze betalen de kranten om hun artikelen te laten zien op hun platform, dat is toch niet hetzelfde als het gebruiken om een LLM model te trainen?!

In ieder geval heeft Google WEL betaald om de content te laten zien maar blijkbaar willen de kranten hier graag extra geld voor omdat dit nu voor een LLM is.

Het lijkt me eerder alsof de kranten geld geroken hebben.
Ik zie het eerder overt machtsmisbruik. In dit geval konden de auteurs niet zeggen dat hun data niet voor een LLM gebruikt mocht worden, tenzij ze ook uit de zoekmachine werden geweerd.

Lijkt mij dus eerder op machtsmisbruik. Auteurs zouden gewoon gecompenseerd moeten worden als hun werk als trainingsmateriaal wordt gebruikt waar straks (misschien) grof geld mee wordt verdient.
Een LLM is in principe ook gewoon een zoekmachine.
Meestal zijn dit soort boetes geen afkoop bedrag, als ze weer betrapt worden krijgen ze weer een (hogere) boete.
Dit voelt toch als de weg van de minste weerstand. Schikken voor bv. 50 miljoen i.p.v. te eisen dat Google het model opnieuw trained zonder de Franse nieuwsartikelen en compensatie geeft voor het scrapen van de nieuwssites.
Dat is geld wat Google tussen de bankkussens vindt...
Is dat zo? Als ik snel reken kom ik op 0,3% van hun jaaromzet uit. Dat lijkt weinig, maar als ik dat omreken naar mijn jaarsalaris dan komt dat neer op een boete voor enkele tientallen kilometers/uur te hard rijden. Best te vergelijken qua ernst toch?
Ik neem aan dat jouw rijgedrag ook niet veel gaat wijzigen na een eenmalige boete van 200-300€? Zodra je die maandelijks zou beginnen te krijgen is het een ander verhaal
Ik neem aan dat jouw rijgedrag ook niet veel gaat wijzigen na een eenmalige boete van 200-300€?
Sterker nog, ik zorg dat ik zo'n boete nooit krijg.
Dan vergelijk je dus een economisch vergrijp met te hard rijden waar men niet echt veel economisch voordeel uithaalt. En waar je eigenlijk nog niemand mee hebt benadeeld (met dat hard rijden).
Dan vergelijk je dus een economisch vergrijp met te hard rijden waar men niet echt veel economisch voordeel uithaalt.
Waarom doen mensen het dan? Om geld te besparen of omdat ze het leuk vinden, allemaal prima in geld uit te drukken als je het vergelijkt met andere tijdsbestedingen.
En waar je eigenlijk nog niemand mee hebt benadeeld (met dat hard rijden).
Ja, snelheidsovertredingen zijn volslagen onschuldig en limieten bestaan alleen om de staatskas te spekken :)
Tja allemaal 50 is veiliger, maar ik geloof niet dat na het terug gaan van 130 naar 100 er minder doden in het verkeer waren. Geloof juist zelfs meer. Denk dat concentratie soms beter is dan. Maar ja assosiaal gevaarlijk gedrag is er nog steeds.
Tja allemaal 50 is veiliger
In de bebouwde kom wel. Op de A5 zouden mensen waarschijnlijk, zoals je al suggereert, een boek gaan lezen of, waarschijnlijker, nog meer TikTok kijken.

Punt blijft dat er nagedacht is over welke snelheid op welke plek veilig is, dus je niet houden aan die limieten wordt niet veilig geacht.

[Reactie gewijzigd door 84hannes op 22 juli 2024 14:04]

Punt blijft dat er nagedacht is over welke snelheid op welke plek veilig is
En dat was dus 130 km/h en is enkel en alleen naar beneden gebracht onder het mom van minder uitstoot en dus niet de veiligheid....
tja - waarom doen we het. Haast? Urgentie? En ook als het entertaiment is - dan is het nog steeds niet hetzelfde als geld verdienen - dat is geld uitgeven omdat we het leuk vinden.
Ja, snelheidsovertredingen zijn volslagen onschuldig en limieten bestaan alleen om de staatskas te spekken
Ja, het merendeel van de overtredingen heeft niemand leed berokkend of financieel verlies laten lijden en de boetes zijn enkel om gedrag aan te sturen omdat in bepaalde situaties een te hoge snelheid wel gevaarlijk is. Maar het aparte daarvan is dat er genoeg gevallen zijn waarbij dit ook geldt voor snelheden onder de snelheidslimiet.
En de opbrengst van die boete gaat nu wel naar de desbetreffende rechthebbenden?
Nee. Het is een boete, geen schadevergoeding. Dat zijn twee wezenlijk verschillende zaken.

Een boete gaat naar de eisende partij, in dit geval dus die toezichthouder.

Als iemand een schadevergoeding wil zullen ze een civiele rechtzaak tegen Google moeten starten. Als individueel bedrijf, of eventueel als massaclaim met meerdere partijen tegelijk.
Nee. Het is een boete, geen schadevergoeding. Dat zijn twee wezenlijk verschillende zaken.

Een boete gaat naar de eisende partij, in dit geval dus die toezichthouder.

Als iemand een schadevergoeding wil zullen ze een civiele rechtzaak tegen Google moeten starten. Als individueel bedrijf, of eventueel als massaclaim met meerdere partijen tegelijk.
Dit snap in uiteraard, sarcasme? Als je gaat lopen miepen dat "de rechthebbenden daardoor onvoldoende vrijheid hadden om juiste compensatie te krijgen" waarom stop je dat bedrag dan in eigen zak. Gewoon de staatskas spekken dit, je lost er niets mee op.
Als je gaat lopen miepen dat "de rechthebbenden daardoor onvoldoende vrijheid hadden om juiste compensatie te krijgen" waarom stop je dat bedrag dan in eigen zak.
Omdat dat is hoe boetes werken! Waarom mag de overheid een bedrijf niet straffen voor het overtreden van de wet?
Gewoon de staatskas spekken dit
Misschien, maar niks mis mee in ieder geval! Het kost de staat ook geld om dit uit te zoeken uiteindelijk, dus ook hun hebben daar kosten aan. Daarnaast komt geld bij de staat ten goede van iedereen (in dat betreffende land), je doet net of ze zichzelf verrijken hiermee, maar de staat is geen persoon en niemand kan dit geld in zijn zak steken, wordt gewoon onderdeel van de balans...
je lost er niets mee op.
Jawel, Google past zich toch aan?
Het bedrijf heeft ook maatregelen aangekondigd om overtredingen in de toekomst te voorkomen.

[Reactie gewijzigd door watercoolertje op 22 juli 2024 14:04]

Toch vind ik het ergens wel een beetje vreemd. Deze producenten van het nieuws kiezen er ergens toch ook zelf voor om de informatie gewoon publiekelijk op het internet te gooien zonder dat hiervoor een account vereist is?

Ik snap wel dat ze voor hun content betaald willen worden (en gun het ze van harte), maar ik zie het ook wel een beetje als een schilder die een muurschildering maakt op een publiek toegankelijke muur en vervolgens gaat klagen dat mensen hier naar kijken en leert van de technieken van de schilder om hun eigen schilderskunsten te verbeteren.
Toch vind ik het ergens wel een beetje vreemd. Deze producenten van het nieuws kiezen er ergens toch ook zelf voor om de informatie gewoon publiekelijk op het internet te gooien zonder dat hiervoor een account vereist is?
Dat klopt, maar dat het publiek op Internet staat betekent niet dat een derde partij, in dit specifieke voorbeeld Google, er meteen maar mee mag doen wat ze willen.

Ook als het publiek beschikbaar is heb je nog zoiets als auteursrechten enzo. En andere eventuele wet- en regelgeving.

Om het over goed fatsoen nog maar niet te hebben. Als Google kennelijk in het verleden een afspraak gemaakt heeft, en die dan blijkbaar niet naleeft, getuigt dat niet van heel veel fatsoen en respect voor andermans werk.

Op dit item kan niet meer gereageerd worden.