YouTube wil dat Clearview AI stopt met scrapen beelden voor gezichtsherkenning

Videosite YouTube en PayPals betaaldienst Venmo hebben een cease and desist-brief gestuurd naar Clearview AI, de app die Amerikaanse politiekorpsen gebruiken om een naam en adres van een persoon te vinden aan de hand van een foto.

Facebook heeft ook brieven gestuurd naar Clearview AI, maar dat is nog geen cease and desist, een brief waarin een bedrijf een ander bedrijf opdraagt om ergens mee te stoppen. YouTube en Venmo vinden dat Clearview AI hun voorwaarden schendt, meldt CBS News. Twitter droeg Clearview AI al eerder op om te stoppen met het scrapen van zijn dienst.

Twitter, YouTube en Venmo willen dat Clearview AI alle data die het heeft verzameld, van zijn platforms verwijdert en voortaan niet meer hun diensten gebruikt om data te verzamelen.

Dat Amerikaanse politiediensten Clearview AI gebruiken, bleek twee weken geleden. De software maakt het mogelijk om een naam en adres te vinden door een foto in te voeren. De software werkt door gescrapete beelden van sociale media en videosites te combineren om zo een database met profielen van mensen met gegevens en beelden op te bouwen.

Door Arnoud Wokke

Redacteur Tweakers

06-02-2020 • 14:43

70

Reacties (70)

70
65
55
4
0
3
Wijzig sortering
Vooropgesteld, ik ben niet gelukkig met iets als clearview, maar het gaat hier toch om openbare data die voor iedereen toegankelijk zijn. Dat er dan vroeg of laat een dergelijke scraping tool wordt ontwikkeld, was vooral een kwestie van tijd...
Dit is niet te stoppen. Bovendien zijn Google en Facebook zelf ook echt wel met facial recognition bezig. Het lijkt me dat dit meer uit concurrentie overwegingen wordt ingegeven, dan uit privacy oogpunt.
Vooropgesteld, ik ben niet gelukkig met iets als clearview, maar het gaat hier toch om openbare data die voor iedereen toegankelijk zijn.
Dat klopt. Maar dat betekend niet dat je alles maar moet kunnen doen met die data? Als ik de deur van mijn huis open laat staan is het toch ook niet ineens een buurthuis?
Ja maar je kunt iemand ook niet vragen om de match tussen je naam en gezicht te vergeten als ie jouw facebook profiel foto en naam daar een keer gezien heeft. Die heb je toch echt openbaar gezet.

Dit is meer te vergelijken met een soort markt kraampje waar iedereen toegang tot heeft, en waar jij een stapel foto's van jezelf met naam neer legt, en vervolgens boos wordt als de politie ook zo'n foto mee neemt.
Je vergelijking met de fysieke situatie (gezichten onthouden) gaat niet helemaal op. want dat recht om vergeten te worden heb je wel degelijk.

Of het nu gaat om het recht om vergeten te worden door Google (zodat sollicitaties niet spaak lopen omdat zoekresultaten over een misstap in een vroeger leven je blijven achtervolgen) of om verwijdering van je persoonsgegevens bij organisaties die jouw gegevens niet meer hoeven te hebben; (o.a.) dankzij de AVG/GDPR heb je dat recht.

Daarnaast kun je YouTube misschien wel toestemming geven jouw beeltenis te 'gebruiken' (als in: publiceren), maar daarmee geef je niet direct toestemming aan Jan en allemaal om datzelfde ermee te doen. Zo wordt het terugtrekken van die toestemming een onmogelijke klus. Laat staan als iemand anders jouw gegevens uploadt; zie dan de schade maar eens te beperken.

Een opmerking als "Dit is niet te stoppen." is deels waar: dit is niet gemakkelijk. Maar om dan maar de handdoek in de ring te gooien?
Ondanks dat het waarschijnlijk op dit moment niet mogelijk is, heeft het recht van vergeten worden niet direct iets te maken met het feit dat iemand jouw gegevens heeft. Je zult dan bij degene die die gegevens heeft verzamelt dat verzoek moeten indienen. Het daadwerkelijk verzamelen heeft daar op zich niks mee te maken, anders zou geen enkele zoekmachine jouw facebook profiel mogen crawlen.

De AVG/GDRP stelt ook, organisaties moeten kunnen bewijzen dat zij geldige toestemming hebben gekregen. Ik durf met enige zekerheid te stellen dat vrijwel niemand de algemene voorwaarden geheel leest op het moment dat je een filmpje upload bij youtube, of jezelf op facebook zet.
Dat een fotograaf een afbeelding publiceert betekend niet dat je er alle rechten van hebt door ernaar te kijken.
Het is mooi dat wij het recht hebben om vergeten te worden, maar dan moet je wel van dit recht gebruik maken. Doe dat niet is je data nog steeds toegankelijk en moet je niet zeuren als anderen dit ook zien en gebruik van maken. Als het dan een onmogelijke klus wordt je toestemming in te trekken ben je dus te laat.
"Zij doen het ook" is een slecht argument.

Het probleem is dat:

1) Toen we met z'n allen de content online zetten, was het nog niet duidelijk dat dit er mee gedaan zou worden.
2) De verandering is langzaam gegaan. Niet van de een op de andere dag.

Het internet en de technieken hebben langzaam verandering doorgemaakt. We kunnen lastig terug.

Je zou wel kunnen stellen dat mits de politie goed met de gegevens om gaat, het een maatschappelijk doel betreft. Op het moment dat bedrijven veel betere opsporingsmogelijkheden hebben dan politie krijg je een samenleving waar mensen naar bedrijven gaan om misdaad op te lossen. Of een samenleving waar de overheid praktisch machteloos is, omdat alles in handen is van een paar gigantische bedrijven (zie de boeken Snow Crash en Jennifer Government). En dat wil je ook niet.

Wat je, imo wil, is dat bedrijven dmv wetten worden beperkt, en dat mensen zichzelf beperken door niet zomaar alles in het openbaar te delen.
Niks niet! ik heb geen FB account en zul dat waarschijnlijk ook nooit doen. En toch sta ik waarschijnlijk op tig FB foto#s van anderen. Dus niet alleen wordt van mensen die zelf spullen op FB zetten oneigenlijk gebruik gemaakt voor een database, maar zelfs mensen die zelf er niet opzetten belanden in die database.
Te fout voor woorden!
Die foto's zijn dus door iemand publiekelijk online gezet. Dat jij het daar niet mee eens bent, is niet een probleem voor iemand die die foto's bekijkt, of dat een crawler is of een echt persoon doet er in feite niet heel veel toe. Je zal dan degene die jouw foto online gezet heeft daar op aan moeten spreken.
Eigenlijk doet dat er wel toe.

Iedereen die die foto's kan bekijken is een gebruiker die heeft ingestemd met de voorwaarden waarin die foto's worden aangeboden.
Crawlen of automatisch verwerken wordt daarin vaak verboden.

Vergeet niet, iemand die een foto uploadt op een site zou er van uit mogen gaan dat iedereen zich aan die voorwaarden houdt.

Komt erbij dat als persoon x toestemming heeft gegeven aan persoon y om zijn foto online te zetten, doch dat geeft gebruiker z die ook aan die foto kan niet automatisch het recht om daar zomaar iets mee te doen, zoals: verder verspreiden, verwerken, opslaan, ...

Auteursrecht en portretrecht staan ook nog eens naast de marktvoorwaarden en kunnen ook een vrij stevige impact hebben.
Hmm... is Google zelf niet ook groot geworden met het leegschrapen van voornamelijk nieuwssites en die data dan (met een klein linkje naar de source) plaatsen op hun eigen pagina? Zijn in Duitsland en Spanje nog rechtszaken over geweest als ik met goed herinner...

https://www.zdnet.com/art...-publishers-that-sued-it/

[Reactie gewijzigd door Tukkertje-RaH op 23 juli 2024 18:59]

Dat doen ze inderdaad maar om te stellen dat ze daar groot mee geworden zijn is wel een rare opmerking...

Daarnaast is dat blijkbaar een win-win situatie itt het scrapen van youtube video's...

https://www.theverge.com/...axel-springer-google-news

Daarnaast is dat geen privacyschending maar copyrightschending, niet echt hetzelfde natuurlijk.

[Reactie gewijzigd door watercoolertje op 23 juli 2024 18:59]

Anoniem: 24417 @MrDrako6 februari 2020 15:18
Toch weet ik niet of ik het er mee eens ben dat je alles mag doen met publieke data.

Ter vergelijking, je mag ook niet alles doen met publiek toegankelijke materialen. Ik zou met legaal verkrijgbare middelen een wapen kunnen maken en gebruiken - dit mag niet.

Dit was voor informatie nooit zo'n probleem, maar omdat we nu in een tijdperk zijn gekomen waarin informatie net zo invloedrijk/gevaarlijk kan zijn als materiele zaken, is het misschien wel logisch als daar ook meer regels voor komen.

Dat heeft natuurlijk ook weer nadelen, dus ik vind het een lastig punt.
Er zit een verschil tussen een persoon / personen die een foto zien en het moedwillig scrapen, geautomatiseerd, van een hele site. Een persoon kan dingen weer vergeten. Een scraper doet dat niet.
Naja, dat ze de foto zien en onthouden wat er op staat is tot daaraan toe, maar meenemen? De foto is niet hun eigendom...
Ik vind dat de schaal en het doel hier een rol spelen en ik krijg een ongemakkelijk gevoel bij een commerciële partij die het hele web afschuimt om mijn kop aan mijn adres te koppelen.

Aangezien ik er blijkbaar geen controle over heb kan die data kan in principe aan iedereen verkocht worden, er is geen controle op. Ik mis de ethiek hier.
Het lijkt me dat dit meer uit concurrentie overwegingen wordt ingegeven, dan uit privacy oogpunt.
Dit gevoel had ik ook. Google en Facebook doen heel veel dingen eerst vanuit concurrentie of financiële positie en als ze met alle middelen niet krijgen wat ze willen spelen ze de privacy-kaart. Het zou mij niet verbazen als er dit jaar nog wordt aangekondigd dat Clearview door Google wordt overgenomen. Want in de wereld van persoonsgegevens geld ook; If you can't beat them, buy them.
Het kunnen ook technische en financiële reden zijn, als een single user heel youtube 'bekijkt' kost dat veel resources. En ik gok dat Clearview niet op banners klikt.
Probleem is daarbij wel dat mijn naam, toenaam, adres, en telefoonnummer publiekelijk op internet staan terwijl ik deze niet heb afgestaan. Op websites als "Family Finder" bijvoorbeeld. Of deze data uit gehackte databases komt of uit verkochte data van bijvoorbeeld webwinkels weet ik niet, maar ik weet wel dat het onmogelijk is dat te verwijderen.

En als deze data daar staat, dan is deze data ook elders wel te vinden of verkrijgen voor een partij als Clearview AI. Dan kan ik mijn overige data nog zo privé houden, en proberen mijn echte naam en nickname of YouTube account gescheiden te houden, als ik Google op mijn echte naam dan vind ik naast deze malafide websites slechts een drietal hits waarop deze voorkomt, maar tegen de kracht van dit soort algorithms verlies ik het uiteindelijk toch wel.

[Reactie gewijzigd door Aiii op 23 juli 2024 18:59]

een winkel is ook vrij toegankelijk, maar dat wil niet zeggen dat je daar aan de ingang met een camera mag gaan staan en foto's/filmpjes van alle klanten mag maken om dan die klanten te linken aan alle andere plaatsen waar je hetzelfde doet.
Ik ben niet gelukkig met mensen die 100km per uur in de bebouwde kom rijden, maar het gaat om de openbare weg die voor iedereen toegankelijk is. Dat iemand het toch doet is slechts een kwestie van tijd... Dit is niet te stoppen.
En toch heeft dit ons niet tegengehouden om het te verbieden, er een stevige straf aan te hangen, en de onverlaten die we kunnen pakken te straffen. We hebben zelfs een instantie opgericht die actief probeert die mensen te betrappen, op te sporen en te bestraffen.

Dat iets openbaar is betekent niet dat je er geen regels aan kunt koppelen.

edit: bedrijven als Clearview is dus waarom ik dit vind.

[Reactie gewijzigd door locke960 op 23 juli 2024 18:59]

In de toekomst zal iedereen alles van iedereen weten tot de dag dat de overheid het internet aan banden gaat leggen. Ik ga ervanuit dat meer en meer bedrijven en overheden en kritieke infrastructuur allemaal het centrale netwerk van Elon Musk opgaat. Dan kan het internet plat gelegd worden terwijl alles toch nog blijft werken. Maar dat is natuurlijk wel het begin van het einde van alle vrijheid die het internet aanbied. Het Chinese systeem is toch wel een beetje te duur voor de hele wereld en ook nog te omzeilen. Maar het netwerk van Elon ... wanneer de ouwe internet plat legt dan kan het zijn dat het hele Elon internet door een persoon of AI gecontroleerd kan worden.

[Reactie gewijzigd door Kain_niaK op 23 juli 2024 18:59]

Anoniem: 1277286 6 februari 2020 14:46
Hoe kan een website als YouTube herkennen dat hun "data" gebruikt wordt om Clearview AI te trainen en/of uit te breiden? Kan dit simpelweg door het verkeer van de website te monitoren en bepaalde IP-adressen en/of MAC-adressen eruit te filteren?
doorgaans ziet google het wel als er een paar honderd gig per uur naar een serverpark gaat. ;)
Dan weten ze dat iets of iemand data binnenhaalt maar naar wie kan een compleet raadsel zijn als de 'tegen'partij het een beetje tactisch aanpakt. Zo moeilijk is het allemaal niet.
indentificatie van serverparken en hun ip adressen is best simpel hoor. zulke bedrijven hoeven zichzelf niet te verbergen achter vage bedrijfjes.

[Reactie gewijzigd door flippy op 23 juli 2024 18:59]

Wat ze waarschijnlijk wel gaan doen als ze geblocked worden.
Nou, bijvoorbeeld als een resultaat van een zoekopdracht in Clearview AI een linkje bevat naar een youtube video. Maar dat is natuurlijk pas achteraf.

Vooraf is het maar net hoe graag de scraper van Clearview onder de radar wenst te blijven. Het is niet heel moeilijk om een batterij proxies te gebruiken bij het scrapen van de hele handel.
Gezien hun business case vooral politie departementen betreft wordt het wellicht wat lastig om een service te verkopen die dan juridisch gezien niet mag, ook al zouden ze stiekem kunnen blijven scrapen.
Als je de link in het artikel volgt:
"YouTube's Terms of Service explicitly forbid collecting data that can be used to identify a person. Clearview has publicly admitted to doing exactly that, and in response we sent them a cease and desist letter," YouTube Spokesperson Alex Joseph said in a statement to CBS News.
Precies mijn gedachte, als ze de video nu gewoon downloaden en dan scrapen komen ze hier dus nooit achter. Beetje dweilen met de kraan open idee.
Dat scrapen is juist die video's en foto's downloaden.

En als er dan 1 partij continu daarmee bezig is zal dat wel opvallen.
enigste wat ze kunnen zien is welk IP adress welke video's bekijken.

dus dan heeft het alsnog geen nut.

of ze moeten dit gebruiken:
https://www.youtube.com/watch?v=Y_UmWdcTrrc
Dit is best wel ernstig voor onze democratische rechten en wat de Amerikaanse politie hier doet kun je vergelijken met Chinese praktijken. Die gezichten zijn nergens goed voor tenzij je van mening bent dat je schuldig bent tot het tegendeel bewezen is.

[Reactie gewijzigd door Kat uit de boom op 23 juli 2024 18:59]

Welke rechten bedoel je?

beter gezegd: welke rechten denk je dat je (nog) hebt in de commerciele wereld?
Ik begrijp je cynische opmerking... maar vooralsnog is het niet de commercie die de wetten en regels maakt, maar is die bedrijfstak vooral goed in het negeren van de regels om vervolgens de boetes die daaruit voortkomen voor een grijpstuiver af te kopen.

Als je om die reden je hoofd laat hangen en maar aanneemt dat je geen rechten meer hebt... tja.
wlke wetten worden hier dan overtreden? het is tot zover 1 bedrijf die alleen maar structureel publiekelijk inzichtelijke data van een ander bedrijf bekijkt. jij als consument van google in dit geval heb er niks op in te brengen aangezien jij zelf het filmpje online hebt gezet waar iedereen die kan zien...

[Reactie gewijzigd door flippy op 23 juli 2024 18:59]

Een foto zien is wat anders als daar data aan ontrekken en al helemaal als dat een database vol gezichtje merken is.
Komt bij dat Google en Facebook dat expliciet verbieden in hun voorwaarden.

Dus juist als klant van Google en Facebook heb je daar een punt waar je tegen kunt ageren.
Nou nee.

Algemene voorwaarden van oa Facebook en Google gelden niet altijd, zelfs binnen de staten van de VS zijn ze niet altijd geldig. En dan is het een heel berg gegevens die benaderbaar zijn van niet altijd eigen burgers. Jurisdictie kwa wetgeving kan dan vervallen als ik vb in een vage staat gegevens van NL ga koppelen.


Het is een bedrijf die de gegevens analyseert en met behulp van relatief simpele AI gegevens combineert. Soortgelijke techniek gebruikte Facebook zelf ook overigens. Zelfs al zouden ze in de VS de rechtszaak kunnen winnen,
dan wordt het een heel interessante situatie buiten de VS.

Dat stukje AI is niet gebonden aan grenzen.

Anno 2020 is het devies,
social media afsluiten.
Eventueel en foto om te herkennen, maar alles wat onder de noemer grappig, lollig etc is posten, niet aan beginnen. Zelfs niet op foto’s van anderen. Knippen en plakken is tegenwoordig kinderspel en je hebt veel kennis nodig om het tegendeel te bewijzen, en dan is het kwaad al geschied.
Voldoende, maar dit gaat niet om commercie gezien het feit dat een federale overheid gezichten scraped voor welk doel dan ook.
nee, het is een commercieel bedrijf waarbij "toevallig" de overheid hun diensten afneemt.
Dit heeft niets met democratie te maken.
De meerderheid heeft er geen probleem mee want anders hadden ze er via democratische wegen wel een eind aan gemaakt.
Je kan ook gewoon ervoor zorgen dat je gezicht zo min mogelijk op het web staat.
Het gaat hier om publiekelijk toegankelijke profielen.. Dit is gewoon een logische keuze om het via AI te doen, handmatig kost gewoon teveel tijd (en zo werd dat dus in het verleden wel gedaan).
Nogal naïef om te denken dat het er in het Westen anders/beter aan toe gaat: het wordt hier alleen chiquer verpakt met een hoop bureaucratisch geneuzel en een paar valse glimlachen van politici die joviaal over proberen te komen.

1984 is allang een feit; degenen die dit niet geloven zijn simpelweg niet goed genoeg op de hoogte van de feiten.
Feitelijk is de USA een republiek, wat een indirecte democratie is.

Als je, zoals sommige definities, alleen directe democratie een democratie zou noemen is de USA, net als Nederland (en alle andere "democratieen") geen democratie.

Maar dat is wel een erg nauwe definitie, en ook niet zoals op e.g. Wikipedia wordt aangehaald.
Sinds de oprichting.
Nee hoor. Dat is juist gedaan zodat kleine gemeenschappen (dunbevolkte staten, platteland, dorpjes, etc) het niet per definitie afleggen tegen de paar grote steden. Het is best een eerlijk systeem.
Daarom zijn in de VS alle staten gelijk. In de EU zijn Duitsland en Frankrijk de baas.

[Reactie gewijzigd door Ralph58 op 23 juli 2024 18:59]

Eng idee eigenlijk. Zo zie je waar social media toe instaat is. Een video van een kermis waar je op de achter grond loopt zou zo dus al gebruikt worden om dichter bij je lokatie te komen.
op Linkedin staan heel veel mensen met een goed herkenbare foto. Maar ze hebben liever bewegende beelden denk ik.
Beetje pot verwijt de ketel dit.

Ik wil dat Google stopt met het verzamelen van mijn data wanneer ik hun services niet gebruik.

Alvast bedankt,

Vexxon
Is er een website waar je kunt controleren of er metrische data van een persoon/jijzelf is opgeslagen wordt gebruikt? Kan niet veel hierover vinden op Google.
Ja, ik wil dat ze stoppen met spammen of ik ook een abonnement wil.
Stel dat ze akkoord gaan en alle data van de verzamelde gedichten verwijderen is het kwaad dan niet al gebeurd?

De algoritmes om van deze data te leren hebben dan al maanden kunnen trainen op deze data. Heb ik het goed dat je daarna de trainingsdagen niet meer nodig hebt?
Titel: want dat doet google zelf al ;)

(ofja alphabet want is niet zelfde, mag niet.)

[Reactie gewijzigd door Stijn Weijters op 23 juli 2024 18:59]

Op dit item kan niet meer gereageerd worden.