X laat derden AI-modellen trainen met gebruikersdata volgens nieuw privacybeleid

Socialemediaplatform X gaat volgens zijn nieuwste privacybeleid gebruikersgegevens delen met derden om AI-modellen te trainen. X-gebruikers die hiermee niet akkoord gaan, moeten dat zelf uitschakelen, aangezien de optie standaard is ingeschakeld.

X heeft afgelopen woensdag de nieuwste versie van zijn privacybeleid gepubliceerd, die van kracht gaat op 15 november. Sectie 3 meldt dat X afhankelijk van de instellingen 'gegevens kan delen of openbaar maken aan derden'. Indien gebruikers zich niet afmelden, kunnen de ontvangers van de gegevens deze 'in sommige gevallen gebruiken voor hun eigen onafhankelijke doeleinden in aanvulling op de doeleinden die worden vermeld in het privacybeleid van X, waaronder bijvoorbeeld het trainen van hun AI-modellen, al dan niet generatief'.

Hoewel X verwijst naar de instellingen om het delen van data te voorkomen, merkt TechCrunch op dat het bedrijf niet specifiek aangeeft hoe gebruikers dit kunnen doen. Momenteel bevat het menu een optie om geen data van posts of gebruikersinteracties te delen met Grok en de serviceprovider xAI, wat niet lijkt te verwijzen naar derden. Mogelijk voegt X een nieuwe opt-outmogelijkheid toe voordat het nieuwe privacybeleid van kracht gaat.

Verder voegt X toe dat het bepaalde gegevens langer gaat bijhouden dan wordt aangegeven in het beleid. Dat is naar eigen zeggen om te voldoen aan wettelijke vereisten en om veiligheids- en beveiligingsredenen. Bovendien herinnert het bedrijf gebruikers eraan dat publiekelijk beschikbare X-content na het verwijderen hiervan nog te zien kan zijn op andere plaatsen, zoals in zoekmachines.

Terwijl X op 7 mei begon met het verzamelen van data van EU-gebruikers, werd er pas vanaf 16 juli een afmeldmogelijkheid aangeboden via de privacyinstellingen. Dat was niet naar de zin van de Ierse Data Protection Commission, die een rechtszaak aanspande tegen X. Het socialemediaplatform maakte begin september bekend dat het de gebruikersinformatie van EU-burgers dan toch niet gaat gebruiken om de AI-chatbot Grok te trainen.

Door Idriz Velghe

Redacteur

18-10-2024 • 17:27

46

Submitter: Xtuv

Reacties (46)

46
43
19
3
0
19
Wijzig sortering
Voor de mensen die snel een link zoeken naar de instellingen:
- settings/data_sharing_with_business_partners
- settings/grok_settings (voor het trainen van hun eigen model)
Interessant. Bij mij staan die opties alvast uit. Ik kan me niet inbeelden/herinneren dat ik die had uitgezet. Nochtans maak ik uit het artikel op dat het opt-out is.
Same, volgensmij is dit niet in EU?
GROK instelling was wel degelijk actief binnen de EU toen die eerst uitrolde. Ik heb em gelijk gedeactiveerd toen die "AI" uit kwam. business partners staat daardoor mogelijk ook gelijk uit. Moest em niet deactiveren nu
Ik probeer zowel via de url die jij hier plaatst als via hun "settings" menu naar de grok instellingen te gaan maar krijg een fout op die pagina. Ook een handige manier om het niet mogelijk te maken dat mensen dit uitschakelen. Bij mij is het enkele maanden geleden uitgeschakeld, maar had toch graag even gecontroleerd of dit nog correct staat.
Buiten de wappies en de cryptoshills is er een subgroep binnen Twitter waar wel veel kwaliteit zit:
Illustratoren en tekenaars. Die zijn momenteel redelijk aan het panikeren.

Ikzelf gebruik Twitter vooral om illustratoren en tekenaars te volgen van *kuch* digitaal geproduceerde visuele werken gestyleerd naar Aziatische origine met een focus op niche materiaal gericht op de zelfbewuste volwassene *kuch* en het huidige algoritme geeft me hierdoor een continue stroom van materiaal wat hierop aansluit.

Tekenaars weten dit zelf ook waardoor er een hele hechte groep is van mensen over de hele wereld die elkaar kent en ook elkaars materiaal promoten. Het Twitter Algoritme™ is wat dat betreft daar perfect voor en is daardoor voor velen de plek om zowel ontdekt te worden, als je portfolio te promoten, en om met elkaar in contact te komen. Platforms als Artstation, Deviantart, Tumblr, en Pixiv, bestaan uiteraard ook maar ze missen de laagdrempeligheid en het bereik van Twitter.

Nu met de verandering van de Twitter TOS is dit specifieke gedeelte onder punt 3 heel verkeerd gevallen bij hun:
By submitting, posting or displaying Content on or through the Services, you grant us a worldwide, non-exclusive, royalty-free license (with the right to sublicense) to use, copy, reproduce, process, adapt, modify, publish, transmit, display, upload, download, and distribute such Content in any and all media or distribution methods now known or later developed, for any purpose. For clarity, these rights include, for example, curating, transforming, and translating. This license authorizes us to make your Content available to the rest of the world and to let others do the same. You agree that this license includes the right for us to (i) analyze text and other information you provide and to otherwise provide, promote, and improve the Services, including, for example, for use with and training of our machine learning and artificial intelligence models, whether generative or another type; and (ii) to make Content submitted to or through the Services available to other companies, organizations or individuals, including, for example, for improving the Services and the syndication, broadcast, distribution, repost, promotion or publication of such Content on other media and services, subject to our terms and conditions for such Content use. Such additional uses by us, or other companies, organizations or individuals, is made with no compensation paid to you with respect to the Content that you submit, post, transmit or otherwise make available through the Services as the use of the Services by you is hereby agreed as being sufficient compensation for the Content and grant of rights herein.
Oftewel:
Content, de creaties van tekenaars, die gedeeld worden op Twitter kunnen door Twitter gebruikt worden voor ieder doel dat ze willen, inclusief commerciele doeleinden en AI modellen, en de originele tekenaars hoeven hier geen compensatie voor te verwachten.

Hier is dus ook GEEN opt-out voor omdat dit niks te maken heeft met Grok, je persoonlijke AI assistent voor Premium gebruikers. Alleen vandaag al heb ik 10+ mensen die ik volg in mijn TL gezien die met spoed hun Bluesky aan het promoten zijn. Dit gaat nog wat worden.

https://x.com/shiinareii/status/1846672917582766246
Denk je nu werkelijk dat OpenAI niet die hele website heeft gescraped?
Beschrijft het eerste vette stuk niet gewoon de normale werking van X in juridische termen?

Wanneer je een afbeelding oplaadt op X wordt die via servers over heel de wereld verspreid en in verschillende formaten publiek getoond. Of met andere woorden: gekopieerd, verwerkt, aangepast, gepubliceerd, verzonden en weergegeven.

Ik zou hier niet meteen in lezen dat je alle rechten over je eigen werk zomaar aan X geeft door het op X te delen.
Voor de gein GPT even de huidige sectie laten vergelijken met de nieuwe die je hier post. TLDR; niks veranderd tov huidige ToS:


Legally, the new X terms don’t introduce major changes but clarify existing rights. The broad license remains, with X allowed to use, modify, and distribute user content without compensation. The key update is the explicit mention of content being used to train AI models, making clearer what was likely implied before. The core legal structure is unchanged; it’s now just more transparent.
Als ik kijk naar de content op X dan lijkt me dit net zo'n slecht plan als je LLM trainen op 4chan data.
Het hoeft daarom niet de content, inhoud te zijn of wat en hoe dingen uitgedrukt worden die relevant zijn. Data is een heel breed concept en kan alles omvatten (van inhoud tot locatie, tijd, irl responstijd en alles wat adverteerders all gebruiken).

De "data", datasets, mixen van verschillende datasets, het al dan niet pre processen van data of (live) data(sets) laten mee spelen op een combinatie (van deze mogelijkheden). Dit zijn tegenwoordig basis zaken. Meerdere modellen laten samenwerken en als variabele input voor een ander model is ook een bijna standaard praktijk.

Het gaat hem niet zozeer meer om (enkel) nieuwe basis modellen te trainen. Alle basis datasets om een klassieke multifunctionele (brede kennis) LLM te trainen en te doen werken bestaan gewoon en worden vaak herbruikt in nieuwere versies.

Een lang gebruikte methode dat nu ook meer toegankelijk is voor de gewone consument is beperkte "snelle" sentiment analyse op schaal (dus niet hoe 1 of enkele schrijvers/users/sprekers zich voelen over iets), vaak gebruikte men hiervoor vroeger deels al o.a. Twitter en X data voor.

Een simpel voorbeeld zijn de vrij nieuwe basis, snelle "financiële sentiment, analyses" en voorspellingsindicatoren die los staan van de harde(re) data. De huidige financiële instituties sentiment analyses zijn uiteraard veel geavanceerder dan wat je beperkt gratis of betalend krijgt. En gaan met veel meer zaken rekening houden, maar ook veel minder gaan steunen op de traditionele "geautoriseerde data" van bv media, huizen en experten.

Ik bedoel dus voor alle duidelijkheid niet de oude traditionele voorspelling analyses die je overal geïntrigeerd ziet tegenwoordig. Die per kwartaal een update krijgen gebaseerd zijn op bv 15 experten opinies(die niet op schaal, snel en op dit soort type sentiment gebaseerd zijn).

Dit is trouwens "een heel fascinerend onderwerp" en Iets wat grote financiële instituties al 50+ jaar actief doen op o.a. traditionele media en verslaggeving. Ze zijn ook de eerste die dit (sentiment) zijn gaan integereren in hun waardebepaling en voorspellingsmodellen en ook sentiment zijn gaan beïnvloeden en misbruiken. Dit is alleen maar toegenomen met online data, dan "persoonlijke" online data, enzovoorts. Maar ga daar nu niet over uitwijken.
Weet iemand een goede tool om alle tweets in 1 keer te verwijderen?
Ik heb het handmatig gedaan, destijds. Ook omdat de API voor tools hiervoor op slot ging. Tools die nu nog werken zoals tweetdelete kosten geld, en je moet onderzoeken of ze te vertrouwen zijn met je account. Handmatig kost even wat tijd, maar voelt eigenlijk net als oude vakantiefoto's uitzoeken. Ik zou er overigens wel van uitgaan, dat het steeds lastiger wordt om je tweets te verwijderen, vergelijkbaar met de Reddit controverse. Bij tweetdelete betaal je om meer & oudere tweets te verwijderen.
Ik ben verder gegaan toen Twitter X werd. Na verschillende pogingen die ook eindigden in 'er is een fout opgetreden' een werkende link van het bedrijf gekregen en mijn account opgegeven en een bevestiging gekregen dat mijn account en data was verwijderd. Die tool of link om zelf al mijn tweets te verwijderen het ik destijds nooit gevonden.
Is een opt-out is de EU wel wettelijk toegestaan?
Welke derden willen data van X? Een klein deel van de data is kwalitatief, zoals accounts van journalisten, maar een grote hoeveelheid is troep dat vaak door AI is gegenereerd.
Dit is wel weer lekker vaag en breed geformuleerd. Stel dat een gebruiker betaalt voor het blauwe vinkje, komen de facturatiegegevens dan ook bij de a.i. terecht? Het factuuradres? De locatie?

En dat iemand dan om een zakelijke voorbeeldbrief aan een a.i. chatbot vraagt en dat dan de adresgegevens van voorgenoemde gebruiker in de voorbeeldbrief komen?

Het zal hopelijk zo'n vaart niet lopen, maar deze formulering beperkt dit in ieder geval niet.
vraag me af in hoeverre derden die die data echt wilden hebben dit niet al reeds middels scraping hebben gedaan voordat de privacy vraagstukken aangekaart werden
Ben ik heel cynisch als ik verwacht dat we over een tijdje te horen krijgen dat er een "foutje" is gemaakt en X toch data heeft gebruikt zonder toestemming? Uiteraard pas nadat het X z'n hele model heeft gebouwd. Eenmaal gebouwd is eigenlijk niet te bewijzen welke data is gebruikt om te trainen. (Soms lekt er iets omdat het een-op-een is overgenomen, maar dat zijn uitzonderingen en foutjes, het model zou het juist niet een-op-een moeten overnemen.)

Voor de zekerheid, dit heeft niks te maken met een afkeer van X, alle AI-bedrijven volgen deze strategie. Ze bouwen hun model zonder toestemming te vragen en hopen dat ze daar lang genoeg mee weg komen en genoeg geld te verdienen om de problemen later op te lossen (of desnoods de boetes te betalen).

Mijn bussinessplan is een AI bouwen die Hollywood-films produceert. Ik ben dus alvast begonnen met trainingsdata te verzamelen. Als je wil helpen kun je materiaal uploaden naar mijn nieuwe website, www.thepAIratebay.org. Ik ga er vanuit dat de industrie ook wel inziet dat we innovatief bezig zijn en dat we de vooruitgang niet kunnen laten tegenhouden door zoiets als copyright.
Goeie idd, openai heeft geluk gehad, ik begrijp wel dat al die bedrijven niet hebben gewacht met hun eigen trainingen en modellen, nu "mocht" er nog veel. Elon zou dat twitter ook wel een klein beetje met AI en trainingsdata in gedachten hebben gekocht. Ik vond het absurd veel geld, maar begin het langzaam te begrijpen.
Hup even snel de voorwaarden aanpassen, die leest toch niemand, en ze verkopen ze je data aan andere partijen.
Ze kunnen nog de mooiste voorwaarden hebben in eerste instantie maar als er extra geld nodig is passen ze die net zo makkelijk aan.
Nog leuker, standaard opt in, dit is gewoon bewust zo gedaan. Niet iedereen zal hier meteen van af weten. Dus kassa voor X. Lekker veel data doorverkopen.
Volgens mij is dat onder de AVG gewoon hartstikke verboden.
Zowat elke online partij verkoopt je data. Howel ik daar tegen ben kan je X moeilijk afrekenen dat ze het ook doen, ergens moeten ze geld mee verdienen met een gratis platform.

[Reactie gewijzigd door Rogers op 18 oktober 2024 18:54]

Als ze niet kunnen bestaan door hun geld op een legale en ethische manier te verdienen moet zo’n “dienst” eigenlijk gewoon verdwijnen imho. Als je alleen bestaansrecht hebt door er immorele praktijken op na te houden, heb je dat niet. De maffia is ook illegaal, om goede redenen.

Jammer dan voor de gebruikers van die dienst, die gaan maar ergens anders heen. Er zullen altijd wel online diensten in een of andere vorm blijven bestaan. Maar wellicht niet in het Amerikaanse megacorporatie model. Alle kosten bij 1 partij leggen is misschien ook wel niet haalbaar zonder er onethische praktijken op na te houden. Met een decentraal model a la Mastodon is het veel beter draaiende te houden. Als er dan af en toe een server weg valt is dat geen drama, dan blijven er nog genoeg andere over. En wie wordt nou echt blij van megacorporaties? Die zijn alleen goed voor het bedrijf zelf, niet voor de rest van de wereld.
ergens moeten ze geld mee verdienen met een gratis platform.
Wat dacht je van gepersonaliseerde advertenties dmv tracking? Premium abonnementen? Exclusieve content?

Volgens mij zijn er genoeg manieren van geld verdienen met een "gratis" (niet met geld maar met aandacht/gegevens betalen) platform zonder gegevens van gebruikers te verkopen toch? En natuurlijk snap ik ook dat er grote kosten gemoeid gaan met dit soort online platforms, maar de vraag is wel of dit de enige manier is om het draaiende te houden, of dat het hebzucht is.
But what about the others? :+
Het valt ieder bedrijf, en dus ook twitter/ x, aan te rekenen als het andermans gegevens gebruikt alsof het hun eigen gegevens zijn. Diensten goedkoop aanbieden is daarvoor geen excuus, omdat de werkelijke rechthebbende geen inzicht heeft of krijgt in de waarde van de gegevens. Het 'gratis' staat dus niet duidelijk in verhouding tot de 'betaling' via de gegevens. En aangezien een bedrijf als twitter / x opzettelijk geen moeite doet om de waarde aantoonbaar te maken, net zo min als de kopers van die data data dat naar de klanten van twitter/ x doen, is het duidelijk niet in het voordeel van de rechthebbende klanten dat anderen er rechten over claimen en hun gegevens standaard maar gebruiken. Ongeacht of anderen dat ook doen.
Die 500k mensen die weg gingen na de wijziging mbt blokkades was nog niet genoeg blijkbaar? De toko moet echt helemáál leeg?
Beter van wel. Het is een naar platform, ik weet niet of je toevallig nog een account hebt of iets maar het is echt heel triest geworden op X. Waar je vroeger nog simpele dingen deelde en nieuwtjes kon lezen (dat kan nog steeds maar moeilijker vindbaar) is het nu spam, bots, en wappies.
Gisteren ook mijn account opgezegd. Ik gebruikte het eigenlijk al niet meer omdat ik gespamd werd met dingen op mijn tijdslijn die me totaal niet boeien (steeds meer wappies ook) en nu was het wel echt klaar
Na weer wat reports en blocks is mijn tijdlijn redelijk schoon. Voor specifieke interesses en hobbies zijn er zeker nog hoekjes op X. Waaronder fotografie, astronomie, meteo
Klinkt niet anders als Facebook of Reddit :D

Op dit item kan niet meer gereageerd worden.