De Italiaanse privacytoezichthouder GPDP gaat het trainen van algoritmes en AI-modellen met persoonsgegevens onderzoeken. Het feitenonderzoek moet uitwijzen of websites voldoende beveiligingsmaatregelen nemen tegen het scrapen van persoonlijke data.
In het onderzoek worden openbare en private websites meegenomen 'die optreden als gegevensbeheerders gevestigd zijn in Italië of diensten aanbieden in Italië', schrijft de Garante Per La Protezione Dei Dati Personali donderdag.
"Het is bekend dat AI-platforms door middel van scraping enorme hoeveelheden gegevens verzamelen, inclusief persoonlijke gegevens. Deze worden vervolgens door de platforms gebruikt voor verschillende doeleinden, terwijl de sites waarvan de gegevens afkomstig zijn, deze hebben gepubliceerd voor specifieke doeleinden, waaronder nieuws en administratieve transparantie", verklaart de toezichthouder.
Verder vraagt de GPDP organisaties en bedrijven om adviezen om de 'massale gegevensverzameling' door AI-bedrijven tegen te gaan. Die adviezen kunnen tot zestig dagen na de publicatie van de onderzoeksaankondiging worden ingediend. De privacytoezichthouder meldt niet hoe lang het onderzoek gaat duren.
De aankondiging van dit specifieke onderzoek is niet verrassend. Eerder dit jaar heeft GPDP kritiek geleverd op ChatGPT-ontwikkelaar OpenAI. De toezichthouder neemt het OpenAI kwalijk dat er een 'gebrek aan informatie is voor gebruikers en geïnteresseerden over wie data verzameld wordt'. Ook zou er geen wettelijke grondslag zijn voor OpenAI om massaal data te verzamelen en op te slaan voor de training van het taalmodel. Daarom heeft Italië ChatGPT eind maart in de ban gedaan.