Cloudflare heeft een nieuwe, gratis tool uitgebracht die voorkomt dat bots websites scrapen om de verzamelde data te gebruiken voor het trainen van AI-modellen. De tool is beschikbaar voor alle Cloudflare-gebruikers.
Voor het trainen van AI wordt regelmatig op het internet verzamelde data gebruikt. Daarvoor worden crawlers ingezet. Websites kunnen dit voorkomen door een regel toe te voegen in de robots.txt-file. Maar niet alle AI-makers respecteren dat.
"Wij horen duidelijk dat klanten niet willen dat AI-bots hun websites bezoeken, zeker niet als bots dat op oneerlijke wijze doen", zegt Cloudflare. Het bedrijf is daarom het verkeer van AI-bots en crawlers gaan analyseren om zo automatisch bots te kunnen detecteren. De modellen die hiervoor gebruikt worden, onderzoeken ook of een AI-bot detectie probeert te omzeilen door het gedrag van een daadwerkelijke gebruiker te imiteren. Vaak worden daarbij tools en frameworks gebruikt die Cloudflare kan fingerprinten. "Op basis van die signalen kunnen onze modellen het verkeer van ontwijkende AI-bots op de juiste manier als bots markeren."
Gebruikers die de tool willen inschakelen, kunnen deze vinden in het beveiligingsmenu van het Cloudflare-dashboards, onder 'Bots'. Daar staat een toggle genaamd 'AI Scrapers and Crawlers' die aangezet kan worden.