Cloudflare heeft zijn tool om crawlers voor taalmodellen te blokkeren een update gegeven, waardoor website-eigenaren nu uitzonderingen kunnen aangeven. Daardoor moeten eigenaren van sites meer controle hebben over welke taalmodellen hun content mogen zien.
Er is een AI Audit-functie om in kaart te brengen welke crawlers hoe vaak op de site komen, zegt Cloudflare. Vervolgens zijn alle crawlers in een keer te blokkeren, iets dat Cloudflare al een paar maanden aanbiedt, maar dat kan ook per aanbieder van taalmodellen. De AI Audit-functie maakt onder meer onderscheid tussen AI-zoekmachines en data crawlers.
Crawlers kopiëren de content van websites om die in taalmodellen in te voeren als trainingsdata. Dat is afgelopen jaren op grote schaal gebeurd. Cloudflare zegt dat de functie de controle terugbrengt bij de site-eigenaren, in plaats van de bedrijven die de taalmodellen trainen. "Wij geloven dat dit een risico vormt voor een open internet", zegt Cloudflare. "Zonder de mogelijkheid om het scannen te controleren en waarde te realiseren, zullen site-eigenaren worden ontmoedigd om interneteigendommen te lanceren of te onderhouden."
Het is op termijn ook slecht voor makers van taalmodellen, betoogt het bedrijf. "Makers zullen meer van hun inhoud achter betaalmuren verbergen en de grootste uitgevers zullen directe deals sluiten. Aanbieders van AI-modellen zullen op hun beurt moeite hebben om kwalitatief hoogwaardige content op kleinere sites te vinden en er toegang toe te krijgen."