Reddit gaat de toegang van de Wayback Machine tot zijn platform beperken. De dienst van The Internet Archive kan daardoor alleen nog de homepagina van het internetforum archiveren en dus niet langer individuele posts.
Reddit geeft The Internet Archive per direct alleen nog toegang tot zijn homepagina, zegt een woordvoerder van het internetforum tegen The Verge. Onder meer de inhoud van posts en gebruikersprofielen wordt daardoor niet langer bewaard. Reddit beperkt de toegang naar eigen zeggen omdat AI-bedrijven de gearchiveerde Reddit-pagina's gebruiken voor het trainen van hun AI-modellen.
De voorwaarden van het platform verbieden al langer dat AI-bedrijven zonder toestemming content van de site verzamelen. Vorig jaar paste Reddit zijn robots.txt-bestand aan om automatische webcrawlers te blokkeren, al bleven partijen die 'te goeder trouw handelen', zoals The Internet Archive, toegang behouden. Nu zou echter blijken dat de crawlers van AI-bedrijven de blokkades omzeilen door het forum via The Internet Archive alsnog te scrapen.
"Tot The Internet Archive zijn site weet te verdedigen en voldoet aan de vereisten van het platform (zoals de privacy van gebruikers beschermen door verwijderde content te dearchiveren), beperken we de toegang tot Reddit-data om onze gebruikers te beschermen", aldus de woordvoerder. Het hoofd van The Wayback Machine, Mark Graham, zegt tegen The Verge dat het 'voortdurend gesprekken' blijft voeren met Reddit over deze kwestie.