Reddit klaagt Perplexity en drie 'datascrapingserviceproviders' aan, omdat Perplexity zijn AI op onrechtmatige wijze zou hebben getraind met Reddit-content. Volgens Reddit hebben de bedrijven zich schuldig gemaakt aan 'grootschalige, onrechtmatige omzeiling van gegevensbescherming'.
Reddit vergelijkt de datascrapingbedrijven SerpApi, Oxylabs en AWMProxy met 'bankrovers die de bankkluis niet kunnen openen en in plaats daarvan inbreken in de gepantserde vrachtwagen met het geld.' Perplexity is volgens het socialemediaplatform een klant van 'minstens een van deze bedrijven'. Het AI-bedrijf zou volgens Reddit 'alles doen' om Reddit-gegevens te verkrijgen, behalve een rechtstreekse overeenkomst met Reddit zelf sluiten.
Reddit schrijft dat het platform in mei een cease-and-desistbrief naar Perplexity heeft gestuurd waarin geëist werd dat Perplexity zou stoppen met het scrapen van Reddit-data. Perplexity zou destijds hebben laten weten dat het geen Reddit-content gebruikte om zijn AI-modellen te trainen en dat het de robots.txt van Reddit respecteerde. Sinds 2024 blokkeert dat bestand crawlers van AI-diensten. Volgens de aanklacht steeg het aantal Reddit-citaties na de brief juist.
Reddit claimt dat Perplexity de beschermingsmaatregelen die het platform had genomen omzeilde door Reddit-content te scrapen via Googles zoekresultaten. Om die hypothese te testen, maakte Reddit een bericht dat alleen door Google kon worden gecrawld en verder niet toegankelijk was. Perplexity kon de inhoud van dat bericht volgens Reddit 'enkele uren' na publicatie citeren.
Reddit paste in 2023 zijn api-beleid aan om te voorkomen dat de content van het platform onbetaald gebruikt kon worden voor de training van AI-modellen. Het bedrijf sloot daarna overeenkomsten met OpenAI en Google, waardoor respectievelijk ChatGPT en Gemini op Reddit-content getraind kunnen worden. Het socialemediabedrijf klaagde eerder dit jaar ook Anthropic aan.