Reddit blokkeert deel van de zoekmachines, Google en Brave werken nog wel

Niet alle zoekmachines kunnen nog recente Reddit-berichten tonen in hun zoekresultaten. Als gevolg van het aangepaste beleid van de site worden de crawlers van sommige zoekmachines geblokkeerd.

De verandering werd eerder deze week opgemerkt door de nieuwssite 404 Media. Zoekmachines als Bing, DuckDuckGo, Mojeek en Qwant tonen bij zoekopdrachten via "site:reddit.com" geen Reddit-berichten van de afgelopen week. De crawlers van de zoekmachines zijn geblokkeerd, waardoor recente berichten niet meer in de zoekmachines geïndexeerd worden. Oudere berichten worden nog wel getoond.

De nieuwssite stelt dat de crawlers worden geblokkeerd omdat Reddit wil voorkomen dat de content gebruikt wordt om AI-modellen te trainen. Het is opvallend dat de zoekmachine van Google nog wel recente berichten kan tonen. 404 Media claimt dat dit het gevolg is van de miljoenendeal die Reddit en Google eerder dit jaar sloten. Onder die deal mag Google content van Reddit gebruiken om zijn kunstmatige intelligentie te trainen.

Reddit ontkent die aantijging in een reactie aan Tweakers. "Dit is helemaal niet gerelateerd aan onze recente samenwerking met Google", zegt een woordvoerder. "We blokkeren alle crawlers die niet bereid zijn om crawlgegevens niet te gebruiken voor het trainen van AI."

'Selectief over samenwerking'

Reddits voorwaarden verbieden al langer dat AI-bedrijven zonder toestemming content van het platform verzamelen. Nadat er berichten verschenen dat AI-start-ups die voorwaarden negeerden, paste het bedrijf eind vorige maand zijn robots.txt-bestand aan, om automatische webcrawlers te blokkeren. Websites gebruiken zo'n bestand om aan te geven welke automatische webcrawlers, zoals die van zoekmachines, welke delen van de website mogen bezoeken.

"Iedereen die toegang wil tot Reddit-content moet aan onze voorwaarden voldoen, ook aan die ter bescherming van redditors. We zijn erg selectief over met wie we werken en wie we met grootschalige toegang tot Reddit-content vertrouwen", aldus de woordvoerder. "We zijn met meerdere zoekmachines in gesprek gegaan. Het is niet gelukt om met ze allemaal tot overeenstemming te komen, omdat sommige geen afdwingbare beloften kunnen of willen doen met betrekking tot het gebruik van Reddit-content, inclusief het gebruik daarvan voor AI."

Het bedrijf benadrukt dat diverse partijen Reddit nog wel kunnen crawlen en dus Reddit-content in de zoekresultaten kunnen tonen. Zo heeft het Internet Archive nog altijd toegang en toont ook de zoekmachine van Brave nog recente resultaten van Reddit. "Ook hebben we hard gewerkt om te zorgen dat er nog wel toegang is voor legitieme onderzoeksdoeleinden, zoals reddit4research."

Vorig nieuwsartikel Volgend nieuwsartikel

Door Eveline Meijer

Nieuwsredacteur

Feedback • 25-07-2024 11:38 96

25-07-2024 • 11:38

Lees meer

Reddit laat Wayback Machine voortaan alleen homepagina archiveren Nieuws van 12 augustus 2025

DuckDuckGo introduceert filter om AI-afbeeldingen te verbergen Nieuws van 18 juli 2025

Brave maakt tool voor blokkeren van cookiebanners opensource Nieuws van 25 april 2025

Bing 'imiteert' Google als gebruikers zoeken naar Google .Geek van 6 januari 2025

Reddit is voor het eerst winstgevend Nieuws van 30 oktober 2024

Internet Archive getroffen door nieuw datalek via supportplatform Nieuws van 22 oktober 2024

Internet Archive neemt buitenlandse proefschriften van Universiteit Leiden over Nieuws van 10 oktober 2024

Internet Archive is slachtoffer van hack, data van miljoenen gebruikers gestolen Nieuws van 10 oktober 2024

Microsoft Bing zet zoekresultaten alleen rechts op de pagina Nieuws van 25 juli 2024

Reddit werkt robots.txt-bestand bij om webcrawlers van AI-diensten te blokkeren Nieuws van 26 juni 2024

Reddit gaat oud beloningssysteem van Awards weer terugbrengen Nieuws van 17 mei 2024

OpenAI gaat Reddit-berichten gebruiken om AI te trainen Nieuws van 17 mei 2024

Aantal dagelijks actieve Reddit-gebruikers neemt toe tot 82,7 miljoen Nieuws van 8 mei 2024

Reddit gaat donderdag naar de beurs, wil 748 miljoen dollar ophalen Nieuws van 21 maart 2024

Google bevestigt licentiedeal met Reddit voor trainen AI Nieuws van 22 februari 2024

Meer producten en artikelen

Websites en community's Google Kunstmatige intelligentie Reddit

IT-banen

Meer vacatures

Reacties (96)

-Moderatie-faq

Wijzig sortering

Tk55 25 juli 2024 11:45

De enshittification van Reddit gaat verder. Het was al vrij waardeloos:
- De web UI is slecht (traag, laadt maar deel van comments)
- Je kan old.reddit.com nog gebruiken maar ze proberen je altijd te redirecten naar de nieuwe versie
- Veel plaatjes/videos laten niet fatsoenlijk
- Third party apps zijn gesloopt

Daarnaast is het jammer dat zoveel content achter een muur zit. Je kan via een normale browser zonder in te loggen al vrijwel niks zien op Instagram, Facebook, Tiktok, etc. Binnenkort zal Reddit ook wel aan de beurt zijn.

Het internet is een enorm waardevolle bron van informatie, maar we zien nu juist het vrije internet verdwijnen achter deze muren (en achter allerlei AI modellen).

[Reactie gewijzigd door Tk55 op 25 juli 2024 11:46]

JustFogMaxi @Tk55 • 25 juli 2024 12:14

Als je niet bent ingelogt, kun je niet meer alles zien. Op mobiel tenminste.

MoonRaven

@JustFogMaxi • 25 juli 2024 13:02

Op desktop ook niet, en sommige communities mag je al helemaal niet meer in de browser zien.

Mizgala28 @MoonRaven • 25 juli 2024 13:40

Wat bereiken ze daarmee dan?

Voor mij des te meer reden om zo'n community te mijden dan, ik wil de app niet gebruiken namelijk.

Jarn00bje @Mizgala28 • 25 juli 2024 13:43

Volgensmij worden alleen NSFW comunities geblokkeerd vanuit de browser als je niet ingelogd bent.

jaenster @Jarn00bje • 25 juli 2024 14:07

Tegenwoordig word echt (even uit de losse pols) 30% van de posts op NSFW gezet. Ik heb geen idee waarom maar we slaan soms wel door met wat NSFW is.

Het meest belachelijke voorbeeld is dat ik onlangs zag dat een foto van een kat was ge-nsfw-ed omdat de achterkant van de kat zichtbaar was

Svennie @jaenster • 25 juli 2024 14:29

Dat hebben we aan onze Amerikaanse vrienden te danken, laatst stond erbij een aflevering van Clarkson's farm een waarschuwing voor sexuele content omdat een paar dieren in beeld waren die "het" aan het doen waren, tja, het zal eerder erger dan minder worden ben ik bang

thefal @Jarn00bje • 25 juli 2024 15:48

Nee hoor, ik ben wel vaker reddit posts tegengekomen die totaal geen NSFW zijn, ook niet zo zijn gemarkeerd, en zich ook niet bevinden in een NSFW subreddit, maar toch geblokkeerd worden tenzij je de app opent. Bv omdat de sub niet "gereviewed" is.

Deze bijvoorbeeld: https://www.reddit.com/r/...ot_not_boot_to_safe_mode/

"Unreviewed Contenct
this community has not been reviewed and might contain content inappropriate for certain viewers"
De subbreddit is /r/Android12

kuurtjes @MoonRaven • 25 juli 2024 15:27

Op desktop wel hoor. Ik gebruik het bijna volledig zonder account. Buiten wat communities die als 18+ zijn aangeduid. (Wat raar is want de fotos en videos zijn nog wel zichtbaar in de homepage feed)

The Zep Man

Websites en community's
Google

@JustFogMaxi • 25 juli 2024 13:55

Als je niet bent ingelogt, kun je niet meer alles zien. Op mobiel tenminste.

Gaat prima in een browser (in ieder geval old.reddit.com) of bijvoorbeeld met RedReader.

[Reactie gewijzigd door The Zep Man op 25 juli 2024 14:01]

StrongArmLance

@JustFogMaxi • 25 juli 2024 14:10

Sink it for reddit voor je telefoon, kan je gewoon de mobiele browser gebruiken voor toegang tot de old.reddit.

DvonDutch84 @JustFogMaxi • 25 juli 2024 15:39

Via old.reddit.com kun je gewoon alles zien, tevens heb je geen account nodig, wat een verademing is.

BlaDeKke @Tk55 • 25 juli 2024 11:59

Misschien leren we er een lesje uit en maken we het internet terug decentraal. Dit krijg je als je allemaal in een walled garden vertoeft. Die poort kan namelijk op slot.

DCG909 @BlaDeKke • 25 juli 2024 15:15

Wanneer was het internet dan decentraal?
Ik herinner mij nog sites met animated gifs voor pokemon ruby en saphire, maar dat is allemaal verdwenen, de site en de gifs.
Een succesvolle Community kan imploderen door verschillende redenen en alle data met zich meenemen.

Ja het was vroeger wat zinniger dat je voor bepaalde onderwerpen een apparte (fan) site had, waardoor het behapbaarder was en bepaalde sites zijn gewoon te groot geworden voor hun eigen goed.

BlaDeKke @DCG909 • 25 juli 2024 17:26

Het internet voor het jaar 2000.
Ik zeg niet dat dat ideaal was, maar dat was wel de bedoeling van het internet, en het is nu niet perse beter, gewoon veel verslavender.

Veel mensen hier zijn apetrots dat ze geen lineair tv meer kijken. Dat zelfs hun kinderen dat niet kennen. Maar het internet neemt stilletjes aan wel dezelfde vorm aan, dan wel interactiever.

En data die verdwijnt van het internet gebeurd nu nog even goed.

[Reactie gewijzigd door BlaDeKke op 25 juli 2024 17:27]

noskill @Tk55 • 25 juli 2024 12:15

Idioot ook dat ze search engines nu blokkeren, zou denken dat dat een grote instroom van verkeer was...

StefanJanssen @noskill • 25 juli 2024 14:20

Zeker, en de meeste Reddit gebruikers zeggen ook dat de zoekfunctie van Reddit zo slecht is dat ze een reguliere zoekmachine gebruiken om Reddit te doorzoeken.

iqcgubon @Tk55 • 25 juli 2024 13:16

De site op mobiel werkt voor een paar posts, daarna is het om zeep. Heel duidelijk dat ze je naar de app willen pushen.

rmk_ @Tk55 • 25 juli 2024 15:03

Ook een dingetje. Veel grote pagina's hebben moderator bots die elke gebruiker die iets plaatst screenen. Op bijvoorbeeld r/mildlyinfuriating word je bijvoorbeeld na het posten (ongeacht wat je post) direct gebanned als je je op bepaalde Reddit groepen actief bent. Je moet dan al je posts op die pagina(s) verwijderen voordat je je ban kunt appealen.

Dat Reddit dit toelaat is op z'n zachts gezegd absurd.

Hatseflats @rmk_ • 25 juli 2024 21:30

Daar heeft het alle schijn van, maar het resulteert dat men verschillende accounts aanmaakt.

Wat weer in het voordeel van Reddit werkt.

Niema @Tk55 • 25 juli 2024 18:03

De onofficiele app stealth scraped reddit zonder login

Remzi1993 @Tk55 • 25 juli 2024 20:07

Het internet is een enorm waardevolle bron van informatie, maar we zien nu juist het vrije internet verdwijnen achter deze muren (en achter allerlei AI modellen).

Inderdaad, terwijl ze eerst de vruchten er van plukken en nu ze 1ste zijn of groot genoeg alles dichtgooien. Eigenlijk moreel en ethisch een moeilijke kwestie. Ik vind eigenlijk moreel en ethisch gezien dat ze dit niet zouden moeten doen want gebruikers hebben het platform groot gemaakt en dat komt ook vaak door zoekmachines die wanneer je een probleem hebt Reddit vaak een oplossing heeft doordat iemand hetzelfde of een soortgelijke probleem heeft gepost.

TheVivaldi

Websites en community's

@Tk55 • 26 juli 2024 12:50

Niet alle third-partyapps zijn gesloopt; alleen de apps die het limiet overschrijden. Maar verder wel met je eens. Ik gebruik Reddit nog wel, maar het gaat wel sterk achteruit, helaas.

Vexxon 25 juli 2024 11:46

"Dit is helemaal niet gerelateerd aan onze recente samenwerking met Google", zegt een woordvoerder. "We blokkeren alle crawlers die niet bereid zijn om crawlgegevens niet te gebruiken voor het trainen van AI."

Je maakt jezelf niet heel erg geloofwaardig met deze uitspraak.
Eerst een deal sluiten met Google specifiek om hun AI te trainen op data van Reddit en nu crawlers van andere zoekmachines blokkeren met deze reden, maar wel de Google crawler blijven toestaan.

Iedereen die toegang wil tot Reddit-content moet aan onze voorwaarden voldoen, ook aan die ter bescherming van redditors.

En dus geef je de grootste datagraaier 'exclusieve' toegang tot Reddit, wat zijn die voorwaarden dan precies waar Google dan wel aan voldoet en anderen niet?

We zijn erg selectief over met wie we werken en wie we met grootschalige toegang tot Reddit-content vertrouwen

De belangrijkste selectiecriteria lijkt op dit moment de grootte van de zak met geld die de betreffende partij bereid is te overhandigen.

pietje63 @Vexxon • 25 juli 2024 12:31

Ik geloof Reddit, totdat de geblokkeerde zoekmachines/crawlers verklaren de data niet te gebruiken voor AI.

De deal met Google zie ik daar (grotendeels) los van. Dat Google's zoekmachine nu een voordeel heeft, is dan een bijvangst.

DeTeraarist 25 juli 2024 11:42

Uhm, Chrome en brave zijn geen zoekmachines?

Christoxz @DeTeraarist • 25 juli 2024 11:43

Brave heeft wel een eigen zoekmachine, die zij Brave Search noemen.
https://search.brave.com/

Chrome gebruiken voor Google, is wel apart..
forumtopic: Chrome zoekmachine?

[Reactie gewijzigd door Christoxz op 25 juli 2024 11:44]

Auteur

EvelineM Nieuwsredacteur @DeTeraarist • 25 juli 2024 11:50

Excuus, dat was een foutje. Het is aangepast naar Google, wat er natuurlijk hoort te staan.

Vaatdoek82 25 juli 2024 11:44

Tegenwoordig gebruikt men "reddit" achter veel search queries gezien de hoge toename aan Ai content op typische SEO websites. Dit is een behoorlijke zet van Reddit die nogal wat gevolgen gaat krijgen lijkt mij. Zeer strategische zet van Google maar dit moeten we niet willen.

cy-gor25 @Vaatdoek82 • 25 juli 2024 11:48

Reddit is interessant omdat het zoveel data bevat en je er een AI bot tot in de perfectie mee kan trainen met al die human interactions, maar je hebt ook wel enorm veel bots natuurlijk.

BlaDeKke @cy-gor25 • 25 juli 2024 11:57

Dat gaat dan toch een sarcastische, nihilistische bot worden.

bramv101 @cy-gor25 • 25 juli 2024 12:45

Daar zitten vooral een hele hoop azijnpissers bij elkaar, ver van het tech forum dat het ooit was.

cy-gor25 @bramv101 • 25 juli 2024 13:46

mja echokamer. Ik gebruikte reddit veel, maar ik snap het nut niet meer. Het is ventileren, internetpuntjes scoren en that´s it. Enkel topics voor advies zijn nog handig.

JayPe

@Vaatdoek82 • 25 juli 2024 11:48

En stroomt Reddit vol met AI in de vorm van bots die 'lukraak' een soort van relevante reacties plaatsen.. een ontwikkeling die vooral rondom politiek gekleurde subreddits al langer bekend is, maar inmiddels groteskere vormen aanneemt, ook bij politiek neutrale onderwerpen.

Langzaam maar zeker wordt 'het internet' zo steeds onbruikbaarder.

Vaatdoek82 @JayPe • 25 juli 2024 11:52

Je komt op een punt en wellicht zijn we daar al.. dat Ai gaat trainen op Ai.
Output... rotzooi.

Terry A Davis @Vaatdoek82 • 25 juli 2024 12:13

Dat is juist hoe Ai werkt, met een feedback loop.

L0g0ff

@Vaatdoek82 • 25 juli 2024 20:05

Is dat met de mensheid ook niet zo dan

_Pussycat_ @Vaatdoek82 • 25 juli 2024 12:03

Niet alleen tegen SEO, maar ook gewoon tegen domme resultaten bij quora, microsoft-forums, etc. Oplossingen voor problemen vind ik zonder "reddit" bij het zoeken nauwelijks.

Aegir81

@_Pussycat_ • 25 juli 2024 13:28

Heb je al eens een andere zoekmachine geprobeerd? Ik wissel af en toe af naar bijv. Ecosia of Qwant. Momenteel test ik Kagi.

De standaardresultaten bij Google zijn de laatste jaren enorm achteruitgegaan.

_Pussycat_ @Aegir81 • 26 juli 2024 01:04

Al een tijdje niet meer, als het met Google niet lukt, lukt het met anderen al helemaal niet.

Ik gebruik bij het zoeken naar plaatjes graag DuckDuckGo omdat ik dan makkelijk het origineel in volle resolutie copy-pasten kan zonder naar de website te moeten.

Alxndr @Vaatdoek82 • 25 juli 2024 11:50

Ik werk in en met SEO en ik kan je vertellen dat ik dat (binnenkort) reddit net zo gemanipuleerd wordt als Google.

SEO wordt SAO: Social Media and AI Optimisation.

JayPe

25 juli 2024 11:45

En zo zal robots.txt door steeds meer partijen genegeerd gaan worden,.

Weer een stukje net-etiquette dat afbrokkelt,.
Want als je als zoekmachine niet de site mag crawlen, om je search database te vullen, maar een collega zoekmachine wel, enkel omdat je geen afspraken met partij x of y wilt maken over wat je met de crawl-resultaten doet en/of de exclusieve rechten/plichten niet kunt/wilt aangaan, dan zal je zo'n robots.txt moeten gaan negeren.

Verwijderd @JayPe • 25 juli 2024 12:02

Blokkeren middels robots.txt zijn we inmiddels ook al wel zo'n beetje gepasseerd, tegenwoordig kan je beter op ASN blokkeren waardoor je meerdere subnets die een tent in handen heeft blokkeert.

raro007 @JayPe • 25 juli 2024 11:50

Maar wie zegt dat ze robot.txt daarvoor gebruiken sinds veel ai bedrijven die ook niet gebruiken?

JayPe

@raro007 • 25 juli 2024 13:04

Nadat er berichten verschenen dat AI-start-ups die voorwaarden negeerden, paste het bedrijf zijn robots.txt-bestand aan, om automatische webcrawlers te blokkeren.

Dit staat in het artikel,..

raro007 @JayPe • 25 juli 2024 13:11

Dat deden ze eerst ja maar zoals ik zij negeren veel bedrijven dat, dus nu blokkeren ze iedereen behalve google.

JayPe

@raro007 • 25 juli 2024 13:15

Ja, dat zei je. Zonde, vind je niet?

raro007 @JayPe • 26 juli 2024 17:46

Probleem met ai vs zoekmachine is dat zoekmachine stuurt jou naar die site dus verdienen ze aan jou.
Maar met ai toe-eigenen ze die info dus verdienen ze niks aan jou.
Eigenlijk niks meer dan logisch want als ze dat zo maar toe laten dan verdienen ze niks en gaan ze sluiten.

BLACKfm @JayPe • 25 juli 2024 12:43

Hier dacht ik ook aan. Want wat zou een 'zoekmachine', die normaliter automatisch opereert, nou in de weg staan om voor bepaalde sites die 'robots.txt' nou gewoon te negeren?

Ik denk vast te simpel als zoiets met een paar regeltjes code is op te lossen door iets als 'IF 'content' from 'websites' !=uptodate THEN ignoreRobot()' als je merkt dat je database niet meer bijgewerkt wordt vanaf een bepaalde datum.

Kan een website wel zijn eigen regeltjes hebben met 'Je mag mijn website niet scrapen', maar daar moet je dan natuurlijk gewoon schijt aan hebben. Al zullen er aan de andere kant wel internationale internetregeltjes zijn die zulke praktijken kunnen bestraffen. Iets wat de minder goedbedoelde crawlers vast een broertje dood aan hebben.

Simpelste is dan de crawlers zelf te blokkeren (ip) als website, maar dat lijkt mij ook weer relatief makkelijk te omzeilen (iets langzamer crawlen, menselijk gedrag vertonen). Beter je resultaten een dag later dan helemaal niet.

ZinloosGeweldig @BLACKfm • 26 juli 2024 16:08

robots.txt is dan geloof ik ook nooit bedoeld geweest om aan robots te vertellen wat ze wel en niet mogen. Het was meer bedoeld zodat webmasters robots instructies konden geven over wat handig is om wel en niet te lezen. Dus meer een webmaster die de bots van zoekmachines helpt (omdat de webmaster graag wil dat zijn website goed geindexeerd wordt) dan regels over wat wel en niet mag.

Alxndr 25 juli 2024 12:18

Correct me if I'm wrong, maar DuckDuckGo, Mojeek en Qwan, hebben helemaal geen eigen AI modellen?
Alleen Bing, als onderdeel van MS, kan ik hier plaatsten.

En hoeveel traffic komt er tegenwoordig van zoekopdrachten met "site:reddit.com" of iets dergelijks? Het meeste komt natuurlijk van Google dat hier buiten de boot valt, maar traffic is geld, waarom zijn ze bereid dat op te geven? En juist Google kan resultaten in een snippet of AI overview weergeven, voor korte informatieve zoekopdrachten betekent dat dat mensen juist niet meer door hoeven te klikken.

Persoonlijk lijkt Reddit, net als anders sociale media en User Generated Content, me de juist de allerslechtste data die je maar kan hebben om een AI mee te trainen. Zowel qua feitelijke/correcte informatie als qua taalgebruik is kwaliteit vaak ver te zoeken. Juist een taalmodel wat niet logisch kan redeneren/na kan denken is toch gebaat bij de kwaliteit van z'n trainings set?

Maarja, je kiest op Reddit natuurlijk je eigen bubbels, dus misschien zit ik in verkeerde en zijn er wel degelijk subs waar men vriendelijk en beleefd op een genuanceerde manier communiceert op basis van feiten en algemeen geaccepteerde aannames?

DeeD2k2 @Alxndr • 25 juli 2024 12:48

Zowel Quant als DuckDuckGo gebruiken Bing als bron van resultaten. Het komt er dus effectief op neer dat Reddit Microsoft niet langer toestaat om te indexeren.

Overigens is ergens scheef dat ze zeggen dit te doen omdat ze niet willen dat hun content gebruikt wordt om Ai te trainen. Ook al staat het los van de deal die ze met Google hebben. Een moderne zoekmachine gebruikt ook Ai om de juiste en persoonlijke resultaten te geven. Google traint dus zijn Search Ai op Reddit.

Ik verwacht dat ze bedoelen dat ze niet willen dat (Generieke) Large Language Models op Reddit getraind worden als daar geen deal voor is...

Blizz @DeeD2k2 • 26 juli 2024 00:25

Als ze Microsoft's crawler blokkeren, dan zullen partijen zoals DDG en Quant automatisch voldoen. Reddit grijpt hier hun kans om te proberen andere partijen ertoe te bewegen vanuit een zwaktepositie contact met hen op te nemen om ze zo deals aan te smeren.

ONiel 25 juli 2024 11:43

Waw, wist niet dat Reddit zo een smerig commercieel bedrijf was… dacht dat het een baken voor vrij internet was.

Alle zoekmachines blokkeren om je content te beschermen? Volledig begrijpbaar en eigen recht, maar dan wel Google toelaten en een privacy-beschermende zoekmachine als DuckDuckGo niet? Zielig

Vaatdoek82 @ONiel • 25 juli 2024 11:46

Reddit zit al een geruime tijd krap bij kas. DuckDuckGo lijkt mij ook niet een partij die een LLM aan het ontwikkelen is maar wel nare concurrentie is voor Google (volgens mij zijn ze redelijk aan het groeien).

_Pussycat_ @Vaatdoek82 • 25 juli 2024 12:01

DDG gebruikt Bing-resultaten, meen ik. Misschien ligt het probleem bij Bing en niet direct bij DDG.

ManIkWeet @_Pussycat_ • 25 juli 2024 12:50

Dat was vroeger zo, ze gebruiken al een hele tijd (ook) hun eigen crawlers https://duckduckgo.com/du...lp-pages/results/sources/

Llopigat

Google
Websites en community's
Kunstmatige intelligentie

@ManIkWeet • 25 juli 2024 13:41

Dat is maar een klein fenomeen hoor, het is nog steeds 99% Bing. DuckDuckBot wordt met name gebruikt om de spam / SEO crap eruit te filteren. Dus het gaat meer om weglaten dan toevoegen.

Net zoals Kagi (ook een privacyzoekmachine maar dan betaald) hebben ze niet de capaciteit om echt het hele web te crawlen zoals de grote partijen dus ze gebruiken het meer voor finetuning.

[Reactie gewijzigd door Llopigat op 25 juli 2024 13:41]

iklucas @Llopigat • 25 juli 2024 17:55

Overigens werkt Kagi nog gewoon wel met de laatste reddit posts, zij betalen weer aan google voor bepaalde zoek-indexen, dus op die manier kunnen zij wel nog recente reddit posts aanbieden.

Llopigat

Google
Websites en community's
Kunstmatige intelligentie

@iklucas • 25 juli 2024 19:15

Ja dat verbaast me niks.

Ik gebruik zelf geen Kagi maar ik heb iets vergelijkbaars: Ik gebruik SearXNG. Die gooit dezelfde opdracht uit naar Google, Bling, Brave en nog wat van die dingen en kijkt vervolgens kritisch naar wat er terugkomt (kan je wegingen in aangeven enzo). Dit is enigszins vergelijkbaar met wat Kagi doet (die hebben ook wel een eigen crawler maar dat is net als met DuckDuckGo maar bijzaak)

Ik kan het erg aanraden trouwens. Zo heb je je eigen zoekmachine die je helemaal kan configureren en je kan hem zelfs instellen om te zoeken naar bijvoorbeeld torrents waar de echte machines zich niet aan zouden wagen.

Het enige dat ik een beetje mis is lokale AI integratie voor samenvattingen enzo. Daar zijn ze een beetje traag mee. Ik heb al een hele lokale AI server opgetuigd maar hier kan ik dat nog niet aan koppelen.

[Reactie gewijzigd door Llopigat op 25 juli 2024 19:16]

Bouwer21000 @ONiel • 25 juli 2024 11:46

Ik weet niet of ik hier een sarcastische ondertoon in moet lezen, maar Reddit is een bedrijf met aandelen op de openbare markt, natuurlijk willen ze winst maken.

Met Google hebben ze een deal, met DuckDuckGo niet. DuckDuckGo traint ook AI-modellen op data, ze hebben niet tot een overeenkomst kunnen komen en dus zorgt Reddit dat hun crawlers ermee ophouden. Dat lijkt me niet onredelijk.

Wat mij betreft staan alle websites in hun recht bij het blokkeren van onrechtmatig trainen van AI-modellen. Sommige AI-bedrijven trainen hun modellen op alles, ongeacht van auteursrecht.

TheMaurice @Bouwer21000 • 25 juli 2024 14:51

Dat klopt, het is een bedrijf, maar ze ontleden hun bestaansrecht wel grotendeels aan user-generated content. Dat is andere koek dan een bedrijf wat zelf haar eigen producten/kennis maakt.

CH4OS @ONiel • 25 juli 2024 11:48

In het artikel wordt dan ook uitgelegd waarom DuckDuckGo geblokkeerd is.

Netburst @ONiel • 25 juli 2024 12:03

Toen Aaron Schwarz er nog zat was dat wel een ding, maar sinds de verkoop aan Conde Nast is dat toch allemaal wat bergafwaarts gegaan.

Terry A Davis @Netburst • 25 juli 2024 12:12

Aaron Schwarz begreep niet dat de wereld om geld en macht draait, ik begreep dat zelf pas te laat overigens.

Over Reddit denk ik dat het juridisch wel mag enzo, maar het is vroeg of laat zo dat er meer websites alleen nog via Google gevonden 'willen' worden.

Een andere website kan bijvoorbeeld 'vrijwillig' kiezen voor Bing.

willemb2 @Terry A Davis • 25 juli 2024 15:12

Aaron Schwarz begreep niet dat de wereld om geld en macht draait

Dat begreep hij donders goed, maar hij vond het onacceptabel dat geld en macht de vrije toegang tot informatie in de weg stonden.

Overigens is zijn betrokkenheid bij Reddit omstreden. Bron.

HollowGamer @ONiel • 26 juli 2024 00:39

Reddit is niet meer van de originele maker, en ook om hem is veel te doen.

Reddit is uitgekomen op het juiste moment. Het is een bridge tussen de sociale media sites en de meer forums van vroeger. Van beide leent het ontzettend veel. Je kunt meer publiekelijk zijn, maar je kunt ook 'anoniem' browsen.

Robbierut4 25 juli 2024 11:42

Reddit blokkeert deel van de zoekmachines, Chrome en Brave werken nog wel

Sinds wanneer is chrome een zoekmachine?

MazDaMan1970 25 juli 2024 13:00

Het valt mij de laatste jaren op dat de zoekresultaten, via Google enorm vervuild worden door Reddit posts. Zelden haal ik er bruikbare info uit, dus eigenlijk is het een goed moment om over te stappen naar DuckDuck Go, als ik het zo lees

Dekar @MazDaMan1970 • 25 juli 2024 14:02

Daarom gebruik ik Brave Search. Je krijg veelal relevantere resultaten en veel minder advertenties

HollowGamer @Dekar • 26 juli 2024 00:40

Ik vind Brave Search enorm langzaam. Weet niet wat ze doen, maar Google renderd heel snel, maar bij hun is er een delay.

Ze zijn ook Leo aan het pushen.

Dekar @HollowGamer • 26 juli 2024 06:56

Ja, dat was initieel ook een punt van kritiek van mij. Nou wil ik een paar tienden van seconden niet als 'enorm langzaam' bestempelen. Echter, het weegt voor mij op tegen de 'enorm slechte' resultaten van Google

Mr. Freeze @MazDaMan1970 • 25 juli 2024 14:10

Heel verstandig ja, en mocht iemand iets willen zoeken op Reddit, zoek dan op Reddit zelf.

kaas-schaaf @MazDaMan1970 • 25 juli 2024 14:41

De reden is volgens mij omdat de andere posts SEO crap zijn met "AI" gegenreerde bloat of copy/paste van andere sites.

Iets vinden via reddit is soms makkelijker dan via de zoekmachine en wellicht heeft google dat door.

Zegt meer over de total enshittification van search icm fora dan over de kwaliteit van reddit. Ik gebruik nu vrijwel altijd "forum" als additionele tekst zodat ik alleen forum posts krijg en geen spam-maskererend-als-advertentie-maskererend-als-nuttige-info, hetgeen vrijwel altijd de volledige eerste pagina van google is.

herpiederpienow 25 juli 2024 13:39

Het is Reddit ook naar de bol gestegen. Het zou beter zijn als ze een keer een tik op de vingers krijgen net als al die andere grote social media platforms. Ze claimen veelste veel rechten op de content van de gebruikers. Er moeten gewoon wettelijke limieten voor komen. In plaats van gemakkelijker wordt het steeds moeilijker om iets op internet te delen.

Op dit item kan niet meer gereageerd worden.

'Selectief over samenwerking'

Lees meer

IT-banen

Reacties (96)

Sorteer op:

Weergave: