Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 70 reacties, 20.659 views •

Google heeft voor de Chrome-browser een extensie uitgebracht die de gebruiker inschakelt in de strijd tegen zogeheten content farms. Dergelijke websites verzamelen willekeurige content in de hoop hoger in de zoekresultaten te eindigen.

blocklist chromeMet de personal blocklist-extensie kan een Chrome-gebruiker websites blokkeren waarvan hij vermoedt dat ze niet relevant zijn. Domeinnamen die aan de zwarte lijst toegevoegd worden, verschijnen niet langer in de lijst met zoekresultaten als er een nieuwe zoekopdracht wordt ingegeven. Daarnaast wordt de geblokkeerde url doorgestuurd naar Google, dat deze data zegt te gebruiken voor nadere analyse.

De zoekgigant stelt dat het met de als experimenteel bestempelde extensie informatie wil inzamelen over content farms. Deze sites publiceren grote hoeveelheden arbitraire content die veelal is gekopieerd van andere websites, om zo hoger in de zoekresultaten te komen. Sommige bedrijven passen deze 'truc' toe als een vorm van search engine optimization.

Google heeft vorige maand al aangegeven dat het deze 'vervuiling' van zijn databases harder wil aanpakken. De experimentele extensie is een onderdeel van deze aanpak, naast aanpassingen aan het algoritme van de zoekmachine.

Reacties (70)

Reactiefilter:-170066+139+24+30
Moderatie-faq Wijzig weergave
Dit is eigenlijk Google die aangeeft dat ze hun algoritme niet slim genoeg kunnen maken om content farms te herkennen, en met deze addon de gemeenschap daarvoor om hulp vraagt. Vrijwilligers merken dan bepaalde sites aan als content farm, en Google kan veel preciezer berekenen wat een content farm is en wat niet. Wel slim van hun natuurlijk, en ook marketingtechnisch goed om het op deze manier te doen.
Ik denk dat het ook gewoon betere resultaten geeft. Mensen kunnen bepaalde dingen gewoon beter dan machines, zoals kwalitatieve oordelen geven over dingen. Vergelijk het met de ReCaptchas die op veel sites gebruikt worden. Dat zijn vaak stukjes van ingescande afbeeldingen van oude texten, die middels OCR niet betrouwbaar gelezen kunnen worden. Doordat er zo ontzettend veel mensen zijn die zo'n ReCaptcha invullen, kan er op een relatief betrouwbare manier aan "human OCR" gedaan worden: jij als mens kunt de vormen van de afzonderlijke letters beter begrijpen en interpreteren dan de op pure logica gebaseerde OCR software.

Helemaal als we het over relatief vage onderwerpen als het beoordelen van het contentgehalte van een website hebben denk ik dat een mens dat vele malen effectiever kan doen dan welk algoritme dan ook, juist omdat wij in staat zijn complexe verbanden te leggen en op basis van meer dan regeltjes kunnen oordelen.

Je kunt je ook nog voorstellen dat ze de resultaten van een dergelijke plugin over meerdere maanden analyseren en daar patronen uit destilleren. Ik denk dat een dergelijke manier van ontwikkelen in dit geval ook de enige goede optie is.

In ieder geval juich ik deze ontwikkeling toe. Het is de eerste stap in de richting van een searchcontent managementsysteem, waarbij ik van tevoren bijvoorbeeld profielen aan kan maken waarbij ik mijn search results kan aanpassen niet alleen naar de content van mijn zoekopdracht maar ook naar de soort van zoekopdracht.
De "vervuiling" zoals Google het noemt zie ik eerder als een vorm van privacy bescherming.
Van mij mag er gerust een betrouwbaar stukje software willekeurige Google analytics draaiende websites gaan aanklikken.
Of Google mijn PC dan een content farm noemt weet ik niet maar hoe meer ruis BB binnenkrijgt hoe minder accuraat het persoonlijk profiel.
Een content farm is iets anders: Je moet hierbij denken aan een site die een 1-op-1 kopie van Wikipedia (of GoT) bevat. Zodra de site dan hoger in de ranking staat kan men cashen door middel van advertenties (AdWords oid) of de ranking gebruiken om andere sites weer omhoog te krijgen - door linkjes naar dit soort sites in de 'content farm' toe te gaan voegen.

Waar jij het over hebt is het genereren van clicks op advertenties (en/of willekeurig bezoeken van sites) - dat is weer iets anders. Waarbij het (geautomatiseerd) genereren van clicks op advertenties Google natuurlijk ook een doorn in 't oog is...
Volgens mij heb je het artikel niet begrepen, het gaat om vervuiling van de zoekresultaten, niet vervuiling van jou online profiel.
Lees dit artikel over o.a. answers.com eens...
Als ze nou slim zijn maken ze ook een extensie voor andere browsers
Als ze nog slimmer zijn plaatsen ze gewoon een knop/link bij de resultaten, zodat je Google kunt helpen ongeacht de gebruikte browser.
Als ze nog slimmer zijn plaatsen ze gewoon een knop/link bij de resultaten, zodat je Google kunt helpen ongeacht de gebruikte browser.
Dat hadden ze in 2005 al:
http://www.flickr.com/photos/antimega/65868441/
http://lifehacker.com/#!1...ults-from-google-searches
Met semi-aankondiging in 2006:
http://googleblog.blogspo...st-this-is-only-test.html

Op een gegeven moment is dat stilletjes verdwenen. Daarna is er een 'sterretje' gekomen waarmee je een site wel als 'favoriet' kan bestempelen.
http://googleblog.blogspo...search-more-personal.html
Ja inderdaad, was erg jammer toen ze dat hebben verwijderd.
natuurlijk niet gekkie - het is toch in het belang van Google dat hun eigen Chrome een groter marktaandeel krijgt?
Dus als ze een toffe feature bedenken (zoals deze) en ze zijn slim, dan houden ze die lekker exclusief voor hun eigen product.
Als ze hiermee hun core business (google search) kunnen verbeteren voor iedereen, waarom niet? Toegegeven, de concurrentie (Bing, etc) staat nog ver achter, maar innovatie blijft nodig om aan de top te blijven.
Ik hoop ook dat er hiervoor snel een FireFox extensie voor beschikbaar komt.

[Reactie gewijzigd door gCassy op 15 februari 2011 11:59]

hoezo is dat gek
het is niet alleen hun browser die hier profijt van heeft
ook hun zoekresultaten(dus ook op andere browsers)
Kan dit niet heel makkelijk misbruikt worden?

Stel je hebt een concurrent die je een hak wilt zetten, je laat al je medewerkers via thuis ip's de site van de concurrent hiermee via chrome als niet-relevant markeren en je concurrent is nauwelijks meer vindbaar via google.
Je blocked het alleen voor jezelf. Google "analyseert het nader" en kan dan ervoor kiezen om die url te blocken voor iedereen... Zolang zij alleen dit soort praktijken (content farms) ermee aanpakken is dat prima wat mij betreft, maar het moet er natuurlijk niet toe leiden dat zij bepalen of het resultaat "relevant" is.
Eerst heb je er zelf last van, want je zal dan de site niet meer in de zoekresultaten zien, maar ook:
Daarnaast wordt de geblokkeerde url doorgestuurd naar Google, dat deze data zegt te gebruiken voor nadere analyse.
Ze zeggen niet a priori dat de site niet meer in hun zoekresultaten "wereldwijd" gaat voorkomen, ze gaan het analyseren. Dat lijkt me correct om kinderachtig gedrag te filteren.
Je mag aannemen dat, als deze informatie naar Google gestuurd wordt (en dat zal wel want anders heeft Google er niets aan en is het alleen de gebruiker die er wat aan heeft), dat er alleen een beslissing genomen wordt op een ruime doorsnee van alle gebruikers. Als er dus maar 1 gebruiker een site verwijderd dan is dat niet voldoende, het moeten er honderden/duizenden zijn...

En verder zal men e.e.a. ook wel weer koppelen aan eigen algoritmes om dit soort praktijken tegen te gaan...

Mocht vanaf een (set) IP-adres(sen) zo'n actie uitgehaald zijn dan zal de ranking van zo'n IP verlaagd of zelfs op 0 gezet kunnen worden door Google...
Ik denk dat ze het op een of ander manier kunnen controlleren.
Kijk dit vind ik wel heel erg handig. Want als je een beetje programmeervragen zoekt op google kom je nog wel eens wat sites tegen die je niet wilt zien omdat je daar alleen de vraag mag zien en de antwoorden enkel te zien krijgt als je inlogt (al dan niet tegen betaling).

Ter voorbeeld: zojuist heb ik Expert Exchange toegevoegd aan de block-list (linkje onder zoekresultaat). En ik krijg inderdaad het domein expert-exchange.com niet meer te zien.
Inderdaad Experts Exchange geeft je steeds een meldig dat je moet betalen om het antwoord te zien.
Echter hebben zij al eens een aanvaring met Google gehad, waarmee Google dreigde om hen index te weren als ze verder gingen met verschillende informatie aan te bieden aan de zoekmachine en gebruikers.
De oplossing die daaruit is voortgevloeid is dat experts-exchange nu het antwoord wel toont, alleen moet je heel even helemaal naar beneden scrollen.
Wanneer ben je voor het laatst op experts-exchange.com beland? Want juist de afgelopen 2 weken merkte ik dat die oplossing (heel ver naar beneden scrollen) niet meer werkt. Ze tonen de 'accepted solution' niet meer. Ook niet als je het cookie verwijdert waarin vastligt dat je onlangs op e-e geweest bent (want in dat geval krijg je helemaal niets te zien).

Jammer, want ik haalde er wel eens nuttige antwoorden vandaan. In de oude vorm zou EE dan ook niet in mijn farmblocklist terecht zijn gekomen. Maar zoals ze de resultaten nu presenteren heeft het geen zin meer en bewijst het farmfilter zijn nut.

Kieskeurig, beslist, ciao-shopping en dergelijke zijn ook geheide kandidaten. Maar dat is natuurlijk wel heel persoonlijk, want ik kan me voorstellen dat mensen die resultaten wel willen zien.

Ik ben dan ook wel benieuwd wat Google gaat doen met de informatie die ze krijgen via het farmfilter.

Edit: typo

[Reactie gewijzigd door Jan-E op 15 februari 2011 21:39]

Ja, Expert Exchange komt bij mij ook stipt bovenaan, eindelijk :)
ah, goeie! Gelijk toegevoegd.
Ik ben grote fan van die site, daar staan tenminste goeie oplossingen op. Je moet wel even scrollen voor je die ziet staan, maar ik hoop dat ze die site niet uit de zoekresulaten gaan wissen!!
En nu nog een extensie die ervoor zorgt dat deze blocklist tussen al jou pc's word bewaard
Mijn Chrome synced extenties en instellingen. Geen extentie voor nodig.
Cool! Ik hoop dat er ook snel een FF plugin voor komt.
Tijd dat die onzin een halt toegeroepen wordt. En de shops ook, zoek eens op review en het gros is niet eens iets. Pagina 4 begint het misschien.
Dit zou Ideaal zijn tegen de zogenaamde shop vervuiling als je bijvoorbeeld een review zoekt van een asus mobo, je eerst 5 pagina's met "write a review for shop X" door moet ploeteren.
Eindelijk!

Afgelopen week rot gezocht naar een nieuwe personen weegschaal. Vind je alleen maar sites als ciao-shopping, beslist, kieskeurig, etc. Alle sites roepen merken en typenummers, geen heeft alle juiste specificaties, geen heeft reviews.
Echt lastig om nog fatsoenlijke gebruikerservaringen te vinden.
Kieskeurig heeft toch vaak wel reviews. Die
Andere sites zijn idd. troep.
Natuurlijk wel handig, hoeven ze niet een slim algoritme te schrijven maar gewoon een oud scriptje om te bouwen om de foute websites er tussen uit te halen :P
Het is trouwens voor het eerst dat ik de "chrome web store" zo zie... ziet er netjes uit, eigenlijk een beetje zoals android :)

Op dit item kan niet meer gereageerd worden.



HTC One (M9) Samsung Galaxy S6 Grand Theft Auto V Microsoft Windows 10 Apple iPad Air 2 FIFA 15 Motorola Nexus 6 Apple iPhone 6

© 1998 - 2015 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True