Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 88 reacties
Submitter: bobwarley

Google stelt dat zijn zoekmachine zich beter zal gaan wapenen tegen zogenaamde 'content farms'. Dergelijke websites verzamelen veelal irrelevante content in de hoop zo hoger in de zoekresultaten van Google te eindigen.

Matt Cutts, principal engineer bij Google, stelt dat de zoekmachine stappen heeft ondernomen om 'content farms', sites die te vaak in zoekresultaten zouden opduiken met veelal gekopieerde inhoud van een lage kwaliteit, te bestrijden. Volgens Cutts heeft Google de nodige stappen gezet om zijn algoritme verder aan te scherpen, waardoor websites die 'oneigenlijke' trucs toepassen in de hoop hoger te eindigen in de zoekresultaten, afgestraft worden met een lagere indexering.

Google kreeg de afgelopen maanden toenemende kritiek over de invloed van zogenaamde 'content farms' op de zoekresultaten. Cutts neemt in zijn betoog een verdedigende positie in en stelt dat Google het algoritme dat websites afstruint op zoek naar nieuwe content, continu blijft verbeteren om zo misbruik te voorkomen. Niet alleen zou de index van Google de afgelopen maanden flink zijn vergroot, ook zou het algoritme beter detecteren dat bepaalde woorden op een website kunstmatig vaak worden herhaald.

Cutts stelt verder dat de zoekrobots van Google zich niets aantrekken van eventuele advertenties die het internetbedrijf op te indexeren websites al dan niet heeft draaien. Ook zou reclame van Google geen positieve invloed hebben op de positie van een site in de zoekresultaten.

Moderatie-faq Wijzig weergave

Reacties (88)

Dat is een goede aanpak. Veelal kom ik op pagina's die alleen maar trefwoorden bevatten voor het ding dat jij zoekt, terwijl de site met waardevolle informatie helemaal onderaan staat, wegens weinig bezoekers.

Goedzo Google!
Google heeft dit aan zichzelf te danken. Veel bedrijven zijn te afhankelijk geworden met internet verkoop en moeten via google gevonden worden.

Het is contiue een wedstrijd om hoog in de zoekresultaten te komen. De meeste mensen kennen al de truct niet eens.

Xrummer software, maakt bijv volautomatisch profielen aan op forums, post profielen daar, berichten met links captcha daar lachen ze om, voor 1 dollar krijg je er een 1000 gekraakt volautomatsich.

Linkwheeel software via zogenaamde web2 properties. Automatsich posten op blogs voor links.

Let op de trucs werken zelf zo dat google er altijd achteraan loop. Je hoofdsite linke je alleen via bijv presberichten of linkwheels. Deze persberichten en linkwheels krijgen dan masaal backlinks via forums, blog enz. Je hoofdsite blijft op die manier altijd buiten schot.

En ja het werkt allemaal. Vooral in de USA bij woorden als finance is de strijd gigantsich om bovenaan in google te komen. Daar gebruiken ze dus dit soort zaken.

Werkt ook leuk voor domeinen waar alleen reclame van google op stat. Zo verdien je aan mensen die dan op jou site komen, via google en dan weer op een betaalde advertentie klikken, waar jij dus weer geld aan verdient.

Als je dit allemaal ziet, zie je eigenlijk pas hoe verrot het in elkaar zit.
Precies ook ik erger me kapot aan dat soort sites, binnen 1 seconde ben ik daar ook weer weg, ik snap niet dat er blijkbaar mensen langer op dat soort onzinpages blijven rondhangen, als er meer snuggere mensen waren was het snel afgelopen met dergelijke onzin sites.

Ook met torrent search altijd leuk bovenaan de lijst een gesponsorde link te vinden met precies de inhoud die je zoekt, maakt niet uit dat de niet gesponserde lijst compleet leeg is en die torrent dus gewoon niet bestaat.

Als je naar een bepaalde review van een apparaat zoekt, weet je bijna zeker dat je alleen maar ads vind waar het apparaat te koop staat, echt handig zo'n zoek functie die alleen maar troep produceert.

Een andere briljante feature vind ik de optie om de verbeterde search waarnaar je zoekt te gebruiken: Bv: did you mean to search blah blah blah ?, en als je er dan op klikt dan vind google niets van dat alles, echt handig.

[Reactie gewijzigd door een_naam op 23 januari 2011 13:15]

Als je naar een bepaalde review van een apparaat zoekt, weet je bijna zeker dat je alleen maar ads vind waar het apparaat te koop staat, echt handig zo'n zoek functie die alleen maar troep produceert.
Als je geluk hebt. Ik kom bij het zoeken naar een apparaat of handleiding ook vaak sites tegen die "<apparaat> reviews!" zo'n vijftig keer op de pagina hebben staan en minstens vijf andere reviewsites linken die allemaal even leeg zijn. En linken naar verkoopsites of de site van de fabrikant, ho maar.
Zelfde met 'Lyrics', 'Drivers', 'mp3', veel beruchte sites ;) Hoop dat ze dit snel aan gaan pakken!
Inderdaad lyrics daar erger ik mij blauw aan.

Maar een tip om dat te voorkomen is best simpel: typ er een stukje tekst waarvan je zeker weet dat het er in komt :)

En mss nog een tip (maar hier op t.net zal iedereen die wel kennen): als je bv 500 filestube links krijgt: -filestube achter je zoekterm zetten :)

Ik ben blij dat ze dit gaan aanpakken.
Inderdaad lyrics daar erger ik mij blauw aan.

Maar een tip om dat te voorkomen is best simpel: typ er een stukje tekst waarvan je zeker weet dat het er in komt :)
Dan krijg je evengoed onzinsites die een bakkes content gekocht / gekopiŽerd hebben, op een lelijke site online gezet hebben en een bakkes ads erbij gezet hebben.
Ik mag hopen dat Google monitored dat na een bepaalde selectie op een zoekresultaat er een andere geselecteerd wordt, of een nieuwe zoekpoging voor het zelfde probleem, dat zou inhouden dat het vorige geselecteerde resultaat niet een gewenste pagina opgeleverd heeft. De volgende keer mag die site dus lager komen te staan dan eentje die daarna selecteerd was.
Als ik me niet vergis doen ze dat al ongeveer, "Personalized Search". Meer info op Google blog en hier kun je het aanzetten.
Off-topic:
Kleine tip om die gesponsorde onzin nůg makkelijker te herkennen, gebruik hoOfdletTers op rare plekken in je zoektermen. Krijg je ze exact zo terug, met 'foute' hoofdletters, dan weet je dat het onzin is.
binnen 1 seconde ben ik daar ook weer weg, ik snap niet dat er blijkbaar mensen langer op dat soort onzinpages blijven rondhangen

maar 1 miliseconde is al meer dan genoeg..

Ben wel eens met je van die 'verbeterde search', als ik zie hoe vaak het voor komt dat google gewoon resultaten tevoorschijn tovert waar ik NIET om gevraagd heb omdatie ook woorden uit zichzelf erbij gaat halen die er deels op lijken. 9 van de 10 results zijn vaak dan ook al results die van de 'did you mean....'
En door deze content farms gaat de daadwerkelijke kwaliteit van de zoekmachine onderuit. Zijn dit dan websites die zeer veel informatie bevatten over dergelijke onderwerpen en zo dus omhoog komen? Of zijn dit sites die eigenlijk een product verkopen, maar door die content die ze op hun servers hebben draaien hoger in de notering komen?
Het zijn sites die content kopiŽren, veelal van Wikipedia etc. en er hun eigen ads bij zetten. Veelal is de content nagenoeg onbruikbaar, omdat afbeeldingen niet worden gekopieerd en de content volledig is ondergesneeuwd door alle ads en popups.

Al met al een uitstekend initiatief om dit soort troep lager te pageranken... Zolang het maar niet ten koste gaat van sites die wel goede intenties hebben en bijvoorbeeld bronvermeldingen bij hun content hebben staan.

[Reactie gewijzigd door intoxicated op 23 januari 2011 12:34]

en zolang het maar niet ten koste gaat van de site waar de content vandaan wordt gekopieerd. maar dat lijkt me erg lastig, omdat het (net als met 2 identieke proefwerken) heel lastig hard te maken is wie nou bij wie gespiekt heeft.

de kans lijkt me levensgroot dat google dan ook de oude schoolmeestertruuk toepast, en beide pagina's een 1 geeft. En dat opent weer nieuwe mogelijkheden om je concurrenten het leven zuur te maken: Bouw even snel een website die content kopieert, en zet die op zeg 100 domeinnamen en gratis hosting. En weg is je concurrent uit de zoekresultaten. Natuurlijk kan die juridische stappen ondernemen ivm copyright enzo, maar dat kan best lastig zijn, en voor hij zijn oude positie weer terugheeft...

[Reactie gewijzigd door xilent_xage op 23 januari 2011 13:22]

en zolang het maar niet ten koste gaat van de site waar de content vandaan wordt gekopieerd. maar dat lijkt me erg lastig, omdat het (net als met 2 identieke proefwerken) heel lastig hard te maken is wie nou bij wie gespiekt heeft.
Met als verschil dat google wel zou kunnen zien welke het eerst was, waardoor het wel duidelijk is wie bij wie heeft gespiekt.

@Xilent_xage
de meeste pagina's veranderen niet enorm veel in een korte tijd, google zou dan nog steeds kunnen zien wie er eerst was.

[Reactie gewijzigd door Goderic op 23 januari 2011 14:38]

dat hangt er vanaf hoe vaak je synced. als je dat vaker doet dan de googlebot langskomt dan weet google het ook niet
Maar het heeft weinig zin om een splinternieuwe site te kopiŽren, tenzij je vantevoren al weet dat hij heel populair gaat worden. Als een site populair begint te worden is die al lang en breed door Google geÔndexeerd lijkt mij.
Het zijn sites die content kopiŽren, veelal van Wikipedia etc. en er hun eigen ads bij zetten. Veelal is de content nagenoeg onbruikbaar, omdat afbeeldingen niet worden gekopieerd en de content volledig is ondergesneeuwd door alle ads en popups.
Ik denk dat het ook gaat om sites die via een paar scripts je zoekresultaten na-papegaaien en daar weer een 'top searches' pagina van weergeven. Natuurlijk om er advertentie-inkomsten op te verdienen.

Hetzelfde zal opgaan voor veel domein-parkeer-pagina's.
Er zijn verschillende vormen om google ranking te manipuleren.
De ene keer is het een website met veel banners en de andere keer met dubieuse produkten of self-installing software.
Deze maken ook vaak gebruik van de xrumer software die zichzelf op forums registreerd (captcha omzeilend) en deze dan spammed met zinloze content en links naar deze dubieuse websites.
Vaak zie je op die websites een content systeem (zoals wordpress) met heel veel gekpieerde topics en/of de zelfde topics maar met de tekst in een andere volgorde.

Er bestaan ook in Nederland bedrijven die op dubieuse wijze de Google ranking proberen te manipuleren (ClearSense bijvoorbeeld) waaraan je heel veel geld kwijt bent voor weinig tot geen resultaat.
Als je veel content en links op niet relevante sites staat krijg je ook een penalty. Is Google al op lang ingesteld. Deze truc is al tijden bekend en getackeld, gelukkig.
idd, dus wat ooit de 'SEO-bedrijven' waren zorgen ervoor dat ze precies de goede verhouding keywords versus links plaatsen op een site.
3 voorbeelden van sites die google wat mij betreft geheel uit hun database mag verwijderen:

bigresource.com: Een site die alleen maar forumberichten van andere site kopieert en bij elkaar in enorme pagina's plakt. Geen idee wat ze er mee willen, ik zie geen reclames, geen mogelijkheid om naar de originele site door te linken

expert-exchange.com: een site die alleen maar laat zien welke vragen er gesteld zijn en je vervolgens een abonnement wil verkopen om uit te vinden of er een antwoord is. Opvallen is dat ze de google-bot andere informatie geven dan bezoekers. In google's preview zie je andere teksten dan wat je op de site zelf kunt terugvinden.

consumentenbond.nl: die vervuilen de zoekresultaten stelselmatig met allemaal lokkertjes, ook alleen maar om abonnementen te slijten. Je kunt er nooit antwoorden vinden zonder te betalen.

Allemaal zoekresultaten die hoog in google staan, maar waar je niet aan hebt.
expert-exchange.com: heb ik al veel nuttige info kunnen vinden.
De antwoorden staan altijd onderaan de pagina. (half uur scrollen)

mocht je dat niet willen dan kun je eventueel betalen.

site:consumentenbond.nl ongeveer 32.400 resultaten :S
Inderdaad, experts-exchange bood in het verleden de gegevens op een echt verkeerde manier aan. Volgens mij eerst op basis van user-agent waardoor de google cache pagina's wel de goede informatie hadden maar jij zelf iets anders kreeg te zien, en later op basis van een cookie... had je de cookie zag je de antwoorden niet. Google-bot support geen cookies, was te omzeilen door cookies te blokkeren.

Tegenwoordig is het enkel een paar keer pagedown inrammen en je hebt uitstekende antwoorden want er hangen toch wel echte 'experts' rond die soms lastige vragen weten te beantwoorden.
Toch jammer dat die 'experts' hun hulp dan op zo'n malafide website aanbieden.

Ik heb die website iig al een paar keer gemeld bij Google, omdat ik me er kapot aan irriteerde.
Hoe kun je het nou voor jezelf goedpraten dat je EE rapporteert? Dit is een prima site, met oplossingen voor veel problemen waar niemand uit kan komen. Ik heb er al erg veel oplossingen gevonden voor problemen.

En ja, het is tegen betaling (ook al kun je nu wel de antwoorden lezen), maar niet alles hoeft gratis te zijn.
google irriteert zich ongetwijfeld ook kapot aan mensen die legitieme websites rapporteren "omdat ze zich er kapot aan irriteren (sic.)"
Ja, zo kun je alle index-crawlers wel even eruit gaan trappen. Kieskeurig, Kelkoo, Pricewatch, en nog een hele berg meer.

Als je Google zou verplichten om alleen maar zoekresultaten met gratis informatie te geven dan zou niemand er meer op adverteren. Maar waar het nu om gaat zijn kansloze meta-pagina's die niks meer zeggen dan je zoekresultaten zelf. Vaak nog met "torrent" of "high speed download" erachter geplakt zodat domme mensen erin trappen en opgezadeld worden met spyware.
Ik zit vooral te denken aan al die pagina's als allebedrijven en de tientallen andere bedrijfsgidsen. Helemaal gestoord wordt je daarvan, en die vervuilen een stuk meer dan "torrent" of "high speed download", dingen die de gemiddelde consument helemaal niet zoekt.
Goed vooruitgang, gelukkig houd google de algoritmes vrij goed up to date en worden misbruik meestal vrij vlok verholpen.

Laten ze ook gelijk maar iets doen aan die on eindige lijst me winkels en vergelijkingssites die steeds bovenaan staat en niet relevant zijn in veel gevallen, of optie zodat je winkels kan filteren, en bedoel dan niet de sponsoren links, maar de gewone links waar google niks voor krijgt. Soms is het handig om in winkels te zoeken en soms zitten ze heel erg in de weg.
Dan moet je al bijna een invoerveld hebben waar je ingeeft naar wa type informatie je op zoek bent. Kan me goed voorstellen dat wanneer mensen een typenr van een TV intypen ze op zoek zijn naar een vergelijkingssite of een webwinkel. Als ik echter een type ingeef is het meestal om de technische specs te vinden of om een schema te vinden.
Google kan dat in mijn ogen op geen enkele manier onderscheiden...
Om echte vooruitgang te boeken zouden ze eigenlijk alle zoekmachines een set van dezelfde instructies moeten geven en een stukje 'zoeken' bij de schoolopleidingen moeten betrekken.

Geavanceerd gebruik van diverse parameters laat stukken betere zoekopdrachten toe en hoeveel mensen weten op het moment Łberhaupt hoe ze een site search kunnen verichten, of dat ze met een min teken dingen weg kunnen filteren etc etc.
Sinds een tijdje kun je aan de linkerkant selecteren wat voor resultaten je wilt: winkels, afbeeldingen, discussies, ... Is dat niet gewoon wat je bedoelt?
Goede zaak! Ik loop tegenwoordig dagelijks tegen dergelijke sites aan via Google. Ik zoek iets, vervolgens kom op een site waar na 15 cm Google ads 2 regels staan van iemand die exact dezelfde vraag stelt, of gewoon alleen mijn ingetypte keywords met daaronder "klik om te zoeken", met aan de zijkant nog meer advertenties, en daaronder nog veel meer advertenties... Het hele businessmodel van dergelijke sites is gericht op advertenties i.p.v. op content, en Google draagt daar enorm aan bij.
Het verbaast me eerder dat ze dit zo lang hebben toegelaten.
Er is natuurlijk nog een verschil tussen toelaten en zo'n resultaten kunnen filteren. Heel het algoritme steunt op trefwoorden en success rate, het probleem is dus echt wel vrij fundamenteel.
ze mogen beginnen die bigresource eruit te flikkeren. Wat heb ik al zitten vloeken toen ik weer op die site belandde. Dan wordt je doorgelinkt naar de startpost van het originele topic en mag je herbeginnen met zoeken.

Experts-exchange is ook zo ťťn, maar als je via google de site bezoekt staan de antwoorden helemaal onderaan, wat dan wel weer handig is.

[Reactie gewijzigd door ieperlingetje op 23 januari 2011 12:34]

E-e haal ik heel af en toe nog wat nuttige antwoorden vandaar, maar je moet idd naar beneden scrollen.

Ik heb een grotere hekel aan die mail archief sites waar geen enkele discussie is te volgen, maar alleen maar losse posts zijn te vinden.
Beetje tweaken en je browser en je kunt bigresource er tenminste uitfilteren ;)

Maar goed natuurlijk niet de aanpak die aan googles eigen kant gewenst is, maar voor ons gebruikers toch wel handig als lapmiddel.
De mogelijkheid om een persoonlijke zwarte lijst van websites bij te houden (die dan worden weggelaten uit de zoekresultaten) zou dit probleem ook grotendeels oplossen, ik merk dat het toch een handjevol sites zijn die bij mij elke keer de zoekresultaten vervuilen.
De persoonlijke zwarte lijst was een feature die Google een tijdje had, maar die hebben ze helaas weggehaald. :(
Dat werkt inderdaad prima.
Maar zoiets zou via karma moeten te doen zijn....
Die haalt met javascript de betreffende sites weg uit je resultaten. Niet ideaal.
niet de perfecte oplossing mss, maar ik zie de resultaten die ik niet wil zien niet meer, en klik er dus niet op ook. Meer moet dat niet zijn...
Ik wist niet dat het Łberhaupt mogelijk was om zo je website hoger aangeschreven te krijgen bij Goolge, het is een beetje hetzelfde als dat mensen bij een youtube-filmpje tientallen trefwoorden in de description zetten om meer views te krijgen... :)
Misschien tijd voor een 'hoe werkt google's pagerank' 101? :P
http://www.youtube.com/watch?v=tq8v2eldxFU

On a sidenote: Het lijkt mij wel dat als deze manier van content farming zo goed werkt google te veel van hun eigen 'PageRank' is afgeweken, danwel dat algroritme flink getweaked moet worden.

[Reactie gewijzigd door SchizoDuckie op 23 januari 2011 13:19]

Pff wat zijn die dingen toch fucking irritant!, standaard sla ik nu ongeveer de eerste 3 zoekresultaten over... overigens wel geniaal dat de reclame die ik krijg zich wel aanpast aan mijn voorgaande zoek acties op google... krijg op het moment alleen nog maar sport artikelen te zien omdat ik naar australian open zocht -_-
overigens wel geniaal dat de reclame die ik krijg zich wel aanpast aan mijn voorgaande zoek acties op google...
Lang leven tracking cookies?
Nee, url tracking. Ga maar eens naar google maps.

typ daar de locatie in die je zoekt.

Zoek vervolgens nog eens een locatie op.

Zowel de 1ste als de 2de locatie staan nu in de parameters van de url. (klik maar eens op LINK in het kaartje)
probeer eens adblock plus, krijg je helemaal geen reclame meer, ook niet in de google resultaten ;)
Lijkt me niet zo moeilijk, als je de huidige implementatie van de zoekmachine en zijn criteria bekijkt. Dit soort zaken (en bijhorende aankondigingen uiteraard) horen bij het aanhouden van een leiderspositie. Kan het zeker niet afkeuren. Het uiteindelijke doel is natuurlijk het aangeven van de gewenste site op de eerste plaats, met een juiste volgorde van belangrijkheid. Dat stadium hebben ze zeker nog niet bereikt, maar je merkt toch wel dat men voortdurend bezig is met vernieuwen en verbeteren van de indexering en implementering.

Wel moet ik zeggen: nog niet veel last gehad van dit soort sites, bij het googlen.
Het is echt goed dat ze dit aanpakken want hoewel je vaak nog met behulp van page preview een aardig idee hebt van welke zoekresultaten relevant zijn en welke niet is het bijzonder irritant als je weer eens terecht komt op een website die alleen maar de zoekopdracht weergeeft met allerlei ads erom heen.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True