Google maakt bommen onschadelijk

Volgens Google heeft premier Balkenende geen raar kapsel meer en is de Amerikaanse president Bush niet langer een 'miserable failure'. Het bedrijf heeft zijn zoekalgoritme aangepast om zogeheten 'Google-bombs' onschadelijk te maken.

Google-bomb Wie in het verleden op bovengenoemde zoektermen zocht kwam op de webpagina's van de desbetreffende bewindslieden terecht. Dat was het resultaat van een actie van website-eigenaren die massaal links naar de pagina's op hun webpagina's zetten, voorzien van de gewenste tekst in de anchor-tag. Een van de eerste 'bombs' die bekendheid kreeg was met de tekst 'more evil than satan himself', die de Microsoft-homepage als eerste hit opleverde. De reden dat Google besloot om zijn zoekalgoritme zo te tweaken dat het de bommen eruit kan pikken mag vermoedelijk gezocht worden in het gegeven dat sommige lieden geloven dat grappenmakers in dienst van de zoekgigant verantwoordelijk voor het zoekresultraat zijn. Hoeveel extra tijd het herkennen van Google-bombs kost is niet bekend.

Door Mick de Neeve

29-01-2007 • 16:56

48

Bron: Google

Reacties (48)

48
46
24
9
0
9
Wijzig sortering
Ik vind het wel jammer dat ze dat soort grappen eruit gehaald hebben, het is niet zo dat als je naar microsoft zoekt dat je dan "more evil than satan himself" krijgt.

Ik vind het veel hinderlijker, dat het steeds moeilijker wordt om nuttige informatie te vinden via google, je komt zo snel uit op allerlei reclama voor producten of diensten. Ik zou het meer waarderen als ze daar eens wat aan deden.
Anoniem: 156329 @Wapster29 januari 2007 17:11
Daarom gaat Wikipedia ook zijn eigen zoekmachine lanceren, probeer hem hier alvast uit:

Nederland:
http://www.google.nl/sear...m+site%3Anl.wikipedia.org

Engels:
http://www.google.nl/sear...m+site%3Aen.wikipedia.org
Met google zoeken naar een zoekmachine |:(
Het probleem is denk ik het vermoeden dat mensen krijgen dat het door Google employees is gedaan. (ook al is daar geen bewijs voor) Het lijkt daarom of het de mening van Google is wat natuurlijk niet leuk overkomt.

Veel belangrijker vind ik het dat zoekmachines eerlijke resultaten neerzetten en google-bombs zijn een duidelijke ondermijning daarvan, dat het tegen Microsoft en Bush is doet daar niets aan af.
Je kan anders ook stellen dat een "google-bomb" juist geen ondermijning van een eerlijk resultaat is.

Blijkbaar is het een veel voorkomende associatie waarin veel mensen zich kunnen vinden en waar ze nog moeite voor willen doen om die uit te dragen ook, overigens zonder daar zelf beter van te worden.
Dat lijkt mij een aardige definitie voor een geldig zoek resultaat. Of je het met de uitgedraagde "mening" eens bent is iets anders natuurlijk. :)

Wat mij betreft is het cruciale verschil met de reguliere zoekmachine vervuiling dat er hier nou juist geen poging gedaan wordt op de een of andere manier geld te verdienen.

Wat mij betreft mag die "google-bomb" blijven. De commerciele vervuiling, daar moeten ze wat aan doen.
customizegoogle helpt al een stuk tegen de de reclame & co. bedrijven 8-)
Toch krijg je nu pagina's die vertellen over dit soort query's. Er vanaf zijn ze er dus nog niet }>
Maar dat is terecht - het was nieuws, er is over geschreven, dus de termen die gebruikt zijn zullen nog terugkomen op allerlei plekken zoals blogs en nieuwssites. Maar nieuwe bommen zouden dus lastig moeten zijn, en vervolgens komen die dus ook niet meer in het nieuws. Dus het fenomeen is dan onderdeel van de geschiedenis.
nou krijg je met "more evil than satan himself" een artiekel van CNN over microsoft
'miserable failure' linkt naar
http://news.bbc.co.uk/2/hi/americas/3298443.stm
Artikel over Google Bom Over MR Bush :+

echt veel nut heeft het dus nog niet
"hoeveel extra tijd het herkennen van Google-bombs kost is niet bekend."

Maakt dit uit? Dit wordt onderzocht bij het crawlen van het web en de verwerking ervan. Het opzoeken van resultaten zal daar denk ik niet onder lijden. Gewoon de bom zin niet linken met de sites die de bom veroorzaken.
Anoniem: 178962 @Tyf29 januari 2007 17:21
Ja dit maakt uit, zoals gezegd wordt dit gedaan vanwege de aansprakelijkheids kwestie.

Als je er dus 2 weken over doet om zo'n bom onschadelijk te maken is het kwaad al geschied en dus heeft het niet zoveel nut.
Dat geldt alleen voor de bestaande "bommen". De huidige database zal dus eenmalig ge-cleaned moeten worden.

Met dit systeem zullen nieuwe nooit meer in de database komen en maakt de extra tijd bij indexering dus inderdaad niet uit.
Anoniem: 127343 @Franckey31 januari 2007 00:11
Idd, nu wordt er slechts van de zoekcapaciteit gebruik gemaakt voor het uitvoeren van niet alledaagse querys omdat (nog) niet bekend is wat je dan wel in moet kloppen om een aap als president op je monitor te krijgen...

Dit is imho een stap in de ondemocratisering van het internet. Omdat een paar lullo's het niet cool vinden dat zij, wellicht met een beetje manipulatie, ongewenst het middelpunt van de belangstelling zijn, worden dit soort gezagsondermijndende zaken fijntjes verboden/een halt toegeroepen door diegenen die de knaken hebben zich van enige kritiek te ontdoen.

Wanneer steeds een positieve Balkenende naar voren komt, kan ik dan ook ergens klagen? "Ze proberen hem goed uit de verf te laten komen, positieve discriminatie.."

Echt een kansloze, desalniettemin geslaagde actie.
Ik zou zeggen, bluf de 'kwaadwillers' eens uit, zorg er voor dat de hits uit het pro kamp beter/meer zijn.

Als ik een balkje zoek voor mn verbouwing:
http://www.google.nl/sear...ult&cd=1&q=Balkie&spell=1
Verpest die Balkenende ook alles...

Punt 1: Bush vraagt er ook wel een beetje om..
Punt 2: Balkenende ook.
Anoniem: 133254 @Tyf29 januari 2007 18:01
Ik begrijp ook niet wat deze zin, die commentaar levert op de brontekst, probeert te zeggen. Ik interpreteer het zoals jij (fractie seconde tijdens crawlen, niets tijdens zoeken). [Kan Mick de Neeve uitleggen?]

In dat geval mist TRRoads' idee het doel, zo'n wachttijd komt enkel in het spel als het een retro-actief klasseren is (bvb `de tweede die naar hetzelfde object linkt met dezelfde onwaarschijnlijke woordcombinatie' als trigger). Dat lijkt mij niet google's algoritme. Ik zou meer iets verwachten als `nieuwe toevoeging die zeer weinig gemeenschappelijke elementen heeft met de second-best match' als trigger.
@MarvinDMartian:

Zo werkt het denk ik niet, ik denk dat dit niet tijdens het crawlen gebeurt maar als nabewerking.

De herkenning moet dusdanig zijn dat er een hoop sites met een bepaalde omschrijving linken naar een pagina die feitelijk niets van doen heeft met de omschrijving.

Zulke herkenning kun je enkel doen wanneer je het op een grote schaal gaat bekijken, je hebt namelijk een hoop sites nodig die ernaar linken.

Aan de andere kant moet het ook niet dusdanig zijn dat er een false positive tussen kan zitten. Het is namelijk niet de bedoeling dat wanneer hier op t.net een review wordt geplaatst en een hoop sites linken erheen dat dit gezien wordt als een Google bomb. Dit is namelijk gewoon perfect normaal internet gedrag, als iemand iets maakt dan gaan we er met z'n allen naar linken.

Zulke herkenning is toch redelijk ingewikkeld en gezien het zoekvlak waarover gesproken wordt neem ik aan dat we het hier hebben over een orde van grootte van dagen.

Google wil deze praktijken aanpakken om te voorkomen dat "kleinste lul ter wereld" linkt naar de homepage van MarvinDMartian zodat jij vervolgens Google gaat aanklagen omdat je volgens Google de kleinste lul ter wereld hebt.

Wanneer deze herkenning dus te traag gaat denkt de hele wereld al dat jij de kleinste lul ter wereld hebt en dan maakt het niet zoveel meer uit of Google het nog zegt of niet. Snelle detectie is dus erg belangrijk.
"Google wil deze praktijken aanpakken om te voorkomen dat "kleinste lul ter wereld" linkt naar de homepage van MarvinDMartian zodat jij vervolgens Google gaat aanklagen omdat je volgens Google de kleinste lul ter wereld hebt."


Google aanklagen is sowieso onzin want niet volgens Google heeft Marvin de kleinste lul ter wereld maar volgens de makers van de websites waar de links op staan. Google indexeert slechts.
Doet me denken aan de tijd dat toen je intypte "weapons off mass destruction" en drukte op "doe een gok", je een venster kreeg van IE met geen the page cannot be found, maar met "these weapons of mass destructions could not be found". :+
Anoniem: 111246 29 januari 2007 17:55
Dus dat kan wel?
Maar als je wil dat bepaalde informatie over jezelf (die je niet zelf op internet hebt gezet) niet meer via Google te vinden is, kan dat weer niet?
Zou ff lekker worden als de halve wereld ineens extreem privacygevoelig zou worden, kan Google een enorme afdeling gaan opzetten voor die aanvragen. En zolang de halve wereld zich daar niks van aantrekt en vrolijk alle gegevens op zijn of haar Hyves profiel pleurt gaat Google daar ook weinig aan doen.

Maar als je dat zo graag wil span je toch een rechtszaak aan? Gebruik je die rechtsbijstandverzekering ook nog 's een keer..


offtopic:
Die 'bom' op de foto is geen bom, maar een hittezoekende luchtdoelraket..
het is ook een zaak van de site die het er op zet, niet google..
Google doet alleen maar z'n/haar werk.

<nog meer offtopic>
het lijkt me een GBU-15 te zijn, een tv geleide vrije val bom
</ot>
Anoniem: 111246 @Sentry2330 januari 2007 09:11
Dat is zo, maar het blijft soms nog lang in de cache hangen.
een bom is een bom..
als het valt en het richt schade aan is het een bom :P (en nu maar wachten op de volgende reactie)
Vanuit google kan ik me deze actie heel goed voorstellen, zij maken hun ranking via het aantal keer dat er naar een pagina word gelinkt door andere pagina's.

Als mensen dus met opzet links naar pagina's gaan toevoegen met een (hele lichte) verwijzing naar de werkelijkheid dan kloppen de pagerankings niet meer.

Maarja aan de andere kant wie zoekt er nou op zomaar op 'miserably failure' :P
Ik zoek altijd naar miserable failure
Lijkt me een redelijk eenvoudige wijziging;
Inkomende trefwoorden niet tellen indien ze op de site zelf niet voorkomen.
Het stomme is, is dat het niet helemaal zo werkt, en dat Google niet alle Google bombs gefilterd krijgt.

Zoek bijvoorbeeld op click here en je krijgt nog altijd de Adobe Acrobat Reader download pagina als eerste. Op die pagina staat nergens 'click here' en heeft puur die ranking gekregen omdat er bij heel veel pdf documentjes 'click here' staat.
Anoniem: 129979 30 januari 2007 12:48
Het is wel bijzonder grappig dat alle topics die nu naar voren komen in google juist gaan over het feit dat google de bommen nu filtert... Met name over bush :P
Als wikipedia z'n eigen zoekmachine gaat maken mogen ze weleens wat andere programmeurs in dienst nemen die hun search engine gaat schrijven. De huidige wikipedia search results zijn namelijk heel erg slecht.
Anoniem: 168507 @Rennie29 januari 2007 18:07
Voornamelijk doordat er geen tolerantie is voor typefouten. Erg irritant als je niet precies weet hoe je iets schrijft. Google is wat dat beftreft een stuk inteligenter. Iets met een z of s schrijven maakt niet zoveel uit net als vele andere kleine of zelfs grove fouten. Suggesties voor de correcte schrijfwijze zoals google dat heeft zou erg handig zijn in Wikipedia!
Quote van mijzelf een paar berichten hierboven:
Daarom gaat Wikipedia ook zijn eigen zoekmachine lanceren, probeer hem hier alvast uit:

Nederland:
http://www.google.nl/sear...m+site%3Anl.wikipedia.org

Engels:
http://www.google.nl/sear...m+site%3Aen.wikipedia.org
Google, alleen dan met nuttige zoekresultaten.
Hetgene waar ik me dus aan erger is daarmee niet opgelost. Probeer maar eens te zoeken naar plazma of hypofise om maar een paar voorbeelden te geven. Google geeft geen suggesties en geeft ook niet de bedoelde pagina's (Plasma en Hypofyse) weer in de resultaten (sterker nog, hij vind helemaal niets!)

Op dit item kan niet meer gereageerd worden.