Hoofdcategorieën

Google grootste index van allemaal

Door Harm Hilvers, woensdag 18 februari 2004 00:22
Bron: InternetNews, submitter: zemartino, views: 12.341

Google logoZoekgigant Google heeft afgelopen dinsdag een nieuwe voorsprong genomen op zijn concurrenten door bekend te maken dat de zoekindex voortaan uit 6 miljard items zal bestaan. De laatste wijziging vond in augustus vorig jaar plaats. Zoekmachine AlltheWeb had laten weten een zoekindex te bezitten met daarin 3,3 miljard items. Google liet dit niet op zich zitten en en vergrootte zijn eigen index naar hetzelfde getal. Op dit moment bevat Google's index 4,28 miljard webpagina's, 880 miljoen afbeeldingen, 845 miljoen Usenet-berichten en een groeiende collectie informatie over boeken. Volgens InternetNews zou de indexvergroting twee redenen kunnen hebben. Allereerst zou Google indruk willen maken op aanstaande beleggers, in verband met de beursgang in april. De tweede reden zou kunnen zijn dat het bedrijf zichzelf opnieuw in de spotlights wil zetten en wil laten zien dat het bedrijf nog steeds innoveert. Er gingen namelijk geruchten waarin gespeculeerd werd over wat de 'next big thing' zou gaan zijn, ná Google.

Volgende 00:47
Vorige 23:34

Reacties

«  1  2  »

De index groote is natuurlijk een super rekbaar begrip. Ga je b.v. mirrors van bepaalde site mee tellen, tellen pdf en doc. documenten ook als page mee? , zijn popups van plaatjes ook pagina's etc. etc.

Dus vandaar dat google zomaar zijn index groote kan veranderen, ze hoefden alleen het begrip pagina wat te verruimen..

Mirrors, PDF, etc zijn hier helemaal niet van toepassing. De index van Google beslaat gewoon 6 miljard unieke entries en daarmee zijn ze de grootste. De index grootte is dus juist niet rekbaar, maar een exact getal!

Of die entries ook nuttig / handig zijn is weer een heel ander verhaal. (Er wordt dus ook niet gerept over pagina's, maar over items!!)

En geloof me, google vergroot echt niet "zomaar" zijn index groote.. Dit moet je echt ver van te voren plannen en bedenken, anders lopen je systemen vol of gaat een query op de index erg lang duren en dan is google 1 van zijn sterkste kanten kwijt... snelheid!. (En dan weer niet te spreken over back-ups, hardware uitbreiding en nog meer zaken waar je rekening mee moet houden!)

Over die laatste zin (geruchten over wat er ná Google zou komen):

Ik vraag me af of ik eigenlijk wel iets anders wil, zò tevreden ben ik namelijk over Google...

En dan nog: hòe kan het beter?

En dan nog: hòe kan het beter?
Vrijwel niet - maar dat hoeft ook niet. Google hoeft slechts één grote fout te maken (b.v. : een popup plaatsen, een lange downtime krijgen), er hoeft maar één concurrent te zijn die even goed is als Google, en dan is iedereen over.

..en als je als Google zijnde je ogen niet openhoud kán dat verbazingwekkend snel gebeurd zijn. Daarom willen ze laten zien dat ze hun ogen nog steeds openhebben en nog steeds alert zijn. Want zeg nou zelf, zonder (serieuze) concurrentie, is het best aantrekkelijk om 't maar z'n beloop te laten gaan. Google "word toch wel bezocht". Maar één fout, en het kaartenhuis kan in elkaar storten.

Bij de beursgang moet zoiets natuurlijk niet ter sprake zijn - bij de beursgang moet het zo zijn dat Google nog jarenlang zal bestaan. Maar dat gaat niet vanzelf.

Het vernieuwende concept wat Google bracht is dan ook al door de meeste bekende zoekmachines overgenomen. Was bijvoorbeeld altavista.com eerder een soort Startpagina, nu is de frontpage puur een zoekbalk met enkele directe links. Juist datgene waar Google mee scoorde.
De snelheid en grootte van de database zal uiteraard altijd moeten groeien. Ookal is het een 'kaartenhuis', Google heeft ontzettend veel bekendheid gekregen in zeer korte tijd. Meer imo dan bijvoorbeeld Altavista of Yahoo (op het gebied van zoeken).
Dus als ze hun huidige kenmerken blijven behouden zal een opkomende concurrent het behoorlijk moeilijk blijven houden om Google van de top weg te slaan.

"En dan nog: hòe kan het beter?"

Nou, bijvoorbeeld met RQL (RDF Query Language) op "The Semantic Web" (de opvolger van WWW, zie www.w3.org/2001/sw/ ). Dan kan je de keywords namelijk in context plaatsen, en wordt het aantal irrelevante hits tot een absoluut minimum beperkt.
Dat en nog veel meer, bijvoorbeeld op ranges zoeken wordt ook mogelijk. Een query "wie was de koning van Nederland in 1820" is dan geen probleem, zelfs al wordt Willem I niet specifiek met dat jaar genoemd (hij was koning van 1813-1840).

Relevante hits zijn veel belangrijker dan VEEL hits.

Ik snap jouw reactie, maar als je op google.nl jouw exacte vraag stelt, krijg je alsnog een antwoord.

Google query

Wat ik wil zeggen is: Google probeert dit ook al voor elkaar te krijgen.

Op naar de wereldwijde dominantie }>

Liever niet. Laten er maar geduchte concurrenten zijn, dan is dat in ieder geval een goede drijfveer van google om te blijven innoveren. En dat is wat we allemaal willen, als zoekende internetter.

Persoonlijk is Booble de zoekmachine voor mij :Y)

Een te grote index is ook weer niks, want dan krijg je veel overbodige resultaten... Google zou die spam meta-tags er maar eens uit moeten filteren! Dat zou beter zijn... :z

Wou net zeggen, ik heb liever kwaliteit dan kwantiteit 8-)

Google ( en alle andere grote Search Engines ) houden al meer dan een jaar geen enkele rekening meer met meta tags zoals keywords & description.

Gelukkig niet nee, mensen vullen maar gewoon wat in, ben echt blij dat deze nachtmerrie voorbij is.

Dat is niet waar, Google kijkt ook naar META tags, ze spelen alleen een ondergeschikte rol aan de inhoud doordat de tags alleen als relevant worden gezien alsze overeenkomen met de inhoud van de pagina.

Als ik daar systeembeheerder zou zijn zou ik gek worden. Ik kan absoluut niet tegen overbodige data op mijn pc. Of niet netjes georderende mapjes.

Ik durf te wedden dat van die 6 miljard minstens 1 miljard wel beestaat uit dode links en dergelijke

Ik durf te wedden dat van die 6 miljard minstens 1 miljard wel beestaat uit dode links en dergelijke
Gelukkig heb je dan nog altijd de Google cache (of www.archive.org :o) ;)

Zelfs dode links kunnen nuttig zijn ;)

Dus volgens jou zou 1link op 6 , een dode link moeten zijn ... |:(

Op zich doet Google z'n werk goed. Maar toch voel ik me een beetje ongemakkelijk bij zo'n grote machtspositie.
Als je de zoek-technologie beheerst, dan beheers je in feite het internet. Want als mensen je niet kunnen vinden besta je in veel opzichten gewoon niet. Ik vind het in dat licht dus best wel eng dat er ex-spionen uit allerlei amerikaanse inlichtingen-diensten bij Google betrokken zijn.
Mischien beetje offtopic, maar ik moest het toch ff kwijt. :)

Ik vind het in dat licht dus best wel eng dat er ex-spionen uit allerlei amerikaanse inlichtingen-diensten bij Google betrokken zijn.
Waar baseer je dat op? URL?

Ik denk dat hij dit baseert op de inhoud van deze site: http://www.google-watch.org/ .

Die URL's van Wyshell en Kingfinn ken ik niet. Maar ik heb ooit eens een nieuwsbericht gelezen waarin stond dat iemand overstapte van de NSA naar Google.

Googles dominantie zal binnenkort voor een groot stuk minderen aangezien Yahoo! en MSN binnenkort met elk hun eigen zoekmachine technologien komen. ( ze zijn al aan het crawlen )

En je vind steeds meer alleen maar rotzooi ermee. Zou die extra dingen die ze erin gestopt hebben soms die rotzooi zijn? :)

Ik vind Ask Jeeves (www.aj.com) op z'n tijd ook erg handig..
je typt gewoon een engelse zin in en vind op nr.1 wat google ergens tussen de eerste 30 verbergt

bijvoorbeeld : what is the capitol of taiwan

[muggenzifter mode]capitAl :+
[/muggenzifter mode]

Een monopolie positie van een bedrijf in welk bedrijfsonderdeel dan ook is nooit goed. Het zou wel eens leuk zijn als Google "gehacked" word om ze eens te controleren hoe ze te werk gaan en dat naar buiten brengen, gewoon om te kijken of wel fair spelen.

Hun bedrijf mag dan wel veel waard zijn in korte tijd maar vaak hebben dat soort bedrijven addertjes onder het gras zitten.

Ik zou ook nooit het internet voor 100% veilig kunnen beschouwen, iedereen kan wel wat zeggen. Maar goed, een beetje slim mens prikt daar wel door heen, helaas het grote gros niet.

Wie weet lekt er nog wel eens iets uit :+

zou wel eens leuk zijn als Google "gehacked" word..
Je hebt gelijk, Google zit iedereen te manipuleren door zeer merkwaardige zoekresultaten te tonen, welke enorme beveiligingsproblemen kunnen veroorzaken :?
Volgens mij verwar je Google met een besturingssysteem.
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 00:47
Vorige 23:34
VNU Media logo Powered by True

© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden

Uitgever van: