Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 34 reacties

Google heeft dinsdag een nieuwe versie van zijn search appliance voor de zakelijke markt gepresenteerd. Versie 7.0 heeft volgens Google onder meer een beter algoritme, waardoor de zoekresultaten beter zouden moeten zijn.

Naast een beter algoritme en daardoor betere zoekresultaten, heeft versie 7.0 van de Google Search Appliance een uitgebreidere vertaalmodule, waardoor onder andere Arabische en Chinese documenten vertaald kunnen worden. De zoekdienst van Google voor bedrijven bestaat uit een combinatie van Google-software en een server die gebruikers in hun eigen datacenter kunnen opnemen.

Daarnaast is de ondersteuning voor Sharepoint verbeterd. Exchange wordt echter nog altijd niet ondersteund, al kunnen gebruikers volgens Google-manager Brent VerWeyst een eigen connector schrijven waarmee ze Exchange-ondersteuning toevoegen.

Het apparaat komt in twee configuraties: een 2U-server die maximaal 10 miljoen documenten aankan, en een 5U-server die maximaal 30 miljoen documenten kan indexeren. Desgewenst kunnen verschillende servers worden gecombineerd om het doorzoeken van meer documenten mogelijk te maken. Goedkoop is de Google Search Appliance niet; voor een licentie die het doorzoekenen van maximaal 500.000 documenten mogelijk maakt gedurende twee of drie jaar, moet 15.000 dollar per jaar worden betaald.

Over de technische specificaties van het product wil Google weinig vrijgeven. Zo wil het bedrijf niet zeggen op welk besturingssysteem de servers draaien. Over de leverancier van de hardware wil Google enkel kwijt dat hieraan niets is veranderd ten opzichte van vorige versies. Die draaiden op hardware van Dell. Daarnaast hadden ze een Cent OS-Linuxdistro aan boord.

Overigens bood Google in 2008 nog korte tijd een gevirtualiseerde versie van de Search Appliance aan, die gebruikers op eigen hardware konden draaien. Of het bedrijf van plan is om dat project weer op te pakken, wil het bedrijf niet aangeven. "Maar bij Google zijn we extreem toegewijd aan cloudcomputing", aldus Google-manager VerWeyst.

Google Search Appliance 7.0

Moderatie-faq Wijzig weergave

Reacties (34)

Is dit een soort Google voor op het interne netwerk?

Stel, een reus als Philips wil kunnen 'Googlen' naar documenten die op de Philips servers staan, dan moeten ze deze server met bijbehorende software aanschaffen?
Ik heb ook even verder gezocht en gelezen, hier een tekst uitleg over de GSA.

Het is in feite een lokale instantie van het grote Google, en je kunt er inderdaad je eigen servers of eigen website mee indexeren en doorzoeken.
Wij hebben de GSA bij ons in het bedrijf sinds een paar jaar draaien. Hij is heel goedkoop; zo'n §23k per productie server voor twee jaar (dus effectief nog geen 1000 euro per maand), waar je tot een half miljoen documenten en webpagina's mee kan indexeren.
Dit is dus inclusief hardware en gratis updates.

Bij ons kost het beheer van 3 machines ongeveer 36 uur per jaar. Dat is inclusief het installeren van updates, contact met leverancier en monitoring.

Dit is voor een multinational als ons, zo goedkoop, dat het initieel moeilijk was mensen te overtuigen dat je een goede zoekmachine zou krijgen.

Na introductie van deze machine op onze publieke website, zijn onze kosten met ruim 150k per jaar gedaald en is onze online verkoop bij zoekresultaten binnen 8 weken (zelf lerend algoritme) sterk gestegen en direct op dat niveau gebleven.

Implementatie kosten bij ons waren nog geen 50k. Niet onbelangrijk, de resultaten zijn er altijd (ondanks ruim 23 duizend zoekopdrachten per dag) binnen de paar milliseconden, bij gebruik van 1 GSA.

[Reactie gewijzigd door djwice op 10 oktober 2012 19:22]

Dit is volgens mij inderdaad voor document databases binnen bedrijven. Grote bedrijven willen nogal eens een grote stapel bestanden hebben met werk instructies, standaarden, procedures, templates etc. Het terugvinden van dergelijke documenten kan soms een ramp zijn (uit eigen ervaring), zeker als je niet precies de naam van het document weet en/of op de inhoud aan het zoeken bent.
Daar zijn ook een hoop andere mogelijkheden voor waarvan een aantal ook prima werkt, denk aan Zieso bijvoorbeeld.
Duidelijk. Raar is het dat de MS SharePoint (exclusief SEARCH, let wel) zoekfunctionaliteit belabberd is ivm Bing, Google, etc
Ik weet niet over het in verband met Bing etc. is, maar het is zeker naar dat zoeken op een intern netwerk met duizenden documenten een drama is in vergelijking met het zoeken "op het internet" waar miljoenen, zo niet miljarden documenten te vinden zijn.
En daar is dus ook zo'n indexing service voor. Lijkt me wel mooi spul van google! Maar let wel, er zijn zoals altijd meerdere oplossingen hiervoor. Liever zie ik dan ook dat tweakers (als ze tweakers zijn) een round-up doen van meerdere oplossingen om te kijken hoe verschillende producten zich tot elkaar verhouden dan altijd deze marketing praatjes. Dat zou een stuk meer nieuwswaarde hebben dan dit.
Altijd lastig zo'n round-up, aangezien de meeste software commercieel is (open source oplossing daargelaten), er geen trial versies van zijn vaak en de software miljoenen kan kosten. Ik kan het weten, ben verantwoordelijk voor een globale enterprise search oplossing bij een grote multinational (we verwerken terabytes aan data in onze index).
Dat is een valide punt. Echter, denk ik toch dat wanneer een gerenomeerde site als tweakers.net een vriendelijke mail stuurt met het verzoek om een testlicentie voor een artikel omtrend het desbetreffende product, er toch echt wel eentje over de mail binnenkomt. Maar dat kan ik mis hebben natuurlijk.
Daar lijkt het inderdaad wel op.
Ik neem aan dat dit systeem allerlei codecs van bestandstypen ondersteunt om deze te indexeren, maar kan je deze zo nodig toevoegen? Het zou wel handig zijn als dat mogelijk zou zijn. Het klinkt als een inclusief hardware product, dus niet zonder hardware te verkrijgen, en niet om zelf mee te klooien. Over het algemeen wel een goed idee trouwens :D

[Reactie gewijzigd door Josaus op 9 oktober 2012 16:19]

Je kunt er zo'n 200 verschillende bestandstypen mee indexen, en de te indexen bestandstypen kun je zelf kiezen. Hier de lijst met bestandstypen.
Hoewel ik een liefhebber ben van Google producten vind ik dit nogal beperkt. Voor veel toepassingen denk ik dat een zelfgebakken oplossing (Lucene of zo) beter zal werken. Een aantal beperkingen:

- documenten tot 30Mb. Veel van mijn documenten (hoewel hooguit 50 pagina's) zijn een stuk groter vanwege afbeeldingen.
- geen API (zover ik kan zien). Je kunt het dus niet gebruiken om gebruikers van je website text te laten zoeken in de boeken die je verkoopt (via je eigen interface).
- geen virtual appliance. Je moet dus een eigen datacenter hebben

Dus, ik zie er het nut niet zo van in (maar ben zeer geinteresseerd in mensen die dat wel zien!). Waar ik overigens op wacht is een appliance voor gmail ;-)

[Reactie gewijzigd door loetje6 op 9 oktober 2012 16:35]

Veel wetenschappelijke en interne artikelen hebben geen afbeeldingen en zijn dus niet zo groot. 30Mb aan tekst is genoeg voor de meesten. En het is niet bedoeld voor gebruikers van je website, het is bedoeld voor je werknemers. Het laatste punt dat je noemt kan je ook als een voordeel zien omdat veel bedrijven liever niet hebben dat al hun documenten in de cloud van Google staan.
OK, ik zie je punt. Maar ;-)....

Veel business documenten zijn gemakkelijk 30Mb (plaatjes voor de managers). En als je nogal wat onderzoeksdata in je appendixes hebt dan zit je ook wel een keer aan 30Mb.
Voor interne gebruikers. Mja, dat betekent dus dat ik een tweede oplossing moet introduceren om de bezoekers van mijn website te bedienen. Waarom dan niet die alternatieve oplossing voor intern gebruik inzetten.
Hosting van een virtual appliance en je documenten betekent niet perse dat die in Google's cloud staan.....Kan wel een heel virtueel datacenter hebben bij een hosting provider (Skytap anybody)
Wij hebben het hier staan voor de zoekfunctionaliteit op onze site.
We kwamen van een oracle-based oplossing, en dit werkt toch wel een heel stuk beter en performanter hoor. Hoe je het ook draait of keert, dit is een extreme high-end oplossing van het bedrijf dat groot geworden is dankzij hun vernieuwende zoekalgoritmes die destijds de vloer aanveegde met de concurrentie.
Extreme high-end omdat dit wel een vrij prijzige oplossing is. Vergelijk het met MySQL en Oracle: voor veel gevallen volstaat MySQL, maar in sommige gevallen biedt Oracle echt wel die meerwaarde en snelheid. Hetgeen zich laat voelen in de prijs. Hier ook: werkt een stuk beter dan Lucene-systemen, kost ook een bom geld.
Wat betreft het gebruik hiervan om je intranet te ontsluiten: je hebt een aantal licenties die oplopen qua aantal documenten dat ze kunnen indexeren ťn qua prijs. Ik meen me te herinneren dat er bij ons sprake van geweest is om dit te introduceren, tot we het prijskaartje zagen van de licentie die hiervoor nodig was. Op dat punt hebben we toch besloten om maar bij een Oracle-oplossing te blijven :)

Edit: Je kan wel degelijk custom data aanleveren en indexeren, wij doen dit. Ik weet niet hoe dit werkt, maar ik dacht dat je het ding XML-data kon feeden.

[Reactie gewijzigd door Bauknecht op 9 oktober 2012 17:17]

Thanks, dat is informatief. Dus je kunt het wel gebruiken voor het voorbeeld dat ik gaf. BTW, jullie kwamen van Oracle Secure Enterprise Search? Kan je met Google ook data in de database (bijvoorbeeld Oracle) indexeren?
Over het algemeen indexeer je de afbeeldingen van een document niet of niet op die manier, dus wellicht valt het wel mee. Lucene gaat volgens mij ook niet zo best werken met documenten van meer dan 30MB aan pure tekst, althans, niet alle features zullen dan nog lekker gaan (denk aan highlights bijvoorbeeld) :P
Hier op het werk ooit eens een document searcher gebouwd m.b.v. Indexing Services voor ons intranet, werkte prima en kon ook de inhoud van office documenten doorzoeken, is ingebouwde tool van MS, zie http://www.simongibson.com/intranet/indexserv/
Die heb ik ook draaiend gehad, nu overgestapt op Sharepoint Search Foundation. Dat werkt geweldig.
Drie jaar met de Google Mini gewerkt (400+ medewerkers); veel goedkoper en voor de meeste MKB bedrijven veel beter te betalen. Top zoekresultaten en heel goed te customizen naar eigen huisstijl.

Daarnaast kun je helemaal los met indexes, groepen, filters en wat dies meer zij om verschillende sets van zoekresultaten (bijv. de intranetsite en een fileshare) gescheiden aan te bieden.

Vergeleken met de prut die MS standaard bij MOSS levert en ook vergeleken met andere commerciŽle zoekmachineoplossingen echt een aanrader.
Hebben wij er ook 3 van versleten de afgelopen jaren. Helaas zijn ze daarmee per 1 juli 2012 gestopt. Ze blijven nog wel support leveren aan klanten die er een hebben, maar verkopen geen nieuwe meer. Sterker nog, de hele maand juni hebben we stad en land afgebeld, maar niets kunnen vinden.

Dus wij hebben nu ook zo'n gele doos van dik 35K op kantoor staan. Voor mijn gevoel is het voor ons en menig MKB bedrijf geen toegevoegde waarde tov de Mini, maar zoals gezegd, die is niet meer te krijgen...
Over de technische specificaties van het product wil Google weinig vrijgeven.
Ik ben benieuwd naar de uitkomsten wanneer dit product wordt gekraakt en ge-reverse-engineered.
Vziw kan je 'm gewoon kopen en op de shell ervan inloggen... en met een beetje moeite kan je vast wel toegang tot het OS krijgen (degene die ik heb gezien draaide iig gewoon een linux-smaakje). Of de kopers van dat soort apparatuur dat ook daadwerkelijk doen is natuurlijk een andere vraag.
Je krijgt absoluut geen rechten om op de shell in te loggen. Je krijgt een webinterface waarmee je je GSA kunt instellen (front-ends, collections etc) en dat is het.
Klopt helemaal, we hebben er vorige maand een gekocht. Daarvoor hebben we diverse Google Mini's versleten (ook fysieke search. Open van Google, maar dan blauw), maar dat product leveren ze niet meer helaas. Dus moest de portemonnee getrokken worden voor het heel veel duurdere GSA.

Je krijgt een geel gespoten Dell server naar binnen geschoven, voorzien van een iets andere bezel. Daarop en op de bovenkant van de rackserver uiteraard heel groot het Google logo. Een monitor en keyboard/muis aansluiten kun je vergeten. Je hebt een aantal netwerkkaarten waarmee je het moet doen.

1 management interface en een paar andere die je voor de live en overige omgevingen kunt gebruiken. En alles gaat via een webinterface(je). Heel summier, net als alle andere producten en diensten van Google, maar het doet datgene dat het moet doen wel heel erg goed. Zonder franje, maar wel met vlag en wimpel zeg maar.
Nou, ik zou wel eens zo'n ding onderhanden willen nemen. Ik durf er wel een tray schultenbršu om te verwedden dat er ergens wel een serial interface verstopt zit.

Dan heb je uiteraard nog geen access. Maargoed, waar een wil is, is een weg.
Dan krijg je Bing. :P
Wat overigens prima werkt :)
In Nederland is het misschien niet zo goed als Google maar in de VS werkt het prima. |:(

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True