Google verbetert zoekmachine voor Engelstaligen door ai-taalmodel in te zetten

Google heeft het algoritme van zijn zoekmachine een update gegeven die ervoor zou zorgen dat de zoekmachine nu 'tien procent beter presteert' voor Engelstaligen. Het nieuwe algoritme maakt gebruik van een ai-taalmodel dat zoekopdrachten beter begrijpt dan vorige modellen.

De verbeterde kunstmatige intelligentie van Google Search is het resultaat van de implementatie van BERT, of voluit Bidirectional Encoder Representations from Transformers, aldus Google. Dit nieuwe neurale netwerk, dat in mei van dit jaar werd aangekondigd, heeft een architectuur die speciaal ontwikkeld is om sequenties van data te verwerken. Dit zou BERT geschikt maken om taal te begrijpen, zo meldt The Register op basis van een gesprek met Pandu Nayak, vice president van Google Search.

Om zinnen te begrijpen is het noodzakelijk dat de zoekmachine alle woorden bekijkt, in hun specifieke volgorde. Vorige transformermodellen waren volgens Google alleen in staat om de woorden in één richting te analyseren, namelijk van links naar rechts. "BERT kan een zin ook in de andere richting bekijken, en rekening houden met het vorige en volgende woord. Op die manier krijgt de zoekmachine een beter beeld van de volledige context en ook van de bedoeling van de zoekopdracht", zegt Google Search vice president Pandu Nayak.

Volgens het bedrijf zijn sommige taalmodellen die het met BERT maakt, zo complex, dat traditionele hardware niet meer toereikend is voor de berekeningen. Daarom zet Google voor de vernieuwde Google Search-dienst generatie 3.0 van zijn zelf ontwikkelde tensor processing units, of tpu's, voor machinelearning in.

Volgens Nayak begrijpt Google Search een op de tien zoekopdrachten beter dankzij BERT. "Dit resultaat geldt op dit moment voor Engelstalige zoekopdrachten in de Verenigde Staten, maar in de toekomst zullen we meer talen en regio’s toevoegen." BERT werkt in deze fase ook in 24 andere landen en in het Nederlands, naast talen als Portugees, Koreaans en Hindi, maar dan uitsluitend voor featured snippets. Dat zijn antwoorden op vaak gestelde vragen die boven in de zoekresultatenpagina van Google verschijnen, met informatie die van andere websites wordt geplukt.

Google Cloud TPU
Cloud TPU Pods die Google inzet voor 'BERT'

Door Michel van der Ven

Nieuwsredacteur

28-10-2019 • 12:28

57

Reacties (57)

57
54
14
1
0
31
Wijzig sortering
We noemen het ai.. maar is het wel ai? Volgens mij wordt alles wat Google of welke andere server dan ook kan nog steeds bepaald door wat wij er aan software in stoppen. Het ding kan volgens mij nog steeds niet echt zelf nadenken. Of zichzelf verbeteren. Vandaar dat google een "update" uitvoert waarna het slimmer wordt. Het wordt naar mijn mening pas echt interessant als deze systemen zichzelf een update kunnen geven en slimmer worden. Dan heb je pas ai
Er wordt hier gebruik gemaakt van een ANN (Artificial Neural Network), wat wel degelijk een vorm van AI is. Dit is een zelflerend systeem (vandaar ook de naam Machine Learning), natuurlijk wel op basis van regels die door een mens bedacht zijn.
Tip: zoek de technoloog podcasts op over AI. Er zijn verschillende gradaties in AI.
Jep maar AI is hipster. Dus iedereen gooit met die term. Al is het je deurbel die gaat rinkelen door de knop in te drukken. Is toch AI, want de deurbel heeft door dat die ingedrukt wordt en je hoort een toontje. Super intelligent.
want de deurbel heeft door dat die ingedrukt wordt en je hoort een toontje.
Nee, jij hebt werkelijk geen enkel idee wat AI is en waarom iedereen daar miljarden in investeert. AI gaat een enorme invloed hebben op vrijwel alles wat we doen. Als tweaker lijkt het me een goed idee om je iets te verdiepen in AI zodat je kan meepraten en opmerkingen zoals je die hebt gemaakt kan vermijden.

AI is geen hele lange reeks WHAT-IF statements zoals jij lijkt te denken.
Mag ik niet stellen dat AI juist een lange reeks WHAT IF statements is, maar het verschil met 'traditionele software' is dat wij niet meer de IF's voeren, enkel de input en output en de software leert door 'trial & error' zelf te bepalen welke WHAT's interessant zijn en vervolgens wat te doen :-)?

Dat is m.i. tenminste AI, i.p.v. het vaak gewoon statistisch gebaseerde geneuzel dat ook vaak als AI wordt afgedaan in de marketing.

Edit: en daar kan je dan nog bij stellen dat het systeem leert te prioritiseren tussen de WHAT's

[Reactie gewijzigd door AntiSocial op 22 juli 2024 15:35]

Niet alle AI is een trial en error progamma.
Bijvoorbeeld games gebruiken ook AI, maar die leert niet per se door Trial en Error.
Kijk maar naar CSGO, die heeft AI, maar maakt keuzes gebaseerd op informatie die in de map-level geplaatst is en gebruikt informatie van andere spelers om keuzes te maken, maar dat is allemaal vast gezet. Die AI zal nooit slimme nieuwe stratagiën bedenken door Trial en Error.

Trial en Error is een vorm van, maar niet de enige!
Met IF-statements kom je niet zo ver; de beste AI-oplossing op die manier is een Random Forest. Daarmee kom je in de buurt van een rechttoe-rechtaan neuraal netwerk. "Statistisch geneuzel" heb je het over SVM's, en die zijn inderdaad niet zo bijster interessant.

Evengoed zijn al die dingen primitiever dan het soort netwerken wat Google hier gebruikt.
Definitie van AI is wel erg vaag hoor.. dat was zijn punt..
https://www.merriam-webst...artificial%20intelligence

Dat de meeste mensen er wel meer van verwachten dan iets simpel is duidelijk.. maar de definitie is niet zo bijzonder..
"1: a branch of computer science dealing with the simulation of intelligent behavior in computers
2: the capability of a machine to imitate intelligent human behavior"
AI gaat niet alleen enorme invloed hebben het doet al invloed hebben.
De vraag is daarom ook nooit, gaat AI invloed hebben.
Men moet ook niet bang zijn voor AI, maar we moeten als samenleving heel snel en heel goed met z'n allen besluiten hoe AI gebruikt moet worden, hoe we het maken en wat het allemaal zou mogen kunnen.

Op het moment is AI een soort wilde westen.
Als we niet goed nadenken over AI en wat we wel en niet willen dan kan het uit de hand lopen, maar dat hoeft niet te gebeuren.

Maar ja tegenwoordig klapt iedereen 'Smart' op apparaten, als er maar een computer chip in zit is het 'Smart' ik trek me er tegenwoordig niet veel meer van aan.
Maar ik loop wel altijd met een grote bocht om apparaten zoals: Ovens, koelkasten, ect. Die met het internet zijn verbonden zonder enige reden.
Het is toch vreemd dat een koelkast een connectie moet hebben met het internet :/
> Het is toch vreemd dat een koelkast een connectie moet hebben met het internet :/

Wel handig toch? Kan je vanuit de supermarkt kijken wat er nou ook alweer precies in zat. Is ook echt een probleem, want hoe vaak moet ik niet even mijn vriend bellen om te vragen of ie wil kijken of we nu nog melk hadden.

Ook kan de koelkast zo updates binnenkrijgen, en dus nieuwe features krijgen of bugs verholpen worden.
Mijn voorouders hebben daar een uitvinding voor:
Een boodschappenlijstje, die maak je voordat je boodschappen doet zodat je niks vergeet!!! :o :o :o :o
Revolutionair toch?
Oh ja, doe ik ook. Gebruik er notes voor. Maar ook al staan de meeste dingen daarop, soms vergeet je toch weer wat he?
Offtopic: volgens mij is @Verwijderd sarcastisch
Wat is het dan? Alles wordt ingetikt door een mens, vergeet die een what if dan zal t ook niet werken. Zo intelligent is die AI anno 2019. Net zo slim als de AI die je in 1969 had.
Nee. Dat van die deurbel is geen AI, dat is simpelweg een stroompje.

AI wordt het pas als de deurbel rinkelt zodra de postbode uit z'n busje stapt omdat het systeem op basis van je aankopen weet dat er een pakje aan zit te komen en de postbode 'dus' verwacht wordt, vóórdat deze zelf op het knopje heeft hoeven drukken.
Opgelet : "pakje verwacht + postbode gedetecteerd = bellen" is op zich een if... Then... statement zonder AI. (Populair zou dit een 'slimme dienst' heten, maar dat stukje is geen AI.)
De AI in het voorbeeld zou bvb zijn dat een camera aan de gevel de postbode onderscheidt van andere passanten.
Maar wat is daar AI aan, iemand moet dan weer wat code schrijven om de kleding van de postbode te onderscheiden van de rest. Weer door een mens bedacht en niet door de AI zelf. Ook is hem niet verteld herken even de postbode. Wij herkennen die, ookal zitten we in een land waar we nog nooit geweest zijn en niet weten hoe hun kleding eruit ziet. Ben benieuwd hoe de AI dat doet. Of we moeten AI alle ervaringen meegeven die onze hersen hebben ja dat gaan we richting AI. Zolang dat allemaal niet ter sprake is is het gewoon dom programmeerwerk met hippe termen om de boel cool te laten ogen.
Supervised learning : toon een paar duizend voorgelabelde foto's of filmpjes van postbodes en niet-postbodes. Geen specifieke code te schrijven om de kleding van postbode te beschrijven oid.

Google heeft systemen getrained met miljoenen afbeeldingen waardoor die erg performant zijn. Misschien kan hun cloud vision API al postbodes voor je vinden zonder verder trainen, zie bvb https://cloud.google.com/vision/docs/object-localizer
Maar wat is daar slim aan? Deden we in de jaren 70 al in de medische wereld om bepaalde patronen te ontdekken, werden gare computers als de PDP-11 voor gebruikt.
Tsja wat bedoel je dan met "slim". Ik ben akkoord dat er geen algemeen erkende definitie is. Misschien denk je wel aan "zelfbewust" of zo. Daar zijn we nog in geen honderd jaar aan. Voor mij betekent het "lerend uit fouten" en dat geldt hier wel. Idd een neuraal netwerkje met weinig nodes kan al "leren uit fouten".

(In de AI community wordt weleens geklaagd dat zodra een AI toepassing werkt in de praktijk, het "computer science" wordt genoemd en geen AI meer...)
Iets hoeft niet zelfdenkend te zijn om intelligent te zijn...
Tegenwoordig klap je Smart al op iets met een chip erin....Kijk maar naar Smart Fridge, smart watch, smart(ect).

AI oftewel kunstmatige intelligentie kan dus meerdere dingen betekenen.
De AI in games kunnen zelf ook niet 'na denken' op de manier zoals wij nadenken.
Geen een AI progamma kan dat, maar ze kunnen acties ondernemen en dingen interpreteren zonder dat een persoon op het knopje hoeft te drukken :)
Wat is daar slim aan? Zit gewoon een embedded controller in die we al sinds de jaren 70 maken. Dan is mijn W116 mercedes uit 1978 ook smart, want die heeft een microcontroller die injectiesysteem aanstuurt. Dat is een stuk smarter dan een koelkast.
Dat noemt men marketing...
Kijk maar naar de Samsung: Smart fridge, daar zit niks slims in... Geen AI, er zit een klein computertje in en daarom heet het slim...

Vraag mij niet waarom want ik weet het ook niet... :/
Elk menselijk gedrag, zonder uitzondering, is aangeleerd. Met andere woorden: je kunt een computer ook letterlijk álles leren. De vraag is alleen of we de algoritmen erachter voldoende begrijpen om het om te zetten in code.

Maar goed, *alles* wat jij en ik doen komt voort uit aangeleerd gedrag, hetzij vanuit ervaringen of kennis of redenatie vanuit cultuur, vrienden, familie et cetera. Alles is terug te brengen naar protocollen en, belangrijker nog, opgedane kennis. En wat kennis betreft kun je best aardig bij Google terecht. Die hebben best wel een datasetje om uit te putten, zeg maar.
In basis is de mens ook een Biochemisch-Elektrische computer.
Een deel van onze doen zit in het DNA(basis gedrag en instincten) en al het andere wordt aangeleerd door de ouder / omgeving en Trial en Error.

Een persoon maakt ook beslissingen door een vast proces.
Waarneming -> verwerking van de informatie -> Checken of ik het al eerder heb meegemaakt -> Alle opties overwegen -> Keuze maken

Je kan ook een computer progamma maken die dat kan doen.
Iemands persoonlijkheid is dan ook aangeleerd en kan veranderen.
Je zou ook iemand kunnen 'progamerren'
Wil alleen inhaken op je beslissing process beschrijving.

Als je deze rite van stappen programmeert kom je er al gauw achter dat dit zo niet werkt, want tegen de tijd dat je bij de stap "keuze maken" komt, is er al zoveel veranderd dat de keuze alweer gebaseerd is op oude informatie.

Nieuwere theorieën van hoe de hersenen werken gaan uit van "predictive coding", wat simpel gezegd een two-way system is. Het brein voorspelt continu wat er in de wereld gaat gebeuren via een internal model, en als de input inderdaad hetzelfde is als de voorspelling, besteed de brein er weinig aandacht aan. Dit bespaart processing power. Echter als deze voorspelling niet klopt, wordt dit teruggevoerd naar het brein as prediction error.
DNA is een stukje code het legt je lichaam uit hoe het zichzelf moet regulieren en hoe het eiwitten moet maken.
Er zijn zelfs projecten om DNA te gebruiken als opslag middel voor computers.
En kan je in DNA programmeren om zo infecties te bestrijden of zelfs andere aandoeningen.

Zoek maar een Fagen therapie op. Daar zijn ze in oost Europa mee bezig en kan antibiotica vervangen.
Dan gebruik je een virus haal je het DNA van die virus eruit en stop je nieuw DNA in het virus die instructies geeft om bijvoorbeeld slechte bacteriën of virussen te elimineren, en het mooie is dat er geen resistentie plaats kan vinden!
Klopt, maar in feite is een mens ook gebouwd.
Het DNA geeft een blueprint en zolang je een kind in leven houd en er voeding(grondstoffen) in gooit dan groeit het. In feite ook een assembelatie.
Alleen mensen en biologische organismen hebben één ding dat computers tot nu toe nog geen emoties kunnen hebben, ze kunnen ze herkennen, en uiten, maar ze hebben geen emoties.

Maar biologie heeft in zekere zin echt te maken met 'menselijk gedrag'
Het lichaam heeft allemaal hormonen en neurotransitors die het lichaam maakt en verspreid en die beïnvloeden het gedrag.
Verliefd worden is in feite dan ook niks anders dan jouw brein ziet dat die persoon een genetische match is en dan hormonen maakt om jouw gedrag te veranderen!
Je lichaam heeft veel invloed op het denken en andersom heeft het denken invloed op het lichaam :)
Ik moet hier toch even op reageren omdat het over mijn vakgebied gaat (Biologie). DNA is geen blueprint voor ons omdat er tijdens de groei zoveel gebeurt dat niet gecodeerd is. Dat blijkt ook uit ons DNA dat voor 98,5% overeen met een chimpansee en voor 60% met een banaan. Een paar switches omzetten (en dat hoeft niet door dna te gebeuren) levert een groeiproces op met een heel ander resultaat. Elk levend wezen is geen assemblage van onderdelen zoals een computer dat wel is. Denk maar eens na: een mens begint bij één cel en als je evolutionair zou terugkijken zelfs bij één molecuul. Het leven gaat dus van één naar veel. Terwijl ieder apparaat dat wij bouwen van vele onderdelen naar één apparaat gaat. De natuur werkt dus geheel andersom. Dat heeft gevolgen voor het zelfbewustzijn van de machine die altijd verdeeld blijft van zijn externe onderdelen wat weer leidt tot de beperkte emotionele mogelijkheden. Dat gezegd hebben zelflerende systemen toch heel veel mogelijkheden en kunnen zij de mens zeker helpen. Ook bij creatieve processen.
Klopt, maar het is wel een blueprint in de zin dat in je DNA staat hoe een mens eruit moet gaan zien, als je dat DNA veranderd kan je eigenschappen veranderen.

Alleen hoe iemand er uit gaat zien is dan ook een heel klein stukje van het DNA, veel van het DNA is gedeeld met andere organismen en er is ook DNA dat wij hebben dat bomen ook hebben.
Dat wij er anders uit zien dan chimps. Komt doordat er een klein stukje DNA anders is bij ons.
Ook hebben chimps en mensen dezelfde voorouder :)

En er gebeurt zeker veel tijdens een mensen leven dat niet gecodeerd staat.
Maar sinds het moment dat de eerste cel begint met delen geeft het DNA aan hoe het moet groeien en overleven. Ik weet niet waar jij zogenaamde switches om wilt gaan zetten, maar DNA regelt alles in je lichaam. Van de productie van eiwitten tot het vervangen van oude weefsels.

Evolutie heeft hier helemaal niks mee te maken, want zelfs als je in god geloofd bestaat DNA gewoon en beginnen mensen als 1 cel.
Juist omdat volgens de evolutie theorie het leven is begonnen uit 1 cel laat zien hoe het kan dat organismen hoe verschillend ze ook lijken toch veel DNA delen.
Het punt dat ik wil maken is dat DNA geen blueprint is en niet te vergelijken is met computercode. Je kunt wel eigenschappen veranderen, uiteraard door DNA te wijzigen maar het is geen codeboek. Bijvoorbeeld iets simpels als blauwe ogen. Iemand kan alle genen hebben voor blauwe ogen zoals we die kennen en toch bij uitzondering bruine ogen hebben. Het is zeldzaam maar het bestaat. Net zo goed als je een X en Y gen kunt hebben en toch alle uiterlijke kenmerken van een vrouw. En dan heb ik het nog niet over de types die zeker weten dat ze een vrouw of man zijn in het verkeerde lichaam. We hebben maar heel weinig genen (schatting is tussen de 20.000 en 25.000) en dan verschilt maar 1,5 % van een chimp, zeg 250 genen. Dat is wel heel weinig. Erfelijkheid is volgens mij maar voor een deel DNA de rest is ontwikkeling die voor een groot deel heel gecontroleerd (qua omstandigheden) verloopt en daarom hetzelfde resultaat geeft (maar dus niet is geregisseerd door genen).
Je op die manier heb je zeker gelijk, het is niet zo strait forward als computer code, nee dat klopt.
Maar de grote reden waarom wij en chimps toch zo verschillend zijn komt omdat een vrij klein gedeelte van het DNA over ons uiterlijk gaat en een heel groot deel is vrij universeel.
We delen ook DNA met bacteriën en planten, omdat sommige dingen zoals eiwit productie, ect niet 100 keer opnieuw uitgevonden zijn :)

Ook is het wel leuk dat 99% van het DNA überhoud nog niet bekent is met wat het doet :)
En wat dan met de mensen die gewoon weten hoe een zoekopdracht geformuleerd moet worden? Bv door alleen bepaalde trefwoorden op te geven en het gebruik van quotes, plussen en minnen.
Maar ook die zoekopdracht moet natuurlijk 'vertaald' worden naar zoekroutines. Google is niet een database waar je in zoekt!
Ik zou toch graag de meest efficiente zoekopdrachten kunnen bouwen. Als developer ben je immers veel in de database van Google aan het zoeken.
vroeger zocht je sleutelwoorden en vond relevante websites... hardstikke handig
zeker met wat google-fu

nu dat SEO roet in het eten gegooid heeft in combinatie met advertisement waardoor het geschatte nut van een website gewoon misleidend is merk ik steeds meer dat ik liever zelf de documentatie in duik dan te proberen om iets nuttigs uit google te plukken tussen en na alle bullcrap die zogenaamd voorrang moet krijgen...

ben niet op zoek naar producten en nieuws reclame websites maar naar relevante informatie over een topic

bovendien word je door jan en alleman gevolgt...
kreeg zojuist weer een telefoontje omdat ik 2 dagen geleden aan het Googlen was naar kansberekeningen van de loterijen.
ben je ineens 'geselecteerd voor een cadeautje'...
pers groep het zelfde... pop jagers

nou nog de URL-bar verwijderen zodat je alleen ergens kunt komen via andere websites...
heel handig voor Google... flikker toch op met je rommel

[Reactie gewijzigd door Verwijderd op 22 juli 2024 15:35]

Ik help ze graag, kleine moeite.
Grappig die opstelling, lijkt bijna op magnetisch geheugen met al die draadjes.
"magnetisch geheugen" = spoelen?
ja.. spoeltjes die magnetisme opslaan door een stukje ijzer te magnetiseren
https://en.wikipedia.org/wiki/Magnetic-core_memory
ja en dan bedoel ik die jaren 50 bakbeesten zoals in onderstaande link, daar heeft t iets van weg.
Ik had een elektrische spoel in gedachten. Die uit de link kende ik niet.
Net voor mijn tijd.
ook voor mijn tijd, maar dat spul fascineerd me zo ontzettend erg. Handwerk, vrouwen maakte het want het wat precisie werk. En ik zag die foto hierboven en moest er meteen aan denken.
Misschien ben ik daar niet oud genoeg voor, bij "magnetisch geheugen" moet ik aan tape denken...
dat is opslag, ja ook een vorm van geheugen. maar niet snel genoeg. Een hdd gebruik je ook niet als geheugen in je computer.
Lijkt net wel, maar gelukkig hebben we nu betere technologie haha:)
Dat wel, maar heeft ons toch wel op de maan gebracht

https://www.youtube.com/watch?v=WquhaobDqLU
Ik heb al altijd geweten dan Bert een neuraal netwerk was ;)
Het nieuwe BERT algoritme is zo goed dat het nog meer verkeer richting Adwords advertenties zal sturen. Hebben de meeste mensen dat nu nog steeds niet door?
Zoeken in zinnen? Gebruik gewoon keywords, heb je dat probleem ook niet meer.
Wat heeft dit te maken met een zoekmachine 8)7 Weer een type van bashen :X
Oops, las Google en engelstaligen. :z
Helaas zal enig transulatie progamma nooit 100% kunnen halen zonder context te kunnen begrijpen.
Ja europese talen zijn nog redelijk simpel, maar Aziatische of Afrikaanse talen goed vertalen is een heel ander level haha

Op dit item kan niet meer gereageerd worden.