ChatGPT en Bing Chat zijn twee verschillende dingen; Bing Chat is een nieuwe Bing-integratie met ChatGPT die in publieke alfa is met een grote wachtlijst (wat overduidelijk een populariteitsstunt is, je komt hoger op de lijst als je je browser naar MS-standaardinstellingen terugzet en de Bing-app installeert, allemaal ingelogd op je MS-account). Bing Chat is nog niet wijdverspreid beschikbaar, maar het interpreteert je verzoek en voert de zoekresultaten daadwerkelijk uit. Het laat ook de queries zien die worden uitgevoerd en geeft bronnen voor de meeste feiten die genoemd worden, per zin of paragraaf.
Ik was zelf ook behoorlijk sceptisch toen ik er voor het eerst over hoorde. De demo's leken allemaal wel erg kunstmatig en ik zie veel mensen denken dat ChatGPT abstracte concepten "snapt" terwijl het onderliggende algoritme natuurlijk slechts nakauwen van input is. Na het zien van een aantal demonstraties tijdens de WAN Show podcast (
link met timestamp) moet ik echter zeggen dat ik enorm onder de indruk ben.
Iets verderop in de video zie je dat Bing Chat
niet alleen met voorgetrainde informatie werkt omdat Bing Chat een antwoord geeft over een product dat dezelfde dag als de podcast online gegaan is inclusief de correcte prijs; de kans dat die specifieke 8 uur het hele algoritme toevallig gehertraind is, is gewoon te klein. Je ziet wel meteen dat het algoritme nog lang niet perfect is (heeft niet door dat een "track suit" ook "track pants" bevat) en dat de hosts niet sceptisch genoeg zijn tegenover/overtuigd worden door de leugen dat ChatGPT kleren voor je kan matchen.
Let wel: een aantal van de conclusies die de podcasthosts hier trekken zijn nogal voorbarig en schrijven veel meer aan het model toe dan het daadwerkelijk kan (nee, het scant geen afbeeldingen op logo's of kleurcombinaties, het kost ze drie kwartier om te realiseren dat Bing Chat loopt te hallucineren) maar "hoeveel LTT rugzakken passen er in een Tesla-kofferbak" is nu precies een vraag met context die je zelfs niet aan Wolfram Alpha zou kunnen stellen; die herkent alleen "tesla model y" ondanks dat die zoekmachine specifiek met dit soort sommen in gedachte gemaakt is.
Je kunt in de video zien hoe live de dimensies van de rugzak worden opgezocht en vergeleken worden met de dimensies van een Tesla-kofferbak, resultaten van twee verschillende, automatisch uitgevoerde queries. Natuurlijk kan ChatGPT niet betrouwbaar rekenen (wel gokken, maar dat gaat vaak fout) dus ik zou de wiskunde zelf nog even nagaan voor ik het gebruik. Echter voert het de wiskundesom "651L in een kofferbak gedeeld door 25,5L in een volle rugzak" correct uit. Daarnaast maakt het ongevraagd berekeningen over het naast elkaar leggen in de lengte en breedte om een realistischer beeld te geven. Het zijn dit soort slimmigheden die me doen denken dat Google geen lang leven beschoren lijkt als ze hier niet als de wiedeweerga een antwoord op kunnen vinden. In feite lijkt het niet veel meer dan "laat ChatGPT zoekopdrachten genereren op basis van een vraag, gooi alle informatie bij elkaar uit de zoekresultaten en stel de vraag nogmaals" maar de combinatie is ontzettend effectief.
Dit kan ChatGPT zelf natuurlijk niet, dat model is voorgetrained en kan geen nieuwe gegevens on the fly toevoegen (alhoewel je conversaties wel voor het trainingsproces worden gebruikt).
[Reactie gewijzigd door GertMenkel op 24 juli 2024 20:43]