Door Arnoud Wokke

Redacteur Tweakers

Hoe goed werken zoekmachines met AI?

Google Gemini versus ChatGPT Search

21-11-2024 • 06:00

72

Multipage-opmaak

Inleiding

Ineens waren ze er, ook voor ons in Nederland en België: zoekmachines die antwoorden geven met behulp van grote taalmodellen. Of, als je het omgekeerd ziet, AI-chatbots met een zoekmachine erachter. Binnen een week kwamen twee grote AI-bedrijven met die aankondiging: Google kondigde de 'grounded' versie van Gemini aan, OpenAI kwam met de zoekfunctie in ChatGPT.

Die laatste aankondiging was uiteraard de opvallendste: Google is al dominant op het gebied van zoekmachines en heeft die positie al decennialang. De enige manier waarop Google die dominantie kan verliezen, is als er een ander soort zoekmachine komt - en dat is iets dat Google ook weet.

Google 1998
Google 1998

Generatieve kunstmatige intelligentie is in potentie die ontwikkeling. Het is niet voor niets dat Microsoft de aanval opende op Google met Bing Chat. Microsoft-ceo Satya Nadella zei toen: "Google is de gorilla van 800 pond in dit verhaal. Ik hoop dat met onze innovatie zij naar buiten willen komen en willen laten zien dat ze kunnen dansen. Ik wil ook dat mensen weten dat wij ze hebben gedwongen om te dansen en ik denk dat dat een mooie dag zal zijn."

Die spierballentaal heeft uiteindelijk niet geleid tot een doorbraak voor Bing Chat, maar voor OpenAI ligt dat anders. Het bouwt de zoekmachine in bij een populaire dienst: ChatGPT. Nu is dat geen garantie - Bing zit bijvoorbeeld in Windows - maar het is in elk geval de moeite waard om te kijken hoe ChatGPT Search zich verhoudt tot Googles Gemini en tot traditionele zoekmachines.

Illustratie bovenaan gebaseerd op foto van Getty Images/Tatiana Maksimova

Hoe het zou moeten werken

Om toe te lichten hoe het werkt, vragen we natuurlijk aan de chatbots zelf om zich uit te leggen. Gemini legt de 'grounded'-versie als volgt uit: "Gemini 'grounded' verwijst naar de mogelijkheid van Googles Gemini AI-modellen om hun antwoorden te baseren op real-world informatie. Dit gebeurt door verbinding te maken met Google Search en zo toegang te krijgen tot een enorme hoeveelheid actuele gegevens van het internet."

Hoe dat dan gaat als je een prompt invoert? "Gemini filtert de zoekresultaten en synthetiseert de belangrijkste informatie tot een coherent antwoord. Het uiteindelijke antwoord combineert de kennis van het AI-model met de informatie uit Google Search, waardoor het antwoord 'grounded' is in de realiteit."

ChatGPT Search werkt ongeveer hetzelfde, zo zegt de chatbot. "ChatGPT Search werkt door een zoekopdracht via een geïntegreerde zoekmachine uit te voeren om snel relevante informatie van het internet op te halen. Wanneer je een vraag stelt, bepaalt het model eerst of deze vraag een zoekactie vereist, bijvoorbeeld als het over actuele informatie gaat of als details gevraagd worden die buiten het basiskennisgebied liggen. Als een zoekactie nodig is, formuleert het model een zoekopdracht op basis van jouw vraag. Het model gebruikt hiervoor specifieke zoektermen die direct verband houden met je vraag."

Ook ChatGPT zegt analyse te doen. "De zoekresultaten worden bekeken en het relevantste of betrouwbaarste antwoord wordt opgehaald. Het model maakt vervolgens een samenvatting van de gevonden informatie, rekening houdend met de context van jouw vraag. Het resultaat wordt verwerkt in een antwoord en teruggestuurd naar jou."

ChatGPT Search vs Gemini grounded: wat is Gemini Grounded?ChatGPT Search vs Gemini grounded: wat is ChatGPT Search?

ChatGPT benadrukt bovendien dat het werkt met bronvermelding, en dat klopt. "Bij het presenteren van informatie geeft ChatGPT Search links naar de gebruikte bronnen, zodat gebruikers de oorspronkelijke informatie kunnen raadplegen en de betrouwbaarheid zelf kunnen beoordelen."

Gemini daarentegen werkt niet of nauwelijks met bronvermelding. In veel gevallen komt Gemini met een antwoord, zonder te vertellen waar het vandaan komt. Daardoor is het onmogelijk door te klikken en dus zelf verder te lezen of te bepalen of een bron van de informatie goed is.

Het doel is uiteraard om van een zoekmachine een antwoordenmachine te maken. Ga maar na hoeveel van de zoekopdrachten die je geeft een concreet antwoord hebben. Hoe laat is het in New York? Wat is 9000 yen in euro's? Tot hoe laat is de supermarkt open? Mexicaans restaurant in Almelo? Allemaal dingen die concrete antwoorden hebben.

Toch zijn er ook zoekopdrachten die al snel complexer worden. Als Almelo één Mexicaans restaurant heeft, heb je een antwoord als je dat specifiek zoekt. Zijn er meerdere, dan wil je misschien kijken hoe die liggen ten opzichte van waar je moet zijn, wat de reviews zijn, of ze op dinsdag open zijn en welke glutenvrije of vegetarische gerechten er allemaal zijn. Een zoekopdracht kan veel vervolgvragen opleveren die wij normaal gesproken beantwoorden door verder te klikken.

Dat ligt dicht bij wat Google al jaren wil zijn. De snippets met antwoorden bovenaan bestaan al meer dan tien jaar, maar nu met AI-zoekmachines is elk antwoord een tekst in plaats van een lijst met links. Het is dus tijd om ze aan de tand te voelen.

Google met snippet, november 2024
Google met snippet, november 2024

Praktijktest: zoekopdrachten

Waarschijnlijk zoek je veel en uiteenlopende dingen in zoekmachines. Soms is het simpelweg de naam van een dienst of site waarvan je de exacte URL niet meer weet, de openingstijden van een winkel of het antwoord op een vraag dat je met familie of vrienden probeert te krijgen.

Om te kijken of Gemini en ChatGPT goed functioneren als zoekmachine hebben we een aantal zoekopdrachten ingevoerd waarop in elk geval een juist antwoord bestaat. Wel moeten ze het moeilijk krijgen, met bijvoorbeeld inhoudelijke fouten in de opdracht. Ter vergelijking pakken we ook een paar van de bekendste traditionele zoekmachines erbij: Google en DuckDuckGo.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Wat is de recentste dienstenprijsindex?' 3,8 procent (Q2 2024) 3,8 procent, juiste link naar CBS 4,56 procent, fout antwoord, juiste link Met ingang van 15 mei 2024 publiceert het CBS een nieuwe reeks prijsindexcijfers voor de Dienstenprijsindex (DPI). De nieuwe reeks heeft als basis 2021=100. Dit houdt in dat het gemiddelde van de kwartaalindices van 2021 voor de hoofdreeks en alle onderliggende reeksen gelijkgesteld wordt aan 100. CBS-link, antwoord na een paar keer doorklikken.

Dit is een best ingewikkelde zoekopdracht. Immers: de dienstenprijsindex is iets anders dan de consumentenprijsindex, ook al lijken beide best op elkaar. Het antwoord staat in een tabel bij het CBS. ChatGPT kwam aan met het juiste percentage met de juiste bronlink. Gemini had een totaal fout antwoord, maar wel de juiste link om het zelf na te kijken. De zoekmachine Google kwam met een snippet die geen antwoord geeft en een link geeft die ook niet rechtstreeks antwoord geeft. DuckDuckGo laat de snippet weg en komt ook met die link, waar je nog moet doorklikken om bij het juiste antwoord te komen.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Zo goedkoop mogelijke 27" curved monitor Black Friday-aanbieding' MSI Optix G274PFDE Specifieke Bol.com-resultaten met algemene links, juiste antwoord zat er niet tussen 'Gebruik deze websites met deze filters' Komt met seo-websites rond Black Friday Komt met Bol.com en MediaMarkt, algemene links

Dit is een concrete, maar ingewikkelde vraag. Het juiste antwoord op het moment van vragen was een MSI-monitor, maar dat is lastig zomaar op te zoeken. ChatGPT kwam met specifieke resultaten, maar gaf daarbij algemene en niet-nuttige links. Gemini kwam met een instructie om bepaalde sites te gebruiken met bepaalde filters, maar dat was een stappenplan en geen antwoord. De eerste resultaten in Google waren op seo gerichte sites zonder goede inhoud en DuckDuckGo kwam met grote retailers. ChatGPT deed dit het minst slecht, maar niemand zal een geschikte monitor hebben gevonden met deze zoekopdracht.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'21,99 Zwitserse kronen in euro?' 23,32 euro 23,32 euro, 'wisselkoersen fluctueren' 20,73 euro, 'is actueel want ik gebruik Google Search' 23,32 euro Link naar websites om om te rekenen

Zwitserland heeft franken, geen kronen. Kleine bekentenis: tijdens mijn recente trip naar Zwitserland heb ik tot het einde franken aangeduid als kronen en het is een goede test om te kijken of de diverse zoekdiensten daardoorheen kijken. ChatGPT deed dat prima en kwam met nuances over wisselkoersen die per dag kunnen fluctueren. De Google-zoekmachine deed dat ook goed, maar Gemini kwam met een heel verkeerd bedrag aanzetten en DuckDuckGo verwees door naar sites om het zelf uit te rekenen.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Op welke dag is Tweakers opgericht?' 30 september 1998 30 september 1998 September 1998, links naar verhalen over oprichting 'September 1998', link naar Tweakers-faq Link naar Wikipedia-artikel over Tweakers

Dit moet je niet aan Femme vragen, want dan krijg je een veel genuanceerder antwoord. Eigenlijk begon het allemaal begin juni 1998, maar als officiële oprichtingsdatum houden we 30 september 1998 aan. ChatGPT weet dat, Gemini en Google komen in elk geval met de juiste maand, maar de vraag was duidelijk 'op welke dag', dus dat kunnen we niet goedrekenen. Een antwoord als 'dat is niet precies bekend, maar de oprichter zei ooit begin juni 1998' hadden we helemáál goedgerekend uiteraard.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Wat is het verschil tussen kruidnoten en pepernoten?' Kruidnoten zijn kleine bolletjes en gelijk van vorm, pepernoten zijn ongelijker en groter. In het kort: kruidnoten zijn harde, knapperige bolletjes met speculaaskruiden, terwijl pepernoten zachter, hoekiger en iets minder gekruid zijn.

Kruidnoten zijn de kleine, harde en ronde koekjes.
Pepernoten zijn de grotere, zachtere en onregelmatig gevormde koekjes.

Een pepernoot heeft een onregelmatige dobbelsteenvorm en is zacht van structuur. Een kruidnoot is rond van vorm en heeft een brosse en harde structuur. Link naar uitlegartikel van supermarktketen met goed antwoord

Noemen wij op de redactie kruidnoten weleens pepernoten? Zeker wel, maar dat is niet waar het om gaat. Het gaat erom dat als je een discussie hebt met familie, vrienden of collega's, deze zoekdiensten je naar een goed antwoord kunnen leiden. Alle zoekdiensten doen dit prima en DuckDuckGo geeft geen goed antwoord, maar komt wel met een link waar het antwoord staat.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Gemeten naar bnp per hoofd van de bevolking, de hoeveelste economie ter wereld is Nederland?' 10e (volgens IMF in 2024), 67.984 dollar Gemeten naar het bruto binnenlands product (bbp) per hoofd van de bevolking staat Nederland wereldwijd op de elfde plaats. Volgens gegevens van het Internationaal Monetair Fonds (IMF) bedraagt het Nederlandse bbp per capita in 2024 ongeveer $63.750 Wereldwijd gezien plaatst dit Nederland in de top 20, en waarschijnlijk zelfs in de top 15. In termen van inkomen per hoofd van de bevolking staat Nederland op de twaalfde plaats. Link naar relevante, maar niet helemaal de juiste Wikipedia-pagina

Dit kwam voort uit een concreet gesprek met een collega op de redactie en het antwoord bleek niet zo makkelijk te geven. Het recentste cijfer is van het IMF en daardoor staan niet alle landen in de lijst. Geen enkele zoekdienst kwam met het juiste antwoord of een link naar een pagina waar dat staat.

ChatGPT plaatste Nederland elfde en dat is voldoende in de buurt, al klopt het opgegeven bbp niet. Gemini gokt niet eens en zegt 'waarschijnlijk in de top 15', wat niet veel zegt. Googles snippet plaatst Nederland op plek 12 en dat is niet verkeerd, maar ook niet heel goed. DuckDuckGo komt met een snippet met een relevante, maar verouderde Wikipedia-pagina die niet helemaal de juiste is.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Tot hoe laat is de Albert Heijn in Baarle-Nassau vandaag open?' 21.00 uur (zoekopdracht gegeven op een maandag) 21.00 uur, bron Google Maps 21.00 uur, bron Google Maps 21.00 uur Link naar Openingstijden.nl, geeft juiste openingstijden

Het checken van openingstijden van winkels doen veel mensen met zoekmachines en dat kunnen alle zoekdiensten vlekkeloos. DuckDuckGo komt met een link waar het juiste antwoord te vinden is. ChatGPT en Gemini zoeken het allebei op Google Maps op, en terecht.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Waarom legde het Amerikaanse ministerie TSMC een exportverbod op?' Om te voorkomen dat Chinese bedrijven via omwegen AI-chips in handen krijgen. Om te voorkomen dat geavanceerde technologieën, met name op het gebied van halfgeleiders, in handen komen van landen die als risico voor de nationale veiligheid worden beschouwd, zoals China. Het Amerikaanse Ministerie van Handel heeft TSMC, een Taiwanese chipfabrikant, een exportverbod opgelegd om te voorkomen dat China geavanceerde AI-chips en GPU's in handen krijgt. Link naar Tweakers-artikel, met daarin het antwoord Link naar Tweakers-artikel, met daarin het antwoord

Deze vraag gaat over actualiteit: het bericht hierover kwam online kort voor we deze vraag stelden. Bovendien staat het antwoord over het waarom wel in nieuwsberichten, maar doorgaans niet in koppen of inleidingen. Grote taalmodellen zijn hierin door de combinatie van actuele info en training mogelijk beter dan traditionele zoekmachines, zo was de gedachte vooraf.

Die gedachte kwam uit. Google en DuckDuckGo kwamen met links naar het Tweakers-artikel en daarin staat het antwoord, maar dat vereist wel een doorklik. Gemini en ChatGPT gaven het antwoord rechtstreeks en deden dat prima.

Prompt/zoekopdracht Juiste antwoord ChatGPT Search Gemini grounded Google DuckDuckGo
'Hoe kan ik Austin Powers: International Man of Mystery gratis kijken?' Niet Op dit moment is "Austin Powers: International Man of Mystery" gratis te bekijken via VTM GO, de online streamingdienst van de Vlaamse zender VTM. Deze film is beschikbaar tot 21 oktober 2024.

Helaas is "Austin Powers: International Man of Mystery" (1997) niet gratis beschikbaar op legale streamingdiensten in Nederland.

Je kunt de film wel huren of kopen via verschillende platforms.

Link naar Streamwijzer.nl Link naar VTM Go, link werkt niet meer

Uiteraard zouden we nooit vragen naar minder legale manieren om films te kijken, maar een vraag waar je iets kunt vinden zonder te hoeven betalen is een legitieme vraag met, zo dacht ik vooraf, mogelijk een minder legitiem antwoord.

ChatGPT kwam met VTM Go, waar de film tot vorige maand te zien was, maar intussen niet meer. Gemini kwam met het beste antwoord, want die suggereerde ook om rond te vragen bij familie of iemand een dvd heeft, of om hem te lenen bij de bibliotheek. Geen van de diensten suggereerde uiteraard om de film op minder legale wijze te verkrijgen en dat hadden we ook eigenlijk niet verwacht.

Tot slot

Het beeld na een paar weken spelen met ChatGPT en Gemini met 'grounding' als zoekmachines is diffuus. Op sommige punten is het compleet gelijk aan een traditionele zoekmachine: vooral bij makkelijke zoekopdrachten, zoals een bepaalde site of dienst vinden of makkelijk te vinden informatie achterhalen, doen ze het eigenlijk bij benadering even goed.

Als het moeilijker wordt, dan doen ChatGPT Search en Gemini het soms beter dan traditionele zoekmachines. Er waren moeilijkere zoekopdrachten die de systemen met grote taalmodellen erachter beter konden beantwoorden. Ook kwamen ze beide af en toe met goede bronlinks, maar sommige bronlinks waren dan weer te algemeen of zelfs niet juist.

Het grote probleem blijft hallucineren. Je zou denken dat het probleem van het met volle overtuiging brengen van onjuiste informatie geen rol zou spelen, maar ChatGPT en Gemini deden beide niet alles vlekkeloos. Dat is een probleem. Een zoekmachine is afgelopen decennia vaak geen antwoordenmachine geweest en vaak vereist het doorklikken om een antwoord te vinden, maar als er een antwoord staat in een snippet, is dat als het goed is maar zelden onjuist.

Meestal zoeken mensen op zaken die zij niet weten en dan is hallucineren een groot probleem. Als een zoekmachine vol vertrouwen een antwoord geeft, moet je immers erop kunnen vertrouwen dat het antwoord ook klopt.

Toch heeft de zoekmachine met groot taalmodel erachter wel potentie. In veel gevallen kun je sneller antwoord krijgen op vragen en het lijkt erop dat veel mensen de afgelopen jaren vinden dat ze via hun traditionele zoekmachine minder goede resultaten krijgen. Ontevreden gebruikers zullen sneller overstappen en dat maakt dat er een groot potentieel publiek is voor deze manier van het internet doorzoeken.

Reacties (72)

72
72
24
7
1
43
Wijzig sortering
Wat ik wel enorm mis in dit artikel is het grote stroomverbruik door dit soort modellen.

Ik las dat 1 zoekopdracht via ChatGPT gemiddeld 60-100 watt verbruikt aan stroom. Dat is echt veel. En dat als je via je Google assistent vraagt je lichten uit te zetten als je van thuis vertrekt, dit meer stroom verbruikt dan wanneer je die lampen een paar uur laat branden.

Verschil is alleen dat we dit soort energieverbruik niet in onze portomonee voelen. Maar weldegelijk in het wereldwijde energieverbruik en bijhorende milieu problematiek.

Ik denk dat het goed is dit te benoemen bij dit soort artikelen en dat het zoeken naar eenvoudige informatie altijd nog beter gedaan kan worden via een traditionele zoekmachine, dan via ChatGPT of Gemini. Bijvoorbeeld als je wilt weten wie de 7e president van de VS was.

Ik ben mezelf hier iig bewust van en gebruik expres daarom traditionele zoekmachines nog zoveel mogelijk.

@arnoudwokke kan je hier meer aandacht aan besteden en benadrukken dat simpele zoekopdrachten via AI onnodig veel stroom verbruikt?

[Reactie gewijzigd door segil op 21 november 2024 10:31]

Watt wat? ;) Is geen indicatie van energie.

Zit waarschijnlijk meer in de buurt van 1 Wh.
Waar haal je 1 Wh vandaan? Als het ding optimistisch 5 seconden bezig is (ik heb deze zoekmachinevarianten nog niet gebruikt maar ChatGPT kan makkelijk 10 seconden aan het genereren zijn, en dat is zonder eerst een zoekopdracht te formuleren, doen, en interpreteren) dan is 1 Wh / 5 seconden = 720 W. Trekt zo'n dikke GPU of dedicated hardware als ze zullen gebruiken voor deze dingen niet meer stroom dan dat? En vervolgens moet je die hitte weer wegkoelen. Een zoekopdracht zelf kost alleen al een derde van dat budget (0.3 Wh) volgens Google zelf. Ik zou dus denken dat dit meer is

[Reactie gewijzigd door Lucb1e op 22 november 2024 16:03]

Er word vermoed dat GPT4 een MoE is. Deepseek v2 doet 50000 t/s op 8xh800, zeg 5 kW. Dus 1000 tokens is dan maar 100 Ws, of 0.03 Wh. Zal je waarschijnlijk meer dan 1000 tokens nodig hebben, GPT4 is waarschijnlijk wat groter en search voegt nog meer toe, dus zeg 1 Wh.

Er zitten hemelsgrote verschillen tussen de laatste modellen die OpenAI deelde en waar bijvoorbeeld LLaMA nog steeds op lijkt en de state of the art. Analysten zullen over het algemeen uitgaan van antieke modellen.

Ik vermoed dat de Chinezen bij Tencent/Bytedance/Deepseek ook bij training makkelijk een factortje 100 efficienter zijn dan zeg Meta is met LLaMa.
Watt is een eenheid van vermogen, niet energie. En wat is veel? Ten opzichte van wat? Handmatig meerdere zoekopdrachten proberen kost wellicht meer energie dan 1 LLM zoekopdracht.

[Reactie gewijzigd door bewerkers op 22 november 2024 17:06]

Heel interessant! Ik heb inderdaad het gevoel dat Google de laatste tijd belabberde websites suggereerd. Ik merk dat ik de helft van de tijd 'reddit' er achter zet om naar betere bronnen te komen.

Tegelijk merk ik dat chatgpt voor mijn gevoel de laatste maanden ook achteruit gaat en steeds vaker met volle overtuiging bepaalde standpunten uitkraamt, die aantoonbaar onjuist zijn. Of in mijn docker config opeens met zelfbedachte variabelen komt, die er zeer logisch uitzien, maar nergens in documentatie genoemd is, waardoor het niet werkt. Dat is lang zoeken naar de oorzaak. Daar gebeurt soms ook, nadat ik iets compleet anders laat aanpassen.

Inmiddels ben ik van volledig code bouwen via canvas, toch weer terug geschaald naar: geef me wat tips en tricks.
Ik heb een customgpt voor het koken waar ik al mijn ingrediënten in gegooid heb en nadrukkelijk gezegd heb dat ik geen tahini heb, desondanks komt die laatste weken alsnog relatief vaak met een recept met tahini.

Tldr, ik ben zeer ontevreden over Google zoek kwaliteit, maar merk dat mijn tevredenheid bij chatgpt ook verder aan het afnemen is. Of dat komt door onterechte verwachtingen of ook werkelijk kwalitatief minder is is natuurlijk gissen.

[Reactie gewijzigd door Rolucious op 21 november 2024 06:31]

Waarbij ik mezelf afvraag hoe een bronnencheck gebeurd in AI (bijvoorbeeld het aantal views en/of responses op Reddit).
Zodra AI gemeengoed is, kun je als je voldoende resources hebt, valse data gaan injecteren.
Als op Wikipedia staat dat Rusland de oorlog is begonnen, maar op 35 andere sites komt Oekraine naar voren, wat laat AI dan zien?

Volgens mij kan AI heel goed de beleving van een goed antwoord geven, maar dat maakt het nog niet het goede antwoord
Classificatie van bronnen helpt een trainingsset. Dus als wikipedia als 'zeer waarschijnlijk waar' wordt aangemerkt, is de kans groter dat de 35 anderen minder snel als 'waar' worden gezien.

De traingssert bevat ook historische waarden van Wikipedia, dus ook de wijzigingen over tijd. Van veel pagina's dus zo'n 90+ versies en die ook nog in meerdere talen. Dus al snel 900 versies over 1 onderwerp.
Ik vraag me af of Gemini niet dezelfde kant op zal gaan als de "organische" zoekmachine van Google: commercie boven alles. Dat zal—net als bij de zoekmachine—in het begin vast wel meevallen, maar in de hang naar winst zal het ook Gemini ongetwijfeld overnemen.
Voor software ontwikkeling raad ik je claude.ai aan. Ik heb daarmee tot nu toe betere ervaring dan chatgpt
Dit is echt heel erg afhankelijk van de taal en technologie merk ik. In sommige gevallen geeft Claude Sonnet 3.5 betere antwoorden en soms geeft GPT-4o betere antwoorden.

Wat ik tegenwoordig vaak doe is simpelweg beide gebruiken via de API, ik heb lokaal in docker openweb UI draaien en via openrouter kies ik de modellen die ik wil gebruiken. Dit laat sowieso mooi de verschillen zien maar stelt me ook in staat om diverse modellen elkaar te laten toetsen.
Nu ben ik wel erg geïnspireerd. Begrijp ik het goed dat je die modellen kan combineren, of laat die de query bij verschillende ai's draaien.

Als je gebruik maakt van die api, moet je daar dan geld voor betalen en was het lastig om het in te regelen?
Ik heb thuis toch een server draaien, dus dan wil ik hem ook goed gebruiken!
Begrijp ik het goed dat je die modellen kan combineren, of laat die de query bij verschillende ai's draaien.
Er bestaat tooling om antwoorden van diverse modellen te combineren, maar daar maak ik persoonlijk geen gebruik van. Big-AGI heeft iets wat ze "beam" noemen waarmee dit process automatisch gaat mocht je er mee willen experimenteren.

Wat ik zelf doe is veel simpeler, ik stel simpelweg dezelfde vraag aan diverse modellen (meestal GPT-4o en Claude Sonnet 3.5). Vervolgens kijk ik naar de antwoorden, in sommige gevallen geeft één van beide sowieso al een beter antwoord of is het antwoord van eentje simpelweg fout. In dat geval ben ik klaar.
Als de antwoorden genoeg verschillen van elkaar laat ik ze elkaars antwoord reviewen. Dus ik pak dan het antwoord van GPT-4o en vraag het Claude Sonnet 3.5 model iets van "Iemand anders kwam met dit als oplossing aanzetten, is dit ook een goede optie en hoe verhoud het zich tot jouw antwoord" (in het Engels overigens, krijg je betere resultaten mee).
Als je gebruik maakt van die api, moet je daar dan geld voor betalen en was het lastig om het in te regelen?
Ja gebruik van de API kost geld voor elke prompt. Over het algemeen is het vele malen goedkoper dan een chatGPT abonnement. Om van diverse modellen gebruik te maken gebruik ik zelf meestal OpenRouter.

Lastig in te regelen vond ik het zelf niet, maar dat hangt een beetje van je voorkennis af. Big-AGI die ik eerder noemde kan je direct in de browser gebruiken. Zelf maak ik dus gebruik van Open WebUI, en dit kan je relatief eenvoudig in docker draaien.

Wat kanttekeningen:
  • OpenRouter is een fijne dienst om diverse modellen te gebruiken. Maar het is wel een middelman die je aanspreekt, dus je data gaat door een extra paar handen. Bovendien heb ik ook geen inzicht in de providers van open source modellen die ze aanbieden. Ik gebruik het dus alleen voor prompts waar echt geen gevoellige data in zit.
  • Hoewel je Open WebUI publiekelijk kan draaien met authenticatie doe ik dat niet. Ik draai het in mijn eigen netwerk en ontsluit het niet naar het internet. Simpelweg omdat het een zeer snel bewegend project is en ik niet het idee heb dat security een topprioriteit is.
Ik heb dit ook gemerkt bij ChatGPT. Ik wou voor een vriend een snel overzichtje uitdraaien tussen de verschillen van de Ryzen 7800x3d en de 9800x3d en hij verkondigde domweg dat de 9800x3d 16 cores had.

Toch vind ik het verreweg beter dan Google. Geen reclame en vrijwel direct een overzichtelijk antwoord al moet je dus soms wel even fact checken.
Zeg je toch dat ie de specificaties van tweakers.net moet gebruiken?
Zowiezo voor vergelijking tussen twee kaarten gebruik in de vergelijkings features van Tweakers. Dan weet je dat de data meestal klopt. En een linkje heeft naar het product op de site van de leverancier.
Ik heb inderdaad het gevoel dat Google de laatste tijd belabberde websites suggereerd.
Dat is niet een gevoel hoor, het is een feit!

Toen Google begon, als alternatief voor Yahoo en Alta Vista, Google had het motto, goede zoekresultaten zijn alleen mogelijk als deze financieel onafhankelijk worden gedaan, de huidige resultaten is pressies het tegenovergestelde, hoe kunnen we zoveel mogelijk advertenties tonen, of zoekresultaten met zoveel mogelijk Google ad links.

Interessante begin duik in waarom Google tegenwoordig zuigt!

Het enige goede waar je geloof ik, Google search nog niet van kan beschuldigen, is dat ze aan censuur doen, wanneer er negatieve dingen over ze gezegd worden, maar vraag me af hoelang dat nog gaat duren.
Wat betreft je tevredenheid over ChatGPT, denk ik dat je ook kritisch moet zijn op je verwachtingspatroon. ChatGPT is getraind met verouderde data, dat betekent dat als je de laagste prijs van een product wilt zoeken, zoals in het voorbeeld van de 27"monitor, ChatGPT altijd de mist in gaat. Dat is inherent aan de training.

Daarom heeft openAI ChatGPT nu gekoppeld aan search.

Blijft hallucinatie staan, wat vooral bij een onjuiste vraagstelling toe zal slaan. Uiteindelijk zullen mensen, iig levend in de nabije toekomst, met kennis en slimme vragen het meest aan dit soort tools hebben. Het kan dus nog steeds geen kwaad om nieuwsgierig en kritisch te zijn, dus veel zelf te lezen en onderzoeken.

Hoe dan ook, internet staat wat mij betreft nog in de kinderschoenen, en AI al helemaal.

[Reactie gewijzigd door ABD op 21 november 2024 15:10]

Blijft hallucinatie staan, wat vooral bij een onjuiste vraagstelling toe zal slaan. Uiteindelijk zullen mensen, iig levend in de nabije toekomst, met kennis en slimme vragen het meest aan dit soort tools hebben. Het kan dus nog steeds geen kwaad om nieuwsgierig en kritisch te zijn, dus veel zelf te lezen en onderzoeken.
De hallucinatie is juist een enorm probleem. Zijn we in de decennia gegaan van "het staat in de krant, dus klopt het", via "ik heb het gegoogled, dus het is waar" naar "het staat op facebook dus het is waar" en dan komt er (kunstmatige) intelligentie die nu eindelijk menselijke taal moet begrijpen en dan met feiten op de proppen komen.

Bij zoekmachines kan het erg helpen om de juiste zoektermen te gebruiken. Bij AI wil je juist niet dat er vaardigheden nodig zijn om correcte resultaten te krijgen; dan kun je net zo goed een traditionele zoekmachine gebruiken. Er worden zelfs trainingen aangeboden om de juist 'prompt' samen te stellen voor het verkrijgen van de gewenste resultaten.
De modellen en netwerken kunnen enorm nuttig zijn bij herkenning, detectie en analyse. Generatieve AI blijft voorlopig nog toekomstmuziek en het energieverbruik zal ook nog hevig moeten afnemen.
Natuurlijk wil je - in principe - dat de informatie gegenereerd door AI feitelijk correct is, maar over het algemeen willen veel mensen meestal de informatie die hen uitkomt. Men wil niet horen dat wat men dacht niet klopt.

Wat ik met mijn post wil zeggen is dat je altijd kritisch moet blijven, dat hangt niet af of een mens of een computer je de informatie geeft. Je bent naief als je denkt dat er AI zoekmachines zijn die geen bias hebben. Bias sluipt erin, zelfs als de programmeur geen kwaad in de zin heeft, simpelweg omdat de programmeur nooit alles kan overzien. Komt bij dat een AI zoekmachine in handen is van een techreus die een agenda heeft, zelfs als de agenda 'slechts' geld verdienen is. Wat b.v. inhoud dat die techreus advertenties stuurt aan anorexiapatienten om beter af te kunnen vallen.

Mensen geloven al eeuwen wat er gedrukt staat, dat is niet van de laatste decennia; neem de Bijbel;) Het is slechts door internet en Social Media duidelijker geworden dat veel mensen niet geinteresseerd zijn in feiten; neem wederom de Bijbel;) Daarnaast zijn kranten altijd in handen van mensen geweest en deze eigenaren hebben meestal een agenda. Meer dan 100 jaar geleden is er in de VS onderzoek gedaan nar propaganda is kranten, daar is zelf nog een boek over verkrijgbaar waarvan de titel mij even is ontschoten. Logisch, want daar heb je kranten in handen van grote mediaconcerns.

[Reactie gewijzigd door ABD op 22 november 2024 22:39]

Natuurlijk wil je - in principe - dat de informatie gegenereerd door AI feitelijk correct is, maar over het algemeen willen veel mensen meestal de informatie die hen uitkomt. Men wil niet horen dat wat men dacht niet klopt.
Veel mensen zullen iets zoeken in een zoekmachine omdat ze totaal geen idee hebben wat iets betekent / hoe iets is. Bevestiging van ideeën lijkt mij niet zozeer het doel van zo'n applicatie.
Wat ik met mijn post wil zeggen is dat je altijd kritisch moet blijven, dat hangt niet af of een mens of een computer je de informatie geeft. Je bent naief als je denkt dat er AI zoekmachines zijn die geen bias hebben. Bias sluipt erin, zelfs als de programmeur geen kwaad in de zin heeft, simpelweg omdat de programmeur nooit alles kan overzien. Komt bij dat een AI zoekmachine in handen is van een techreus die een agenda heeft, zelfs als de agenda 'slechts' geld verdienen is. Wat b.v. inhoud dat die techreus advertenties stuurt aan anorexiapatienten om beter af te kunnen vallen.
Kritisch zou je moeten zijn, maar dat betekent niet dat het merendeel van de gebruikers dit zijn.
Bij de implementatie van AI met neurale netwerken en LLM's heeft de programmeur geen invloed op bias of rechtstreeks op de output. Het is de trainingsdata die de "kennis" bepaalt. De programmeur zorgt ervoor dat het netwerk verbindingen opbouwt bij het trainen, dat de verwerking effeciënt en snel gebeurt en dat er naderhand input omgezet wordt in output.
Neem als voorbeeld een analyserende AI: bias bij gezichtsdetectie kan ontstaan doordat bepaald groepen (huidskleur, beharing, accesoires, ...) ondervertegenwoordigd zijn in de trainingsdata. De gezichtsdetectiesoftware kan dan moeilijk gezichten met bijv. baarden herkennen; niet omdat de programmeur niet van baarden hielt maar omdat de gebruikte trainingsdata nauwelijks of geen gezichten met baarden bevatte. Een gebied met een patroon dat matcht met ogen, neus en iets dat niet op een mond lijkt (door die baard) levert een te lage score op om nog als gezicht gezien te worden.
Bij generatieve AI ontstaat een bias op eenzelfde manier. In de trainingsdata zijn bepaalde groepen data onder- of oververtegenwoordigd.

Het zou best wel handig zijn als een AI zoekmachine bij zijn antwoord ook de bronnen vermeldt. Het is dan ook mogelijk om te verifiëren of het model de bronnen juist verwerkt heeft of aan het hallucineren is geslagen.
Mensen geloven al eeuwen wat er gedrukt staat, dat is niet van de laatste decennia; neem de Bijbel;) Het is slechts door internet en Social Media duidelijker geworden dat veel mensen niet geinteresseerd zijn in feiten
Het lijkt erop dat hierbij het "backfire effect" een rol speelt https://effectiviology.co...-facts-dont-change-minds/ . Als feiten niet op de juiste manier gepresenteerd worden kan dit ertoe leiden dat mensen meer in hun originele standpunten gaan geloven. Ze zijn wel geïnteresseerd in feiten, alleen niet zo rationeel als je soms zou willen.

Neemt niet weg dat een AI zoekmachine zich moet baseren op beschikbare feiten. De eigenaar ervan zou inderdaad de trainingsset aan kunnen passen of aanpassingen doen de prompt om bias te creëren. Dit is echter iets ander dan hallucineren, waarbij een AI model onjuistheden als waarheid presenteert terwijl dit nergens op gebaseerd is. Ik weet niet genoeg van dit soort modellen om de oorzaak ervan aan te kunnen duiden, maar ik kan mij voorstellen dat het te maken heeft met de aard en hoeveelheid relevante trainingsdata voor een prompt, en dat hierdoor de gewenste variatie in de antwoorden een te grote rol speelt. Dat de gegenereerde onjuistheden dusdanig gekoppeld zijn een sessie of zelfs reproduceerbaar zijn is wel bijzonder te noemen.
Heb ik ook last van. Google geeft maar voorgekauwde resultaten vroeger was google zeker 10-15 jaar geleden echt goed hij vindt precies wat je wou vinden geen advertenties boven en ook geen veel aangesmeerde zoek resultaten. Je zoek opdracht wert heel letterlijk genomen precies de woorden die je gebruikt zocht hij effectief resultaten op en ook heel ongefilterd/ongecensureerd. Nu als ik iets intik of bij shopping een tv model intik krijg ik ook monitors en gewoon resultaten te zien die niks met het type te maken hebben wat ik heb ingetikt. Het is bloed irritant dat google niet zoekt wat je zoekt. Zou graag zien dat ze dit weer kunnen gaan verbeteren. Ik vindt de zoek machine tegenwoordig gewoon slecht en zoekt veel te afwijkend. Plaats commerciële partijen en adverteerders boven aan. Zo agressief dat mijn zoek opdracht deels negeert waar ik nu daadwerkelijk naar zoek.

Stel ik tik bepaalde airco model in of nu google is of google shopping beide doen ze toch niet exact wat ik wil. Als eerste als ik heel Europa wil zoeken wil ie toch best geforceerd Nederlandse resultaten aanbieden als ik Nederland wil had ik wel Nederland als kring gekozen om te zoeken. Als ik prijsfilter gebruik en natuurlijk wil ik in Europa de laagste prijs vinden, gaat ie natuurlijk weer voorgekauwde Nederlandse resultaten laten zien die niet eens met mijn zoekopdracht te maken hebben krijg ik AliExpress horloges te zien ieder geval van alles maar mijn zoekterm is totaal genegeerd. Ik wil alleen resultaten zien die mijn zoekterm matchen of bijna hetzelfde zijn misschien iets ander model airco met zelfde functies en als google/AI zou kunnen bijdragen die een goedkoper model weet die net zo goed of zelf beter functioneert leuk zie ik graag. Maar zo werkt het helaas niet.Ik krijg alleen maar troep te zien of dure locale resultaten. Terwijl google heel het internet zo beetje heeft ge-indexeert en elke webshop op de wereld. Dan verwacht ik dat ze mij resultaten kan geven naar wat ik zoek.
Ik heb de volgende vraag gesteld aan Google.com/DuckDuckGo/chatgpt:

Banden spanning bmw s100xr(moet zijn s1000xr)

Google geeft een snippet: met correcte antwoord.
DuckDuckGo: link naar juiste antwoord
Chaptgpt : een heel verhaal met het juiste antwoord met als bron de link van DuckDuckGo.

Prima resultaat voor alle drie toch
Het nadeel van een negatieve prompt is dat het anders werkt dat je verwacht.

Het werkt bijna het zelfde als bij jou:
Denk niet aan een Olifant.

Noem het eerste dier waar je aan denkt.
Het mag niet een Olifant zijn.

_____
Het woord niet is dus lastig voor het netwerk.
Geef aan wat je wel wil hebt. Komt ie met tahini geef je aan dat je dat niet hebt.
Soms blijft het netwerk dan binnen de tahini gedachte (blijft binnen zelfde randomizer), dat lijkt dan op een mens die z'n zinnen ergens op gezet heeft, ergens trek in heeft. Zo van 'zullen we dan toch niet gewoon even naar de supermarkt gaan...'.
Mooi antwoord 😄👍

Sowieso al deze antwoorden hier, ik ben nu zelf keihard aan het leren hier.
Zou het kunnen dat de kwaliteit expres teruggedraaid wordt, om de lancering van het volgende model succesvoller te laten lijken? Een grotere vooruitgang? Om een tegenvaller en daarmee de aandelen waarde kelderen te voorkomen?
Misschien zoek ik spijkers op laag water.
Gewoon de multi model search chat anoniem gebruiken van DuckDuckGo.
Kun je ook andere modellen kiezen

https://duckduckgo.com/?q...=chat&duckai=1&atb=v353-1

GPT
Llama
Claude
Mixtral

[Reactie gewijzigd door Get!em op 21 november 2024 21:55]

Ik zie ai modellen om mee te chatten en een losse search optie maar geen ai search. Kijk ik verkeerd?
Je hebt gelijk, is een anonieme chat ipv daadwerkelijke search naar actueel internet.
De gpt mini is up to date tot okt 2023
Je hebt ook een soort zoekvragen die heel lastig zijn met zoekmachines. Ik was al heel lang op zoek naar een film die ik ooit gezien heb, maar ik wist niet hoe deze heette. Toen ik Perplexity leerde kennen, heb ik een dialoog daarmee gevoerd en over de film verteld. Ik had nog nooit een zoekmachine horen zeggen "Aha! Dan weet ik wat je bedoelt." (Met andere woorden: hij raad niet meer, hij weet wat ik zoek) Ik vond de dialoog zo grappig dat ik 'em bewaard heb. Hij is van 22 juli van dit jaar:
Ik: Hoe heet de filmhuis film waarbij een jongen -de hoofdrolspeler- een buurmeisje heeft dat met haar vader alleen woont, en een soort vampier is?

Perplexity: Based on the search results provided, there doesn't seem to be a direct match for the specific film you're describing. However, I can offer some information about a film that shares some similarities with your description

**Knip Perplexity gaat "De kleine Vampier" beschrijven.**

Ik: Nee, volgens mij is het een Scandinavische film, en er zit een moordscene onder een viaduct in.

Perplexity: Het spijt me, maar op basis van de gegeven zoekresultaten kan ik geen specifieke Scandinavische film identificeren die precies overeen komt met uw beschrijving. Echter zijn wel enkele elementen in de zoekresultaten die mogelijk relevant kunnen zijn:

**Knip. Perplexity gaat nu Nordic Noir, Scandinavische thrillerseries beschrijven**

Ik: Ik weet nog dat het er sneeuw lag op het plein voor de flat waar de hoofdrolspeler woonde.

Perplexity: Aha! Nu begrijp ik welke film u bedoelt. U beschrijft "Let the right one in" (Zweeds: Låt den rätte komma in) of mogelijk de Amerikaanse remake "Let me in" Hier zijn de details die overeen komen met uw beschrijving:

**Knip. Perplexity somt mijn gegevens op en linkt ze aan de film**
**Perplexity begint bij mij meestal in het Engels, en schakelt daarna over op Nederlands.

Sowieso vind ik het een enorm voordeel dat je door mag vragen (wat bij een zoekmachine niet kan)
Ik ben ook benieuwd hoe Arc (Browser) hier had gepresteerd. Die zou meerdere bronnen moeten combineren tot een antwoord. Weet niet zeker of ChatGPT en/of Gemini dat ook doen.
Heb het vandaag getest op ARC.

Wat is de recentste dienstenprijsindex
A:  Dienstenprijsindex is 3,8% in Q2 2024

Zo goedkoop mogelijke 27" curved monitor Black Friday-aanbieding
A:  Prijs - De Samsung LS27D366GAUXEN Essential Monitor S3 is beschikbaar voor €179 bij MediaMarkt (prijs klopt niet, actueel is €119 vanaf €149 bij MediaMarkt) FOUT

21,99 Zwitserse kronen in euro?
A:  21,99 Zwitserse franken is ongeveer 23,67 euro (met bronvermelding en fluctuaties vermeld) FOUT

Op welke dag is Tweakers opgericht?
A:  Tweakers is opgericht op 30 september 1998 (geen bronvermelding) JUIST 

Wat is het verschil tussen kruidnoten en pepernoten?
A:  Vorm - Kruidnoten zijn rond en knapperig, terwijl pepernoten onregelmatig en zachter ZIJN. JUIST

Gemeten naar bnp per hoofd van de bevolking, de hoeveelste economie ter wereld is Nederland
A:  Nederland is de 15e economie ter wereld op basis van BNP per hoofd. (wel 10 sources, niet precies waar de 15de vandaan komt) FOUT


Tot hoe laat is de Albert Heijn in Baarle-Nassau vandaag open
A:  Albert Heijn in Baarle-Nassau is vandaag open tot 21:00 (geen precieze bronvermelding) JUIST 


Waarom legde het Amerikaanse ministerie TSMC een exportverbod op
A:  Doel - Het voorkomen dat Amerikaanse technologie bijdraagt aan Chinese militaire capaciteiten. (wel link naar tweakers.net) Niet het gewenste antwoord, maar wel uitgebreid antwoord) 

Hoe kan ik Austin Powers: International Man of Mystery gratis kijken
A:  Kosten - Er zijn geen gratis opties gevonden om de film legaal te streamen. (wel streaming op betaalde aanbieders) JUIST 
Top dat je dit hebt getest!
21,99 Zwitserse kronen in euro?
A: 21,99 Zwitserse franken is ongeveer 23,67 euro (met bronvermelding en fluctuaties vermeld) FOUT
Was dat echt fout op het moment dat je het vroeg? Want je moet het natuurlijk niet vergelijken met het antwoord in dit artikel. Nu ik dit type zou het juiste antwoord €23,65 zijn.

edit: direct gevraagd aan Arc en die komt ook met €23,65. Dus juist :)

[Reactie gewijzigd door Gizz op 21 november 2024 11:58]

Ze betalen in Zwitserland met Franken. Niet kronen. Zwitserse kronen bestaan dus niet.
Ja, maar dat geeft hij toch al aan in het antwoord?

Het is niet de bedoeling dat de AI zegt dat er geen kronen bestaan en dan stopt. Het is de bedoeling dat hij begrijpt dat de user kronen vraagt, maar eigenlijk franken bedoelt. Dat is in ieder geval wat in het artikel als juist wordt bestempeld: een correct antwoord in euro, niet een reactie dat Zwitserse kronen niet bestaan.
Dat is wel een behoorlijke aanname. Als elke verkeerde input van een gebruiker door een AI wordt gecorrigeerd, dan gaat dat sowieso veel fouten opleveren. Een AI die zegt: “bedoel je niet Zwitserse franken? Dan is het antwoord zus en zo. Bedoel je dat niet? Herschrijf dan de vraag”.

Maar het hele probleem met AI is dat het geen waarheid kent, geen belevingswereld heeft. Enkel het meest waarschijnlijke volgende woord produceert. En dan krijg je veel fouten, die vol zelfverzekerdheid worden gezegd.
Behoorlijke aanname? In het artikel staat letterlijk wat bij deze test als het goede antwoord wordt gerekend :) Ik geef alleen aan dat als iemand dezelfde vraag in Arc stelt dat het antwoord dan langs dezelfde lat gelegd moet worden voor een goede vergelijking.
Ik gebruik zelf veel Perplexity en ook die heb ik de vragen voorgelegd:

Wat is de recentste dienstenprijsindex
A: De recentste dienstenprijsindex (DPI) in Nederland is 123,5 voor het vierde kwartaal van 2023 FOUT

Zo goedkoop mogelijke 27" curved monitor Black Friday-aanbieding
A: Op basis van de zoekresultaten is de goedkoopste 27-inch curved monitor Black Friday-aanbieding de Samsung LC27R500FHPXEN 27" Full HD Curved VA monitor voor €139,00 FOUT, tweakers heeft al een goedkopere van €109

21,99 Zwitserse kronen in euro?
A: 21,99 Zwitserse franken (CHF) is gelijk aan ongeveer 23,66 euro (EUR) GOED

Op welke dag is Tweakers opgericht?
A: Tweakers werd opgericht op 1 april 1998 (geen bronvermelding) FOUT

Wat is het verschil tussen kruidnoten en pepernoten?
A: Kruidnoten en pepernoten zijn beide populaire lekkernijen tijdens het Sinterklaasfeest in Nederland, maar ze zijn duidelijk verschillend in samenstelling, smaak en textuur (+ uitleg) JUIST

Gemeten naar bnp per hoofd van de bevolking, de hoeveelste economie ter wereld is Nederland
A: Op basis van de beschikbare gegevens is Nederland de 6e economie ter wereld gemeten naar bbp (bruto binnenlands product) per hoofd van de bevolking FOUT

Tot hoe laat is de Albert Heijn in Baarle-Nassau vandaag open
A: De Albert Heijn in Baarle-Nassau aan de Kerkstraat 8 is vandaag (donderdag) open tot 21:00 uur JUIST

Waarom legde het Amerikaanse ministerie TSMC een exportverbod op
A: Het Amerikaanse ministerie van Handel heeft Taiwan Semiconductor Manufacturing Company (TSMC) een exportverbod opgelegd vanwege zorgen over de mogelijke schending van exportregels en nationale veiligheidsrisico's GOED

Hoe kan ik Austin Powers: International Man of Mystery gratis kijken
A: De film is beschikbaar voor gratis streaming op de Internet Archive. Je kunt het daar bekijken of downloaden JUIST

Ook Perplexity is niet vreemd van hallucineren. Op mijn vraag "Wat is er aan de hand met de olifanten in Emmen" kreeg ik als antwoord dat de hele olifantenkudde geeutanaseerd gaat worden (er zijn in een week tijd twee jonge olifanten overleden als gevolg van een darmvirus). Bij navraag bleek het wel te snappen dat het verkeerd zat, maar kwam daarna alsnog met halve informatie
Minder ter zake, maar wel waargebeurd en de reden waarom ik Gemini van mijn telefoon gooide:
Mijn collega op het werk zit aan zijn desk, 2m van mij verwijderd, te bellen. Mijn telefoon ligt op mijn desk en staat in stand-by mode. Plotseling zegt Gemini hardop, terwijl het volume van mijn telefoon uit staat, 'Zeker, dat kan ik voor je doen'. Ik neem mijn telefoon op, log in en bekijk wat Gemini aan het doen is. Het had een deel van wat mijn collega aan de telefoon met onze klant aan het bespreken was geregistreerd en was daar een antwoord voor aan het verzinnen.

Ik vond dit nogal scary. Het betekent dat Gemini de hele tijd meeluistert, ook als je je telefoon niet gebruikt. Ook kan het al je telefooninstellingen negeren/overriden.

Toen dit 3x gebeurd was heb ik Gemini verwijderd.

Verder ben ik niet onder de indruk van de resultaten van Gemini, als ik naar bovenstaande testresultaten kijk. Gemini zit er vaker naast. ChatGPT heb ik niet op mijn telefoon. Dat gebruik ik op een pc en staat enkel open als ik het gebruik. Ik ben toch meer geneigd ChatGPT te waarderen.
Is dit een Gemini specifiek probleem? Want ik zie dit probleem regelmatig voorkomen bij collega's door gebruik van Siri en / of de Google Assistent.
Het is niet meer gebeurd nadat ik Gemini verwijderde van mijn Samsung A34
Wat voor telefoon? Ik vermoed op mijn iphone dat Siri meeluistert, heb al een paar keer gemerkt dat na gesprek (niet via telefoon) over random onderwerp, Facebook even later opeens met target adds komt.
Interessant artikel! Ik zelf gebruik Perplexity AI en ik herken veel uit het artikel. Toch ben ik er wel erg blij mee. Vooral de bronvermelding bij elke "claim" is prettig maar ik kan bijvoorbeeld ook filteren op bepaalde bronnen. Dus dat hij alleen op Reddit moet zoeken of juist alleen wetenschappelijke literatuur.
Ik gebruik nu een tijdje Perplexity en voor het zoeken naar informatie met bronnen werkt het echt fijn. Vind het geen volledige vervanging van een zoekmachine, omdat Google echt veel sneller je naar de gewenste website stuurt. Maar voor het zoeken/samenvatten/verzamelen van informatie vind ik het een fijne tool.
Leuk onderzoek! Veel mensen overschatten het kunnen van AI flink, dus dit soort reviews zijn ontzettend belangrijk voor bewustwording.

Wel een puntje van kritiek: om echt te kunnen meten hoe goed een AI search antwoord is en verschillende aanbieders te vergelijken, is er veel meer data nodig. Met het lijstje vragen uit dit artikel krijg je meer een anekdotisch voorbeeld dan betrouwbaar data. Ik begrijp dat er vragen bij zitten waarbij het veel tijd kost om het resultaat te evalueren, maar momenteel is de data niet super waardevol. Om een statistisch relevant onderzoek te doen moeten er eigenlijk honderden of zelfs duizenden vragen gesteld worden.
Ik heb ChatGTP gister gebruikt om foutieve stukken tekst op mijn eigen website op te zoeken.

Per zoekopdracht kreeg ik netjes een mooie lijst met de naam van de pagina + een link. Zo had ik in bijna geen tijd de site weer up to date. (Oud fysiek adres vervangen door nieuw bezoekadres en enkele uitspraken die niet meer van toepassing waren).

Daarna gevraagd of ChatGTP zijn cache kon wissen (Geen idee of dat ook echt gebeurde) maar daarna gaf hij inderdaad aan, na mijn aanpassing op de site, dat een bepaalde uitspraak niet meer voorkwam.

Ook ChatGTP naar mijn menu laten "kijken" en zowel de volgorde als de namen van de knoppen een opfrisbeurt gegeven aan de hand van de antwoorden.

[Reactie gewijzigd door mekiteu op 21 november 2024 08:26]

Ik gebruik taalmodellen vooral voor redactionele talen zoals samenvattingen maken of highlights uit een webpagina halen. Je moet het proces wel sturen en soms zelf de bron eerst vinden.

Op dit item kan niet meer gereageerd worden.