Google Gemini krijgt mogelijk realtime antwoordvoortbrenging op Android

Google werkt naar verluidt aan realtime antwoordvoortbrenging voor de Gemini-app voor Android. De functie moet gebruikers in staat stellen om het antwoord van de AI-chatbot te lezen terwijl het gegenereerd wordt. De webversie van Gemini biedt deze mogelijkheid al.

Gemini realtime antwoorden

De feature is ontdekt door Piunikaweb en X-gebruiker AssembleDebug, die vaker juiste informatie deelt over aankomende functies van Google-producten. Op dit moment moeten appgebruikers wachten tot het antwoord van Gemini volledig is gegenereerd. Met de aankomende functie kunnen Android-gebruikers naar verluidt het antwoord lezen terwijl het gegenereerd wordt, zoals bij de webversie ook het geval is.

De tipgever zegt daarnaast dat Google met de optie komt om het gebruiken van de locatie van de gebruiker uit te schakelen. Wanneer de nieuwe functies publiekelijk beschikbaar worden, is niet bekend. Ook is het niet duidelijk of en wanneer ze naar iPhones komen. Soortgelijke apps, zoals ChatGPT van OpenAI, beschikken al langer over realtime antwoorden.

Door Sabine Schults

Redacteur

22-04-2024 • 13:56

22

Reacties (22)

Sorteer op:

Weergave:

Lijkt me sterk dit, hoe kan Google 0 ping bereiken dan?
Nee, het genereren van het antwoord duurt meerdere seconden.
In de webversie kan je het antwoord zien verschijnen, woord-voor-woord, alsof ChatGPT dit nog aan het schrijven is.
Dat is niet "voor de lol", maar simpelweg omdat het totale antwoord zoveel rekentijd komt.
Deze feature komt ook naar Gemini,
De grap is dat dit tot hele menselijke situaties zou kunnen leiden, waarbij het uitspreken sneller gaat dan het antwoord berekenen.
Dan krijg je pauzes in het antwoord. Net als een mens dit soms tijdens het antwoord geven nog ff nadenkt over het antwoord.
Sorry even stukje tekstverklaring (lang geleden geleerd maar denk dat het nog klopt).
Citaat "In de webversie kan je het antwoord zien verschijnen, woord-voor-woord, alsof ChatGPT dit nog aan het schrijven is."

Hiermee lijk je te zeggen dat de webversie van Gemini ChatGPT is (??). Overigens staat in de eerste alinea dat "De webversie van Gemini biedt deze mogelijkheid al". Dus ook voor Gemini is dit niet nieuw.

weet natuurlijk niet of het artikel na je comment is aangepast :)
Hopelijk krijgt ie een "euh" als stopwoordje :D
Je zegt het waarschijnlijk als grap, maar Google had dat destijds (2018) bij hun Google Assistant/Duplex al toegevoegd als gedrag om het meer menselijk te laten klinken. Zie de onderstaande video waarin ze een demo laten zien met de GA die een restaurant belt voor reserveringen. Zowel Gemini als ChatGPT hebben ook een tekst-naar-spraakfunctie en een spraak-naar-chatfunctie, dus dat kan zomaar toegevoegd worden (note, daar zijn nu wel (interne) richtlijnen voor opgesteld, zie tweede alinea). Door realtime generatie kan Google Gemini waarschijnlijk ook direct met een spraakantwoord beginnen, in plaats van te moeten wachten op het gegenereerde antwoord en dan pas met spraak te beginnen. Dit zal een spraakgesprek met de AI soepeler laten verlopen.

YouTube: Google Assistant calling a restaurant for a reservation
En zonder euh:
YouTube: Google Duplex: AI assistant makes a restaurant reservation*

Al kan ik me wel herinneren dat er destijds flinke kritiek was op deze functie. Veel gebruikers en critici uitten hun bezorgdheid over ethische aspecten, voornamelijk het gebrek aan transparantie. Die waren bezorgd dat ze niet konden onderscheiden of ze met een mens of een AI aan het communiceren waren. Dit leidde tot vragen over de verantwoordelijkheid van bedrijven om gebruikers duidelijk te maken wanneer ze met een machine spreken. Als gevolg van de feedback hebben verschillende bedrijven, waaronder Google, maatregelen genomen om meer transparantie in hun diensten te brengen, zoals het verplicht stellen voor de AI om zichzelf als niet-menselijke agent te identificeren aan het begin van een gesprek.

nieuws: Google Assistant zal zichzelf identificeren bij bellen van mensen

* Google zet mens in bij meer dan 36 procent van Duplex-restaurantreserveringen dus het kan ook zomaar een mens zijn geweest.

[Reactie gewijzigd door jdh009 op 23 juli 2024 05:36]

Dat is ... euh... best wel irritant... zeg maar :)
Invidious: https://inv.tux.pizza/watch?v=bR4mtvwZSPM&t=107 Middelbare school - Dat Dan Weer Wel
Ik heb nog niet zo veel meer Gemini gewerkt maar chatgpt etc vatten eerst de vraag samen een geven daarna een antwoord. Ze moeten eerst de vraag interpreteren met hun model en dan hebben ze het antwoord. Ze kunnen dus als beginnen met het uitschrijven van hun vraag nog voordat het antwoord bedacht is. Mogelijk zal hij wanneer het antwoord binnen is dit ook nog moeten omzetten naar taal. Door het in dit stapjes op te splitsen kan je logischer wijs al beginnen met uitschrijven. Het is dan dus meer dan een effect dat je het woord voor woord presenteert (een effect) maar echt een proces onderverdeeld in stappen.
Zelfs als twee mensen een fysiek gesprek hebben met elkaar zit daar een vertraging tussen. Ik heb zo'n vermoeden dat 'realtime' niet al te letterlijk opgevat moet worden.
Ze bedoelen net als bij chatgpt, dat je de woorden ziet typen in plaats van in een keer de gehele tekst.
Realtime betekent in de IT dat de respons tijd voorspelbaar is in echte tijd (tenzij de definitie veraderd is sinds ik het op mijn opleiding kreeg), en niet onder invloed van system load, interrupts en iowaits.
Dus een antwoord dat een uur duurt kan nog steeds real-time zijn.
In plaats van realtime is on-the-fly misschien een betere benaming.

Maargoed iedereen weet wel wat er bedoeld wordt en daar gaat het om. :P
Leuk, maar alleen nuttig als ze hun politieke bias uit Gemini hebben gehaald.

nieuws: Google pauzeert beeldgenerator Gemini na klachten over diversiteit

[Reactie gewijzigd door verytallman op 23 juli 2024 05:36]

Elk model heeft een bias.

De meeste “plaatjesmakers” gaan er bij “vrouw” bijvoorbeeld vanuit dat het antwoord een blanke, 25 jaar oude, lachende, rijke, sportief-uitziende meid moet zijn.
Dat is ook een bias.

Of dat een “senior partner in advocatuur” een norse, oude, witte man omringd door boeken, is.
Of dat een “senior partner in advocatuur” een norse, oude, witte man omringd door boeken, is.
Daar zal Gemini geen last van hebben aangezien Google's politieke bias inhoudt (of inhield als het gewijzigd is?) dat het geen witte mensen wil vernoemen of plaatjes van wilt maken. Elk model heeft een bias, maar die van Google Gemini is wel heel extreem.

Edit: de bias er nog steeds. Zoeken naar "white couple" zorgt voor foto's van interraciale koppels, terwijl "black couple" enkel zwarte mensen laat zien. Ik heb niets tegen welke koppel samenstelling dan ook, maar het antwoordt dat Google geeft is niet correct en extreem politiek gekleurd.

[Reactie gewijzigd door verytallman op 23 juli 2024 05:36]

Ik weet niet of je dit echt “politiek gekleurd” moet noemen. Ik zie zelf vooral incompetentie hierin. Het is gewoon stupide.
Werknemers van Google hebben gewoon aangegeven dat dit de bedoeling was, en nog steeds is blijkbaar.
Is het al bekend of en wanneer de gemini app naar Nederland komt?
Indien Google Gemini succesvol kan integreren in hun systeem, is het mogelijk dat ze hun concurrenten kunnen overtreffen, net zoals Microsoft dat deed met Netscape.

[Reactie gewijzigd door KKose op 23 juli 2024 05:36]

…zoals bij de webversie ook het geval is.
Sterker nog, de Bard beta versie kon dit ook al.
Niet echt wereldnieuws 🤥
Dus het nieuws is dat wat al gebeurd in de web-app komt naar de Android-app. Verandert dus weinig aan de functionaliteit van Gemini.

Maar ook leuk (vind ik in ieder geval). Vraag: geef je realtime antwoord?

Reactie ChatGPT:
Ja, ik geef antwoord in realtime. Mocht er een fout optreden, dan zal ik mijn best doen om die fout zo snel mogelijk te corrigeren. Laat het me gerust weten als je ergens vragen over hebt!

Reactie Gemini:
In zekere zin ja, mijn antwoorden zijn realtime in die zin dat ik ze genereer op basis van de meest recente informatie die voor mij beschikbaar is. Ik heb toegang tot een enorme hoeveelheid informatie via Google Zoeken en ik kan deze informatie snel verwerken en gebruiken om mijn antwoorden te genereren.

Ik ben echter niet in staat om informatie te verwerken die in realtime wordt gegenereerd, zoals updates van sociale media of live nieuwsuitzendingen. Dit komt doordat ik een groot taalmodel ben en het enige tijd kost om nieuwe informatie te verwerken en in mijn kennisbestand op te nemen.

Daarnaast ben ik niet in staat om acties uit te voeren in de echte wereld, zoals het instellen van timers of het beantwoorden van telefoontjes. Dit komt doordat ik een computerprogramma ben en ik niet de fysieke capaciteiten heb om deze acties uit te voeren.

Over het algemeen ben ik in staat om realtime antwoorden te geven op een breed scala aan vragen, maar er zijn enkele beperkingen aan mijn vermogen om dit te doen. Ik ben altijd aan het leren en verbeteren, en in de toekomst kan ik wellicht meer realtime informatie verwerken en acties in de echte wereld uitvoeren.

[Reactie gewijzigd door H.Klinkhamer op 23 juli 2024 05:36]

Op dit item kan niet meer gereageerd worden.