Bing Chat krijgt ondersteuning voor spraakinvoer in Edge voor desktop

Microsoft kondigt aan dat Bing Chat in Edge voor desktop voortaan ondersteuning biedt voor spraakinvoer. Eerder was spraakinvoer enkel mogelijk op mobiele apparaten. De Nederlands taal wordt vooralsnog niet ondersteund.

De spraakinvoer van Bing Chat ondersteunt de talen Engels, Duits, Frans, Japans en Mandarijn. Op een later moment zullen andere talen volgen, aldus Microsoft. De feature werkt op een soortgelijke manier als in de mobiele versie van Edge, namelijk door op een icoon van een microfoon te klikken en een vraag in te spreken. Het is ook mogelijk om tekst-naar-spraakantwoorden te ontvangen, waarbij Bing Chat zijn antwoord hardop uitspreekt.

Bing spraakinvoer
Beeld: Microsoft

Door Sabine Schults

Redacteur

10-06-2023 • 12:22

34

Reacties (34)

Sorteer op:

Weergave:

LCARS - here we come! :Y)

Super coole ontwikkeling. Al gaat het mij uiteindelijk om acties die het moet kunnen uitvoeren dan informatie/gesprekken geven. Zeg maar de Google home, maar dan 1000x beter.
LCARS is toch alleen maar de UI van (Next Generation) Star Trek computers , niet de bredere UX?

Kan het fout hebben hoor.
"In the Star Trek fictional universe, LCARS is a computer operating system."

Maar mij gaat het om een futurische computer/interface waar je de helft van de tijd tegen het scherm aan het brabbelen bent.

En omdat ik daar naar uitkijk, gebruik ik de referentie naar LCARS voor de fans onder ons :*)

[Reactie gewijzigd door Triblade_8472 op 1 augustus 2024 09:23]

Cool, maar dan moet de computer wel echt snappen wat je bedoelt als je het belangrijke opdrachten geeft. Ik vermoed dat er in Siri al een kans evaluatie zit verwerkt waarbij er wordt geschat hoe groot de kans is dat wat Siri heeft gehoord daadwerkelijk is gezegd, zodat de kans kleiner is dat Siri dingen gaat doen die niet de bedoeling zijn. Daarom vind ik spraak interface (op dit moment) niet geschikt voor alle taken.
In het twitter linkje hieronder van @singingbird zie je dat de AI bij elke opdracht bevestiging vraagt. Zal wel irritant zijn in het begin, maar wel veiliger.
HEEL irritant, die AI.
Bij chatgpt antwoorden al.
Elke keer weer bij elk antwoord te moeten zien dat de eerste 3 regels worden ingenomen door de AI die verteld dat het geen gevoelens etc etc heeft, dat het een AI is, dat het BLABLABLABLA.. Noise!!!!!
Mja, nerd-alert hier, maar de Padds hebben ook LCARS. En daar kan je niet tegen praten…

(Snap wel dat dit heel erg Star Trekkie voelt, hoor. Heb ooit eens een blogpost gemaakt waar de iPhone 3G met de Tricorder/Commbadge combi werd vergeleken)
Wat vind je van zoiets: https://twitter.com/localghost/status/1663274587860393984

Opdrachten uitvoeren, waar je zelf uren voor nodig zou hebben.
Ja precies, dat is toch geniaal gebruik van deze 'nieuwe' tooling!

Het enige waar ik mij een klein beetje zorgen over maak zijn 2 dingen hiermee:
1) door elkaar heen praten kan een vreselijke kakofonie worden in een kamer met meerdere mensen.
2) deels gelinkt aan hierboven. Assistenten kunnen naar iedereen luisteren en niet alleen de primaire gebruiker. Dus als mijn buur een e-mail dicteerde wil ik niet dat mijn pc commands gaat uitvoeren die ik niet uitspreek.
Goede richtmicrofoons gebruiken. Als deze technologie gemeengoed wordt volgen de headset fabrikanten vanzelf met producten die de problemen ondervangen.
Ik denk zelf meer in de richting van detectie waar mensen naartoe praten.
Volgens mij moet er toch prima met spraakherkenning te werken zijn? Mijn Amazon 'smart' speakers vroegen mij wel of ik dat wou instellen (niet gedaan, ik sta toch geen bestellingen of iets via die speakers toe en ik heb weinig persoonlijke gegevens bij Amazon die je niet al weet als je toch al in mijn huis bent, enkel mijn muziek smaak en wekkers kan je leren :p ). Geen idee hoe goed dat werkt, en met een opname zal het vast te foppen zijn, maar het moet toch aardig werken tegen onbedoelde commando's door derden?
Tot je een omgeving hebt waar meerdere mensen van dezelfde pc gebruik mogen maken.

Ik denk zelf meer in de richting van detectie welke kant mensen op praten samen met nabijheid detectie.
Ah eindelijk. Ik hoopte al dat ze dit snel gingen toevoegen en ook op mobiel. Bing Chat snapt een stuk beter wat ik probeer te zeggen dan Google Assistent doet. Daar krijg ik toch nog veel te vaak geen antwoord als ik wat probeer te doen.
Mijn ervaring met spraakgestuurd zoeken is dat je vaak langer bezig met met corrigeren dan dat hij het snapt.
Jaaaa, eindelijk. Het is vrij evident dat alle assistants naar AI gaan, maar dat lijkt me nu eens de meest nuttige toepassing. Sinds de introductie van Siri en Google assistant en anderen, ben ik nooit echt verder gegaan dan timers zetten. :)
Een opgepompte versie van Cortana.

Daar kon Google niet aan tippen in de tijden van Windows Phone. De tijd dat je zelfs met steenkolen Engels een antwoord kreeg of het vandaag zou gaan regenen, inclusief varianten op de vraag of je een paraplu nodig hebt.

[Reactie gewijzigd door mavaros op 1 augustus 2024 09:23]

Je kan iig op Windows 11 al voice input gebruiken dmv van de WIN + H shortcut.
Ach, als we straks Copilot hebben in Windows (11) dan denk ik dat we Cortana heel snel vergeten zijn :+
Ik type zelf met 10 vingers blind en ben vaak sneller met gewoon tekst intypen dan dat mijn stem herkent word en de juiste tekst verschijnt. Hetzelfde vaak ook met Google Nest dat ik vaker wel 3 tot 4 keer met stemverheffing moet roepen eer dat Google snapt wat ik wil. Plus daarbij dat ik Bing Chat niet wil en zoveel mogelijk ook dat hele AI gedoe niet op mijn pc wil, net ook als ChatGPT.
Dat een voice assistent je goed zal begrijpen is uiteindelijk een kwestie van tijd, zelfs als je slecht articuleert.
Je gaat het voordeel vooral merken als je met iets anders bezig bent, en tegelijk een andere taak wil laten uitvoeren. Of je zit bijv. niet achter je keyboard, en dan kan je toch iets gedaan krijgen.
Dat een voice assistent je goed zal begrijpen is uiteindelijk een kwestie van tijd,
Nou, ik heb mijn Google Nest Hub nu denk ik al een jaar of 2, maar nog steeds snapt ie de helft van de tijd niet wat ik vraag. Of ja ene keer reageerd ie direct en andere keer moet ik vaak 2 of 3 keer hetzelfde vragen eer die het snapt.
Je gaat het voordeel vooral merken als je met iets anders bezig bent, en tegelijk een andere taak wil laten uitvoeren.
Nou nee, dat wil ik niet ook nog bezig zijn met stemopdrachten waarvan je nog maar moet afwachten of dat goed gaat.
Ondertussen snapt Google Assistant mij de helft van de tijd nog steeds niet 8)7
Mijn Nest Audio snapt ook 99% van de tijd niet wat ik zeg, maar Bing op mijn mobiel reageert veel beter.. ik hoop dat Bard snel uitkomt tot nu toe via VPN gebruikt en ik vind het ook heel goed werken. Alleen de implementatie is niet zo snel als Microsoft. Ook jammer dat Europa een van de gebieden is die nu niet van Bard kan genieten. :( Ik zie beide AI graag ook terug in de OS dan alleen op een app of browser.
Kunnen we het ML noemen vanaf heden? Het heeft allemaal heel weinig met AI te zien. En je bent echt enthousiast om een privacyschendende toepassing in het OS zelf te hebben? Jeetje.
Terwijl het begrijpelijk is dat je het ML niet als AI beschouwt vanwege de verschillen in complexiteit en functionaliteit, is het belangrijk om de waarde van Machine Learning te erkennen. ML heeft zijn eigen unieke toepassingen en kan buitengewoon waardevol zijn in het oplossen van complexe problemen. Wat betreft de privacykwestie, het implementeren van bepaalde ML-algoritmen in een besturingssysteem kan juist leiden tot betere beveiliging en bescherming van gevoelige gegevens, mits goed ontworpen en geïmplementeerd. Het is belangrijk om een evenwicht te vinden tussen innovatie en privacybescherming om de voordelen van ML ten volle te benutten zonder inbreuk te maken op de privacy van gebruikers.
Mooi he, en dan roepen sommigen al dat je geen kinderen meer moet nemen vanwege AI.

https://www.euronews.com/...warns-ai-expert-mo-gawdat
In welke taal gebruik je het? In de auto gebruik ik het in het Engels en het werkt verbazend goed.
In Engels is het inderdaad een stuk beter, en lijken meer "abstracte" opdrachten ook tot zoekopdrachten te leiden. Maar ik vind Engels dan weer onhandig omdat het oplezen van Nederlandstalige inkomende berichten een drama is, en opdrachten zoals "tot hoe laat is schoenmaker van der Heijden open?" niet te doen zijn.

Ik heb geprobeerd twee talen tegelijk te gebruiken maar dat heeft als resultaat dat ze allebei slecht werken 🤭
Bij mij belt hij wel eens iemand als ik een nummer wil afspelen (muziek).
Voor flitsmeister werkt het altijd. Zit hem in de naam denk ik. Bedrijven moeten daar rekening mee gaan houden voor hun producten. ;)
Maar goed, beter dan pielen op je telefoon tijdens het rijden. (In mijn geval altijd is mijn auto muziek)
Dus 50% winst :)
Leuk hoor, in macOS kun je ook dingen laten doen door Siri. Gelukkig kan het gewoon uit.

Op dit item kan niet meer gereageerd worden.