WhatsApp test functie om spraakberichten te transcriberen

WhatsApp test een functie waarmee gebruikers spraakberichten kunnen transcriberen. Dat meldt WABetaInfo op basis van info uit de recentste WhatsApp-bèta voor Android. Eerder bleek al dat Meta daar aan werkt, maar de feature werd toen nog niet daadwerkelijk getest.

WABetaInfo meldt dat de transcribeerfunctie nu beschikbaar is voor een beperkte groep gebruikers die WhatsApp-bètaversie 2.24.15.5 voor Android draaien. Uit de testversie blijkt dat gebruikers zowel transcripties kunnen genereren voor spraakberichten die ze ontvangen als berichten die ze zelf versturen. Dat gebeurt volledig on-device, dus zonder dat de cloud daaraan te pas komt. De huidige test is beperkt tot vijf talen: Engels, Spaans, Portugees, Russisch en Hindi.

Een eerdere testversie van WhatsApp suggereerde al dat Meta werkt aan transcripties voor spraakberichten. Versie 2.24.7.8 uit maart bevatte daar verwijzingen naar, hoewel de feature toen nog niet daadwerkelijk werd getest onder gebruikers, meldde WABetaInfo destijds. Dat is nu dus wel het geval. Het is echter niet duidelijk wanneer de functie algemeen beschikbaar komt.

WhatsApp-bèta met transcripten van spraakberichten
Bron: WABetaInfo

Door Daan van Monsjou

Nieuwsredacteur

10-07-2024 • 20:51

39

Lees meer

Apple kondigt iOS 18 aan
Apple kondigt iOS 18 aan Nieuws van 10 juni 2024

Reacties (39)

Sorteer op:

Weergave:

Benieuwd waarom juist Russisch als eerste taal wordt gebruikt gezien de huidige situatie. Iemand een idee?
Vroeg het me ook al af en vraag me direct af of WhatsApp nog wel gebruikt mag/kan worden in Rusland. Een eigen mening hebben is nogal een gevaarlijke bezigheid in Rusland dus ik zou niet weten of je deze wel in woord of geschrift zou willen vastleggen op je telefoon.
Dacht ook dat heel facebook en whatsapp geblokkeerd was in Rusland
Misschien om de karakterset te checken, maar dan had ik eerder Oekraïens gekozen. Niet alleen vanwege de situatie, maar ook mede omdat de oprichter (Jan Koum) uit de Oekraïne kwam.
Denk bij Russisch niet alleen aan Rusland. Google:
"Russian has over 258 million total speakers worldwide. It is the most spoken native language in Europe, the most spoken Slavic language, as well as the most geographically widespread language of Eurasia."
F_J_K Forummoderator @mailis11 juli 2024 09:12
Wilde gok zonder kennis van zaken: omdat die talen 'toevallig' al waren opgenomen in de gebruikte AI.
Misschien omdat Russisch niet alleen in Rusland gesproken wordt, maar ook in veel andere landen van de voormalige Sovjet Unie, Zoals in Oost-Europa maar vooral Centraal Azië. Daar hebben ze wel hun eigen talen, maar die zijn veelal nog in ontwikkeling (na in de Sovjet periode onderdrukt te zijn geweest) en kennen vaak grote regionale verschillen. Russisch is daar de lingua franca dat misschien niet zo erg geliefd is, maar waarmee je je wel in een zeer groot gebied begrijpbaar kan maken.

En praktischer denk ik dat dit de vijf grootste taalgebieden zijn waar WhatsApp gebruikt wordt.
Handige functie, WeChat heeft het al jaren en ik gebruik het regelmatig.
Bij WeChat gebeurt dit wel op een server, als je end to end encryptie wilt behouden zal dit op je veel minder krachtige telefoon moeten gebeuren
iOS doet het ook al in iMessage, denk dat het wel mee valt qua rekenkracht.
Kan zeker zijn, telefoons zijn al een stuk sneller dan vroeger en de modellen zijn de laatste jaren zeer sterk vooruit gegaan. Ik denk niet dat het praktisch was toen WeChat er mee begon, ongeveer 10 jaar geleden als ik me niet vergis.

Dat gezegd, een Tesla model 3 kan geen voice recognition doen zonder internetverbinding... 8)7
F_J_K Forummoderator @Jeoh11 juli 2024 09:24
Houd er bij gebruik van Wechat wel rekening mee dat het vast niets voor niets verboden is voor (o.a. rijks-)ambtenaren om te gebruiken.
Ja graag. Het is echt pure waanzin om een van een asynchrone dienst, namelijk chat, de ontvangende partij te dwingen om op 1 tempo naar een geluidsbericht te laten luisteren?

Maar goed. Dat zeg ik, ik luister ook mijn voicemails niet af.
Voor sommige mensen is het een uitkomst, die spraakberichten. Niet goed in schrijven of lezen, en toch asynchroon.
Maar lange spraakberichten zijn vreselijk. Tip voor doorontwikkeling (wat makkelijker zou kunnen bij open protocollen natuurlijk): De ontvanger maakt meteen een (AI) samenvatting als een lang bericht binnenkomt, stuurt die naar de afzender, die vervolgens mag aangeven of het klopt of niet.
Wat de ontvanger dan weer ziet: goedgekeurde samenvatting.
Installeer dan een toetsenbord waarbij je kan dicteren. Zo heb ik mijn zwager met zijn dikke monteursvingers ook aan de whatsapp gekregen
Het is soms fijn om iemand zijn of haar stem te horen. Ik gebuik het bovengemiddeld veel. Ieder zn ding.
Daarom ben ik wel blij hiermee, dan kan ik kiezen
Eens. Ik heb veel klanten die via Whatsapp sturen maar aantal spreken dan vragen in. En dan vaak met hele inleiding. Kan je eerst vele spraakberichten afluisteren om dan kort en krachtig het antwoord te geven. Ik heb zelf wel een bloedhekel aan die spraakberichten. Kost gewoon tijd.
Dit is nu eens een functie, mensen met een beperking waarbij dit handig is hebben misschien een dedicated solution voor dit. Maar dit maakt de drempel wel een stuk kleiner.
als hardhorend persoon ben ik hier ontzettend blij mee ja dit maakt het stuk minder inspannend om een bericht te volgen
Eindelijk! Een functie waar ik echt op zit te wachten.
Ik heb dit al een bijna een jaar op Whatsapp for Business (iOS), wel alleen bij spraakberichten die ik ontvang (in het Engels).
Liever een functie waarbij niemand mij een spraakbericht kan sturen
Zou handig zijn ja 👍
Je zou ze ook kunnen appen of een spraakbericht kunnen sturen dat ze dat niet moeten doen. Vet handig!
Dat zou inderdaad een uitkomst zijn. Deze functie, om het om te laten zetten in een tekstbericht is een goede tweede.
Handig voor mensen met een handicap of om andere redenen niet kunnen afluisteren.

Zeer onhandig voor mensen die deze methode gebruiken om te voorkomen dat berichten ongewenst in de publieke omgeving terecht komen. Het snapshotten van berichten om deze oneigenlijk te gebruiken is daarmee een stuk makkelijker geworden. En ja, ik weet dat audioberichten doorgestuurd kunnen worden, maar dit maakt het een stuk makkelijker het op externe platforms te posten e.d.
Ik vind het zelf soms wel ietwat hinderlijk als mensen een gesproken bericht sturen, deels wel omdat dit niet altijd even duidelijk gesproken is. Nu vraag ik mij wel af wat dit voor invloed heeft op een transcriptie en mij wel lijkt dat dan duidelijk gesproken moet worden.
Mijn probleem is meer dat ik bij mij het omgevingsgeluid storend is om het bericht goed te kunnen verstaan. Dat is met transcriptie opgelost.
Wanneer transcriptie net goed lukt omdat er onduidelijk gesproken wordt (of omgevingsgeluid bij de verzender overheerst) neem ik aan dat er wel en transcriptie kan worden, maar dat die een hoop onzin bevat. Dan kan je die transcriptie terugsturen naar de afzender met het vriendelijke verzoek om een tekstbericht te sturen omdat zelfs WhatsApp diegene niet kan verstaan.
het omgevingsgeluid storend is om het bericht goed te kunnen verstaan
Ja oke, dat is wel een punt en dan kan transcriptie handig zijn ja.
Handig... Ja.

Maar hoe zit het met de privacy? De end to end encryptie is niet meer van toepassing als het ergens in de cloud opgenoteerd wordt, neem ik aan.

Edit: Ah dit gebeurt dus on-device, dat is echt super. (y) Sorry dat had ik even gemist in het artikel. Ik ben wel benieuwd hoe goed dit gaat werken on device, aangezien het toch op beperktere hardware zal moeten draaien dan in de cloud.

[Reactie gewijzigd door Llopigat op 22 juli 2024 13:55]

Op dit item kan niet meer gereageerd worden.