Door Arnoud Wokke

Redacteur

Kunstmatig, maar niet intelligent

Hoe slim zijn Siri, Cortana en Google Now?

Waarom het niet werkt in het Nederlands

Google Now heeft wat functionaliteit in het Nederlands, maar Siri en Cortana werken nog in zijn geheel niet in onze moedertaal. Hoe komt dat toch? Het ligt niet aan de spraakherkenning zelf, denkt Van Leeuwen. "Spraak naar tekst is niet zozeer ingewikkeld, we weten wel ongeveer hoe het moet. Ik heb zelf indertijd een systeem voor het Nederlands ontwikkeld en er zijn nu verscheidene systemen verkrijgbaar, het kost wel veel inspanning." Het belangrijkste is volgens Van Leeuwen om databases aan te leggen met zoveel mogelijk sprekende Nederlanders, zodat het systeem om kan gaan met accenten.

Dat is waar bijvoorbeeld Google mee bezig is geweest: de zoekgigant heeft rondgereden in Nederland en op veel plekken mensen gevraagd om een vaste set zinnen in te spreken. Bovendien leren systemen van spraakherkenning door te vragen wat mensen bedoelen. Op die manier blijft het systeem zich verbeteren, zo is de gedachte.

Voor het interpreteren van natuurlijke taal geldt min of meer hetzelfde. "Het taalkundige stuk van spraakherkenning wordt steeds meer computationeel van aard." Daardoor is het steeds makkelijker om dat te verbeteren.

Systemen als Google Now, Siri en Cortana hebben naast veel kennis over het individu ook algemene kennis nodig: als het heeft gedetecteerd dat een gebruiker bijvoorbeeld houdt van honkbal, moet het weten waar het uitslagen van honkbalwedstrijden kan vinden om die te tonen en weten hoe de competitie in elkaar steekt om die te interpreteren.

Dat soort kennis is een van de obstakels waarom de systemen van Apple en Microsoft helemaal niet en die van Google slechts deels in Nederland werkt. "Maar ik kan me voorstellen dat er met betrekking tot de ontologie wel een soortgelijke inspanning moet worden gedaan om Amerikaanse systemen in Nederland te laten werken. Wij zijn niet geïnteresseerd in de Boston Red Sox of de New York Yankees, maar in Vitesse of Ajax. Maar ik vermoed dat een deel van deze kennis wel kan worden verkregen uit het automatisch doorspitten van websites in Nederland."

Dat de systemen niet of beperkt werken in het Nederlands, lijkt vooral te komen doordat er weinig Nederlands sprekenden zijn. "Maar wij hebben wel een hoge smartphonepenetratie, dus bedrijven slaan ons niet altijd over bij dit soort ontwikkelingen."


Google Pixel 7 Sony WH-1000XM5 Apple iPhone 14 Samsung Galaxy Watch5, 44mm Sonic Frontiers Samsung Galaxy Z Fold4 Insta360 X3 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2022 Hosting door True

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee