Mozilla heeft de Nederlandse taal toegevoegd aan zijn Common Voice-project. Dat betekent dat vrijwilligers hun stem kunnen laten opnemen bij het voorlezen van bepaalde zinnen. Het project heeft tot doel om een open dataset te bouwen van verschillende talen.
Common Voice bestaat al sinds de introductie halverwege vorig jaar, maar sinds kort kunnen gebruikers ook Nederlandse zinnen inspreken. Tot nu toe hebben vier sprekers een totaal aan 51 seconden opgenomen, de doelstelling is 1200 uur.
Er zijn maar weinig talen die veel bijdragen hebben, met uitzondering van Engels. De teller staat daar op 462 uur met in totaal meer dan 30.000 sprekers.
Bij de introductie van Common Voice zei Mozilla dat het de bedoeling is een open dataset met een CC0-licentie te bouwen aan de hand waarvan bijvoorbeeld onderzoekers spraakdiensten kunnen ontwikkelen die werken met machinelearning.
Samen met Common Voice kondigde Mozilla destijds ook het opensourceproject DeepSpeech aan, dat zich richt op speech-to-text. Op die manier moeten mensen meer keuze krijgen als het gaat om spraakherkenningsdiensten, is de redenering. Onder meer de slimme speaker Mycroft gebruikt DeepSpeech, dat op zijn beurt weer Common Voice gebruikt.