Friezen hebben de Voice Challenge van Mozilla Common Voice gewonnen. Studenten uit Leeuwarden en Amsterdam werden afgelopen week opgeroepen zoveel mogelijk Friese en Nederlandse zinnen in te spreken. Friese studenten gaven daar massaal gehoor aan.
Mozilla Common Voice organiseerde afgelopen week in samenwerking met de Hogeschool van Amsterdam en de Rijksuniversiteit Groningen Campus Fryslân een taalwedstrijd waarbij studenten werden opgeroepen zinnen in te spreken en te valideren in het Nederlands en het Fries. Friese studenten gaven daar massaal gehoor aan. Friezen namen meer dan 10.000 zinnen op in een week tijd en valideerden er bijna 5000. In het Nederlands werden ongeveer 5000 zinnen opgenomen en 2500 gevalideerd.
Het doel van de wedstrijd was om meer Nederlandstalig en Friestalig materiaal te verzamelen om te gebruiken in stemherkenning. Mozilla Common Voice is een opensource-initiatief dat machines moet leren hoe echte mensen spreken. De dataset is toegankelijk voor iedereen die werkt aan stemsoftware en wordt ook gebruikt voor taalonderzoek. Het grote nadeel van veel spraaksoftware, volgens Common Voice, is dat die vooral werken met Engels en Japans. Met de wedstrijd hoopt het project ook de Nederlandstalige en Friestalige dataset te vergroten.
De opdracht voor deelnemende studenten was makkelijk: spreek zoveel mogelijk van de zinnen in die op de website van Common Voice uitgeschreven staan. Verschillen in uitspraak zijn daarbij alleen maar welkom. Er kan ook in tal van andere talen zinnen ingesproken worden, zoals Azerbeidzjaans, Esperanto en Zweeds.
In 2019 trok de provincie Fryslân 38.000 euro uit om Fries in de Common Voice-dataset te krijgen. De Fryske Akademy, dat onderzoek doet naar de Friese taal, kreeg de taak om zinnen te bedenken die vrijwilligers via Common Voice kunnen inspreken. Een jaar eerder werd Nederlands toegevoegd aan Common Voice.
Er kunnen nog steeds Nederlandse en Friese zinnen ingesproken worden. “Het inspreken en valideren stopt niet na deze week”, vertelt initiatiefnemer Wim Benes, een systeembeheerder bij het ziekenhuis MCL in Leeuwarden en eerder initiatiefnemer voor de Friese vertaling van browser Firefox. “Iedereen met een telefoon, tablet of computer kan meedoen. Verschillen in regionale uitspraak zijn geen probleem. Dat is juist belangrijk bij het opbouwen van de dataset.”