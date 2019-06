De provincie Fryslân trekt 38.000 euro uit om Friese gesproken woorden in de Mozilla-dataset Common Voice te krijgen. Software kan die dataset gebruiken voor diensten die werken met stemcommando's, die daardoor ook kunnen werken in het Fries.

De Fryske Akademy, een instituut voor onderzoek naar de Friese taal en bevolking, gaat de zinnen bedenken die vrijwilligers kunnen inspreken, meldt het Friesch Dagblad. In de dataset komen eenvoudige instructies en een basiswoordenschat. Daarbij zoekt de Akademy vrijwilligers uit meerdere delen van de provincie, zodat meerdere dialecten van het Fries in de dataset belanden.

De initiatiefnemer voor het project is Wim Benes, een systeembeheerder bij het ziekenhuis MCL in Leeuwarden en eerder initiatiefnemer voor de Friese vertaling van browser Firefox, eveneens van Mozilla. Het inspreken moet eind dit jaar beginnen en over een jaar ongeveer zijn afgerond.

Common Voice ondersteunt sinds september vorig jaar al Nederlands. Er zijn tot nu toe 506 Nederlandse sprekers die tot nu toe 22 uur aan Nederlandstalige spraakcommando's hebben ingesproken. Dat is een klein deel van het totaal dat Mozilla denkt nodig te hebben voor een complete dataset.