Een Belgische onderzoeker van de KU Leuven heeft Fietje uitgebracht, een Nederlandse variant op Phi 2 van Microsoft. Met 2,8 miljard parameters moet het bruikbaar zijn op weinig krachtige hardware.

Fietje

Fietje moet innovatie in Nederlandstalige taalmodellen bevorderen en toegang tot Nederlandse taaltechnologie verbeteren, zegt maker Bram Vanroy tegen Tweakers. "De stap om dit soort modellen lokaal op je telefoon te draaien wordt hierdoor kleiner." Vanroy maakte GEITje Ultra, een Nederlandstalig taalmodel geoptimaliseerd voor gebruik als AI-assistent. GEITje Ultra heeft zeven miljard parameters. "Hoewel Fietje het in benchmarks bijna zo goed doet als GEITje 7B Ultra, is het in de praktijk toch minder krachtig. Het is dan ook bedoeld als een stap naar het lokaal draaien van LLM's, ook op kleine apparaten zoals een Raspberry Pi of een telefoon."

Fietje kwam tot stand met data van Wikipedia en CulturaX, zo zegt Vanroy. Daarna volgden instruction tuning en voorkeurstraining. Het kleine model moet een compromis zijn tussen snelheid en kwaliteit, zegt Vanroy. Fietje is te proberen op de HuggingFace-pagina van het project.

Update, woensdag - Het screenshot is vervangen door een nieuw screenshot en er is meer duiding toegevoegd over de benchmarks met een quote en een link.