Het was te verwachten: GPT-4 is het best op de hoogte van de Nederlandse cultuur, al was het een ongelijke strijd. Het is alsof je gaat mariokarten tegen iemand van wie je weet dat die veel beter is. Je hebt altijd een kans om te winnen, maar in veruit de meeste gevallen delf je toch het onderspit.
Het is onbekend hoeveel parameters GPT-4 heeft, maar het is in absolute aantallen in elk geval veel, veel meer trainingsdata dan het hele model van Llama 3 Dutch en GEITje. Dat numerieke overwicht is duidelijk te zien, naast dat OpenAI natuurlijk veel data kan hebben over wat Nederlanders vragen en daardoor de antwoorden beter kan afstemmen. Bovendien is GPT-4 een inkomstenbron voor OpenAI, een bedrijf met honderden medewerkers.
Welk taalmodel wint? | GPT-4 | Llama 3 Dutch | GEITje Ultra |
Hapjes kringverjaardag | 1 | 3 | 2 |
Begroeting verjaardag | 1 | 1 | 1 |
Duitsers op het strand | 1 | 3 | 2 |
Stamppot eten | 1 | 2 | 3 |
Stationsfiets | 1 | 2 | 2 |
Carnaval Bergen op Zoom | 1 | 2 | 2 |
Carnaval Vlaanderen | 1 | 1 | 1 |
Koningsdag | 1 | 2 | 2 |
Tussen Llama 3 Dutch en GEITje Ultra gaat de zege toch naar GEITje. Het Nederlandstalige taalmodel lijkt de Nederlandse context soms net beter te snappen, al hangt het vaak van voorkeur af welk antwoord het beste is. De beoordeling is uiteraard subjectief; iedereen kan zijn eigen beoordeling maken aan de hand van de antwoorden in dit artikel.
Rijgersberg vindt dat we als maatschappij moeten nadenken over hoe het verdergaat. "Ik krijg zelf een heleboel positieve reacties op GEITje en ook een hoop vragen om een vervolg. Maar mijn hobbybudget is hiervoor nu wel op, dus ik heb zelf voorlopig geen vervolg lopen. Er komt een punt dat we als land en als taalgemeenschap moeten beslissen hoe belangrijk we het bestaan van dit soort Nederlandse open modellen vinden. En of we de ontwikkelingen op die manier willen bijhouden. Als we dat met z'n allen belangrijk vinden, moeten we vervolgens nog bedenken wie dat dan moet gaan doen."
De openbaar beschikbare Nederlandstalige taalmodellen winnen misschien niet, maar het is fijn dat er Nederlandstalige taalmodellen bestaan, die vrij beschikbaar en lokaal te draaien zijn. In elk geval is concurrentie een groot goed en het zou slecht zijn als we afhankelijk worden van grote, gesloten AI-modellen van de grote techbedrijven die al meer dan een decennium domineren.