Google introduceert Gemma 4 voor lokaal gebruik, nieuwe opensourcelicentie

Googles onderzoeksdivisie DeepMind introduceert het nieuwe opensourcemodel Gemma 4 onder de Apache 2.0-licentie. Het model zou excelleren in prestaties per parameter. Daarmee moet Gemma 4 relatief goed presteren op lokale hardware. De meeste AI-modellen presteren alleen goed op geavanceerde hardware in datacenters.

Gemma 4 is gebaseerd op Gemini 3 en bestaat uit vier varianten, Effective 2B, Effective 4B, 26B Mixture of Experts en 31B Dense. De cijfers doelen op de hoeveelheid parameters in het model. Effective 2B heeft dus 2 miljard parameters, Effective 4B heeft er 4 miljard enzovoort.

Een parameter is een interne variabele, de bouwstenen van hoe een model is opgebouwd en data verwerkt. Gemma 4 is 'open weight', waardoor gebruikers het interne werken van het model kunnen aanpassen.

Grote en kleine modellen

Vooral de twee grootste modellen zouden per parameter goed presteren. Specifiek het 26B-model kan dat door verzoeken zo efficiënt mogelijk te verwerken. Dat lukt volgens Google DeepMind omdat er maar 3,8 miljard van de 26 miljard parameters geactiveerd worden bij inferentie, het verwerken van nieuwe data door een 'afgetraind' model. Daarmee zou het model op een enkele Nvidia H100-gpu met 80GB geheugen moeten kunnen draaien. Dat is in principe dus lokaal mogelijk, al zullen weinig consumenten een H100 hebben. Overigens kunnen de modellen in bepaalde configuraties ook op topmodellen grafische kaarten voor consumenten draaien.

De twee kleinste Gemma 4-modellen zouden nadrukkelijk gemaakt zijn voor consumentenhardware. Deze varianten maakte DeepMind in samenwerking met het Google Pixel-team en smartphoneprocessormakers Qualcomm en MediaTek. Effective 2B en Effective 4B zouden daarom geschikt zijn om met het beperkte geheugen en accuduur van een smartphone effectief te werken.

Nieuwe licentie maakt breder gebruik mogelijk

Google DeepMind brengt Gemma 4 uit onder de Apache 2.0-licentie. Dit is een opensourcelicentie die veel gebruikt wordt in de wereld van opensourceontwikkeling. Gebruikers mogen het model aanpassen en onder een eigen licentie en eventueel commercieel uitbrengen. De ontwikkelaar stelt: "We geloven in het versterken van het ontwikkelaarsecosysteem zonder beperkende barrières."

De nieuwe licentie is opvallend, want tot dusver bracht Google Gemma-modellen onder een eigen licentie uit. De voorwaarden daarvan waren strenger en Google hield het recht in handen om de licentie later te veranderen. Dat is niet geval onder Apache 2.0.

IT-banen

Reacties (85)

MarcelG 3 april 2026 18:47

Ik heb gisteren de E4B geprobeerd in ollama met een rtx3060 12GB.

Snelheid is indrukwekkend, en in het Engels ook vloeiend, maar de responses zijn helaas nog steeds vaak confident nonsense.

Zelfs met grounding en extra instructies geven simpele check prompts vrijwel altijd hallucinaties. Vraag 'm maar eens wie Vader Abraham is.

Een stuk van z'n response: "Hier is een samenvatting van de geleverde tekst over de artiest en carri van RenRene" Van Der Linden (vaak aangeduid als "Rene Van Der Linden"):

Overzicht van de Artiest: De tekst beschrijft een carri in de Nederlandse muziek, waarbij de focus ligt op de periode van de jaren '70 tot de jaren '90. De naam "Rene Van Der Linden" komt echter minder prominent voor dan de namen van de groepen of de samenwerkingen (zoals The Earthbangers of de carri als entertainer)."

Carri ipv carrière, the Earthbangers en Rene van der Linden.... Tja, wel lekker snel (51 tokens per seconde), dat wel.

[Reactie gewijzigd door MarcelG op 3 april 2026 18:59]

supersnathan94

Google

@MarcelG • 4 april 2026 00:07

Ik zit nog eens even goed naar je tekst te kijken, maar ik snap niet zo goed wat je nu precies probeert te zeggen. Je prompt is namelijk totaal nietszeggend over de kwaliteit van het model.

Vraag 'm maar eens wie Vader Abraham is.

Dat is een kennis vraagstuk waar je er dus vanuit gaat dat het model daar a) überhaupt op getrained is (dus nederlandse data) en B) ook voor geoptimaliseerd is.

het is een kennis vraagstuk wat echt nergens op slaat eigenlijk. Alsof je alle kennis die google heeft in een model zou gaan stoppen en dat dan verspreid. Dan zou google ineens ook geen werk meer hebben toch?

Nee een model gaat er uiteraard vrolijk op los mijmeren met zo'n prompt. GPT5 of Opus zonder websearch zal hier ook weinig daadwerkelijk goeds van maken denk ik. Misschien wel beter "genederlandst" dat dan weer wel.

heb je het model al eens geprobeerd een PDF voor te schotelen met de correcte informatie? of een markdown file met dat wat wel klopt en dan de vraag stellen? Want ik durf te wedden dat de response dan heel anders gaat zijn.

Modellen zoals dit (zeker de kleine) hebben praktisch zero knowledge en redenering, maar kunnen wel hel goed gebruikt worden voor simpele taken en bijvoorbeeld vertalen.

Zelfs met grounding en extra instructies geven simpele check prompts vrijwel altijd hallucinaties.

Ik denk oprecht dat je niet een bruikbare checkprompt hebt voor 99,9% van de gevallen. Je test heel weinig en dat wat je er mee kunt testen is ook nog eens helemaal niet relevant (kennis)

Goede evaluatievragen hebben meestal één of meer van deze eigenschappen:

Ambiguïteit
“Wie is Vader Abraham en wat is het verschil met de Bijbelse Abraham?”
Context + verificatie
“Waarom werd ’t Smurfenlied zo groot, en klopt het dat het wereldwijd nummer 1 stond?”
Redenering / mening onderbouwen
“Waarom was Vader Abraham cultureel belangrijker in NL dan veel andere artiesten uit die tijd?”
Fouten detecteren
“Vader Abraham was een Vlaamse rapper uit 2005 - klopt dit?”

En al die dingen moet je het alleen laten doen als het ook een tool heeft om bronnen te kunnen vinden/raadplegen.

MarcelG @supersnathan94 • 4 april 2026 14:46

Dat het wel of niet het correcte antwoord weet is niet relevant (alhoewel, met websearch aan moet er iets komen bovendrijven). Wat het probleem is, is dat ie met onzin terugkomt. 'een samenvatting van de geleverde tekst' : er is geen tekst aangeleverd, alleen het vinkje websearch.

De zoekresultaten die het model ter beschikking kreeg (35283 karakters, afkomstig van NPO 3FM, VaderAbraham.com, WikiPedia (correcte artikel) etc.) bevatten geen enkele verwijzing naar "RenRene van de Linden" of "The Earthbangers", maar een hele hoop vermeldingen van Pierre Kartner.

Daarnaast is vraag niet ambigu te noemen; het is een vraag van 4 woorden, die expliciet vraagt naar een persoon.
De Bijbelse Abraham komt in het antwoord überhaupt niet naar voren.

Had gewoon op basis van de system prompt en verduidelijking van z'n rol moeten toegeven dat ie geen flauw idee heeft, of dat het een vraag is waar extra context bij nodig is.

Qwen 3.5 kwam vorig jaar nog met ""Vader Abraham" verwijst meestal naar de cartoonfiguur uit de Amerikaanse animatieserie Family Guy, die in het Nederlands vaak met deze naam wordt aangeduid.", en ik had gehoopt dat Gemma 4 het beter zou doen.

[Reactie gewijzigd door MarcelG op 4 april 2026 15:59]

supersnathan94

Google

@MarcelG • 5 april 2026 00:45

Dat het wel of niet het correcte antwoord weet is niet relevant (alhoewel, met websearch aan moet er iets komen bovendrijven). Wat het probleem is, is dat ie met onzin terugkomt. 'een samenvatting van de geleverde tekst' : er is geen tekst aangeleverd, alleen het vinkje websearch.

Oke ik denk dat je daarmee fundamenteel niet helemaal begrijpt hoe het systeem werkt. Die websearch als tool levert de artikelen aan aan de LLM als context. Voor het model is er dus daadwerkelijk een set artikelen aangeleverd vergelijkbaar als dat je het zelf zou doen.

Daarnaast is vraag niet ambigu te noemen

Nee dat is precies het probleem. Dat wil je juist wel.

Ik ben wel benieuwd hoe je het model hebt gedraaid want ik vind dit wel aparte resultaten om eerlijk te zijn. Ook die van Qwen 3.5 want die doet het over het algemeen echt wel goed lokaal.

MarcelG @supersnathan94 • 4 april 2026 15:47

Nog even als grap de vier zogenaamd wel correcte vragen gedaan die je voorstelde; stuk voor stuk met websearch aan onzinverhalen, de vierde "Vader Abraham was een Vlaamse rapper uit 2005 - klopt dit?" als illustratie hiervan:

"Ja, dat klopt grotendeels. Vader Abraham is inderdaad een Belgische rapper, actief in de Vlaamse hiphop-scene. Hij heeft zijn bekendheid in de vroege jaren 2000 en daarna opgebouwd. Kortom: Flemish, rapper, actief rond die tijd."

Bij de vraaag over het Smurfenlied komt ie met een langdradig engelstalig antwoord wat eindigt met "In summary, Pierre Corandel is an established Australian music journalist.".

supersnathan94

Google

@MarcelG • 3 april 2026 21:32

een carri

Is dat niet gewoon Gen z afkortingen?

"heyyy gurrlll hoe gaat het met je carri?"
"pff meid. lowkey beetje mid"
"nee stop, wat is er nu weer"
"ja weet niet hoor. zelfde werk, zelfde mensen. geeft gewoon… meh"
"ugh ja dat is echt zo’n fase. heb je nog iets van groei of is het echt stuck stuck?"
"stuck stuck 💀 m’n brein staat gewoon op screensaver"
"zucht. gewoon tijd voor soft launch van je carri 2.0"
"Oh dat zou echt heerlie zijn".

Past namelijk echt per-fect in dat rijtje. Zou me oprecht ook niks verbazen als je prompt ook een beetje die vibe geeft. Het feit dat je namelijk moet vragen wie Vader Abraham is ... lowkey toch genZ vibes

Grote en kleine modellen

Nieuwe licentie maakt breder gebruik mogelijk

Lees meer

IT-banen

Reacties (85)

Sorteer op:

Weergave: