Googles onderzoeksdivisie DeepMind introduceert het nieuwe opensourcemodel Gemma 4 onder de Apache 2.0-licentie. Het model zou excelleren in prestaties per parameter. Daarmee moet Gemma 4 relatief goed presteren op lokale hardware. De meeste AI-modellen presteren alleen goed op geavanceerde hardware in datacenters.
Gemma 4 is gebaseerd op Gemini 3 en bestaat uit vier varianten, Effective 2B, Effective 4B, 26B Mixture of Experts en 31B Dense. De cijfers doelen op de hoeveelheid parameters in het model. Effective 2B heeft dus 2 miljard parameters, Effective 4B heeft er 4 miljard enzovoort.
Een parameter is een interne variabele, de bouwstenen van hoe een model is opgebouwd en data verwerkt. Gemma 4 is 'open weight', waardoor gebruikers het interne werken van het model kunnen aanpassen.
Grote en kleine modellen
Vooral de twee grootste modellen zouden per parameter goed presteren. Specifiek het 26B-model kan dat door verzoeken zo efficiënt mogelijk te verwerken. Dat lukt volgens Google DeepMind omdat er maar 3,8 miljard van de 26 miljard parameters geactiveerd worden bij inferentie, het verwerken van nieuwe data door een 'afgetraind' model. Daarmee zou het model op een enkele Nvidia H100-gpu met 80GB geheugen moeten kunnen draaien. Dat is in principe dus lokaal mogelijk, al zullen weinig consumenten een H100 hebben.
De twee kleinste Gemma 4-modellen zouden nadrukkelijk gemaakt zijn voor consumentenhardware. Deze varianten maakte DeepMind in samenwerking met het Google Pixel-team en smartphoneprocessormakers Qualcomm en MediaTek. Effective 2B en Effective 4B zouden daarom geschikt zijn om met het beperkte geheugen en accuduur van een smartphone effectief te werken.
Nieuwe licentie maakt breder gebruik mogelijk
Google DeepMind brengt Gemma 4 uit onder de Apache 2.0-licentie. Dit is een opensourcelicentie die veel gebruikt wordt in de wereld van opensourceontwikkeling. Gebruikers mogen het model aanpassen en onder een eigen licentie en eventueel commercieel uitbrengen. De ontwikkelaar stelt: "We geloven in het versterken van het ontwikkelaarsecosysteem zonder beperkende barrières."
De nieuwe licentie is opvallend, want tot dusver bracht Google Gemma-modellen onder een eigen licentie uit. De voorwaarden daarvan waren strenger en Google hield het recht in handen om de licentie later te veranderen. Dat is niet geval onder Apache 2.0.
:strip_exif()/i/2008101316.jpeg?f=imagenormal)