IBM heeft een nieuwe versie van zijn llm Granite uitgebracht. Granite 4.0 bestaat uit meerdere modellen die gebouwd zijn om minder rekenkracht te gebruiken dan eerdere versies. Alle modellen zijn onder een Apache-licentie beschikbaar.
De nieuwe generatie modellen bestaat uit Granite-4.0-H-Small, -Tiny en -Micro. Die zijn volgens IBM beschikbaar via het eigen WatsonX-platform en via verschillende platformen zoals Hugging Face en Ollama.
IBM komt met drie modellen. Het Granite-4.0-H-Small-model is een hybride 'mixture of experts'-model met 32 miljard parameters. Dat model noemt IBM 'het werkpaard' binnen het aanbod dat bedoeld is om bijvoorbeeld klantenserviceagents te bouwen. Daarnaast zijn er het Granite-4.0-H-Tiny-model met 7 miljard parameters en het Granite-4.0-H-Micro-model met 3 miljard parameters. Die laatste twee zijn voornamelijk bedoeld om edge-applicaties mee te bouwen, zegt IBM.
Volgens IBM zijn de modellen vooral gemaakt om als agents in te kunnen zetten of er agenttools op te kunnen bouwen. Volgens IBM zijn de 4.0-modellen in benchmarks veel krachtiger dan Granite 3.3, maar ook veel efficiënter. Zelfs het kleinste model, 4.0-H-Tiny, vereist minder vram dan Granite 3.3 8B. IBM vergelijkt het model in de meeste prestatiebenchmarks met Qwen, het Chinese model van Alibaba. Ook op dat gebied scoort het model een stuk efficiënter.