XAI heeft Grok 4 Fast uitgebracht. Dat is een snellere en vooral goedkopere versie van taalmodel Grok 4. De Fast-versie heeft een contextvenster van twee miljoen tokens en is veertig procent efficiënter dan Grok 4, terwijl het ongeveer dezelfde prestaties haalt, zegt xAI.
Grok 4 Fast haalt volgens xAI vergelijkbare prestaties als Grok 4 en in bepaalde benchmarks scoort het zelfs hoger dan de volwaardige versie. Daarbij merkt xAI op dat Grok 4 Fast tot wel veertig procent minder tokens gebruikt dan grotere modellen. Het model kan op internet zoeken en specifiek op X.
Het model heeft een contextvenster van twee miljoen tokens. Onder de 128.000 inputtokens kost Grok 4 Fast via de xAI-api 20 dollarcent per miljoen tokens, voor outputtokens gaat het om 50 cent. Boven de 128.000 tokens betalen developers 40 cent per miljoen inputtokens of een dollar per miljoen outputtokens.
Het nieuwe taalmodel is een zogenaamd 'unified model' dat zowel kan redeneren als snelle niet-beredeneerde antwoorden kan geven. Grok 4 Fast heeft twee modellen: grok-4-fast-reasoning
en grok-4-fast-non-reasoning
. Het model maakt daarbij zelf de afweging op basis van de prompt welk model het gebruikt.