XAI heeft zijn Grok 4-taalmodellen beschikbaar gemaakt. De geavanceerdste versie zou beter dan elk ander model scoren op de ARC-AGI 2-benchmark, die de 'algemene intelligentie' van llm's moet meten. Toegang tot deze versie kost 300 dollar per maand.
XAI heeft zijn Grok 4-llm's tijdens een livestream onthuld en direct beschikbaar gemaakt. Het bedrijf haalt in de stream verschillende benchmarks aan waarin de modellen beter zouden scoren dan concurrenten. Het grootste model, Grok 4 Heavy, scoort in de ARC-AGI 2-benchmark bijvoorbeeld beter dan alle andere llm's die momenteel beschikbaar zijn. Het model behaalt in deze algemene test, waarin de intelligentie van de AI wordt vergeleken met die van het menselijke gemiddelde, een score van 16,2 procent. Claude Opus 4 bezat hiervoor de hoogste score, van 8,6 procent.
Naast het reguliere Grok 4-model en Grok 4 Heavy zijn er ook modellen aangekondigd die specifiek getraind zijn voor programmeren en voor het houden van spraakgesprekken. Het reguliere model kan worden gebruikt door betalende Supergrok-abonnees. Dat abonnement kost 30 dollar per maand. XAI heeft ook een nieuw Supergrok Heavy-abonnement onthuld, dat 300 dollar per maand kost. Daarmee krijgen gebruikers toegang tot Grok 4 Heavy. In de toekomst moeten abonnees ook vroegtijdige toegang krijgen tot nieuwe AI-functies, waaronder de mogelijkheid om video's te genereren.
De release van Grok 4 volgt vijf maanden op de introductie van zijn voorganger. Onlangs kwam de chatbot in opspraak omdat deze ongepaste berichten verstuurde op X. De bot prees onder meer Adolf Hitler in meerdere posts. Op het moment van schrijven kan Grok enkel nog afbeeldingen posten op het socialemediaplatform. Kort voor de onthulling van het nieuwe AI-model stapte X-ceo Linda Yaccarino op.