OpenAI heeft o3-mini beschikbaar gemaakt voor zowel betaalde als gratis gebruikers van ChatGPT. Het vorige redeneermodel o1-mini zat nog achter een betaalmuur. O3-mini moet 24 procent sneller zijn dan o1-mini en nauwkeurigere antwoorden geven.
Volgens OpenAI is o3-mini bedoeld voor 'technische domeinen die precisie en snelheid vereisen', zoals programmeren, wiskunde en wetenschap. Het minimodel moet zich op deze vlakken kunnen meten met het huidige o1-model, dat beschikbaar blijft als breder redeneringsmodel voor algemene kennis. Het o3-mini-model laat net als zijn voorganger zien hoe het tot een antwoord is gekomen, in plaats van enkel het antwoord te geven.
Gratis gebruikers kunnen het o3-mini-model gebruiken door 'Reason' te selecteren bij het opstellen van een bericht. Het is voor het eerst dat een redeneermodel beschikbaar is voor gratis gebruikers van ChatGPT. Betalende gebruikers kunnen overschakelen naar o3-mini in het modelselectiemenu. Ook kunnen zij kiezen voor o3-mini-high, die een hogere intelligentie biedt, maar ook een iets langere reactietijd heeft. Het o1-mini-model is niet langer te vinden in het keuzemenu.
Ontwikkelaars kunnen o3-mini gebruiken via de api-diensten van OpenAI. Microsoft heeft aangekondigd dat het model ook beschikbaar is in Azure OpenAI Service, GitHub Copilot en GitHub Models. Eerder deze week bracht OpenAI ook een 'agent' uit die zelfstandig acties kan uitvoeren in de browser. De Operator-agent is momenteel alleen beschikbaar voor Amerikaanse gebruikers met een ChatGPT Pro-abonnement van 200 dollar per maand.
De publieke release van het o3-mini-model volgt kort na de komst van de Chinese AI-app DeepSeek, die de afgelopen tijd veelvuldig gedownload werd in de Amerikaanse App Store van Apple. De app is gebaseerd op het R1-model van het bedrijf dat in meerdere tests op een soortgelijk niveau presteert als het o1-model van OpenAI. De Autoriteit Persoonsgegevens uitte eerder deze week zijn zorgen over privacy bij het gebruik van DeepSeek.
OpenAI maakte de komst van o3-mini in december van vorig jaar bekend. Naast het minimodel wordt er een breder o3-redeneermodel verwacht. Dit moet een verbeterde versie worden van het huidige o1-model. Eerder werd al bekend dat o3 een score van 87,5 procent heeft behaald in de highcomputemodus op de ARC-AGI-benchmark. Het o1-model haalde in deze benchmark een maximale score van 32 procent. Het is nog niet bekend wanneer het o3-model beschikbaar wordt voor het grote publiek. Het model is al wel enige tijd opengesteld voor wetenschappelijk onderzoek.