OpenAI maakt ChatGPT o3-pro beschikbaar voor Pro-gebruikers

OpenAI maakt zijn ChatGPT o3-pro-model beschikbaar voor gebruikers met een Pro- of Team-abonnement. Deze abonnementen kosten respectievelijk 229 euro per maand en 29 tot 34 euro per maand per gebruiker. OpenAI beweert dat het o3-pro-model zijn intelligentste model tot nu toe is.

OpenAI schrijft dat o3-pro net als o3 toegang heeft tot allerlei tools. Zo kan het model op het internet zoeken, bestanden analyseren, redeneren op basis van visuele invoer zoals plaatjes of foto's, Python gebruiken en reacties personaliseren. Door het gebruik van de tools doet o3-pro er wel gemiddeld langer over om te antwoorden dan o1-pro, waarschuwt OpenAI. Het bedrijf raadt het gebruik van zijn nieuwste model aan voor gevallen waarin betrouwbaarheid belangrijker is dan snelheid.

OpenAI deelt ook een aantal benchmarks waarin het bedrijf o1-pro, o3(medium) en o3-pro met elkaar vergelijkt. Bij de AIME 2024-benchmark scoort het nieuwe model volgens het bedrijf negentig procent, tien procentpunt hoger dan de twee andere modellen. Ook bij de GPQA Diamond- en Competition Code-benchmarks zou o3-pro hoger scoren dan de twee andere modellen. O3-pro vervangt o1-pro in het modelkeuzemenu van ChatGPT en komt volgende week beschikbaar voor Enterprise- en Edu-gebruikers.

Op dit moment zijn tijdelijke chats nog niet beschikbaar in o3-pro vanwege een 'technisch probleem'. Wat dat probleem precies is, legt OpenAI niet uit. Ook het genereren van afbeeldingen en de progammeerinterface Canvas ondersteunt o3-pro momenteel niet. Het is niet bekend of en wanneer OpenAI deze functies toevoegt.

Benchmarks o3-pro

Door Imre Himmelbauer

Redacteur

11-06-2025 • 10:17

24

Reacties (24)

24
24
12
1
0
12
Wijzig sortering
Denk dat het internet et vol van is, maar ik herhaal het nog eens... De naamgeving/nummering van de verschillende modellen is gewoon onbegrijpelijk. Het is gewoon totaal niet overzichtelijk welk model ik moet gebruiken voor wat.

En zelf al doe je zoekwerk en gebruik je het beste model, heb ik al meegemaakt dat het basismodel een beter resultaat geeft.
Is toch allemaal hartstikke logisch? :+ 4o, o4 mini, 4.1 mini en natuurlijk o3 pro die blijkbaar beter is dan de versies met een 4 erin.
Is toch allemaal hartstikke logisch? :+ 4o, o4 mini, 4.1 mini en natuurlijk o3 pro die blijkbaar beter is dan de versies met een 4 erin.
En daarin zit dus juist the verwarring: dat je mensen een 'beter' model probeert aan te praten (met een 3 in de naam), terwijl we al bij versie 4 zijn. Dat is alsof Microsoft plotsklaps Windows 10a aan zou kondigen (en dan met een vaag verhaal dat een vertakking van een oudere versie op een of andere manier toch beter zou wezen). Moet je gewoon niet doen.
Die verwarring zit een beetje in 'hoger nummer is beter'. Net zoals ik vroeger ooit de 64-bit versie van onze software beter bekte dan de 32-bit versie (maar ondertussen wel 30% meer geheugen gebruikte; die 64-bit adress space heeft wel een prijs).

Hoe dan ook: de vraag die je stelt is zelfs zonder AI van Google te vinden. De eerste hit bij mij was: https://platform.openai.com/docs/models/compare. Dat is wel heel high level, maar openAI heeft meer artikelen waar de verschillen uitgelegd worden (bijv. https://platform.openai.com/docs/models). En als er een stukje marketing in de documenten staat, dan is dat uiteraard lovend over wat het wel kan en minder duidelijk over wat het niet kan. Maar daar moet je maar doorheen kijken. Je eigen intelligentie is doorgaans beter _/-\o_ (hoop ik).

[Reactie gewijzigd door kdekker op 11 juni 2025 13:18]

Klopt, het blijft onbegrijpelijk aks je er niet dagelijks mee werkt.

Maar als je er dagelijks mee werkt wen je er gelukkig heel snel aan.

4o voor afbeeldingen en exporteren naar word/excel e.d.

o3 slimste dagelijks gebruik model. o3 Pro aller slimste model voor belangrijke taken met hoge betrouwbaarheid.

o4 mini en mini high, snellere redeneermodellen. (Gebruik ik zoor simpelste taken, want 4o is meestal toch te foutgevoelig)

4.1 en 4.5 gebruik ik nauwelijks. Zijn bij mij meestal niet nuttig gebleken.

Deep research, voor uitgebreid onderzoek op internet met bronvermelding.
4.1 werkt voor mij goed bij het herstellen van taalfouten in teksten.
Dit is hoe OpenAI het zelf verduidelijkt:

GPT-4o --- Uitstekend voor de meeste taken
o3 --- Gebruikt geavanceerd redeneren
o3-pro --- Beste in redeneren
o4-mini --- Snelst in geavanceerd redeneren
o4-mini-high --- Goed in programmeren en visueel redeneren

Ik gebruik zelf 4o voor algemene vragen. o4-mini-high voor niet te ingewikkelde programmeervragen waarvoor het internet doorzocht moet worden. o3-pro voor complexe programmeervragen waarbij het doorzoeken van het internet niet nodig is.
Alleen weet GPT 4.1 nog niet van zijn/haar eigen bestaan :)

Voor zover ik weet is GPT 4.1 een opvolger van 4o.

Overigens geeft OpenAI ook aan dat het op dit moment een puinhoop is:
We hate the model picker as much as you do and want to return to magic unified intelligence.

We will next ship GPT-4.5, the model we called Orion internally, as our last non-chain-of-thought model.

After that, a top goal for us is to unify o-series models and GPT-series models by creating systems that can use all our tools, know when to think for a long time or not, and generally be useful for a very wide range of tasks.

In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model.
GPT-5 wordt dus een model dat je vraag bekijkt en vervolgens doorstuurt naar het best passende model (simpel/snel model voor simpele vragen, redeneermodel voor meer complexe zaken).
Laat maar komen die 5 en los van openai. Heb je dit probleem natuurlijk ook bij al die andere partijen.

Geen idee meer wnr in Claude, Gemini Pro of Chatgpt moet gebruiken laat staan de modellen
Zelfs usb denkt: what the fuck!

Ik wilde inderdaad net vragen: waar kun je een diepgravend document vinden waarin de verschillende modellen vergeleken worden en wat hun use case is. Ik heb echt geen idee wat het verschil is en ik een goed model kan kiezen voor wat ik wil.
Hetzelfde geldt ook voor de keuze van default ChatGPT of een eigen Ollama die ik thuis draai.
Dan vraag je ChatGPT toch om een kort samenvattend overzicht te maken? :/
Heb ik toevallig al ooit gedaan. Waren echt compleet zinloze antwoorden altijd... Maar misschien vraag ik het wel verkeerd.
*knip*

[Reactie gewijzigd door Boxman op 11 juni 2025 15:45]

Dan vraag je dit toch gewoon ChatGPT? Selecteer dan wel eerst o3, want die is betrouwbaarder ;)
Ze hadden een plan om alles samen te voegen in een model, en dit is soortvan gebeurt met het basismodel 4o, deze krijgt dan ook om de zoveel tijd een (significante) update. Nadeel is dat ze de andere modellen ook nog ter beschikking hebben gelaten + ze moeten competetief lijken voor investeurs etc dus er moeten nog altijd nieuwe modellen naar buiten rollen.

enige andere model dat ik zelf zou gebruiken is een 'nadenk' model voor enige moeilijke kennis/research vragen.
Gemini heeft dat intussen wel gedaan, de hele lijst is verdwenen, je hebt een snel model en een trager maar slimmer model (2 opties)
Zoals je zelf al min of meer aangeeft: deze kritiek is inmiddels echt een grijsgedraaide plaat.. Het is inderdaad onoverzichtelijk, maar ongebrijpelijk is ook weer overdreven. Zeker als je je er wat meer in verdiept. Voor de gemiddelde ChatGPT-gebruiker is dat misschien wat teveel gevraagd, maar de verschillen tussen de modellen (en de kosten daarvan) zijn toch voornamelijk interessant voor de veelgebruiker, bij toepassingen voor programeren en logica - en van die gebruikers valt toch ook wel wat te verwachten - of gebruikers van de API.
De koptelefoonlijn van Sony is nog begrijpelijker qua benamingen dan de modellen van OpenAI
De AI race verlegt zich nu van het beste model naar het beste ecosysteem en tool support. Gezien de kosten snel toenemen om nog meer performance te krijgen.
Ik snap het even niet is dus de o3 pro beter, betrouwbaarder en intelligenter dan gpt 4o?
Ja maar gebruikt meer kracht en is ook trager met redeneren. De verschillende modellen zijn voor specifieke taken; je kan dus niet zomaar zeggen dat o4 beter is dan o3 pro of omgekeerd. In die zin was een andere naamgeving dan een nummertje misschien beter geweest. Ik ben geen groot fan van marketingnamen, maar hier zou het de communicatie kunnen verbeteren.

Hier is een chat waarbij ik ChatGPT zelf namen laat bedenken. Werkt redelijk (scroll naar het einde) :)

https://chatgpt.com/share...50-8002-87d9-bc4f29ccedc6

[Reactie gewijzigd door uiltje op 11 juni 2025 14:25]

Je moet 4 niet als beter zien dan 3.
Een cijfer betekent dat het een ander soort model met een ander doel is.

Niet helemaal logisch op het eerste gezicht.

Op dit item kan niet meer gereageerd worden.