OpenAI heeft de nieuwste versie van zijn GPT-taalmodel aangekondigd, te weten GPT-4. De nieuwe versie heeft als voornaamste vernieuwing dat tekst en afbeeldingen als input kunnen dienen. Het GPT-taalmodel vormt de basis voor AI-chatbots als ChatGPT en het nieuwe Bing.
OpenAI benadrukt dat GPT-4 afbeeldingen en tekst accepteert om teksten als output te genereren. Volgens het bedrijf is het nieuwe model minder capabel dan mensen in veel situaties uit de echte wereld, maar vertoont GPT-4 prestaties op menselijk niveau bij verschillende professionele en academische benchmarks.
De voorganger, GPT-3.5, accepteert alleen tekst als input. In een normaal, informeel gesprek kunnen de verschillen tussen GPT-3.5 en GPT-4.0 subtiel zijn. OpenAI stelt dat de verschillen pas echt goed naar voren komen als de taak een bepaalde mate van complexiteit haalt of overschrijdt. GPT-4 zou in vergelijking met GPT-3.5 betrouwbaarder en creatiever zijn en in staat zijn om meer genuanceerde instructies af te handelen.
OpenAI toont een aantal voorbeelden van de capaciteiten van GPT-4 waarbij er een vraag in tekst wordt gesteld over een bijgevoegde foto. Zo zijn er meerdere voorbeelden waarbij aan het model wordt gevraagd om uit te leggen wat er grappig is aan het plaatje.
Volgens OpenAI is er zes maanden gewerkt om de prestaties van de nieuwste versie te verfijnen. Een jaar geleden werd GPT-3.5 getraind als een eerste testsessie voor het nieuwe systeem. Daarbij zijn bugs en theoretische onderbouwingen verbeterd. Op basis daarvan was de GPT-4-testsessie 'ongeëvenaard stabiel', stelt OpenAI. Daarmee werd deze nieuwe versie het eerste taalmodel van OpenAI waarvan de trainingsprestaties accuraat en voortijdig waren te voorspellen, aldus het bedrijf.
De tekstinvoercapaciteit van GPT-4 wordt uitgebracht via ChatGPT en de api van het nieuwe model, waar een wachtlijst voor is. Om de capaciteit voor het invoeren van afbeeldingen breder beschikbaar te maken, werkt OpenAI vooralsnog samen met een enkele partner, te weten Be My Eyes. Dat is een mobiele app om de wereld beter toegankelijk te maken voor blinden en slechtzienden.