OpenAI heeft een zogenaamde 'agent' voor ChatGPT uitgebracht. Die heet Operator en kan in een browser zelfstandig acties uitvoeren. De tool is voorlopig alleen in de onderzoeksfase als bèta beschikbaar, maar kan 'alles doen wat iemand in een browser met toetsenbord en muis kan'.

De Operator-agent is voorlopig alleen nog te gebruiken door abonnees van het ChatGPT Pro-abonnement van 200 dollar per maand. Dat kan bovendien enkel nog door Amerikaanse gebruikers. Op den duur wil OpenAI de tool ook uitbrengen voor Plus-, Teams- en Enterprise-abonnees.

Operator is een agent die in de praktijk alles moet kunnen doen wat een gebruiker ook kan doen op een website binnen een browser met een toetsenbord en muis, zegt OpenAI. Het noemt als specifieke voorbeelden het invullen van formulieren, het bestellen van boodschappen en het maken van memes. Gebruikers hoeven daarvoor in de browser alleen maar een prompt op te geven en aan Operator te beschrijven wat ze willen doen. Gebruikers kunnen ook bepaalde instructies meegeven aan Operator, bijvoorbeeld om bij het boeken van vliegtickets alleen bepaalde luchtvaartmaatschappijen mee te nemen. OpenAI werkt samen met verschillende bedrijven zoals DoorDash en Uber om specifieke prompts mogelijk te maken.

OpenAI heeft voor Operator een nieuw AI-model uitgebracht: Computer-Using Agent. Dat model bevat een combinatie van onder andere de visuele herkenning die in GPT-4o zit en het zogenaamde logisch beredeneren van informatie om acties uit te voeren in de browser. Bij de input wordt zo niet alleen een tekst geïnterpreteerd, maar ook een screenshot bijgevoegd dat CUA analyseert. Bij iedere nieuwe actie, bijvoorbeeld nadat Operator op een knop heeft geklikt, volgt er weer een nieuw screenshot.

Operator kan bepaalde acties niet uitvoeren, zoals het doen van banktransacties waarbij gebruikers gevoelige data uitwisselen. Bij andere websites, zoals bij e-maildiensten, zou een gebruiker actief moeten meekijken. Ook heeft OpenAI een aantal waarborgen ingebouwd waardoor de tool niet zou moeten werken als deze merkt dat een gebruiker cybercrimeacties uitvoert.