ChatGPT krijgt een Lockdown Mode die bepaalde internetfuncties van de chatbot uitschakelt of beperkt. Zo zijn gebruikers minder vatbaar voor promptinjectionaanvallen, waarbij hackers prompts verstoppen op websites en zo de controle willen overnemen van de chatbot. De modus was al beschikbaar voor bedrijven en komt nu uit voor consumenten.
OpenAI's chatbot is de afgelopen jaren steeds meer uitgebreid met functies, waardoor ChatGPT nu bijvoorbeeld kan zoeken op het web en in opdracht van de gebruiker functies kan uitvoeren op sites en apps. Daardoor is ChatGPT vatbaar geworden voor promptinjectionaanvallen, waarbij sites prompts bevatten en zo ChatGPT proberen te verleiden iets te doen wat de gebruiker niet wil.
Een voorbeeld is een gebruiker die ChatGPT vraagt online onderzoek te doen naar vakantieplannen. Daarbij komt de chatbot op een site die misleidende informatie of schadelijke instructies bevat, zoals in reacties of een review. De website zou ChatGPT zo kunnen verleiden de verkeerde informatie te verschaffen 'of erger, het stelen van creditcardinformatie', schrijft OpenAI.
Lockdown Mode is een instelling die de webfuncties van ChatGPT drastisch inperkt en de chatbot daardoor minder vatbaar maakt voor zulke aanvallen. De functie kwam in februari uit voor grote bedrijven, maar is sinds vorige week ook beschikbaar voor kleinere bedrijven en consumenten.
De modus is volgens OpenAI vooral bedoeld voor mensen die een 'conservatieve ChatGPT-ervaring willen terwijl ze met gevoelige informatie werken'. De functie is niet nodig voor de meeste gebruikers. De modus zorgt er verder voor dat ChatGPT minder afbeeldingen genereert, dat deep research wordt uitgeschakeld en voorkomt dat de chatbot bestanden downloadt. Code die met Canvas is gemaakt, krijgt in Lockdown Mode ook geen netwerktoegang.
OpenAI meldt overigens dat Lockdown Mode niet alle vormen van promptinjectionaanvallen kan voorkomen. Als gebruikers zelf bestanden uploaden met malafide prompts, kan ChatGPT die bijvoorbeeld nog steeds uitvoeren.
/i/2008203252.webp?f=imagenormal)