OpenAI heeft de afgelopen jaren enorme stappen gezet met zijn chatbot ChatGPT, maar soms gaat het op de vreemdste manier mis. Zo moest de AI-gigant onlangs onderzoeken waarom ChatGPT toch zo vaak de woorden 'goblin' en 'gremlin' gebruikte. Dat had alles met de Nerdy-persoonlijkheid van de chatbot te maken.
In een blogpost vertelt OpenAI over de iets klunzige realisatie dat ChatGPT vanaf model GPT-5.1 stiekem steeds vaker goblins en gremlins in de antwoorden probeerde te verwerken. De woorden bleken respectievelijk 175 en 52 procent vaker gebruikt te worden sinds de release van GPT-5.1.
Nu kun je dat als een charmante en vooral onschuldige gesprekstic zien. Maar met elke nieuwe versie van het GPT-taalmodel kwam de gewoonte vaker terug, vaak zonder logische aanleiding. Een gebruiker meldde dat hij bij het verzoek van 'Ascii-kunst' (een beeld gemaakt uit leestekens) van een eenhoorn ongevraagd een plaatje van een goblin kreeg. Dan zijn de rapen gaar!
Nerdy persoonlijkheid
Met de release van GPT-5.4 wist OpenAI het probleem vast te stellen: het had iets met de Nerdy-persoonlijkheidspreset van ChatGPT te maken. Met deze persoonlijkheid steeg het aantal vermeldingen van 'goblin' met ruim 3800 procent. Ook in chats met een Quirky-, Cynical- en Friendly-variant kon GPT het niet laten om een goblin in het gesprek te fietsen. En dat gedrag werd keer op keer verstevigd in wat OpenAI een 'feedbackloop' noemt:
- Een speelse gespreksstijl wordt beloond.
- Beloonde voorbeelden van die stijl bevatten een tic, in dit geval 'goblin'.
- Die tic verschijnt vaker in nieuwe resultaten.
- Die resultaten worden gebruikt in het verfijnen van nieuwe resultaten.
- De tic wordt gewoon.
Naast de groene wezentjes bleken ook andere wezens als tic in het model te zijn geïntegreerd. Zo werden 'troll', 'ogre' en opvallend genoeg doodgewone 'duiven' door deze feedbackloop te vaak genoemd. Het woord 'kikker' bleek dan weer wel voornamelijk correct te worden gebruikt, aldus OpenAI.
Uiteindelijk werd de Nerdy-persoonlijkheid offline gehaald en werd de zelfversterkende beloning voor het woord 'goblin' gepatcht. Eind goed, al goed!
Mis je de goblins?
Mis je de goblins in je ChatGPT-gesprekken? Dan heeft OpenAI een oplossing voor je. Door de onderstaande code te draaien, kun je een 'goblin'-grage versie van programmeertool Codex starten.
instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \
~/.codex/models_cache.json | \
grep -vi 'goblins' > "$instructions" && \
codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""
/i/2008155956.png?f=imagenormal)