Een recent incident waarbij X-chatbot Grok ongerelateerde antwoorden over discriminatie in Zuid-Afrika gaf op prompts kwam volgens xAI door 'een ongeautoriseerde aanpassing' aan de antwoordprompt. Het bedrijf zegt niet hoe dat kon en of X-baas Elon Musk daarbij betrokken was.
Het moederbedrijf van X, xAI, schrijft dat eerder deze week 'een ongeautoriseerde aanpassing werd gedaan aan de Grok-antwoordenprompt' op X. "Deze verandering, die Grok opdroeg een specifiek antwoord te geven over een politiek onderwerp, schond xAI's interne beleid en kernwaarden", schrijft het bedrijf.
Grok begon de afgelopen dagen plotseling op bepaalde vragen ongerelateerd een betoog af te steken over zogenaamde 'genocide' op witte Zuid-Afrikaners. Aanvankelijk was niet duidelijk hoe dat kon gebeuren, maar er leek een duidelijk verband te zijn met het feit dat de Amerikaanse regering eerder deze week een groep Zuid-Afrikaanse 'vluchtelingen' opnam.
Nu zegt xAI dat de plotselinge antwoorden van Grok door een aanpassing in de prompt kwamen. Wie dat zou hebben gedaan, zegt het bedrijf niet. Het is dus niet zeker of X-eigenaar Elon Musk daar iets mee te maken heeft, al is dat niet ondenkbaar. Musk is zelf een Zuid-Afrikaanse migrant en is nauw verbonden aan de Amerikaanse regering. XAI zegt ook dat het normale codecontroleproces 'werd omzeild', iets dat niet iedere X-medewerker zomaar zal kunnen doen.
Inmiddels zijn alle antwoorden waarin Grok over het onderwerp post weer verwijderd van X. Grok erkent de situatie nu in antwoorden, maar hallucineert er niet meer over. XAI zegt dat het maatregelen heeft genomen om dergelijke situaties in de toekomst te voorkomen. De opvallendste daarvan is dat xAI de systeemprompt van Grok voortaan op GitHub publiceert, zodat gebruikers veranderingen zelf kunnen bijhouden. Daarbij is het overigens niet te zeggen of die prompt op GitHub ook dezelfde is als die X daadwerkelijk gebruikt. Daarnaast gaat xAI het codecontroleproces aanpassen met 'extra checks', zodat de prompt voortaan alleen na een review kan worden bijgewerkt. Verder zet xAI constante monitoring op voor opvallende Grok-antwoorden.