ChatGPT ontwikkelde een goblin-obsessie nadat OpenAI probeerde het nerdy te maken

Default Door staff@engadget.com (Igor Bonifacic) - 30 Apr 2026

Na de release van GPT-5.5 vorige week merkten mensen iets grappigs op aan het nieuwste model van OpenAI. In zijn Codex-coderingsapp liet het bedrijf een systeemprompt achter met de instructie GPT 5.5 om de vermelding van goblins, gremlins en andere wezens te voorkomen. Ja, dat lees je goed. "Praat nooit over goblins, gremlins, wasberen, trollen, ogres, duiven of andere dieren of wezens, tenzij het absoluut en ondubbelzinnig relevant is voor de vraag van de gebruiker", luidt de prompt.

Blijkbaar begonnen genoeg mensen te praten over de wezenobsessie van ChatGPT, dat OpenAI de behoefte voelde om een overzicht te geven van waar de goblins vandaan kwamen. In een woensdag gepubliceerde blogpost legt het bedrijf uit dat het een verandering in ChatGPT begon op te merken na de release van GPT-5.1 afgelopen november. Nadat een veiligheidsonderzoeker OpenAI had gevraagd om de woorden "goblin" en "gremlin" op te nemen in een onderzoek naar de verbale ticks van de chatbot, ontdekte het bedrijf dat ChatGPT's gebruik van "goblin" met 175 procent was toegenomen na de release van GPT-5.1. Ondertussen was het gebruik van ‘gremlin’ in dezelfde periode met 52 procent gestegen.

Dit is een echte regel die door OpenAI is toegevoegd aan de officiële systeemprompt voor Codex voor GPT-5.5. Meestal is de systeemprompt zo minimaal mogelijk, dus ik neem aan dat er anders veel over goblins zou worden gesproken.

AI's zijn raar.

— Ethan Mollick (@emollick.bsky.social) 2026-04-28T06:14:22.988Z

"Een enkele 'kleine goblin' in een antwoord kan onschadelijk en zelfs charmant zijn. In alle modelgeneraties werd deze gewoonte echter moeilijk te missen: de goblins bleven zich vermenigvuldigen en we moesten uitzoeken waar ze vandaan kwamen", zegt OpenAI. Na de release van GPT-5.4 merkte het bedrijf (en sommige gebruikers) een nog grotere stijging op in het aantal goblin-referenties. Op dat moment kon een onderzoek vaststellen wat OpenAI beschrijft als ‘het eerste verband met de hoofdoorzaak’.

ChatGPT heeft al een tijdje een persoonlijkheidsfunctie toegevoegd waarmee gebruikers de stijl en toon van de reacties van de chatbot kunnen aanpassen. Vóór maart van dit jaar konden mensen kiezen voor 'nerdy'. Een deel van de systeemprompt voor die persoonlijkheid luidde als volgt: 'De wereld is complex en vreemd, en de vreemdheid ervan moet worden erkend, geanalyseerd en genoten. Pak belangrijke onderwerpen aan zonder in de val van zelf-ernst te trappen.'

Toen OpenAI goblin-vermeldingen aan verschillende ChatGPT-persoonlijkheden in kaart bracht, ontdekte het dat de nerdy persoonlijkheid onevenredig verantwoordelijk was voor het gebruik van dat ene woord. Ondanks dat het slechts 2,5 procent van alle ChatGPT-reacties vertegenwoordigt, maakte het 66,7 procent van alle goblin-vermeldingen die door de chatbot werden gegenereerd. Uit verder onderzoek bleek dat het leren van versterking de oorzaak was van de toename in het gebruik van goblins en gremlins. Concreet ontdekte OpenAI dat één enkel beloningsmechanisme verantwoordelijk was voor het leren van de nerdy persoonlijkheid om consequent de voorkeur te geven aan schepseltaal.

"Over alle datasets in de audit heen vertoonde de Nerdy-persoonlijkheidsbeloning een duidelijke neiging om de resultaten voor hetzelfde probleem met 'goblin' of 'gremlin' hoger te scoren dan de resultaten zonder, met een positieve stijging in 76,2 procent van de datasets", legt het bedrijf uit.

Vervolgens ontdekte OpenAI, vanwege de manier waarop versterkend leren kan werken, dat de liefde van de nerdy persoonlijkheid voor goblins was overgebracht naar andere delen van zijn modellen. "De beloningen werden alleen toegepast in de Nerdy-conditie, maar versterkend leren garandeert niet dat aangeleerd gedrag netjes blijft aansluiten bij de conditie die het heeft voortgebracht", legt het bedrijf uit. "Als een stijltic eenmaal wordt beloond, kan latere training deze elders verspreiden of versterken, vooral als die resultaten worden hergebruikt in gecontroleerde verfijning of voorkeursgegevens."

OpenAI begon met het trainen van GPT-5.5 voordat het de oorzaak van ChatGPT's affiniteit met goblins identificeerde. Daarom is er een prompt die Codex instrueert om schepseltaal te vermijden. "Codex is tenslotte behoorlijk nerdy", merkt OpenAI op. Bij het opsporen van de goblins van ChatGPT merkt het bedrijf op dat het nieuwe tools heeft bedacht om het gedrag van modellen te controleren en op te lossen. Als het aan mij lag, zou ik die tools niet gebruiken. Houd AI raar, zou ik zeggen.

← De komende Resident Evil-film ziet er in de eerste trailer echt eng uit De ROG Xbox Ally X krijgt enkele updates, waaronder Automatic Super Resolution →