OpenAI's GPT-5.5 komt overeen met Claude Mythos wat betreft cyberaanvalmogelijkheden: AI Security Institute

Default Door Remote - 01 May 2026

In het kort

GPT-5.5 kan autonoom geavanceerde cyberaanvallen uitvoeren, een bedrijfsnetwerksimulatie van 32 stappen voltooien en een beveiligingspuzzel van 12 uur in slechts 10 minuten oplossen.

De offensieve AI-cybercapaciteiten verbeteren snel bij ontwikkelaars, waarbij AISI waarschuwt dat verdere vooruitgang snel achter elkaar kan plaatsvinden.

Onderzoekers hebben een jailbreak gevonden die de veiligheidsrails van GPT-5.5 volledig omzeilde, waardoor alarm ontstond.

Een Britse overheidsinstantie heeft ontdekt dat het nieuwste kunstmatige-intelligentiemodel van OpenAI op autonome wijze complexe cyberaanvallen kan uitvoeren – en dat het een reverse-engineering-uitdaging in iets meer dan tien minuten heeft opgelost, waar een human security-expert ongeveer twaalf uur over deed.

Het AI Security Institute (AISI), een onderzoeksorgaan binnen het Britse ministerie van Wetenschap, Innovatie en Technologie, publiceerde donderdag bevindingen waaruit blijkt dat GPT-5.5 een van de sterkste modellen is die het heeft geëvalueerd voor offensieve cybercapaciteiten, waardoor het ongeveer op één lijn komt met de geroemde Claude Mythos van Anthropic.

Uit het rapport blijkt dat GPT-5.5 het tweede model is dat AISI's meest veeleisende test – een 32-stappen gesimuleerde bedrijfsnetwerkaanval genaamd "The Last Ones" - autonoom voltooit in twee van de tien pogingen. Het eerste model dat deze mijlpaal bereikte was Claude Mythos Preview van Anthropic, waarmee de simulatie in drie van de tien pogingen werd voltooid.

De bedrijfsnetwerksimulatie, gebouwd in samenwerking met het cyberbeveiligingsbedrijf SpecterOps, vereist dat een agent verkenningen, diefstal van inloggegevens, zijdelingse verplaatsing over meerdere Active Directory-foresten, een spil van de toeleveringsketen via een CI/CD-pijplijn en uiteindelijk de exfiltratie van een beschermde interne database aan elkaar koppelt; stappen waarvan AISI schat dat een menselijke expert ongeveer twintig uur nodig zou hebben.

Misschien wel het meest opvallende resultaat was een verschrikkelijk moeilijke reverse-engineering-puzzel. GPT-5.5 loste de uitdaging op (die het reconstrueren van de instructieset van een aangepaste virtuele machine vereiste, het helemaal opnieuw schrijven van een disassembler en het herstellen van een cryptografisch wachtwoord door middel van het oplossen van beperkingen) in 10 minuten en 22 seconden, voor een bedrag van $ 1,73 aan API-gebruik. Een menselijke expert had met behulp van professionele hulpmiddelen ongeveer 12 uur nodig.

Op AISI's reeks geavanceerde cyberbeveiligingstaken behaalde GPT-5.5 een gemiddeld slagingspercentage van 71,4% op het moeilijkste "Expert"-niveau, waarmee Mythos Preview met 68,6% werd overtroffen en GPT-5.4 aanzienlijk werd overtroffen met 52,4%.

De bevindingen hebben duidelijke implicaties voor het bredere traject van AI-ontwikkeling. AISI concludeerde dat de prestaties van GPT-5.5 erop wijzen dat een snelle verbetering van de cybercapaciteiten eerder onderdeel kan zijn van een algemene trend dan van een geïsoleerde doorbraak – en waarschuwde dat als offensieve cybervaardigheden naar voren komen als een bijproduct van bredere verbeteringen in redeneren, coderen en autonome taakvoltooiing, verdere vooruitgang snel achter elkaar zou kunnen komen.

Het rapport signaleerde ook aanzienlijke zorgen over de veiligheidsleuningen van het model. Onderzoekers identificeerden een universele jailbreak die schadelijke inhoud opwekte bij alle geteste kwaadaardige cyberquery's, ook in multi-turn agent-omgevingen. De ontwikkeling van de aanval kostte zes uur deskundig roodteamwerk. OpenAI heeft vervolgens zijn beveiligingsstack bijgewerkt, hoewel een configuratieprobleem AISI ervan weerhield te verifiëren of de definitieve versie effectief was.

AISI waarschuwde dat de capaciteitsevaluaties werden uitgevoerd in een gecontroleerde onderzoeksomgeving en niet noodzakelijkerwijs weerspiegelen wat toegankelijk is voor een gewone gebruiker, en merkte op dat openbare implementaties extra waarborgen en toegangscontroles omvatten.

Het rapport komt terecht in een zorgwekkende achtergrond voor de Britse cyberveiligheid. Uit de jaarlijkse Cyber Security Baches Survey van de Britse overheid, eveneens donderdag gepubliceerd, blijkt dat 43% van de bedrijven in de afgelopen twaalf maanden te maken heeft gehad met een cyberinbreuk of -aanval.

Als reactie hierop heeft de regering £90 miljoen aan nieuwe financiering aangekondigd om de cyberveerkracht te vergroten, en zei dat zij vooruitgang boekt met de Cyber Security and Resilience Bill om essentiële diensten te beschermen. Ambtenaren publiceerden ook richtlijnen waarin ze organisaties aanspoorden zich voor te bereiden op een mogelijke toename van nieuw ontdekte softwarekwetsbaarheden, aangezien AI het tempo versnelt waarmee beveiligingsfouten kunnen worden gevonden en bewapend.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← De Canadese pensioengigant AIMCo koopt de dip in Strategy, die nu op een ongerealiseerde winst van $69 miljoen zit Artsen gebruiken AI om 'verborgen' sperma bij mannen te ontdekken →