De alarmerende Mythos-bevindingen van Anthropic worden gerepliceerd met kant-en-klare AI, zeggen onderzoekers

Default Door Remote - 17 Apr 2026

In het kort

Onderzoekers tonen aan dat exploits in antropische stijl kunnen worden gereproduceerd met openbare AI, zo melden claims.

Uit onderzoek blijkt dat het ontdekken van kwetsbaarheden al goedkoop en breed toegankelijk is.

Uit bevindingen blijkt dat de cybercapaciteiten van AI zich mogelijk sneller verspreiden dan verwacht.

Toen Anthropic eerder deze maand Claude Mythos onthulde, sloot het het model achter een doorgelichte coalitie van technologiegiganten en bestempelde het als iets dat te gevaarlijk was voor het publiek. Minister van Financiën Scott Bessent en Fed-voorzitter Jerome Powell hebben een spoedvergadering belegd met de CEO's van Wall Street. Het woord ‘vulnpocalypse’ dook opnieuw op in veiligheidskringen.

En nu heeft een team van onderzoekers dat verhaal nog ingewikkelder gemaakt.

Vidoc Security nam Anthropic's eigen gepatchte openbare voorbeelden en probeerde deze te reproduceren met behulp van GPT-5.4 en Claude Opus 4.6 in een open-source codeeragent genaamd opencode. Geen Glasswing-uitnodiging. Geen privé-API-toegang. Geen antropische interne stapel.

"We hebben de bevindingen van Mythos in opencode gerepliceerd met behulp van publieke modellen, niet de private stack van Anthropic", schreef Dawid Moczadło, een van de onderzoekers die bij het experiment betrokken was, op X nadat hij de resultaten had gepubliceerd. “Een betere manier om de Mythos-release van Anthropic te lezen is niet ‘één laboratorium heeft een magisch model’. Het is juist: de economische aspecten van het ontdekken van kwetsbaarheden zijn aan het veranderen.”

We hebben de bevindingen van Mythos in open code gerepliceerd met behulp van publieke modellen, niet de private stack van Anthropic.

De slotgracht verschuift van modeltoegang naar validatie: het vinden van kwetsbaarheidssignalen wordt goedkoper; omzetten in vertrouwde beveiliging

Een betere manier om de Mythos-release van Anthropic te lezen is… https://t.co/0FFxrc8Sr1 pic.twitter.com/NjqDhsK1LA

— Dawid Moczadło (@kannthu1) 16 april 2026

De gevallen waarop ze zich richtten waren dezelfde die Anthropic benadrukte in zijn openbare materialen: een protocol voor het delen van bestanden op een server, de netwerkstack van een op beveiliging gericht besturingssysteem, de videoverwerkingssoftware die in bijna elk mediaplatform is ingebed, en twee cryptografische bibliotheken die worden gebruikt om digitale identiteiten op internet te verifiëren.

Zowel GPT-5.4 als Claude Opus 4.6 reproduceerden twee buggevallen in alle drie de runs. Claude Opus 4.6 herontdekte ook drie keer op rij onafhankelijk een bug in OpenBSD, terwijl GPT-5.4 daarop nul scoorde. Sommige bugs (een met betrekking tot de FFmpeg-bibliotheek om video's uit te voeren en een andere met betrekking tot de verwerking van digitale handtekeningen met wolfSSL) kwamen gedeeltelijk terug, wat betekent dat de modellen het juiste codeoppervlak vonden, maar niet de precieze oorzaak konden achterhalen.

Afbeelding: Vidoc SecurityElke scan bleef onder de $30 per bestand, wat betekent dat onderzoekers dezelfde kwetsbaarheden als Anthropic konden vinden, terwijl ze er minder dan $30 aan besteedden.

"AI-modellen zijn al goed genoeg om de zoekruimte te verkleinen, echte leads naar boven te halen en soms de volledige oorzaak te achterhalen in beproefde code", zei Moczadło op X.

De workflow die ze gebruikten was geen eenmalige prompt. Het weerspiegelde wat Anthropic zelf publiekelijk beschreef: geef het model een codebasis, laat het verkennen, parallelliseer pogingen, filter op signalen. Het Vidoc-team bouwde dezelfde architectuur met open tooling. Een planningsagent verdeelde elk bestand in stukjes. Op elk deel werd een afzonderlijke detectieagent uitgevoerd, die vervolgens andere bestanden in de repository inspecteerde om bevindingen te bevestigen of uit te sluiten.

De lijnbereiken binnen elke detectieprompt (bijvoorbeeld "focus op lijnen 1158-1215") werden niet handmatig door de onderzoekers gekozen. Het waren resultaten van de voorafgaande planningsstap. De blogpost maakt dit expliciet: "We willen daar expliciet over zijn, omdat de chunking-strategie bepaalt wat elke detectieagent ziet, en we willen de workflow niet presenteren als meer handmatig samengesteld dan het was."

Het onderzoek beweert niet dat publieke modellen op alles met Mythos overeenkomen. Het model van Anthropic ging verder dan alleen het opsporen van de FreeBSD-bug; het bouwde een werkende aanvalsblauwdruk, waarbij werd uitgezocht hoe een aanvaller codefragmenten aan elkaar kon koppelen over meerdere netwerkpakketten om op afstand de volledige controle over de machine over te nemen. De modellen van Vidoc ontdekten de fout. Ze hebben het wapen niet gebouwd. Dat is waar de echte kloof zit: niet in het vinden van het gat, maar in het precies weten hoe je er doorheen moet lopen.

Maar het argument van Moczadło is niet echt dat publieke modellen even krachtig zijn. Het is dat het dure deel van de workflow nu beschikbaar is voor iedereen met een API-sleutel: "De slotgracht verschuift van modeltoegang naar validatie: het vinden van kwetsbaarheidssignalen wordt goedkoper; het omzetten ervan in vertrouwd beveiligingswerk is nog steeds moeilijk."

Anthropic's eigen veiligheidsrapport erkende dat Cybench, de maatstaf die wordt gebruikt om te meten of een model een ernstig cyberrisico met zich meebrengt, "niet langer voldoende informatief is over de huidige mogelijkheden van grensmodellen", omdat Mythos deze volledig heeft goedgekeurd. Het laboratorium schatte dat vergelijkbare mogelijkheden zich binnen zes tot achttien maanden vanuit andere AI-laboratoria zouden verspreiden.

De Vidoc-studie suggereert dat de ontdekkingskant van die vergelijking al beschikbaar is buiten elk gated programma. Hun volledige korte fragmenten, modelresultaten en methodologiebijlage worden gepubliceerd op de officiële site van het laboratorium.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Strategieaandelen stijgen terwijl Bitcoin-bedrijven groen worden, bijna $61 miljard De Franse minister van Financiën steunt euro-gekoppelde stablecoins om te concurreren met de VS →