Live News

Gedecentraliseerd financieel protocol Aave heeft maandag in New York een noodmotie ingediend om een ​​straatverbod van een Amerikaans advocatenkant...

Western Union heeft zijn in Amerikaanse dollars luidende USDPT stablecoin op Solana gelanceerd, waarmee het de eerste stap markeert naar op blockch...

Belangrijkste afhaalrestaurants: De verbeterde winstgevendheid van Bitcoin-mining en de enorme instroom van ETF's hebben de vrees van investeerders...

05/05/26

Volg ons:

Iemand heeft een open source ‘theoretische mythos’ gebouwd om de gevaarlijkste AI van Anthropic te reverse-engineeren

Iemand heeft een open source ‘theoretische mythos’ gebouwd om de gevaarlijkste AI van Anthropic te reverse-engineeren
Default Door Remote - 04 May 2026
In het kort

OpenMythos is een reconstructie van de grond af aan van de Claude Mythos-architectuur, uitsluitend opgebouwd op basis van openbare onderzoekspapers en onderbouwde gissingen.

Claude Mythos is het krachtigste model van Anthropic, opgesloten in Project Glasswing omdat het autonoom 271 Firefox-kwetsbaarheden en netwerkaanvallen in 32 stappen heeft gevonden.

De repository is een theoretische steiger: code zonder getrainde gewichten. Het weerspiegelt een afzonderlijke inspanning van Vidoc Security die de kwetsbaarheidsbevindingen van Mythos reproduceerde met behulp van kant-en-klare modellen.

Als Anthropic je niet wil laten zien wat er in de gevaarlijkste AI zit, zal iemand op GitHub het raden.

Een ontwikkelaar genaamd Kye Gomez heeft OpenMythos gepubliceerd, een open-source reconstructie van hoe hij denkt dat Claude Mythos er onder de motorkap uitziet. De repository heeft binnen een paar weken na de release ruim 10.000 GitHub-sterren verzameld en wordt geleverd met een uitgebreid ‘readme’-bestand vol vergelijkingen, citaten en een beleefde disclaimer dat het niets met Anthropic te maken heeft.

Het is speculatie. Maar het is gestructureerde speculatie, in code.

Hier is een snelle opfrisser over wat Mythos is: Mythos lekte eind maart in de publieke opinie, toen Anthropic per ongeluk conceptmateriaal publiceerde waarin het werd beschreven als het meest capabele model van het bedrijf tot nu toe – een niveau boven Opus. Het vervolg, Mythos Preview, bleek onlosmakelijk goed op het gebied van cybersecurity.

Volgens Anthropic heeft Mythos tijdens Mozilla-tests 271 kwetsbaarheden in Firefox gevonden. Het werd het eerste AI-model dat een 32-staps aanvalssimulatie op bedrijfsnetwerken voltooide. Anthropic sloot het op in Project Glasswing, een doorgelichte coalitie van ongeveer veertig partners, waaronder Microsoft, Apple, Amazon en de NSA.

Het publiek mag er nooit aan komen. Dus Gomez probeerde erachter te komen hoe het werkt.

De centrale inschatting van OpenMythos is dat Mythos een Recurrent-Depth Transformer is, ook wel een lustransformator genoemd. Standaardmodellen stapelen honderden unieke lagen. Lusmodellen nemen een kleinere stapel en voeren deze vele malen per voorwaartse doorgang door.

Met andere woorden, het zijn dezelfde gewichten die meer iteraties ondergaan. Dieper nadenken, in een continue latente ruimte, voordat er een token wordt uitgezonden.

Het repo beweert dat dit de twee vreemdste eigenschappen van Mythos zou verklaren: het redeneert via nieuwe problemen die geen enkel ander model kan kraken, maar de ruwe memorisatie ervan is ongelijkmatig. Dat is de architectonische vingerafdruk van looping: compositie boven opslag.

OpenMythos citeert Parcae, een artikel uit april 2026 van de Universiteit van Californië in San Diego en Together AI dat het al lang bestaande instabiliteitsprobleem in lusmodellen oploste: een Parcae-model met 770 miljoen parameters komt qua kwaliteit overeen met een transformator met een vaste diepte van 1,3 miljard, met voorspelbare schaalwetten voor het aantal lussen dat moet worden uitgevoerd. De repository leent ook de Multi-Latent Attention van DeepSeek om het geheugen te comprimeren, en een Mixture-of-Experts-opstelling om de breedte van domeinen te kunnen verwerken.

Wat het niet heeft, zijn gewichten, dus eigenlijk is het een techniek zonder uitvoerder.

OpenMythos is theoretisch. De code definieert modelvarianten van 1 miljard tot 1 biljoen parameters, maar je moet ze zelf trainen. Het leesmij-bestand verwijst naar een trainingsscript voor 3 miljard parameters op FineWeb-Edu en een door Chinchilla aangepast doel van 30 miljard tokens, het soort rekenrekening dat op H100s in de honderdduizenden dollars kan oplopen. Niemand heeft het nog gedaan.

Dus waarom maakt het uit?

Omdat het de tweede keer in een maand is dat iemand de muur rond Mythos kapot maakt. De eerste was een onderzoek van Vidoc Security, waarin een aantal van de meest alarmerende kwetsbaarheidsbevindingen van Mythos werd gereproduceerd met behulp van GPT-5.4 en Claude Opus 4.6 in een open source-agent. Geen Glasswing-toegang en voor minder dan $ 30 per scan. Andere invalshoek, dezelfde conclusie: de gracht rond Mythos kan dunner zijn dan de marketing suggereerde.

OpenMythos en de Vidoc-replicatie doen verschillende taken. Vidoc reproduceerde de uitkomsten van Mythos (de ontdekkingen van de kwetsbaarheid zelf) met behulp van bestaande modellen. OpenMythos probeert de architectuur te reproduceren: de daadwerkelijke machine die deze output produceert. Eén zegt dat je Mythos niet nodig hebt om de bugs te vinden die Mythos heeft gevonden. De ander zegt dat je uiteindelijk misschien zelf zoiets als Mythos kunt bouwen.

Anthropic deelt de architecturale inschattingen van Gomez vrijwel zeker niet publiekelijk, en verschillende ontwerpkeuzes in OpenMythos zijn expliciete hekken; het leesmij-bestand zorgt ervoor dat het vaag genoeg is, zodat gebruikers weten dat dit slechts een benadering is. Er staat herhaaldelijk 'waarschijnlijk', 'verdacht' en 'vrijwel zeker'. Real Mythos is misschien helemaal geen lustransformator. Of het kan er een zijn met details die Gomez nog niet heeft reverse-engineered.

Wat OpenMythos aantoont is dat de onderzoeksliteratuur de meeste stukken al bevat. Lustransformatoren, mix van deskundigen, multi-latente aandacht, adaptieve rekentijd, de stabiliteitsoplossing van Parcae: niets daarvan is eigendom van het bedrijf. De repository is vooral een inventaris van wat publiekelijk bekend is over het bouwen van een Mythos-klassemodel.

De repo heeft een MIT-licentie en heeft al 2.700 forks. Het trainingsscript ligt daar te wachten tot iemand met een GPU-cluster en een scriptie het bewijs levert.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!