Anthropic helpt de NSA China te hacken. Het wil ook dat iedereen AI pauzeert

Default Door Remote - 05 Jun 2026

In het kort

Anthropic heeft naar verluidt ongeveer een zestal ingenieurs bij de NSA ingehuurd om zijn Mythos AI-model in te zetten voor offensieve cyberoperaties – mogelijk inclusief aanvallen op netwerken in China en Iran.

Anthropic waarschuwde ook dat AI recursieve zelfverbetering nadert en riep op tot een gecoördineerd mondiaal pauzemechanisme.

Beiden kwamen binnen als Anthropic-dossiers voor een IPO die de waarde ervan boven de $ 1 biljoen zou kunnen waarderen.

Anthropic heeft ongeveer zes ingenieurs binnen de National Security Agency geplaatst om Mythos – het meest capabele AI-model – te helpen inzetten voor offensieve cyberoperaties, zo meldde de Financial Times donderdag.

De ingenieurs zijn voorwaarts ingezet personeel en passen het model aan voor specifieke toepassingen. Eén bron vertelde de FT dat het nuttig zou kunnen zijn voor het infiltreren van netwerken in landen als China en Iran.

Of deze ingenieurs betrokken zijn bij actieve operaties is niet bevestigd. Wat is: Mythos is hetzelfde model dat Anthropic niet publiekelijk wil vrijgeven, vanwege het risico op misbruik. Het bedrijf beperkte het tot doorgelichte partners via Project Glasswing, een beperkte coalitie waartoe ook Microsoft, Apple en Amazon behoren.

Anthropic klaagt ook het Pentagon aan. Eind februari bestempelde minister van Defensie Pete Hegseth het bedrijf als een risico voor de toeleveringsketen – een label dat van oudsher voorbehouden was aan buitenlandse tegenstanders als Huawei – nadat een contract ter waarde van 200 miljoen dollar was mislukt. Het knelpunt: Anthropic weigerde het Ministerie van Defensie Claude te laten gebruiken voor volledig autonome wapens of binnenlandse massabewaking. Het NSA-contract was vrijgesteld van dat verbod.

Een rechter uit Californië blokkeerde de zwarte lijst als een schijnbare vergelding uit het Eerste Amendement. Een hof van beroep in D.C. ontkende het bod van Anthropic om het stop te zetten terwijl de rechtszaak loopt. Volgens de berichtgeving van de FT bleef de NSA Mythos de hele tijd gebruiken.

Hoe je AI kunt stoppen die AI bouwt

Op dezelfde dag dat het NSA-verhaal naar buiten kwam, publiceerde het interne onderzoeksinstituut van Anthropic 'When AI Builds Itself', een blik op hoe ver Claude is gekomen in het automatiseren van zijn eigen ontwikkeling. Daarin pleit het bedrijf in wezen voor een mondiaal moratorium op de AI-wapenwedloop – en vergelijkt het dit zelfs met nucleaire verdragen uit de Koude Oorlog tussen de Verenigde Staten en Rusland.

Om te begrijpen waarom, gaf het bedrijf dit stukje context:

Claude schrijft nu meer dan 80% van de code die is samengevoegd in de productiecodebasis van Anthropic – een stijging ten opzichte van de lage enkele cijfers voordat Claude Code begin 2025 werd gelanceerd. Ingenieurs verzenden ongeveer acht keer zoveel code per dag als in 2024.

De auteurs van het rapport – Marina Favaro, hoofd van het Anthropic Institute en mede-oprichter Jack Clark – beweren dat dit traject afstevent op wat zij recursieve zelfverbetering noemen: AI-systemen die autonoom hun eigen opvolgers ontwerpen, bouwen en trainen, waarbij de mens bij elke stap een steeds kleinere rol speelt.

In een visuele weergave laten de onderzoekers een tijdlijn zien waarin de eerste manier om AI op het werk te gebruiken, is dat mensen de computer ertoe aanzetten een resultaat te behalen, waarbij toenemende automatiseringen eindigen in AI-agenten die subagenten aanzetten totdat het resultaat is bereikt, zonder dat er mensen bij betrokken zijn.

Het scherpste datapunt dat ze aanhalen: in april kregen Claude-agenten een openlijk AI-veiligheidsprobleem voorgelegd – of een zwakker model op betrouwbare wijze toezicht kan houden op een sterker model – en mochten ze het oplossen. Twee menselijke onderzoekers hebben in ongeveer een week tijd 23% van de prestatiekloof tussen de modellen hersteld. De agenten herstelden 97%, meer dan 800 cumulatieve rekenuren. De mens heeft de vraag gesteld. De agenten ontwierpen elk experiment. Het is het eerste gepubliceerde geval waarin Claude onderzoeksoordeel uitoefent, en niet alleen taken uitvoert die iemand anders heeft gespecificeerd.

Dat is de grens waar Anthropic zich zorgen over maakt. Zodra AI kiest welke experimenten de moeite waard zijn om uit te voeren – en ze niet alleen maar uit te voeren – verliezen mensen de laatste betekenisvolle rol in de ontwikkelingscyclus. Kleine afwijkingen die zichtbaar zijn in de huidige modellen kunnen zich over generaties heen verergeren totdat niemand ze kan corrigeren.

Hun voorgestelde oplossing is een verifieerbare mondiale pauze: meerdere grenslaboratoria stoppen tegelijkertijd, met onafhankelijke verificatie dat iedereen daadwerkelijk is gestopt. Anthropic zei dat het zich bij één zou aansluiten. Ze erkennen dat een eenzijdige vertraging de leiding overdraagt aan degene die doorgaat.

We hebben deze film eerder gezien. De laboratoria die AI bouwen, zijn dezelfde die waarschuwen hoe gevaarlijk AI is. AI is echter de meest winstgevende onderneming van het decennium, dus niemand wil stoppen – zelfs niet degenen die waarschuwen voor AI.

In 2023 ondertekenden meer dan honderd grote namen in de AI-onderzoeksgemeenschap een open brief waarin werd gevraagd om een wereldwijde inspanning om het risico van uitsterven dat de ontwikkeling van AI intrinsiek met zich meebrengt, te verkleinen. Een paar maanden daarvoor eiste een andere open brief dat OpenAI de voortgang op ChatGPT zou onderbreken vanwege het gevaarlijke karakter ervan.

Niemand stopte na de open brief van 2023. OpenAI deed dat niet. Antropisch deed dat niet. De deadline van het Pentagon om Claude uit zijn systemen te verwijderen valt in augustus, rond dezelfde tijd dat de beursgang van Anthropic naar verwachting zijn financiën onder de publieke aandacht zal brengen.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Zcash-crash heeft zojuist miljarden van de marktkapitalisatie van de privacymunt weggevaagd: kan ZEC herstellen? Bitcoin-beren worden geconfronteerd met een val van $2,6 miljard nu de financieringsrente van BTC daalt: is er sprake van een short squeeze? →