Default
Door Remote - 13 Jun 2026
De Amerikaanse regering heeft Anthropic vrijdag opgedragen om de toegang tot twee van zijn krachtigste AI-modellen – Claude Fable 5 en Claude Mythos 5 – onmiddellijk af te sluiten, vanwege bezorgdheid over de nationale veiligheid. Anthropic maakte op X bekend hieraan te hebben voldaan, maar maakte duidelijk dat het denkt dat de regering het bij het verkeerde eind heeft gehad.
De richtlijn, die Anthropic naar eigen zeggen vrijdag om 17.21 uur ET heeft ontvangen, dwingt het bedrijf om beide modellen uit te schakelen voor alle gebruikers wereldwijd – en niet alleen voor de buitenlanders waar het exportcontrolebevel van de regering nominaal op gericht was. De toegang tot de andere modellen van Anthropic wordt niet beïnvloed.
Waarom is dit allemaal van belang? Mythos is het meest capabele AI-model van Anthropic, een model waar het bedrijf begin april een preview van heeft gegeven en dat sindsdien streng aan banden is gelegd vanwege wat Anthropic omschreef als zijn uitzonderlijke vermogen om beveiligingskwetsbaarheden in software te vinden. Volgens Anthropic identificeerde Mythos fouten in elk groot besturingssysteem en elke webbrowser die het testte. In plaats van het breed uit te brengen, lanceerde het bedrijf een gecontroleerd programma genaamd Project Glasswing, dat het deelde met ongeveer 50 doorgelichte organisaties, waaronder Amazon, Apple, Google, Microsoft en CrowdStrike, om te gebruiken voor defensief cyberbeveiligingswerk.
Fable 5, slechts drie dagen geleden uitgebracht, was het antwoord van Anthropic op de voor de hand liggende commerciële druk: een versie van Mythos uitgerust met vangrails die reacties op risicovolle gebieden zoals cybersecurity en biologie blokkeren, waardoor deze veilig genoeg is voor algemene release, betoogde het bedrijf. Het was meteen het meest capabele AI-model dat beschikbaar was voor het publiek, volgens benchmarktests van Vals AI, een bedrijf dat de technische prestaties van AI bijhoudt.
Beeldcredits: Vals AI /
De richtlijn van de regering is opgevat als een exportcontrolemaatregel, waardoor de toegang van buitenlanders tot de modellen wordt beperkt. Maar in een lange blogpost zegt Anthropic te begrijpen dat de onderliggende zorg een geclaimde jailbreak van Fable 5 is. Tot nu toe heeft de overheid alleen mondeling bewijs geleverd van een “potentiële smalle, niet-universele jailbreak” – een die, zoals Anthropic het beschrijft, neerkomt op het aanzetten van het model om een specifieke codebase te lezen en softwarefouten te identificeren. En trouwens, zo voegt het bedrijf toe, het is een ‘capaciteitsniveau’ dat al algemeen beschikbaar is in andere publiek toegankelijke modellen, waaronder OpenAI’s GPT-5.5. Het wordt ook routinematig gebruikt door cybersecurityprofessionals voor defensieve doeleinden, zegt Anthropic.
Het bredere argument van Anthropic is dat de sterkste waarborgen werken via onafhankelijke classificatiesystemen die los van het model zelf functioneren, wat betekent dat zelfs als iemand Fable ervan overtuigt om voorbij een weigering te blijven praten, de onderliggende bescherming tegen de gevaarlijkste uitkomsten van kracht blijft.
Het is duidelijk dat niets van dat alles genoeg was om de regering ervan te weerhouden actie te ondernemen, en Anthropic verbergt haar frustratie niet. “Wij zijn het er niet mee eens dat de vondst van een beperkte potentiële jailbreak reden zou moeten zijn om een commercieel model in herinnering te roepen dat voor honderden miljoenen mensen wordt ingezet”, schreef het bedrijf. “Als deze standaard in de hele sector zou worden toegepast, denken we dat dit in wezen alle nieuwe modelimplementaties voor alle aanbieders van grensmodellen zou stopzetten.”
Er wordt algemeen verwacht dat Anthropic dit jaar een beursintroductie zal nastreven en een groot deel van zijn publieke identiteit heeft ingezet om het veiligheidsbewuste alternatief voor zijn rivalen te zijn. De ironie zal de waarnemers niet ontgaan dat juist de voorzichtigheid die Anthropic aan de dag heeft gelegd bij het beperken van Mythos – dat het promootte als een model dat zo gevaarlijk was dat het niet publiekelijk kon worden vrijgegeven – nu blijkbaar precies het soort toezicht van de overheid heeft aangetrokken dat zijn activiteiten het meest zou kunnen ontwrichten.
Sam Altman van OpenAI zal hier in ieder geval van genieten. In april vertelde hij podcaster Ashlee Vance dat de manier waarop Anthropic met Mythos omging neerkwam op ‘op angst gebaseerde marketing’. "Het is duidelijk ongelooflijke marketing om te zeggen: 'We hebben een bom gebouwd. We stonden op het punt hem op je hoofd te laten vallen. We zullen je een schuilkelder verkopen voor $ 100 miljoen'", zei Altman. Altman, wiens bedrijf ook naar verwachting zo snel mogelijk een beursintroductie zal nastreven, voorspelde geen sluiting van de overheid, maar hij identificeerde iets dat Anthropic voorlopig heeft gehinderd, namelijk dat wanneer je maandenlang de wereld vertelt dat je AI uniek gevaarlijk is, de wereld – inclusief de Amerikaanse overheid – de neiging heeft om te luisteren.
De richtlijn, die Anthropic naar eigen zeggen vrijdag om 17.21 uur ET heeft ontvangen, dwingt het bedrijf om beide modellen uit te schakelen voor alle gebruikers wereldwijd – en niet alleen voor de buitenlanders waar het exportcontrolebevel van de regering nominaal op gericht was. De toegang tot de andere modellen van Anthropic wordt niet beïnvloed.
Waarom is dit allemaal van belang? Mythos is het meest capabele AI-model van Anthropic, een model waar het bedrijf begin april een preview van heeft gegeven en dat sindsdien streng aan banden is gelegd vanwege wat Anthropic omschreef als zijn uitzonderlijke vermogen om beveiligingskwetsbaarheden in software te vinden. Volgens Anthropic identificeerde Mythos fouten in elk groot besturingssysteem en elke webbrowser die het testte. In plaats van het breed uit te brengen, lanceerde het bedrijf een gecontroleerd programma genaamd Project Glasswing, dat het deelde met ongeveer 50 doorgelichte organisaties, waaronder Amazon, Apple, Google, Microsoft en CrowdStrike, om te gebruiken voor defensief cyberbeveiligingswerk.
Fable 5, slechts drie dagen geleden uitgebracht, was het antwoord van Anthropic op de voor de hand liggende commerciële druk: een versie van Mythos uitgerust met vangrails die reacties op risicovolle gebieden zoals cybersecurity en biologie blokkeren, waardoor deze veilig genoeg is voor algemene release, betoogde het bedrijf. Het was meteen het meest capabele AI-model dat beschikbaar was voor het publiek, volgens benchmarktests van Vals AI, een bedrijf dat de technische prestaties van AI bijhoudt.
Beeldcredits: Vals AI /
De richtlijn van de regering is opgevat als een exportcontrolemaatregel, waardoor de toegang van buitenlanders tot de modellen wordt beperkt. Maar in een lange blogpost zegt Anthropic te begrijpen dat de onderliggende zorg een geclaimde jailbreak van Fable 5 is. Tot nu toe heeft de overheid alleen mondeling bewijs geleverd van een “potentiële smalle, niet-universele jailbreak” – een die, zoals Anthropic het beschrijft, neerkomt op het aanzetten van het model om een specifieke codebase te lezen en softwarefouten te identificeren. En trouwens, zo voegt het bedrijf toe, het is een ‘capaciteitsniveau’ dat al algemeen beschikbaar is in andere publiek toegankelijke modellen, waaronder OpenAI’s GPT-5.5. Het wordt ook routinematig gebruikt door cybersecurityprofessionals voor defensieve doeleinden, zegt Anthropic.
Het bredere argument van Anthropic is dat de sterkste waarborgen werken via onafhankelijke classificatiesystemen die los van het model zelf functioneren, wat betekent dat zelfs als iemand Fable ervan overtuigt om voorbij een weigering te blijven praten, de onderliggende bescherming tegen de gevaarlijkste uitkomsten van kracht blijft.
Het is duidelijk dat niets van dat alles genoeg was om de regering ervan te weerhouden actie te ondernemen, en Anthropic verbergt haar frustratie niet. “Wij zijn het er niet mee eens dat de vondst van een beperkte potentiële jailbreak reden zou moeten zijn om een commercieel model in herinnering te roepen dat voor honderden miljoenen mensen wordt ingezet”, schreef het bedrijf. “Als deze standaard in de hele sector zou worden toegepast, denken we dat dit in wezen alle nieuwe modelimplementaties voor alle aanbieders van grensmodellen zou stopzetten.”
Er wordt algemeen verwacht dat Anthropic dit jaar een beursintroductie zal nastreven en een groot deel van zijn publieke identiteit heeft ingezet om het veiligheidsbewuste alternatief voor zijn rivalen te zijn. De ironie zal de waarnemers niet ontgaan dat juist de voorzichtigheid die Anthropic aan de dag heeft gelegd bij het beperken van Mythos – dat het promootte als een model dat zo gevaarlijk was dat het niet publiekelijk kon worden vrijgegeven – nu blijkbaar precies het soort toezicht van de overheid heeft aangetrokken dat zijn activiteiten het meest zou kunnen ontwrichten.
Sam Altman van OpenAI zal hier in ieder geval van genieten. In april vertelde hij podcaster Ashlee Vance dat de manier waarop Anthropic met Mythos omging neerkwam op ‘op angst gebaseerde marketing’. "Het is duidelijk ongelooflijke marketing om te zeggen: 'We hebben een bom gebouwd. We stonden op het punt hem op je hoofd te laten vallen. We zullen je een schuilkelder verkopen voor $ 100 miljoen'", zei Altman. Altman, wiens bedrijf ook naar verwachting zo snel mogelijk een beursintroductie zal nastreven, voorspelde geen sluiting van de overheid, maar hij identificeerde iets dat Anthropic voorlopig heeft gehinderd, namelijk dat wanneer je maandenlang de wereld vertelt dat je AI uniek gevaarlijk is, de wereld – inclusief de Amerikaanse overheid – de neiging heeft om te luisteren.

