Antropische terugtrekkingen op beleid dat het werk van onderzoekers 'saboteerd'

Default Door staff@engadget.com (Steve Dent) - 11 Jun 2026

Anthropic loopt terug op een beleid dat onderzoekers op discrete wijze hinderde bij het gebruik van de nieuwe Claude Fable 5 LLM om concurrerende AI-modellen te creëren, vertelde het bedrijf aan Wired. "We veranderen de waarborgen van Fable 5 voor grensverleggende LLM-ontwikkeling om ze zichtbaar te maken", aldus het bedrijf in een verklaring. "We hebben de verkeerde afweging gemaakt en we verontschuldigen ons voor het feit dat we de balans niet goed hebben gevonden."

Toen Anthropic Claude Fable 5 uitbracht, een nieuw model gebaseerd op het krachtige Mythos-systeem, merkten onderzoekers iets vreemds op. Ze ontdekten dat Fable 5 verzoeken stilletjes zou omleiden naar een minder model wanneer hen werd gevraagd bepaalde acties uit te voeren. Bovendien werd die beperking niet vermeld in de documentatie van het model.

Het nieuwe model weigerde of degradeerde reacties op taken als het trainen van concurrerende LLM's, het debuggen van AI-code en het optimaliseren van de neurale architectuur. Onderzoekers hadden niet alleen last van die degradatie, maar ook van het gebrek aan transparantie daarover van Anthropic. Ze waren natuurlijk ook bezorgd dat ze tokens en geld hadden verbrand voor een model dat niet deed wat ze verwachtten.

Anthropic heeft zichzelf afgeschilderd als een meer ethisch en onderzoeksvriendelijker alternatief voor OpenAI, dus hun acties met Fable 5 zorgden voor een snelle terugslag. "Het verlagen van de prestaties op het gebied van ML-onderzoek *zonder de gebruiker hiervan op de hoogte te stellen* is schokkend vijandig en ziet er vreselijk uit", zegt onderzoekscollega en Substack-auteur Dean W. Ball over X.

Anthropic draait zijn beveiligingsbeleid op Fable 5 niet terug, maar maakt de beperkingen eerder zichtbaar voor gebruikers. "Als het bedrijf vermoedt dat een gebruiker Claude probeert te gebruiken om een zeer capabele AI te bouwen, zal het hen waarschuwen dat het het verzoek weigert of de gebruiker omleidt naar een minder capabel model", schreef Wired.

← YouTube breidt direct messaging uit naar de VS Framework vertraagt leveringen van Laptop 13 Pro met een maand →