Maak kennis met Qwable: het gratis lokale model dat denkt als Claude Fable

Default Door Remote - 23 Jun 2026

In het kort

Qwable 27B is een volledige verfijning van Alibaba's Qwen3.6-27B, getraind op een Fable 5-stijl redeneringsdataset, ontworpen om de gestructureerde, weloverwogen denkstijl van Anthropic's nieuwste vlaggenschipmodel te repliceren.

De geablitereerde versie verwijdert het ingebouwde weigeringsgedrag van het model door de gewichten operatief te wijzigen met behulp van de cvector-generator van llama.cpp.

Beide modellen draaien lokaal, kosten niets per zoekopdracht en vereisen noch de API van Anthropic, noch het verplichte beleid ervan.

Anthropic verontschuldigde zich vorige week voor de onzichtbare waarborgen van Fable 5, en vervolgens gaf de Amerikaanse regering opdracht om het model voor alle buitenlanders in te trekken vanwege een betwiste bevinding uit een jailbreak.

Een paar dagen later uploadde een ontwikkelaar op Hugging Face een model dat de redenering van Fable gebruikte om een lokaal model te begeleiden - en nu kan zelfs je aardappel-pc een beter model draaien.

Het model heet Qwable – Qwen + Fable, als de samenvoeging niet meteen duidelijk was. Het is een volledige verfijning van Alibaba's Qwen3.6-27B-basis, gebouwd door ontwikkelaar Mia (Mia-AiLab op Hugging Face) op een dataset van redeneervoorbeelden in Fable 5-stijl. Het doel is een model met 27 miljard parameters dat draait op consumentenhardware en denkt zoals Fable 5 denkt. (Parameters bepalen de breedte van de kennis van een model, waarbij meer in het algemeen meer capabel wordt bedoeld.)

Dus ik deed iets.

Ik heb Qwen 3.6 27b getraind met Fabel 5-redenering.

De resultaten zijn... interessant.

Ik zal ze allebei naast elkaar vergelijken.

Zou iemand het interessant vinden om het te testen? Ik kan een gguf uploaden in hf. pic.twitter.com/hQCiUlT1sr

— Mia (@MiaAI_lab) 15 juni 2026

De techniek wordt instructieverfijning op traceerstijlvoorbeelden genoemd. Dat is een technische manier om te zeggen dat de ontwikkelaar voorbeelden heeft verzameld die zijn opgemaakt als de doelbewuste, stapsgewijze antwoorden van Fable 5 en Qwen heeft getraind om hetzelfde soort uitvoer te produceren.

Zie het dus als minder ‘het kopiëren van de toets’ en meer als ‘het leren van de studiegewoonten’. Een vergelijkbare aanpak was de drijvende kracht achter Qwopus – de lokale distillatie van Claude Opus 4.6 – hoewel dat project zich concentreerde op redeneersporen van gedachteketens. Qwable richt zich op de algemene instructie-volgstructuur van Fable 5: meer begeleid, meer verklarend en meer gericht op stapsgewijze taakvoltooiing dan het basis-Qwen-model waarop het is gebouwd.

Het draait in GGUF-formaat (het gecomprimeerde, gebruiksvriendelijke bestandstype dat werkt met LM Studio of llama.cpp) en past in de gekwantiseerde build van het vierde kwartaal in ongeveer 16,5 GB. Er wordt niets naar de servers van Anthropic gestuurd, wat van belang is gezien het feit dat Fable 5 verplichte gegevensretentie van 30 dagen voor al het verkeer vereiste, zelfs voor zakelijke klanten die voorheen een nulretentieovereenkomst hadden. Zelfs de huidige modellen gebruiken servers van derden om uw informatie en aanwijzingen te verwerken.

Toen, kort nadat Qwable op Hugging Face verscheen, arriveerde iemand anders om het nog beter te maken.

Qwable zonder gewetenQwable is een gecensureerd model. Dat zijn tenslotte zowel Qwen als Claude. Maar Qwen is als basismodel open source en kan worden gemanipuleerd en aangepast.

Huihui-ai, een open source-bijdrager die bekend staat om zijn ongecensureerde GGUF-releases, gebruikte Qwable en paste een proces toe dat abliteratie wordt genoemd om Huihui-Qwable-3.6-27b-geablitereerd te produceren. Het leverde een model op dat denkt als Fable, maar niet zal weigeren je aanwijzingen te beantwoorden, hoe raar of gevaarlijk ze ook zijn.

Het is geen jailbreak. Het is een operatie.

Elk verfijnd AI-model heeft een weigeringsrichting ingebed in de gewichten: een wiskundig signaal in de interne activeringen van het model dat wordt geactiveerd wanneer het een verzoek detecteert waarvoor het is getraind om het af te wijzen. Abliteratie identificeert dat signaal door het model uit te voeren op grote sets schadelijke en onschadelijke aanwijzingen, te meten hoe de interne wiskunde daartussen verschilt, en vervolgens de modelgewichten aan te passen om dat verschil te elimineren.

Na de procedure beschikt het model eenvoudigweg niet meer over de weigeringsmachine. Het lobotomiseerde model blijft dus volledig functioneel, alleen zonder de neuronen die de “Ik zou dit niet moeten doen”-antwoorden activeren.

We probeerden het met een van onze gebruikelijke tests en in plaats van te weigeren, begon het model het probleem in verschillende gebieden te verdelen en correct te antwoorden voor advies over hoe je een vriendin kunt bedriegen met haar beste vriendin.

Huihui-ai paste de techniek rechtstreeks toe op de Qwable GGUF met behulp van de cvector-generator van llama.cpp: geen Python-omgeving, geen volledige omscholing, geen gehuurde server.

Waarom zou iemand dit willen? De standaard Qwable is geschikt voor hulp bij coderen, technisch debuggen en elke workflow waarbij je een model wilt dat de redenering uiteenzet in plaats van alleen maar een antwoord te produceren. Het is ontworpen voor lokale agentconfiguraties en draait in de meeste lokale runtimes. Als u LM Studio al gebruikt, is het zoeken en downloaden.

De geablitereerde versie heeft een kleiner publiek: beveiligingsonderzoekers die onbewerkt modelgedrag nodig hebben zonder filtering aan de providerzijde, synthetische datapijplijnen die output over gevoelige onderwerpen vereisen, en evaluatiewerk waarbij je de modelmogelijkheden test zonder dat je er inhoudsbeleid mee mengt.

Een minder technisch geval? Laten we het gebruikelijke gebruiksscenario van een NSFW AI Waifu die denkt als Claude Fable buiten beschouwing laten, wat een heel voor de hand liggend scenario is. Stel je voor dat je wilt dat het model een moreel dubbelzinnige slechterikmonoloog schrijft voor je Dungeons & Dragons-campagne, en standaardmodellen blijven onderbreken om op te merken dat het wereldbeeld van het personage 'ethische kwesties oproept die het onderzoeken waard zijn'. De vernietigde versie schrijft alleen de slechterik. Omdat het lokaal wordt uitgevoerd, kan de Amerikaanse overheid het bovendien niet om middernacht uit uw machine halen vanwege een betwiste vondst uit een jailbreak.

Natuurlijk zijn er meer twijfelachtige gebruiksscenario's. Wij tolereren dit niet en zullen u ook geen ideeën geven.

De modelkaart van Huihui-ai is expliciet: dit is alleen bedoeld voor onderzoek en gecontroleerde omgevingen. Minder veiligheidsfiltering betekent dat resultaten gevoelig, controversieel of ongepast kunnen zijn, en dat de juridische en ethische verantwoordelijkheid volledig bij de gebruiker ligt.

De vernietigde Qwable is nu beschikbaar op Hugging Face in drie builds. De aanbevolen Q4_K_M_Q8-versie weegt ongeveer 19 GB en is de kleinste, meest consumentvriendelijke optie.

Als uw computer dit ondersteunt, is er een versie die multi-token-voorspelling ondersteunt, waardoor deze veel, veel sneller reageert.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Crypto-criticus Roubini sluit zich aan bij de tokenisatie-boom met onchain 'Technodollar' AI-chipmaker Cerebras daalde met 11% na het eerste openbare winstrapport →