Het Chinese Z.AI brengt GLM-5.2 uit: een model dat kan wedijveren met Claude Opus

Default Door Remote - 18 Jun 2026

In het kort

GLM-5.2 loopt slechts 1% achter op Claude Opus 4.8 op FrontierSWE – een benchmark die autonome engineeringprojecten van meerdere uren meet – en verslaat GPT-5.5 in dezelfde test. Het wordt verzonden onder een MIT-licentie zonder regionale beperkingen.

Het model is volledig gebouwd op Huawei Ascend-chips, zonder dat er NVIDIA-hardware bij betrokken is.

Unsloth AI heeft al 2-bit GGUF-kwantiseringen uitgebracht die het model verkleinen van 1,51 TB naar 238 GB. Je hebt nog steeds 256 GB RAM of VRAM nodig, maar op dat moment kun je het gebruiken.

Z.ai liet GLM-5.2 op 16 juni vallen, beloofde prestaties op topniveau en versloeg zijn reeds geavanceerde GLM 5.1.

Het in Beijing gevestigde laboratorium, dat sinds januari 2025 op de Amerikaanse Entity List staat, lijkt te profiteren van de groeiende bezorgdheid over de Amerikaanse aanpak van AI. De afgelopen week hebben het verbod op Anthropic Fable en de release van dit nieuwe model ervoor gezorgd dat de aandelen van zAI met 90% zijn gestegen, waardoor het naar een nieuw record ooit is gestegen.

GLM 5.2 heeft de cijfers om de hype te ondersteunen.

Op FrontierSWE – een benchmark die evalueert of een AI-agent technische projecten met een open einde kan voltooien, gemeten in uren, waaronder systeemoptimalisatie, grootschalige codeconstructie en toegepast ML-onderzoek, gescoord op basis van dominantiepercentage – scoorde GLM-5.2 74,4 tegen Claude Opus 4.8's 75,1. Het versloeg GPT-5,5 op 72,6. Op SWE-bench Pro, dat de autonome oplossing test van GitHub-problemen uit de echte wereld, scoorde GLM-5.2 62,1 tegenover de 58,6 van GPT-5.5 - en ruimde de 58,4 van zijn voorganger GLM-5.1 met een ruime marge.

De kwaliteitssprong maakt het tot nu toe het beste open-sourcemodel in de Artificial Analysis Intelligence Index, die de resultaten van 9 verschillende scores samenvoegt om de algemene kwaliteit van een AI-model te beoordelen. De benchmarks van OpenRouter plaatsen het in dezelfde categorie als de nu verboden Claude Fable 5.

De hardware die wordt gebruikt om deze prestatie te bereiken is een ander interessant deel van het verhaal. GLM-5.2 is getraind op Huawei Ascend-chips – er zit geen Nvidia in de pijplijn. Emad Mostaque, oprichter van Stability AI, schatte de totale trainingskosten op ongeveer 25 miljoen dollar, 80% van die na de training, wat het extreem goedkoop zou maken in vergelijking met zijn collega's.

Zoals Decrypt eerder dit jaar meldde, trainde Z.ai al beeldmodellen op Huawei's Ascend Atlas-servers zonder een enkele Amerikaanse chip. GLM-5.2 gaat nog een stapje verder: een mix-of-experts-model met 744 miljard parameters, een echt contextvenster van 1 miljoen tokens, vijf keer de limiet van 200K op GLM-5.1, en een MIT-licentie die betekent dat geen enkele overheidsrichtlijn de toegangsschakelaar kan omdraaien.

Tokens zijn de stukjes tet die een model kan lezen en genereren, terwijl parameters het aantal interne instellingen en waarden zijn die bepalen hoe een model informatie verwerkt en reacties genereert

Voor wie is het bedoeld en wat het kostVoor ontwikkelaars is het contextvenster de operationele verschuiving. Navigatie door hele repository's, refactoren van meerdere bestanden en lange agentische pijplijnen die voorheen in chunks moesten worden gesplitst, worden workflows met één oproep. API-prijzen bedragen $ 1,40 per miljoen inputtokens en $ 4,40 per miljoen output – tegen de $ 5 input en $ 25 output van Claude Opus 4.8. Het coderingsplan begint bij ongeveer $ 18 per maand en werkt rechtstreeks in Claude Code, Cline, Kilo Code en de meeste populaire agentomgevingen.

Ook lokaal inzetten is technisch mogelijk. Unsloth AI pushte 2-bit GGUF-kwantiseringen die het model comprimeren van 1,51 TB naar 238 GB, terwijl de nauwkeurigheid van ~82% behouden blijft.

Raak echter niet te opgewonden. Dat betekent nog steeds dat er 256 GB uniform geheugen of een bijpassende RAM/VRAM-combinatie nodig is: een maximale M4 Ultra Mac Studio of een werkstation met een GPU uit het middensegment en 256 GB systeem-RAM met een combinatie van experts. Het is nog steeds veel geld, maar in ieder geval iets dat je kunt kopen en op je huis kunt laten draaien als je dat echt wilt.

We hebben een snelle test uitgevoerd en GLM-5.2 gevraagd om onze standaard spelmechanismen voor het mixen van typen met een shooter te bouwen. De gebruikersinterface was niet de mooiste: andere modellen genereerden meer gepolijst ogende interfaces, maar de ervaring was het meest gevarieerd: verschillende scenario's over golven, vijandelijke typen die veranderden, bazen die later in de race verschenen.

Het genereerde meer diverse spelstatussen dan al het andere dat we voor dezelfde taak testten in een zero shot-opstelling.

Als je het wilt spelen, staat het live in ons Itch.io-profiel.

Deze variantie wijst in de richting van waar GLM-5.2 economisch het meest zinvol is. Voor workflows voor het genereren van meerdere shots en agentische pijplijnen waarbij de outputdiversiteit belangrijker is dan de afwerking, is de wiskunde op open source-prijsniveaus moeilijk te betwisten. Voor de zwaarste taken – de SWE-Marathon, waar het een score van 13,0 scoort tegenover de 26,0 van Opus 4.8 – is de kloof met de gesloten grens nog steeds reëel, en 13 punten breed.

Open-sourcegewichten zijn live op HuggingFace onder de MIT-licentie. De gekwantiseerde gewichten zijn ook beschikbaar op HuggingFace. GLM Coding Plan-abonnees kunnen nu overstappen met de modelstring GLM-5.2, en deze is ook beschikbaar voor gratis testen op z.AI met enkele gebruiksbeperkingen.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Startup voor AI-inferentie Baseten zou maanden na de laatste megaronde $1,5 miljard hebben opgehaald Dit is wat er vandaag in crypto is gebeurd →

Het Chinese Z.AI brengt GLM-5.2 uit: een model dat kan wedijveren met Claude Opus – zonder Nvidia-chips