Live News

Aandelen- en cryptocurrency-handelsplatform Robinhood kondigde de lancering aan van zijn openbare mainnet ongeveer vier maanden nadat het begon met...

In het kort Robinhood lanceerde het publieke mainnet van Robinhood Chain, een ‘AI-native’ Ethereum layer-2-netwerk...

In het kort Venice AI heeft in zijn eerste externe financieringsronde $65 miljoen opgehaald tegen een waardering van $1 miljard...

02/07/26

Volg ons:

LongCat-2.0: het Stealth AI-model dat de hele tijd stilletjes bovenaan OpenRouter stond

LongCat-2.0: het Stealth AI-model dat de hele tijd stilletjes bovenaan OpenRouter stond
Default Door Remote - 01 Jul 2026
In het kort

Meituan onthulde LongCat-2.0 officieel op 30 juni en onthulde het als het model achter "Owl Alpha."

Het anonieme model stond op de eerste plaats op Hermes Agent, op de tweede plaats op Claude Code en op de derde plaats op OpenClaw qua belvolume.

De standaard API-prijs is $0,75 per miljoen inputtokens en $2,95 per miljoen outputtokens - ruim onder de $5/$30 van GPT-5.5 en de inleidende $2/$10 van Claude Sonnet 5.

Het Chinese technologiebedrijf Meituan heeft LongCat-2.0 officieel onthuld op 30 juni, waarmee wordt bevestigd dat het AI-model met open licentie en 1,6 biljoen parameters hetzelfde systeem is dat twee maanden anoniem op OpenRouter heeft gedraaid onder de alias Owl Alpha.

Parameters zijn het totale aantal draaiknoppen dat een model tijdens de training aankan. Het model activeert grofweg 48 miljard van zijn parameters per token (de kleinste gegevenseenheid die een AI-model verwerkt), waarbij dat cijfer tussen de 33 miljard en 56 miljard schommelt, afhankelijk van hoe veeleisend de vraag is.

De stealth-periode heeft zijn vruchten afgeworpen. Tegen de tijd dat Meituan naar voren stapte, had het model al de eerste plaats behaald op de Hermes Agent-werkruimte, de tweede op Claude Code en de derde plaats op het gebied van OpenClaw-implementaties, allemaal gerangschikt op maandelijks belvolume.

Dit is het eerste model met biljoen parameters dat end-to-end is getraind en ingezet op binnenlandse Chinese ASIC's, en niet alleen daarop is toegepast na training elders. Ter vergelijking: DeepSeeks V4-Pro gebruikte Huawei-chips alleen voor gevolgtrekking, terwijl de voortraining op Nvidia-hardware draaide.

Meituan zegt dat de pretraining-run, die meer dan 35 biljoen tokens omvatte in een cluster van meer dan 50.000 in eigen land geproduceerde accelerators, eindigde met "geen terugdraaiingen of onherstelbare verliespieken." Die stabiliteitsclaim is van belang gezien het feit hoe vaak grote trainingsruns op onbewezen hardwarestacks halverwege mislukken en hoe China zijn afhankelijkheid van Amerikaanse hardware lijkt te verminderen om zijn modellen te trainen.

Prijs is waar LongCat-2.0 zijn echte pleidooi maakt. Standaard API-toegang kost $0,75 per miljoen inputtokens en $2,95 per miljoen output, verlaagd naar $0,30/$1,20 tijdens de huidige lanceringspromo, met gratis contextlezen in de cache. Dat ondermijnt GPT-5.5's $5/$30 per miljoen tokens, Claude Sonnet 5's introductietarief van $2/$10, en komt dicht in de buurt van DeepSeek V4-Pro's permanente $0,435/$0,87 en Xiaomi's MiMo-V2.5 Pro, die hetzelfde tarief evenaarde na zijn eigen prijsverlagingen in mei.

Meituan biedt ook een tokenplan, dat het nog goedkoper maakt voor programmeurs en zware gebruikers, door pakketten van 1 miljard tokens aan te bieden voor ongeveer $ 60.

We hebben LongCat-2.0 zelf door een snelle game-building-test geleid. Het klaarde de klus en de uitvoer hield redelijk goed stand na een paar iteratierondes. Het resultaat kwam zichtbaar achter Claude Fable en Opus 4.8 terecht, waardoor het gemakkelijker werd om in de buurt van Sonnet 4.6 te komen, maar de wiskunde per dollar is moeilijk te betwisten tegen deze prijzen.

Het zorgde ervoor dat de golven vijanden vanuit verschillende hoeken kwamen, waarbij de camera automatisch op de dichtstbijzijnde vijand werd gecentreerd. De logica van het model hield echter geen rekening met wat er gebeurt als het aantal vijanden moeilijker toeneemt. Bij hogere snelheden werd de logica voor het schakelen van doelen grillig; de focus zou midden in een typprompt naar een dichtstbijzijnde vijand springen, waardoor het spel frustrerend onspeelbaar werd.

Dit is normaal bij vibe-coderingssessies, waarbij modellen niet veel logische gevolgen van een beslissing voorzien, en zich in plaats daarvan concentreren op het leveren van een resultaat op basis van wat de gebruiker letterlijk vraagt.

Dit is ook de reden waarom een ​​goedkoop model altijd een goede optie is, omdat het de gebruiker meer kans geeft om elk resultaat iteratief te verbeteren totdat het eindproduct aan de verwachtingen voldoet.

Zonder verdere interactie belandt de algehele kwaliteit op het eerste gezicht ergens tussen DeepSeel v4 Flash en Deepseek v4 Pro in onze snelle coderingstests.

Je kunt de resultaten bekijken op onze itch.io-site

Hoe Meituan het heeft gebouwdLongCat-2.0 gebruikt verschillende technieken om het model sneller en capabeler te maken zonder de omvang dramatisch te vergroten.

Het aandachtssysteem, gebaseerd op het ontwerp van DeepSeek, richt zich alleen op de meest relevante delen van zeer lange gesprekken in plaats van alles gelijkmatig te verwerken, waardoor het sneller kan reageren.

Bovendien geeft een nieuw N-gram-inbeddingssysteem (een manier om groepen woorden of subwoorden samen te begrijpen) het model een veel rijker begrip van woorden en zinsneden – ongeveer 100 keer meer mogelijke representaties – zonder veel meer AI-componenten toe te voegen. Het leert de AI in feite om veelvoorkomende zinnen te herkennen in plaats van alleen individuele woorden. In plaats van 'New', 'York' en 'City' als drie afzonderlijke stukken te zien, kan het 'New York City' ook als één betekenisvol concept behandelen. Dit geeft het model een veel rijker begrip van taal zonder het dramatisch groter te maken.

Na de training combineert Meituan ook drie gespecialiseerde systemen, één gericht op het gebruik van tools (Agent), één op het oplossen van problemen (Redeneren) en één op gesprekken (Interactie). Een routeringsmechanisme beslist vervolgens welke combinatie van deze specialisten elk verzoek moet behandelen, net zoals het toewijzen van het juiste team aan de juiste taak.

Op SWE-bench Pro, een benchmark die meet hoe vaak een model echte GitHub-problemen oplost die uit productiecodebases zijn gehaald, haalde LongCat-2.0 een score van 59,5, vóór 58,6 van GPT-5.5 en 54,2 van Gemini 3.1 Pro, maar nog steeds achter Claude Opus 4.7 en 4.8. Op FORTE, dat agenten beoordeelt voor dagelijkse kantoortaken in 15 beroepen binnen een tijdslimiet van 45 minuten, scoorde het een 73,2, vergelijkbaar met Claude Opus 4,6, maar achter op de 77,8 van GPT-5.5.

Maak kennis met LongCat-2.0 🐱

1,6T-parameters · MoE met ~48B actief · 1M-context

Het volledige model achter Owl Alpha op @OpenRouter – nu beschikbaar.

Gebouwd voor agentische codering vanaf de basis:

◆ LongCat Sparse Attention (LSA) — schaalt efficiënt voor 1M-contexttokens

◆… pic.twitter.com/zum2SdZ0Z2

— Meituan LongCat (@Meituan_LongCat) 30 juni 2026

Teams die codeeragenten bouwen met een beperkt budget, of iedereen die grote hoeveelheden werk op repository-schaal uitvoert waarbij de gratis context-cache samenstelling leest, behalen de duidelijkste overwinning. Het model is vandaag de dag bereikbaar via Meituan's OpenAI- en Anthropic-compatibele API-eindpunten, of via agent-harnassen zoals Hermes, Claude Code en OpenClaw die het al integreren.

Iedereen die zelf moet hosten, heeft voorlopig pech. Zowel op de GitHub- als op de Hugging Face-repository staat nog steeds "modelgewichten binnenkort beschikbaar", maar Meituan heeft nog geen datum vastgesteld waarop de bestanden zullen worden verzonden.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!