Rio de Janeiro bouwde een AI-model dat DeepSeek versloeg, maar gebaseerd was op het werk van iemand anders

Default Door Remote - 15 Jun 2026

In het kort

IplanRIO bracht op 13 juni Rio 3.5 Open 397B uit en bestempelde het als een door de overheid gebouwd grensverleggend AI-model met benchmarkscores die hoger liggen dan Qwen 3.7 Plus.

AI-bedrijf Nex publiceerde een wiskundig bewijs dat aantoont dat het model een directe samenvoeging van gewichten van 0,6 Nex / 0,4 Qwen is.

IplanRIO heeft de modelkaart bijgewerkt, Nex gecrediteerd, de benchmarkclaims ingetrokken en de schuld gegeven aan een "onjuiste upload".

Rio de Janeiro's IplanRIO bracht op 13 juni Rio 3.5 uit. Het IT-bureau van de stad noemde het een grensmodel: 397 miljard parameters, met een permissieve open-sourcelicentie, gebouwd door de gemeentelijke overheid van een stad in het Zuiden.

De timing van de lancering van Rio 3.5 was perfect: Brazilië speelde zijn WK-opener en de sociale media stonden al in brand. Opmerkingen erover verspreidden zich snel van Brazilië naar daarbuiten.

Maar net zo snel als het aandacht kreeg, ontstond er onenigheid over wie het model precies had gemaakt.

De originele modelkaart beschreef Rio 3.5 als een post-trein van Qwen 3.5 397B, Alibaba's open-basismodel, met daarbovenop een nieuwe redeneerlaag genaamd SwiReasoning. De ontwikkelingskosten werden gerapporteerd op R$ 500.000 (Rio heeft dit niet bevestigd), of bijna $ 100.000 USD – ongeveer 30 keer goedkoper dan vergelijkbare kant-en-klare AI-systemen.

De architectuur is Mixture-of-Experts, wat betekent dat slechts ongeveer 17 miljard van de 397 miljard parameters op een bepaald token worden geactiveerd. Dat maakt gevolgtrekking goedkoper dan de kopgrootte doet vermoeden. Het model ondersteunt ook visie en tekst, kan meer dan een dozijn talen verwerken en wordt geleverd onder een volledig open MIT-licentie.

SwiReasoning is het technische middelpunt. Het is een trainingsvrij inferentieraamwerk dat dynamisch tussen twee modi schakelt. Wanneer het model vertrouwen heeft in een volgend woord – lage entropie in de waarschijnlijkheidsverdeling – redeneert het in gewone taal. Wanneer het onzeker is, verschuift het naar latent redeneren, denken in verborgen interne toestanden zonder tokens uit te zenden. IplanRIO zei dat Rio 3.5 specifiek is getraind om hiervan gebruik te maken, en dat de winsten zichtbaar zijn in de benchmarkcijfers.

De zelfgerapporteerde cijfers waren opvallend. Terminal-Bench 2.1 – dat de autonome uitvoering van terminalopdrachten meet, gescoord als percentage van de voltooide taken – kwam uit op 70,8% voor Rio 3.5, en liet Qwen 3.7 Plus achter met 70,3% en de krachtige DeepSeek v4 Pro met 67,9%.

Op IMOAnswerBench, een wiskunde-olympiade-benchmark die als percentage correct scoorde, bereikte Rio 3.5 89,5%. Op HLE – Humanity's Last Exam scoorde een vrijwel onoplosbare expertbatterij met meerdere domeinen als een percentage – Rio 3.5 kwam uit op 36,5%, vóór de 34,7% van Qwen 3.7 Plus.

Een gemeentelijke overheid die de belangrijkste vlaggenschipmodellen verslaat op de meest betekenisvolle kwaliteitscriteria: dat is de kop die zich verspreidde, vooral nadat de burgemeester van Rio de Janeiro erover had getweet.

“Een open AI-model dat in Rio is getraind en het afgelopen jaar door de gemeente Rio is gefinancierd, heeft zojuist alle andere modellen overtroffen”, schreef Eduardo Cavaliere. “Vandaag heeft de wereld het over een open AI-model dat in Rio is getraind.”

🇧🇷 Open AI-model dat het afgelopen jaar in Rio is getraind met publieke financiering door @Prefeitura_Rio en beter presteert dan alle andere modellen. Kunstmatige intelligentie is niet iets ver weg, vreemds, van een laboratorium van een miljard dollar... het bestaat niet alleen om tekst en afbeeldingen te maken... https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 14 juni 2026

Toen kwam Nex opdagen. “Trained in Rio” bleek niet helemaal juist te zijn.

Nex-AGI, een in Shanghai gevestigde open source AI-alliantie, publiceerde binnen X dagen na de lancering. De opener: "Het Rio 3.5-model brak deze week het internet. De plotwending? In wezen ons open source-model, Nex N2 Pro, met een andere hoed op."

Ze analyseerden de gewichten. De wiskunde was exact: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Een scriptverificatie en een volledig GitHub-rapport volgden.

Het Rio 3.5-model brak deze week het internet. De plotwending? In wezen draagt ons open source-model, Nex N2 Pro, een andere hoed.

🤯 We hebben de gewichten geanalyseerd en het recept is exact: Rio 3,5 ≈ 0,6 * Nex N2 Pro + 0,4 * Qwen 3,5

Het dringt nog steeds letterlijk binnen… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 14 juni 2026

Het bewijsmateriaal bestond uit twee delen.

Ten eerste gedragsmatig. Nex verwijderde de hardgecodeerde "Jij bent Rio"-systeemprompt van het geïmplementeerde model en stuurde het 120 identiteitsvragen. Zonder het masker meldt Nex dat het model zichzelf 79,2% van de tijd "Nex, van Nex-AGI" noemde. Het noemde zichzelf precies 0% van de tijd "Rio". Nex zei dat het model ook het specifieke achtergrondverhaal van het bedrijf letterlijk reciteerde, waarbij het ‘Shanghai Innovation Institute’ en ‘een grootschalige ecosysteemalliantie’ werden genoemd. Dat zijn de eigen trainingsgegevens van Nex, die in het model van iemand anders naar voren komen.

Ten tweede: wiskundig. Bij een echte gewichtsfusie bevindt elke parameter in het nieuwe model zich op een rechte lijn tussen de twee bronmodellen. Nex heeft deze collineariteit gemeten over alle 60 lagen. Het resultaat kwam terug op 0,993. Twee niet-gerelateerde modellen in dezelfde parameterruimte scoorden toevallig bijna nul. Het bereiken van 0,993 over elke afzonderlijke laag is geen toeval. De mengverhouding werd gehandhaafd op α ≈ 0,571, stabiel tot op drie decimalen.

Kortom, het was bijna 60% Nex, terwijl de rest het basismodel van Qwen was.

"Elke gewichtstensor in Rio is, op duizenden standaardafwijkingen na, dezelfde 0,6/0,4 mix van Nex en Qwen - over alle 60 lagen en elk onderdeel van het netwerk heen", schreef Nex. "Er is geen onschuldige verklaring."

Bron: Nex EcosystemDe cijfers vertelden ook een rustiger verhaal. Nex N2 Pro, enkele dagen vóór Rio 3.5 uitgebracht, scoort 75,3% op Terminal-Bench 2.1, hoger dan de 70,8% van Rio. Op GDPval, een benchmark voor economische prognoses die wordt beoordeeld als een Elo-stijl, staat de Nex op 1.585, tegenover de 1.533 van Rio. Als Rio voor 60% uit Nex bestaat, zou je verwachten dat het onder Nex zou scoren op de eigen benchmarks van Nex. Dat doet het.

Bron: Nex EcosystemIplanRIO reageertIplanRIO heeft de Hugging Face-modelkaart bijgewerkt: de benchmarktabel is verwijderd en de toeschrijving is gewijzigd.

"Het model is gebouwd via een samenvoeging van nex-agi/Nex-N2-Pro en Qwen/Qwen3.5-397B-A17B, voorafgegaan door On-Policy Distillation van een sterker model", aldus het bijgewerkte Readme. "We hebben een onjuiste upload gedetecteerd in de vorige versie, waarbij de samengevoegde basisversie werd geüpload in plaats van het definitieve gedestilleerde model. We verontschuldigen ons voor de verwarring en bieden onze excuses aan."

Er is geen andere publieke verklaring van IplanRIO naar buiten gekomen. Nex wordt nu gecrediteerd.

De verklaring voor "onjuiste upload" is de belangrijkste claim. IplanRIO zegt dat de beoogde release een gedistilleerde versie was van de samengevoegde basis, en niet de onbewerkte samenvoeging zelf. On-beleidsdistillatie betekent dat een sterker lerarenmodel resultaten genereert, en dat de leerling daarop traint en tegelijkertijd zijn eigen resultaten genereert. Het is duurder dan een ruwe fusie, maar nog steeds goedkoper dan helemaal opnieuw trainen. Als die stap reëel zou zijn, zou het op zijn minst enig origineel werk vertegenwoordigen bovenop de fusie.

Wat feitelijk werd verzonden, volgens IplanRIO, was de samengevoegde basis met niets erbovenop.

Gemeenschapswaarnemers waren verdeeld over wat dat betekent. Tech-commentator Rafael Quintanilha gaf de liefdadigheidsinstelling het volgende te lezen: Omdat Nex N2 Pro zelf op Qwen is gebouwd, heeft het team mogelijk de onderliggende architectuur gecrediteerd en deze daar gelaten. Hij wees er ook op dat het model viraal ging tijdens een WK-wedstrijd, "niet noodzakelijkerwijs 'klaar voor publieke consumptie'."

over de Rio 3.5-situatie

het samenvoegen van twee modellen van de ~400B-klasse en het vervolgens toepassen van beleidsdistillatie is niet triviaal

dat gezegd hebbende, maakten ze twee fouten:

- een technische fout (waarschijnlijk veroorzaakt door een gebrek aan aandacht voor detail)

- en een communicatieve (we kunnen debatteren over de integriteit van...

— Montana (@lucas_montano) 15 juni 2026

Ontwikkelaar en AI YouTuber Lucas Montano merkte op dat "het samenvoegen van twee modellen van ~400B-klasse en het vervolgens toepassen van beleidsdestillatie niet triviaal is", terwijl hij zowel een technische fout als een communicatiefout erkende.

AI-onderzoeker Diego Ambrosio was minder genereus. Bij de oorspronkelijke lancering werd Rio 3.5 beschreven als het resultaat van "autonome post-training en eigen verfijning" - een frame dat origineel onderzoek impliceerde, en geen samensmelting.

Legaal? Ja. Ethisch? Nou... Het samenvoegen van modellen is volkomen legaal. Nex N2 Pro is Apache 2.0. Je kunt het gebruiken, aanpassen en opnieuw distribueren, zolang je het maar vermeldt. Qwen 3.5 heeft ook een open licentie. Niemand gaat naar de rechter. hier.

Het probleem was het presenteren van de output als onafhankelijk ontwikkeld werk zonder alle bronmodellen te benoemen. De open-sourcegemeenschap heeft dit eerder gezien. Eerder dit jaar werd ontdekt dat Cursor's Composer 2 zonder openbaarmaking was gebouwd op de Kimi K2.5 van Moonshot. De reactie was snel en reputatiegericht: geen advocaten, alleen screenshots.

was aan het knoeien met de OpenAI-basis-URL in Cursor en ontdekte dit

accounts/anysphere/modellen/kimi-k2p5-rl-0317-s515-fast

dus componist 2 is gewoon Kimi K2.5 met RL

hernoem in ieder geval de model-ID https://t.co/MQOuEuF3Pd pic.twitter.com/fyUWbo1InF

— fynn (@fynnso) 19 maart 2026

Voortbouwen op bestaande open modellen is normaal. Zoals Decrypt heeft besproken, is het stapelen en samenvoegen van open gewichten praktisch een eigen subcultuur. De norm is niet: 'bouw niet voort op het werk van anderen'. De norm is: zeg wat je hebt gebruikt.

Wat dit luider maakte dan een typische toeschrijvingsmisser was de institutionele verpakking. Een pseudonieme ontwikkelaar die een frankenmerge onder zijn eigen naam verzendt, is één ding. Een gemeentelijke overheid die het gebruikt om AI-soevereiniteit in de publieke sector op te eisen – tijdens het WK – is een andere. “Het was een verspilling van middelen”, schreef een Braziliaanse commentator.

Nex maakte er geen oorlog van. "We zijn gevleid dat de stad Rio ons werk heeft gebruikt om SOTA-prestaties te bereiken", schreef het bedrijf op X. "Maar in de open-sourcewereld is attributie van belang."

IplanRIO werkt aan het uploaden van het gecorrigeerde, gedestilleerde model met volledige attributie. Wanneer dat landt, worden dezelfde controles opnieuw uitgevoerd - en zal de gemeenschap ontdekken of de destillatie daadwerkelijk iets heeft veranderd, of dat het nog steeds grotendeels Nex is met een andere systeemprompt.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← CFTC huurt SEC-crypto-taskforce-adviseur in met blockchain-forensische karbonades Iemand heeft zojuist $ 1 miljoen verloren op Polymarket tijdens het WK Shocker in Spanje →