We vroegen zeven AI-agenten om het WK van 2026 te voorspellen: dit is wat ze zeiden

Default Door Remote - 08 Jun 2026

In het kort

Zeven grensverleggende AI-modellen kregen elk dezelfde WK-trekking voor 2026 en kregen te horen dat ze op hun eigen manier een kampioen moesten voorspellen.

Vier kozen voor Spanje, waarvan Stepfun met 33% de brutaalste is; drie gekozen titelverdediger Argentinië, waarvan Qwen de brutaalste is met 22%. Elk model plaatste Spanje, Argentinië en Frankrijk in de hoogste klasse.

Myriad, de voorspellingsmarkt gerund door het moederbedrijf van Decrypt, is het eens over de favoriet – Spanje 19%, Frankrijk 17% – maar prijst Argentinië vanaf 7 juni op slechts 10%.

Het WK 2026 begint over enkele dagen, wat betekent dat de halve planeet op het punt staat te doen alsof hij de toekomst kan voorspellen.

Iedereen heeft een mening. Je groepschat heeft er een. Je door voetbal geobsedeerde collega heeft er een. En dit jaar geldt dat ook voor de slimste software ooit gebouwd.

AI is, misschien niet zo stilletjes, veranderd in ons go-to-orakel. We laten deze modellen onze e-mails schrijven, onze code debuggen, onze vakantie plannen en de uitslag van 3 uur 's nachts diagnosticeren - dus vragen we hen natuurlijk ook wie de trofee in de wacht sleept. Ze zullen de squadrons analyseren, de vorm afwegen en je een kampioen uitreiken met de zekerheid dat de rest van ons alleen maar kan faken.

Ik heb deze feesttruc al eerder uitgevoerd: een AI-droomteam op mijn March Madness-beugel (wat slecht was), een zelfgemaakte HorseGPT op de Kentucky Derby (wat eigenlijk best goed was). Gelijke delen zijn echt nuttig en diep vernederend.

Dus nu het grootste toernooi ter wereld bijna hier is, hebben we het teruggedraaid – groter dan ooit.

We creëerden Hermes-agenten, configureerden ze met toegang tot statistiekensites (de gratis sites, niet degenen die één nier per maand kosten om te gebruiken), gaven ze aangepaste vaardigheden en gaven zeven van 's werelds meest geavanceerde AI-modellen dezelfde taak: het WK 2026 voorspellen, kampioen worden tot aan de winnaars, en hun werk laten zien. Ieder kreeg de echte loting – 48 teams, 12 groepen, de volledige schijf – en totale vrijheid om deze te kraken.

Toen leunden we achterover en lieten ze ruzie maken.

Vier kozen Spanje. Drie kozen Argentinië. En de grens daartussen bleek minder over voetbal te gaan dan over de cijfers die elke machine koos te vertrouwen.

Dit is wat alle zeven zeiden: kies jouw kant.

Opus 4.8 Max – De meteoroloog

Keuze: Spanje. 20% / Dixon-Coles Poisson + Monte-Carlo · finale: Spanje def. Frankrijk

Anthropic's Opus 4.8 Max behandelde het WK als een natuurkundig probleem. Het kostte de Elo-rating van elk team, zette de gaten om in verwachte doelpunten met een Dixon-Coles-model – het soort bookmakers dat daadwerkelijk gebruikt – en simuleerde de beugel duizenden keren. Spanje kwam als kampioen uit de bus met 20%, voorbij Frankrijk in de finale, terwijl Portugal en Engeland verslagen werden in de halve finale.

De echte obsessie was echter dat alles buiten de bal gebeurde. Opus was het enige model op dit gebied dat rekening hield met de omstandigheden die een spreadsheet gewoonlijk negeert: hitte, ijle berglucht en reizen ter grootte van een continent.

Het gaf aan dat grofweg vijf wedstrijden in hitte verkeren die zo ernstig zijn dat de prestaties van spelers kunnen worden beïnvloed, en dat bezoekende teams die naar 2.200 meter klimmen bij de Azteca de neiging hebben om in de laatste 20 minuten te verwelken. Het behandelde het allemaal als een stille belasting voor de gezondere, diepere Europese kanten.

Toen deed het het koudste wat er op het bord te zien was en verwoestte het Brazilië. Nu Rodrygo's knie weg was, Estêvão pijn deed en een 34-jarige Neymar zich terugsleepte voor een laatste dans, verlaagde Opus de kansen van de vijfvoudig kampioen tot 8% – de helft van wat de naar Argentinië neigende modellen hen gaven.

De scherpste beslissing was de kwartfinale die werd bestempeld als "de echte finale, een ronde te vroeg": Spanje boven Argentinië, een 39-jarige Messi die in het gras werd gedrukt. Voor de Gouden Schoen was Mbappé nodig en knipperde nauwelijks met zijn ogen.

GPT 5.5 — De zorgvuldige verkenner

Kies Spanje 15–18% / Vijf gewogen emmers, geen simulatie · finale: Spanje 2-1 Frankrijk

GPT 5.5 van OpenAI vertrouwde geen enkel groot getal, dus bouwde het in plaats daarvan een scorekaart. Elk team werd beoordeeld in vijf gewogen kolommen: de kwaliteit van de ploeg telde met 35% het meest, daarna tactische controle, afwerking, beschikbaarheid en de vriendelijkheid van de loting. Het hield de gewichten opzettelijk bot om zichzelf niet voor de gek te houden dat voetbal voorspelbaarder is dan het is.

Spanje kwam als beste uit de bus, maar had slechts een kans van 15 tot 18% om te winnen, en het land zou niet de pretentie hebben preciezer te zijn dan dat. "Bereiken in plaats van nep-precisie", schreef het, waarin werd geprojecteerd dat Spanje Frankrijk met 2-1 zou verslaan in een finale die naar verwachting zou worden beslist door een enkel doelpunt of extra tijd.

Wat hem tot verkenner maakte, was het beenwerk. GPT 5.5 vergeleek zichzelf met Opta's supercomputer met 25.000 exemplaren (die op vrijwel dezelfde plek belandde, Spanje eerst op 16,1%) en ging vervolgens de Spaanse sportpers lezen op dingen die een model niet kan zien.

Het bracht een schrik op het trainingsveld in het Spaanse kamp aan het licht, een verdwaalde Gavi-uitdaging waardoor Rodri op de grond bleef liggen, en de zorgvuldige re-integratie van Yamal en Nico Williams na spierproblemen. Niets ervan bracht de houweel in beweging, maar het verlaagde wel het vertrouwen – precies wat een goede verkenner doet.

De vier halve finales waren Spanje, Frankrijk, Brazilië en Argentinië, en het was bot over Engeland: geladen, werkelijk gevaarlijk en hoogstwaarschijnlijk tegengehouden door Frankrijk vóór de laatste vier.

DeepSeek v4 Pro — De Maximalist

Kies Argentinië 18% / Kwalitatieve niveaus · finale: Argentinië versus Frankrijk

DeepSeek v4 Pro beantwoordde een eenvoudige vraag met een epos van 5000 woorden. Er werden niet alleen winnaars genoemd; het bouwde de hele ronde van 32, annoteerde alle 48 squadrons en woog het reizen tot aan de 4.500 kilometer tussen Vancouver en Miami. Als de anderen previews schreven, schreef DeepSeek de bedieningshandleiding.

Al dat detail leidde ergens tegendraads: Argentinië, met een toernooi-beste 18%, versloeg Frankrijk voor de trofee in een Messi-versus-Mbappé-finale in Miami – wat een hallucinatie is: de finale zal plaatsvinden in het MetLife Stadium in New Jersey.

De zaak was ouderwets: de kampioenen hebben de rustigste ruggengraat, de zachtste groep en een coach die toernooien heeft gewonnen en precies weet hoe hij een 39-jarige Messi moet rantsoeneren.

Vervolgens zette het de hele voorspelling in op één kuitspier. DeepSeek besloot dat de titel afhing van de Franse doelman Mike Maignan en zijn blessure in maart: "Als Maignan speelt, is Frankrijk medefavorieten; zo niet, dan wordt de kloof groter", betoogde het.

De rimpel is dat DeepSeek een oude kaart aan het lezen was. Het had nog steeds Gareth Southgate in de Engelse dug-out en Dorival Júnior als manager van Brazilië – beide verdwenen in 2024 – en leunde de hele tijd op verouderde ranglijsten.

Het was de meest grondige analist in het gebouw, die werkte vanuit een enigszins verouderd dossier. Indrukwekkend en enigszins spookachtig, als een detective die de zaak oplost met behulp van het telefoonboek van vorig jaar.

Stepfun 3.7 — De ware gelovige

Kies Spanje 33% / Pure-Elo Monte Carlo, 50.000 sims · finale: Spanje versus Argentinië

Geen enkel model geloofde er harder in. Stepfun 3.7 organiseerde 50.000 gesimuleerde toernooien en kroonde Spanje met een wilde 33% – bijna het dubbele van de overtuiging van wie dan ook, met Argentinië op verre tweede plaats met 15%.

Maar het beste wat Stepfun deed, was in het openbaar falen. De eerste poging was een luxer model dat probeerde de verwachte doelpuntencijfers voor nationale teams te verzinnen, en dat leverde onzin op: Mexico, Zuid-Afrika en Zuid-Korea kwamen uit de top drie van favorieten om het WK te winnen.

In plaats van dat te begraven, legde Stepfun het hele ongeluk uit, kwam erachter dat de verzonnen statistieken de echte kloof tussen goede teams en geweldige teams hadden afgevlakt, schrapte het vervolgens en herbouwde alleen op rauwe Elo. De nieuwe versie was eenvoudiger, botter en veel verstandiger.

De wisselwerking is dat pure Elo blind is voor alles wat menselijk is. Het Spanje van Stepfun weet niet dat Lamine Yamal een hamstringblessure heeft, hitte of reizen niet inschat, en beschouwt een strafschoppenserie als een munt die wordt gewogen op basis van rating. Het is een prachtig eerlijke machine die nog nooit een voetbalwedstrijd heeft gezien.

De groep marcheerde naar de voor de hand liggende plaatsen - Spanje voorbij Argentinië in één halve finale, de gastlanden en Brazilië eerder - en plantte zijn vlag: Spanje, comfortabel, een derde van de tijd. De meest zelfverzekerde keuze op het bord, en de meest openhartige reden waarom u er niet volledig op moet vertrouwen.

Trouwens, de agent die Spaans en Engels in hetzelfde antwoord mengde, was een gedrag waarvan bewezen is dat het met dit model behoorlijk moeilijk te vermijden is. Deze agent was polyglot en wisselde gedurende de hele sessie tussen Engels, Spaans en Portugees. Dat gebeurt wanneer uw agent leert dat u de taal spreekt die op een bepaald moment gemakkelijker is.

Nemotron 3 Ultra — De dubbele controle

Kies Spanje 18–22% / Bivariate Poisson + een subjectieve tweeling · finale: Spanje versus Argentinië

Nvidia's Nemotron 3 Ultra vertrouwde zichzelf niet, dus liep het toernooi twee keer. De eerste passage was een koudesimulatie, een bivariate-Poisson-model dat door 5.000 haakjes schuurde. De tweede gooide de wiskunde eruit en scoorde teams met de hand – ploeg, tactiek, vorm, de manager, zelfs ‘mystiek’ – om te zien of een menselijke stijl het daar niet mee eens zou zijn.

Dat gebeurde niet. Beide versies bekroonden Spanje met een odd van 18% en 22%, ongeveer net zo dicht bij een second opinion als één model je kan geven.

Nemotron deed ook het meeste huiswerk op het gebied van voetbal. Het kwam met opstellingen, drukintensiteit en verwachte doelpuntenpercentages voor team na team, in twee talen, en las minder als een voorspelling dan als een coachdossier.

Die diepte leverde de meest pittige versie van het experiment op. Nemotron zorgde ervoor dat Türkiye – en niet het gastland van de Verenigde Staten – de wijd open Groep D won, waarbij de Amerikanen als laatste eindigden terwijl alle anderen hen doorzwaaiden; het beoordeelde de gierige verdediging van Ecuador ook een tandje hoger dan Duitsland.

Toen het stof was opgetrokken, zette het de zwaargewicht halve finales op een rij die de helft van de planeet verwacht, Spanje-Frankrijk en Argentinië-Brazilië, en stuurde het Spanje erdoorheen om het op te tillen. Een model dat met zichzelf in discussie ging, extra las en toch op de favoriet belandde, probeert je iets te vertellen.

MiniMax 2.7 — De zelfauditor

Kies Argentinië 18% / Kwalitatief, zelfgecontroleerd · finale: Argentinië versus Frankrijk, geen score

MiniMax 2.7 koos Argentinië met een kans van 18%, een haar voorsprong op Frankrijk – en besteedde vervolgens de laatste pagina's aan het beoordelen van zijn eigen werk. De meeste modellen verbergen hun onzekerheid; MiniMax drukte een doorlopende lijst met correcties af en liep openlijk terug op de zaken die eerder in hetzelfde rapport verkeerd waren gegaan.

De bonnen zijn een genot. Het betrapte zichzelf op het herhalen van een valse statistiek over Zuid-Amerikaanse kampioenen, corrigeerde de coachingsituatie van Uruguay, corrigeerde de positie van Kai Havertz zodat deze overeenkwam met zijn daadwerkelijke clubrol, en gaf een "onbevestigde" uitspraak over zowel Haaland's conditie als Ronaldo's selectie in plaats van ze door te wuiven.

Het bewaakte ook zijn eigen hype. MiniMax schrapte een verleidelijke halve finale Messi-tegen-Ronaldo toen het zich realiseerde dat een koppeling onmogelijk was (de twee zitten in tegenovergestelde helften en kunnen elkaar alleen in de finale ontmoeten) en schrapte de verzonnen scorelijnen die andere modellen met plezier afdrukten.

Toen, op het beslissende moment, weigerde het eenvoudigweg te raden. Argentinië tegen Frankrijk, zo schreef MiniMax, is “een echte 50/50”, en het zou geen winnaar opleveren die het niet had.

In een veld van uiterst zelfverzekerde robots kwam de terughoudendheid terecht. MiniMax was degene die steeds schriftelijk bleef zeggen: dit is precies wat ik niet weet – wat op de een of andere manier betrouwbaarder is dan een nette voorspelling.

Qwen 3.5 — De tegendraadse met ontvangstbewijzen

Kies Argentinië 22% / Alleen onderzoek, geen sims · finale: Argentinië 2-1 Spanje

Qwen 3.5 – een model met 397 miljard parameters – was het meest door bewijzen geobsedeerde van allemaal en op de een of andere manier de grootste rebel. Het weigerde überhaupt simulaties uit te voeren, sorteerde elke verklaring in ‘geverifieerde feiten’, ‘schattingen’ en ‘voorspellingen’ en bestempelde zijn algehele vertrouwen in zijn eigen hoofdletters als LAAG.

Toen ging het schurkenstaten. Qwen zorgde ervoor dat Argentinië Spanje met 2-1 versloeg, terwijl Spanje op de vijfde plaats eindigde met slechts 10% – het enige model dat La Roja niet eens op het podium zette.

De reden was de liniaal die het greep. Het Spaanse kamp maakte gebruik van live voetbal Elo, waarmee Spanje op de eerste plaats ter wereld staat; Qwen bereikte een clubgebaseerde rating waarmee Argentinië, Brazilië, Frankrijk en Engeland allemaal voorop gingen. Dit verandert van perspectief en genereert plotseling een andere favoriet.

Het pleidooi voor Argentinië was puur textuur: het spiergeheugen van de kampioen, Messi die een perfect einde najaagde, en één statistiek waar het hard op leunde: tijdens het laatste WK wonnen teams die minder bal zagen, 38% van de knock-outwedstrijden. Georganiseerd en meedogenloos verslaat mooi en bezitszwaar, zo betoogde het.

Er was een prijs voor al die toewijding. Het model dat het meest trots is op de feiten, rommelde ook met de basisprincipes, waardoor Schotland in de verkeerde groep terechtkwam en het kleine Curaçao dubbel in twee groepen werd ingedeeld.

Waar ze het eigenlijk over eens zijn

Als je een stapje terug doet, maken de zeven AI-modellen minder ruzie over hun voorspellingen dan het lijkt. Elk model plaatste Spanje, Argentinië en Frankrijk op de hoogste ranglijst, noemde bijna identieke groepswinnaars – Brazilië, Engeland, Portugal, Duitsland, België – en markeerde dezelfde wildcards: Haalands conditie, Messi’s leeftijd op 39, en een Groep D die niemand kon noemen.

De breuklijn waren de data, niet het voetbal. De vier die vertrouwden op live voetbal Elo, waar Spanje duidelijk op de eerste plaats staat, kozen voor Spanje. De drie die steunden op de FIFA-ranglijst, een andere Elo-bron of een rauwe stamboom uit 2022, dreven naar Argentinië. Geef een model een andere nummer één en je krijgt een andere kampioen.

Wat de mensen met geld op het spel denken

De menigte kiest de kant van de pluraliteit. Op Myriad, de voorspellingsmarkt van Decrypt's moederbedrijf Dastan, is Spanje met 19% de regelrechte favoriet, gevolgd door Frankrijk met 17% vanaf zondag.

Daarna worden de mensen gieriger tegenover Argentinië dan de bots. Gokkers prijzen de titelverdedigers op een winkans van slechts 10% – op hetzelfde niveau als Brazilië, na Engeland en Portugal op 12%, en minder dan de helft van de 22% die Qwen hen gaf.

Voor wat het waard is, zijn de voorspellers van Myriad eveneens onbeslist over de winnaar van Groep D, waarbij de kansen verdeeld zijn over Turkije en de Verenigde Staten, zelfs op 45%.

Je kunt hier de live noteringen op Myriad bekijken voor elke wedstrijd van het WK.

Dus wie wint?

Niets van dit alles is een kristallen bol, en alle zeven AI-modellen zeiden dat hardop. De beste voetbalmodellen voor één wedstrijd hebben amper meer dan de helft van de tijd gelijk, en daarom betekent zelfs de bullish 33% van Stepfun nog steeds dat Spanje twee van de drie keer tekortschiet.

Het format vergroot de kansen alleen maar: 48 teams, 104 wedstrijden, drie landen, echte hitte en echte hoogte. Italië, viervoudig kampioen, kwalificeerde zich niet eens.

Naast de gebruikelijke hallucinaties wanneer modellen creatief willen zijn in hun analyses, kan er ook sprake zijn van enige vorm van bevestiging. Bedenk dat het een mens was die deze agenten erin heeft geluisd. De prompt, de interactie, de configuratie, de ideeën voor onderzoek en bronnen werden allemaal beïnvloed door de architect van de agent. Als al deze elementen naar Spanje wijzen, zullen alle agenten misschien tot een soortgelijke conclusie komen. Dat gezegd hebbende, een model in het wild achterlaten en simpelweg vragen: “Wie zal het WK winnen” zal het niet beter doen.

Dus neem de zeven robots zoals ik mijn eigen beugel neem: een geweldige manier om een gevecht aan de bar te beginnen, geen reden om opnieuw een hypotheek op het huis te nemen en alles op het spel te zetten.

Vier machines zeggen Spanje. Drie zeggen Argentinië. Het prachtige spel, dat nog nooit heeft vertrouwd op een door AI geschreven rapport, zal precies doen wat het wil.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Apple's langverwachte AI Siri-revisie is eindelijk hier FTX-oprichter Sam Bankman-Fried heeft formeel gratie aangevraagd bij president Trump →