Meta lanceert Muse Spark, de meest capabele AI tot nu toe, maar Gemini 3.1 Pro loopt nog steeds voorop

Default Door Remote - 08 Apr 2026

In het kort

Meta’s nieuwe Muse Spark markeert een verschuiving naar gesloten, native multimodale AI met agent-gebaseerd redeneren.

Meta rapporteert sterke benchmarkwinsten op het gebied van gezondheid en zoeken, maar loopt nog steeds achter op Gemini op het gebied van kernredeneren en coderen.

Gebouwd in negen maanden met veel minder rekenkracht, wijst dit op een nieuwe, op efficiëntie gebaseerde AI-strategie.

Meta lanceerde woensdag Muse Spark en markeerde het eerste model dat werd gebouwd door Meta Superintelligence Labs – het team dat negen maanden geleden werd samengesteld onder leiding van Chief AI Officer Alexandr Wang na Meta's Scale AI-acquisitie ter waarde van $ 14 miljard. Het is nu live op meta.ai en de Meta AI-app, met een uitrol naar Facebook, Instagram en WhatsApp in de komende weken.

Dit is niet zomaar een chatbot-upgrade of een nieuwe versie van Llama. Muse Spark is van nature multimodaal: het verwerkt afbeeldingen, tekst en stem vanaf de basis, in plaats van de visie aan een bestaand tekstmodel te koppelen. Het wordt geleverd met een visuele gedachtegang, ondersteuning voor het gebruik van tools en iets dat Meta de ‘Contemplating-modus’ noemt: een opstelling die meerdere AI-agenten parallel laat draaien om moeilijkere problemen aan te pakken. Dat is Meta's antwoord op de uitgebreide denkmodi van Google's Gemini Deep Think en OpenAI's GPT Pro.

“Muse Spark is de eerste stap op onze schaalladder en het eerste product van een grondige herziening van onze AI-inspanningen”, schreef Meta in een officiële aankondiging. “Om verdere schaalvergroting te ondersteunen, doen we strategische investeringen in de hele stack: van onderzoek en modeltraining tot infrastructuur, inclusief het Hyperion-datacenter.”

Het bedrijf werkte samen met meer dan 1.000 artsen om trainingsgegevens samen te stellen voor de medische redenering van Muse Spark. De resultaten op HealthBench Hard, een open benchmark voor gezondheidsvragen, zijn opvallend: Muse Spark scoorde 42,8, vergeleken met 40,1 voor GPT 5.4 en slechts 20,6 voor Gemini 3.1 Pro. Dat is geen marginaal verschil.

Op agentic search (DeepSearchQA) leidt Muse Spark ook met 74,8 en verslaat hij Gemini (69,7) en GPT 5,4 (73,6). Op CharXiv Reasoning – het begrijpen van cijfers uit wetenschappelijke artikelen – scoorde het een score van 86,4, het hoogste van alle modellen in de vergelijking.

Voor degenen die van jailbreak-AI houden: het model werd binnen enkele minuten opengebroken:

🚰 SYSTEEM DIRECT LEKKAGE 🚰

Hier is de volledige Muse Spark-systeemprompt van Meta!

Ik merkte dat @AIatMeta vergat het te openen, dus ik heb ze de beleefdheid bewezen 😘

PROMPT:

"""

Wie ben jij?

Je bent een vriendelijke, intelligente en agentische AI-assistent. Je bent warm en een beetje speels.…

— Plinius de Bevrijder 🐉ꠅԠ ԠԠԠԠԠԠڄڠԠԠꠅԠ (@elder_plinius) 8 april 2026

Maar goed is niet hetzelfde als geweldig. Het algemene benchmarkbeeld laat zien dat Gemini 3.1 Pro nog steeds voorop loopt in de meeste categorieën. De kloof is het meest zichtbaar in ARC AGI 2, de benchmark voor abstracte redeneerpuzzels: Gemini scoorde 76,5 tegen Muse Spark's 42,5.

Op het gebied van coderen (LiveCodeBench Pro) overtreft Gemini's 82.9 beter dan Meta's 80.0. Op MMMU Pro – multimodaal begrip – scoorde Gemini 83,9 versus 80,4. Meta's eigen blog erkent de huidige prestatieverschillen in agentische systemen en codeerworkflows met een lange horizon.

Er zit ook een opmerkelijke strategische verschuiving in deze lancering ingebakken. Muse Spark is een gesloten model; de architectuur en gewichten worden niet openbaar gemaakt. Dat is een scherpe afwijking van Llama, die de reputatie van Meta in open AI-kringen heeft opgebouwd. Na de teleurstellende ontvangst van Llama 4 eerder dit jaar lijkt Meta besloten te hebben dat het volgende hoofdstuk anders geschreven moet worden.

Het bedrijf zegt dat het toekomstige versies van Muse hoopt te openen, maar voorlopig blijft de code binnen Meta. De aandelen van de technologiegigant stegen woensdag met bijna 9% na de aankondiging en eindigden de handelsdag met een stijging van 6,5% naar een prijs van $612,42.

De “Contemplating-modus” maakt gebruik van parallelle agentorkestratie om het plafond van het model hoger te leggen. In die configuratie haalde Muse Spark 58% op Humanity's Last Exam en 38% op FrontierScience Research – een gebied dat het concurrerend maakt met de meest capabele versies van Gemini en GPT, in plaats van met hun standaardreleases.

Meta introduceert ook een winkelassistent die producten vergelijkt en rechtstreeks naar aankopen linkt, en is van plan Muse Spark de komende weken naar Facebook, Instagram en WhatsApp te brengen – volgens hetzelfde script dat sinds Llama 3 is geïmplementeerd, waardoor het voor meer dan 3,5 miljard gebruikers beschikbaar komt. Er wordt een privé-API-preview geopend voor geselecteerde ontwikkelaars.

Het model werd in negen maanden gebouwd en kreeg intern de codenaam Avocado, waarbij Meta beweerde dat de nieuwe pretraining-stack hetzelfde vaardigheidsniveau kan bereiken als Llama 4 Maverick met meer dan 10 keer minder rekenkracht.

Muse Spark wordt intern omschreven als een "kleine en snelle" eerste stap in de Muse-familie. Een krachtigere versie is al in ontwikkeling.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Amazon beëindigt de ondersteuning voor oudere Kindle-apparaten De baas van AWS legt uit waarom het investeren van miljarden in zowel Anthropic als OpenAI een prima conflict is →