Live News

Airbnb heeft zich de afgelopen tien jaar verder uitgebreid dan alleen kamers en woningen te huur...

Quantic Dream sluit zijn multiplayer online strijdarena Spellcasters Chronicles na een vroege toegangsperiode van enkele maanden...

Op de Android Show: I/O Edition vorige week beloofde Google dat 2026 een groot jaar zou worden voor Android Auto, met grote updates gepland voor ho...

20/05/26

Volg ons:

Google onthult Gemini Omni: een AI-videobouwer van de volgende generatie die 'de wereld kan simuleren'

Google onthult Gemini Omni: een AI-videobouwer van de volgende generatie die 'de wereld kan simuleren'
Default Door Remote - 19 May 2026
In het kort

Google introduceerde Gemini Omni op I/O 2026 als een multimodaal AI-model dat is ontworpen om uit vrijwel elke invoer video en andere media te genereren.

DeepMind CEO Demis Hassabis zei dat Gemini Omni Gemini combineert met mediageneratiemodellen zoals Veo, Nano Banana en Genie.

Gemini Omni Flash wordt als eerste gelanceerd via Flow en Flow Music voor Google AI-abonnees.

Google heeft dinsdag Gemini Omni geïntroduceerd, een nieuw multimodaal AI-model dat de Gemini AI-modellen van het bedrijf combineert met zijn tools voor het genereren van media, waaronder Veo, Nano Banana en Genie.

De aankondiging kwam tijdens Google I/O 2026, waar DeepMind CEO Demis Hassabis Gemini Omni omschreef als “ons nieuwe model dat alles kan creëren uit elke input.”

"Het combineert de intelligentie van Gemini met het beste van onze generatieve mediamodellen voor een nieuw niveau van wereldbegrip, multimodaliteit en redactie", aldus Hassabis.

Google zei dat de eerste release, Gemini Omni Flash, zal worden gelanceerd via Flow, het AI-filmplatform van het bedrijf, en Flow Music, dat zich richt op AI-ondersteunde muziekcreatie.

We laten Gemini Omni vallen: onze eerste stap op weg naar een model dat alles van alles kan creëren - te beginnen met video.

Het combineert de intelligentie van Gemini met onze generatieve mediasystemen – wat een sprong voorwaarts betekent in wereldbegrip, multimodaliteit en redactie 🧵 pic.twitter.com/GAtqzr0VIV

— Google DeepMind (@GoogleDeepMind) 19 mei 2026

Hassabis noemde Omni een ‘stap in de richting van kunstmatige algemene intelligentie’ en zei dat Google het afgelopen jaar Gemini heeft uitgebreid tot ‘een wereldmodel AI dat de wereld kan begrijpen en simuleren’.

De Omni-uitrol van Google bouwt voort op de populariteit van Nano Banana, het eerdere AI-beeldbewerkingsmodel van het bedrijf dat Gemini afgelopen september naar de top van Apple's App Store heeft geduwd. Nano Banana werd op grote schaal gebruikt voor het genereren van meme's en het bewerken van conversatiebeelden, waardoor Gemini voor het eerst sinds de lancering van OpenAI's chatbot in 2022 ChatGPT inhaalde op het gebied van app-downloads en Google-zoekinteresse.

In de vergelijking van Decrypt eerder deze maand presteerde Nano Banana 2 beter dan OpenAI's GPT Image 2 in anime-illustraties en ruimtelijke compositietests, terwijl het model van OpenAI beter presteerde met fotorealisme en tekstweergave. Google lijkt nu veel van deze bewerkingsfuncties uit te breiden naar video via Gemini Omni.

Tijdens de presentatie demonstreerde Google dat Omni een educatieve video in claymation-stijl genereerde waarin het vouwen van eiwitten werd uitgelegd. Het bedrijf toonde ook conversatiebewerkingstools die een selfievideo aanpasten door nieuwe visuele elementen toe te voegen en de omgeving te veranderen.

Google zegt dat Omni dezelfde karakters, achtergronden en bewegingen consistent kan houden, zelfs nadat gebruikers wijzigingen in een video hebben aangebracht, iets waar veel AI-videomodellen moeite mee hebben. Het bedrijf zegt ook dat Omni het redeneervermogen van Gemini gebruikt om bredere instructies te begrijpen, zodat gebruikers het soort scène kunnen beschrijven dat ze willen zonder elk detail handmatig uit te leggen.

Het bedrijf introduceerde ook Flow Agent, een AI-assistent die is geïntegreerd in Google Flow en die over scènes kan brainstormen, assets kan organiseren, plotwijzigingen kan aanbevelen en projecten in batches kan bewerken.

Extra updates zijn onder meer Flow Tools, waarmee gebruikers aangepaste bewerkingsworkflows kunnen creëren met behulp van aanwijzingen in natuurlijke taal zonder codeerervaring.

Hassabis zei dat Google begint met het genereren van video's, maar van plan is de toegang tot Omni uit te breiden en beschrijft dit als de langetermijnvisie achter het multimodale ontwerp van Gemini.

“Dit was altijd ons doel met Gemini en de reden waarom we het vanaf het begin multimodaal hebben gebouwd”, zei hij.

Google reageerde niet onmiddellijk op een verzoek om commentaar van Decrypt.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!