Live News

Xbox heeft begin juni de volgende reeks titels aangekondigd die naar zijn Game Pass-abonnement komen...

Als je een fan bent van Wolverine, weet je waarschijnlijk dat je wat bloed kunt verwachten als hij opduikt...

Lego Batman: Legacy of the Dark Knight is misschien wel de beste Lego-videogame tot nu toe...

03/06/26

Volg ons:

Deze twee oprichters verlieten Goldman en Meta om stem-AI te bouwen voor markten die iedereen over het hoofd zag

Deze twee oprichters verlieten Goldman en Meta om stem-AI te bouwen voor markten die iedereen over het hoofd zag
Default Door Remote - 03 Jun 2026
Klantenondersteuning en service behoren momenteel tot de meest populaire sectoren op het gebied van spraak-AI. Maar het bouwen van een product dat menselijk klinkt en zonder merkbare vertraging reageert, blijkt in sommige markten veel moeilijker te zijn dan in andere – en de meeste grote spelers zijn niet gebouwd met Afrika en het Midden-Oosten in gedachten.

AethexAI, een startup die vorig jaar werd opgericht om dat gat te dichten, heeft $3 miljoen aan pre-seed-financiering opgehaald onder leiding van 4DX Ventures, met deelname van Enza Capital, Dorm Room Fund, Mojo Ventures en Stanford GSB 26 Fund. Individuele investeerders zijn onder meer de Stanford-faculteit, telecombestuurders en AI-onderzoekers van Anthropic.

In plaats van bestaande orkestratietools zoals Vapi en LiveKit te gebruiken, heeft het bedrijf zijn eigen kleine model- en orkestratielaag helemaal opnieuw opgebouwd om de gelokaliseerde dialecten van het Engels, Frans en Arabisch te kunnen verwerken die in zijn doelmarkten worden gesproken – een beslissing die, zoals we zullen zien, wordt ingegeven door de specifieke eisen van het opereren in de regio.

Het bedrijf lanceert ook zijn platform waarop bedrijven zijn technologie kunnen uitproberen en zich kunnen aanmelden voor zijn diensten, samen met API's en SDK's waarmee ontwikkelaars met zijn modellen kunnen experimenteren.

De startup is opgericht door Mariama Diallo en Ayooluwa Odemuyiwa. CEO Diallo werkte bij Goldman Sachs en trad later in dienst bij het door YC gesteunde ModelML als product- en groeihuurder. CTO Odemuyiwa studeerde af aan Caltech, werkte bij Meta en schreef zich in aan de Stanford Business School voordat hij het bedrijf mede oprichtte. Het tweetal wilde iets bouwen voor opkomende markten en ging op zoek naar kansen.

Bedrijven over de hele wereld haasten zich om AI-tools te adopteren om delen van hun activiteiten te automatiseren. Maar dat lukt niet altijd. In Egypte automatiseerde een callcenter een aanzienlijk deel van zijn oproepen, maar werd het systeem teruggedraaid vanwege slechte resultaten, ontdekten de oprichters. Verschillende ondersteuningscentra in Afrika vertelden hen dat het vinden en inhuren van technici om gesprekken tegen de juiste kosten te automatiseren een aanhoudende hoofdpijn was.

"De latentie en jitter die we zagen bij geautomatiseerde oproepen in deze regio waren schandalig. Als we orkestrators waren geworden, hadden we misschien grote modellen moeten gebruiken die buiten de regio werden gehost, wat resulteerde in een hogere latentie. We realiseerden ons dat we, om dit te laten werken, zeer kleine modellen moeten gebruiken en de latentie bij elke stap moeten terugdringen", vertelde Odemuyiwa aan TechCrunch over de beslissing om de eigen modellen en orkestratielaag van het bedrijf te bouwen.

AI-laboratoria die hun nieuwste modellen inzetten, besteden doorgaans miljoenen aan training en het verzamelen van gegevens. AethexAI heeft voor beide een oplossing gevonden. In plaats van de grootst mogelijke modellen na te jagen, besloot het dat kleine modellen voldoende zijn om het latentieprobleem aan te pakken met behoud van de nauwkeurigheid en ontwikkelde het zijn eigen Kora-serie, met parameters variërend van 300 miljoen tot 1,7 miljard. Dat is een fractie van de omvang van de LLM’s, en dat is precies het punt.

Om deze modellen te trainen gebruikte de startup geanonimiseerde opnames van een callcenterpartner. Het verscheepte ook harde schijven naar radiostations in heel Afrika om meer audiogegevens te verzamelen. Om de kosten laag te houden, bouwde het een netwerk van universiteitsstudenten op om gegevens te annoteren en lokale namen uit te spreken. Als gevolg hiervan verwerkt de startup nu meer dan 17.000 oproepen per dag.

Aan de zakelijke kant zorgt het bedrijf ervoor dat klanten die nieuw zijn bij het uiten van AI door het proces worden geleid, door demo's en workshops op locatie aan te bieden om hen te helpen de beste gebruiksscenario's voor automatisering te identificeren.

"We vertellen klanten altijd dat we op dit moment niet alles voor iedereen kunnen zijn. We zijn klein. Als we met een bedrijf beginnen te praten, vragen we hen om één gebruiksscenario te kiezen dat voor hen het belangrijkst is om mee te beginnen", aldus Diallo.

De startup staat open voor samenwerking in alle sectoren, maar op dit moment omvat een groot deel van de gebruiksscenario's oproepen tot incasso, klantactivering of KYC - Know Your Customer-verificatie, het standaard identiteitscontroleproces dat door banken en telecombedrijven wordt gebruikt. Het bedrijf neemt op contractbasis technici in dienst om lokale markten te bedienen en kanaalpartnerschappen op te bouwen met telecomaanbieders om de telefonie voor spraak-AI-oproepen af ​​te handelen. Plug-and-play-oplossingen werken hier simpelweg niet.

Walter Baddoo, mede-oprichter en managing partner van 4DX Ventures, stelt dat de markt in Afrika en het Midden-Oosten fundamenteel verschilt van de markten waarvoor de meeste voice-AI-bedrijven zijn gebouwd.

“Bedrijven in Afrika en het Midden-Oosten verwerken grofweg drie keer het belvolume van hun westerse tegenhangers, omdat spraak nog steeds het dominante kanaal is voor klantinteractie”, zei hij. "Gevestigde systemen zijn gebouwd voor westerse markten die worden gekenmerkt door een hoogwaardige GPU-infrastructuur, standaard Engelse en Europese spraakomgevingen en zakelijke workflows die gebruikelijk zijn in de VS en Europa. Dat creëert echte gaten wanneer bedrijven systemen nodig hebben die dialecten, codewisselingen en informele spraakpatronen verwerken, en die werken binnen hun bestaande telefonie-infrastructuur en hun werkelijke prijsniveaus."

Anders gezegd: terwijl bedrijven als ElevenLabs, Deepgram, Sierra en Cognigy zich in een snel tempo wereldwijd uitbreiden, zijn de markten waarvoor ze zijn gebouwd en de markten die ze betreden niet altijd hetzelfde. Startups als AethexAI gokken erop dat de gaten – modellen gespecialiseerd in lokale dialecten, partnerschappen ter plaatse, infrastructuur gebouwd voor de regio – een marktopening vertegenwoordigen die de giganten noch de stimulans, noch de architectuur hebben om te dichten.