Dood internet? Een derde van de nieuwe websites wordt door AI gegenereerd, zegt Stanford

Default Door Remote - 28 Apr 2026

In het kort

Medio 2025 was 35% van de nieuw gepubliceerde websites door AI gegenereerd of ondersteund door AI, een stijging ten opzichte van nul vóór de lancering van ChatGPT in november 2022.

De bevestigde effecten zijn semantische contractie en kunstmatige positiviteit – en geen verkeerde informatie of stilistische homogeniteit, ondanks wat de meeste mensen geloven.

Bij een AI-prevalentie van 35% verschuift het risico van modelinstorting van een theoretische zorg naar een empirische zorg voor de volgende generatie basismodellen.

Een nieuwe studie heeft een cijfer voor hoeveel van het internet nu door AI wordt gegenereerd: 35%. Dat is het aandeel nieuw gepubliceerde websites dat medio 2025 is geclassificeerd als door AI gegenereerd of door AI ondersteund, blijkt uit onderzoek van Stanford University, Imperial College London en het Internet Archive. Dit cijfer was in wezen nul voordat ChatGPT in november 2022 werd gelanceerd.

"Ik vind de enorme snelheid waarmee AI het internet overneemt behoorlijk verbijsterend", vertelde Jonáš Doležal, onderzoeker aan het Imperial College London en co-auteur van het artikel, aan 404 Media. “Na decennia van menselijke vormgeving is een aanzienlijk deel van het internet in slechts drie jaar tijd door AI gedefinieerd.”

Het onderzoek, getiteld “The Impact of AI-Generated Text on the Internet”, was gebaseerd op 33 maanden aan website-snapshots van de Wayback Machine van het Internet Archive en maakte gebruik van een AI-tekstdetector genaamd Pangram v3 om elke pagina te classificeren.

De bevestigde schade: vibraties, geen feiten

Onderzoekers testten zes hypothesen over wat AI-inhoud met het internet doet. Slechts twee hielden stand onder dataonderzoek.

De eerste: we veranderen in een horde domme NPC’s die op dezelfde manier handelen… Of, wetenschappelijker gezegd: het web wordt minder semantisch divers.

Door AI gegenereerde sites vertoonden een paarsgewijze semantische gelijkenisscore die 33% hoger was dan door mensen geschreven sites. Dezelfde ideeën worden steeds op vrijwel dezelfde manieren uitgedrukt.

Het artikel suggereert dat het online Overton-venster mogelijk kleiner wordt, niet door censuur of gecoördineerde campagnes, maar omdat taalmodellen optimaliseren voor resultaten die dicht bij hun trainingsverdeling liggen.

De tweede: het internet wordt agressief vrolijk.

AI-inhoud liet zien dat positieve sentimentscores ruim 107% hoger zijn dan menselijke inhoud. Onderzoekers koppelen dit aan de goed gedocumenteerde sycofantische neigingen van LLM's: getraind op menselijke goedkeuringssignalen, produceren ze tekst die opgeruimd, wrijvingsvrij en meedogenloos vrolijk aanvoelt.

Een internet dat wordt overspoeld met vrolijke, gehomogeniseerde inhoud kan menselijke afwijkende meningen op grote schaal marginaliseren zonder dat iemand aan een hendel trekt.

Ondanks de wijdverbreide publieke overtuiging vond het onderzoek geen statistisch significant bewijs dat AI-inhoud het internet feitelijk minder accuraat maakt. Onderzoekers vonden geen betekenisvolle correlatie tussen de prevalentie van AI en het feitelijke foutenpercentage.

De stilistische monocultuurhypothese – AI die individuele stemmen afvlakt tot een generiek uniform register – was de overtuiging die de respondenten het sterkst hadden (83% was het daarmee eens). De gegevens bevestigden het niet. Analyse op karakterniveau vond geen statistisch significante toename in stilistische homogeniteit die verband hield met de prevalentie van AI.

Het probleem van de ineenstorting van het model is zojuist reëel geworden. De bredere inzet gaat verder dan de kwaliteit van het discours. Bij een AI-prevalentie van 35% verschuift het theoretische risico op het instorten van modellen – waarbij toekomstige modellen degraderen na training op door AI gegenereerde data – van academische zorg naar empirische realiteit. Toekomstige basismodellen die zijn getraind op hedendaagse webcrawls zullen onvermijdelijk gegevens opnemen die substantieel door AI zijn gegenereerd en meetbaar minder semantisch divers zijn.

Het team werkt nu samen met het Internet Archive om het onderzoek om te zetten in een continue, live monitoringtool, waarbij het aandeel van AI op het web in realtime wordt gevolgd in plaats van als een eenmalige momentopname.

Uit een Amerikaans onderzoek dat naast het onderzoek werd uitgevoerd, bleek dat de meeste Amerikanen al in alle zes de negatieve hypothesen geloven, inclusief de hypothesen die de gegevens niet ondersteunen. Mensen die AI niet vaak gebruiken, hadden 12% meer kans om in de schade te geloven dan frequente gebruikers. Dead Internet Theory-gelovigen, maak kennis met de gegevens: het internet is niet dood, maar 35% van wat er nieuw is, is waarschijnlijk op de een of andere manier zombie-inhoud.

Dagelijkse debriefing NieuwsbriefBegin elke dag met de belangrijkste nieuwsverhalen van dit moment, plus originele artikelen, een podcast, video's en meer. Uw e-mail Download het! Download het!

← Het Robinhood-aandeel daalt met 8% nadat grote winsten zijn gemist als gevolg van zwakke crypto-handelsinkomsten CFTC steunt voorspellingsmarkten in alweer een rechtszaak tegen een staat →