Hand omhoog als je niemand kent die afgelopen maanden aan de slag is gegaan met het programmeren met agentische AI-diensten. Veel mensen zijn gebruik gaan maken van Claude Code, GitHub Copilot en Google Antigravity. Daarnaast kwamen er diensten bij als OpenClaw, die urenlang achter elkaar AI gebruiken.
Bedrijven als Google en Microsoft behoren tot de bedrijven met de meeste datacentercapaciteit in de wereld. Ook Anthropic en OpenAI zijn op dit gebied geen kleine start-ups meer en hebben miljarden euro's gepompt in hardware om hun AI-diensten aan te bieden. De vraag naar AI krijgt de grote bedrijven op de knieën en zij nemen nu maatregelen om dat allemaal in goede banen te leiden.
De reactie van grote AI-bedrijven heeft niet lang op zich laten wachten. Om het capaciteitstekort op te vangen hebben ze de afgelopen weken de nodige maatregelen genomen.
Waar dit misging: in datacenters en bij gebruikers
Succes heeft vele ouders, maar mislukkingen zijn weeskinderen, zo gaat het spreekwoord zo'n beetje. Dat klopt hier niet, want de recente AI-tekorten hebben te maken met veel verschillende factoren die samenkomen.
De AI-race draaide afgelopen jaren vooral om chips: geheugen en gpu's. Dat is nog steeds in zekere zin zo, want de vraag naar geheugen voor AI-datacenters blijft onverminderd hoog. Dat zien we ook terug in bijvoorbeeld de prijzen van geheugen, die weliswaar niet meer zo erg lijken te stijgen, maar nog steeds hoog blijven.
Al die hardware moet natuurlijk in datacenters en daar knelt het wel. Datacenters bouwen is niet zo makkelijk meer als het tien of twintig jaar geleden was en daar lopen bedrijven tegenaan. Dat komt door een paar dingen. Ten eerste willen veel mensen geen grote dozen in het landschap om hen heen en de weerstand tegen datacenters is daardoor enorm gegroeid. Elk plan voor een groot datacenter kan rekenen op aandacht vanuit publiek en politiek. Dat geldt niet alleen in Nederland, maar in heel veel landen. Vergunningen zijn daardoor lastiger te krijgen en de bouw duurt langer.
/i/2006596696.png?f=imagenormal)
Zelfs als die datacenters er mogen komen, moeten ze stroomaansluitingen hebben. Dat is ook lang niet altijd makkelijk. Niet alleen in Utrecht is het stroomnet vol, in heel veel landen speelt dit probleem. Ook in de VS lopen datacenters vertragingen op door een gebrek aan stroom, schreef de Financial Times.
Daar komen extra problemen bij. In de VS zijn niet genoeg werklui te vinden die de datacenters kunnen bouwen en klaar kunnen krijgen voor gebruik bijvoorbeeld. Het zijn beperkingen waardoor plannen die er liggen op zijn minst vertraging oplopen en vermoedelijk ook veel duurder worden dan gedacht.
Een tekort aan capaciteit in datacenters was te overzien geweest als AI-gebruik niet zo snel steeg. Maar dat doet het wel. Vooral het gebruik van agentische AI voor zakelijk gebruik lijkt de afgelopen maanden snel toegenomen. Ook privé zullen veel meer mensen AI zijn gaan gebruiken voor programmeren.
Daarbij gaat het om complexere vragen dan de typische vragen aan AI van gewone gebruikers. Vaak is er een groot contextwindow bij nodig en agents kunnen uren achter elkaar werk verzetten voor een gebruiker. Dat vraagt veel van de capaciteit van servers. Een enkele prompt binnen Claude Code of Google Antigravity vraagt een veelvoud aan capaciteit ten opzichte van een prompt in een reguliere 'ouderwetse' AI-chatbot.
Nu gaat dat veelal om zakelijke klanten die betalen voor de diensten van AI-bedrijven en dat zorgt ervoor dat het lastig is om de capaciteit te ver te beperken. Immers: het moet niet zo ver gaan dat ze er onvoldoende waarde uit halen en dus stoppen met hun abonnement.
Hoe bedrijven omgaan met tekort aan datacenters
Bij Anthropic viel de schaarste misschien wel het meeste op. Zo is het aan het testen met het vereisen van het duurste Max-abonnement voor Claude Code, terwijl dat nu nog beschikbaar is bij een goedkoper Pro-abonnement. De afgelopen tijd heeft het bedrijf de gebruikslimieten al verlaagd, waarbij het werkt met twee soorten limieten: eentje binnen vijf uur en een voor een week. Het heeft een pagina online staan over het beperken van het gebruik. Veel klanten klagen ook over de beperkte beschikbaarheid tijdens piekuren.
En dan moet Mythos nog komen. Het nieuwe model, een ster in het vinden van kwetsbaarheden in software, is momenteel alleen in gebruik bij enkele tientallen bedrijven en organisaties. Als dit model beschikbaar komt voor iedereen, zal het gebruik niet afnemen. Het beperkt beschikbaar stellen was uiteraard voor de veiligheid, maar het komt Anthropic niet verkeerd uit om juist nu een aansprekend groot model even niet uit te brengen.
Microsoft heeft ook drastische maatregelen genomen: abonnementen nemen op GitHub Copilot kan nu even niet. Daarnaast krijgen bestaande betalende klanten lagere limieten. Verder is Claude Opus niet langer beschikbaar voor Pro-abonnees. Opus 4.7 is er voor Pro+-abonnees, maar oudere versies van Claude Opus zijn niet langer te kiezen als model. Die maatregelen moeten de druk op de servers doen afnemen.
OpenAI pakt het ook niet halfslachtig aan. Het is gestopt met Sora. De tool om video's te genereren bleek te duur en te belastend om in de lucht te houden. Een extra opvallend detail is dat Sora in eerste instantie snel veel gebruikers kreeg, maar daarna geen doorslaand succes is geweest.
Google is er minder vocaal over, maar lijkt ook last te hebben van tekorten. Klanten klagen over lagere limieten en soms zijn AI-diensten als het genereren van 'deep research' of afbeeldingen tijdelijk niet beschikbaar.
Bovendien komt er een hoop extra werk aan voor Googles datacenters. Apple komt later dit jaar met zijn nieuwe versie van Siri en die is gebaseerd op Gemini-modellen. Hoewel Siri vermoedelijk een hoop werk gaat verzetten op het apparaat zelf en in Apples eigen datacenters, komt er vermoedelijk extra verkeer van veel iPhones richting Googles servers.
Op de lange termijn zijn er meer datacenters nodig, die meer stroom verbruiken. In een wereld gericht op elektrificatie is dat veel om te vragen. Bovendien zullen de prijzen van de abonnementen behoorlijk omhoog moeten om de kosten te dekken.
Economie is een spel van vraag en aanbod. Als het aanbod van capaciteit in datacenters niet kan toenemen, zal de vraag gaan afnemen. Minder bedrijven en consumenten zullen de prijs willen betalen die AI-bedrijven moeten vragen om te kunnen leveren.
De agentische AI-toekomst zien we voor onze ogen tot leven komen. Maar of die haalbaar en betaalbaar blijft voor iedereen die dat wil, is natuurlijk de vraag. We kunnen op onze menselijke vingers natellen dat de huidige groei in AI-gebruik niet houdbaar is.
Redactie: Arnoud Wokke • Eindredactie: Marger Verschuur
:strip_exif()/i/2007997284.jpeg?f=imagenormal)
/i/2008140046.webp?f=imagenormal)
/i/2008138118.webp?f=imagenormal)