Een van de problemen is dat de energie efficiëntie van supercomputers de laatste jaren niet heel hard meer toeneemt. Neem bijvoorbeeld de meest efficiënte supercomputers uit de
Top500-lijst, ook bekend als de
Green500:
Je ziet dat sinds de introductie van de MI250X er nauwelijks nog winst is geboekt qua energie efficiëntie.
Onderliggende problemen zijn dat silicium duurder wordt: De kosten per transistor dalen sinds 28nm een stuk minder hard (tot niet) dan voorheen. Om toch steeds sneller te kunnen elke generatie wil je meer uit de (dure) transistoren halen, en ga je ze dus hoger klokken. Daarom zien we nu ook ineens 1000 watt acceleratoren.
Naast dat de kosten per transistor steeds minder dalen zijn ook daalt ook het verbruik per rekenkracht steeds minder. Waar het vroeger heel gebruikelijk was dat bij een nieuw process een vergelijkbare processor 50% of zelfs 60% minder stroom verbruikte, mag je nu blij zijn met 30% minder verbruik. A16, een peperduur TSMC process gepland voor eind 2026,
verwacht slechts 20% energie te besparen ten opzichte van N2P.
Tegelijkertijd heeft sinds GPT-3 iedereen het gevoel vlak bij AGI te zitten, dus zijn er belachelijke bedragen beschikbaar om te kijken of dat ook daadwerkelijk het geval is. Want de eerste met functionele agents op menselijk niveau heeft een goudmijn in handen, ook al is het enkel "software".
Ondertussen is de initiële schok op de hardware markt voorbij en zijn de meeste spelers gewend aan een "nieuw normaal" waarbij, datacenter een gigantische markt is. Waar Nvidia bijvoorbeeld nog meer dan de helft van zijn omzet uit gaming haalde
slechts twee jaar geleden, komt nu dik 80% uit het datacenter. Hun datacenter omzet is een factor 6x gestegen, en met H200 superchips en Blackwell lijkt daar nog geen eind aan te komen.
Dus, samenvattend:
- Er kan minder snelheids- en energiewinst uit nieuwe semiconductor nodes worden gehaald
- Om toch te blijven groeien en de dure chips eruit te halen wordt er hoger geklokt
- Er is een enorme vraag naar AI-acceleratoren vanwege de AGI gold rush
- Het aanbod is ondertussen redelijk op peil
Of dit dan ook een bubbel is, vind ik heel moeilijk in te schatten, en weet denk ik (bijna) niemand. De grote vraag is hoe snel kunnen bedrijven er hoeveel waarde uit halen, en kan dat de huidige investeringen goedmaken.
Het zou kunnen zijn als
VR in de jaren 90: Heel veel hype, heel veel investeringen, maar uiteindelijk gewoon technologisch echt te vroeg voor prime time.
Het zou ook een iPhone-moment kunnen zijn voor AI, waarbij alle technologische puzzelstukjes er lagen maar ze enkel nog aantrekkelijk genoeg geïntegreerd moesten worden.
Of ergens er tussen in, zoals een dot-com bubbel waar miljarden de potentie er wel degelijk zat maar het gewoon nog allemaal net iets te vroeg was.