'IBM gaat serverchips op 7nm bij TSMC laten maken'

IBM wil naar verluidt een overeenkomst met de Taiwanese chipfabrikant TSMC sluiten om serverchips te fabriceren op het 7nm-procedé. De stap zorgt er mogelijk voor dat Intel meer concurrentie krijgt op de servermarkt.

IBM liet zijn serverchips tot nu toe bij GlobalFoundries maken, maar de it-gigant staat op het punt TSMC in te schakelen om serverprocessors op 7nm te kunnen maken. Die chips zouden in komende Z15-mainframes terecht moeten komen. Dat schrijft de Japanse zakenkrant Nikkei. GlobalFoundries maakte dit jaar bekend de stap naar 7nm en verder niet te maken maar zijn bestaande 12nm- en 14nm-procedé's te optimaliseren.

IBM gebruikt Power9-processors op basis van de Power-architectuur voor zijn servers. In 2014 verkocht IBM zijn divisie voor x86-servers aan Lenovo. De Power-systemen van IBM hebben een relatief klein marktaandeel, maar zitten in het hogere segment. Intel levert volgens TrendForce 96 procent van de chips voor datacenterservers. Omdat Intel moeite heeft de overstap naar 10nm te maken, ontstaan er wellicht kansen voor concurrenten om marktaandeel op de lucratieve servermarkt te winnen.

Intels eerste 10nm-chips worden eind 2019 verwacht. AMD maakt ook de overstap naar 7nm voor zijn Epyc-processors voor servers. De overstap naar een kleiner procedé biedt inherent de mogelijkheid de prestaties te verhogen en de efficiëntie te verbeteren, nog los van de verbeteringen op het gebied van de architectuur.

Door Olaf van Miltenburg

Nieuwscoördinator

20-11-2018 • 18:34

50

Reacties (50)

50
49
20
7
2
26
Wijzig sortering
Wat wil dat eigenlijk zeggen dat GlobalFoundries de stap naar 7nm niet gaat maken. Zullen nieuwe processors gemaakt op een verder geoptimaliseerd 14 of 12nm proces sneller kunnen zijn dan een processor die gemaakt is op 7nm?

[Reactie gewijzigd door Username3457829 op 23 juli 2024 04:35]

Er waren voor GlobalFoundries drie typen 7nm klanten:

-Die ene die veel capaciteit nodig had, meer dan GloFo had gepland, hier moesten na 2018 nog eens miljarden extra geïnvesteerd om genoeg capaciteit te bieden,
-Alle andere voor wie 7nm eigenlijk veel te duur is (een 7nm ontwerp kost al snel 300 miljoen), en die kleine capaciteit nodig hadden,
-Die ene die weinig capaciteit maar wel 7nm nodig had en kon betalen.

De eerste is AMD, tellende voor bijv. 5x de beschikbare GloFo 7nm capaciteit, de laatste IBM, tellende voor 0,1.

Welnu, alleen voor 5,1 klant is dit astronomisch duur; en als die 5.0 problemen heeft is GloFo kapot. Bovendien had AMD al zeg maar van de 5x GloFo capa al 2x uitbesteed aan TSMC.

De vraag was: GloFo heeft een eindige spaarpot en personeel: gaat die naar IBM en AMD en de rest heeft pech? Of andersom? Als het naar 7nm voor AMD en IBM ging, kon er praktisch niet worden geïnvesteerd in de rest.

Ok, zelfreflectie: Waar kan GloFo zich differentiëren van TSMC en Samsung? En veel marge maken?

7nm niet echt, hebben die andere twee al eerder. En waarschijnlijk goedkoper. TSMC zit in een lage lonen land en wordt vooraf betaald door s werelds 1 na rijkste bedrijf, Samsung wordt betaald door de DRAM miljarden. Moordende 7nm concurrentie, slechts 1 halve klant die de andere helft elders laat maken (AMD) en 0,1 mega veeleisende (IBM).

Of waar GloFo marktleider in is en unieke processen biedt die TSMC en Samsung _niet_ hebben: RF SOI (‘radiogolven apparatuur chipproces’) van IBM en 22nm FDSOI?

Let wel: RFSOI was de melkkoe van IBM foundry: Weinig moeite, veel marge en groei, sterke IoT business.

Moeilijk, maar het werd het laatste. En dan nog geld over om 12nm te verbeteren.

Bovendien waren er tekenen dat GloFo 7nm op hetzelfde doodlopende Kobalt spoor zat als Intel 10nm.

Nee, voor CPU’s, servers en GPU’s (AMD en IBM) bieden TSMC en Samsung 7nm betere prestaties, en eerder op de markt.

Ja, voor IoT, 5G, radar, defensie, nucleaire industrie, auto industrie gekwalificeerd (groeimarkt!), ruimtevaart (alle vorige vier willen stralingsbestendigheid wat FinFET absoluut niet is), al het andere met radiogolven en ‘Edge computing’ winnen FDSOI (22FDX) en IBM’s RFSOI, nu van GloFo, het vrij ruim van de concurrentie. Dus veel marge! Kijk maar hoe bagger Intels processen zijn: Ze hebben absoluut nog geen werkend 5G platform, wat ze hadden is uitgesteld en er zijn alleen fotoshoot foto’s van. Bestaat dus alleen op papier; Intel heeft _niks_ qua radiogolf processen (RF) dat ook maar enigszins bruikbaar is voor 5G. Al zegt hun PRietPRaat afdeling van wel; sommige naïevelingen geloven die sneue kolder nog ook. Daar, ongelofelijk maar waar, wint GloFo ‘qua snelheid’ van Intel!!!

Bijna _alle_ smartphones bevatten onderdelen gemaakt op IBM’s RF SOI. Dat zijn er best veel, en dat proces wint niet zomaar.

GloFo 22FDX kan -middels een ontwerptrucje dat nog weinig bedrijven gebruiken (Body Bias)- _nadat_ het uit de fabriek rolt, op en neer schakelen tussen ‘redelijk snel’ en ‘super megazuinig’. Ideaal voor IoT dat 99% van de tijd zuinig en stand-by moet zijn en 1% snel. Intel en TSMC poepten zo in hun broek dat ze als reactie 2 nietszeggende 22nm processen ertegenover hebben gezet, zonder genoemd body bias zijn die trager, en meer energie gebruikend, nog niet op de markt toen en niet gecertificeerd voor automotive.

Daar en bij RFSOI zit dus de unieke kracht van GloFo! Daar is tevens weinig concurrentie.
Globalfoundries heeft zelf duidelijk laten weten waarom ze met 7nm stoppen en dat is eigenlijk niet zo heel complex. Het was simpelweg de eigenaar van GlobalFoundries, Mubadala weigert nog meer geld te investeren.

Voor wie niet bekend is met de context. AMD heeft zich rond 2006 verslikt in de overname van Ati (radeon) a 3 miljard. Gevolg was miljarden afschrijvingen en vrij het afstoten van alle fabrieken. Die fabrieken zijn gekocht door Mubadala onder de naam GlobalFoundries. Vervolgens heeft Mubadala in de afgelopen 10 jaar boven de aanschaf prijs al meer dan 20 miljard verloren op dit avontuur.

Nu het probleem. De race naar kleinere nm wordt steeds prijziger en om die kosten terug te verdienen is volume nodig. Na 10 jaar GlobalFoundries blijkt de omzet van 2017 slechts 6 miljard te bedragen (met een verlies van 1.2 miljard). Ter vergelijking, TSMC doet bijna 30 miljard en maakt daarbij bovendien iets van 11 miljard winst. Om de ontwikkeling en productie van 7nm voor GlobalFoundries winstgevend te maken is dus veel meer volume nodig. Om dat volume te kunnen leveren zijn extra fabrieken nodig. Die fabrieken kosten weer 10 miljard per stuk (grote zelfs 20 miljard). Daarvan heeft Mubadala dat het na 10 jaar geld verliezen mooi is geweest en ze niet mee gaan in die strategie.

Zie hier wat meer achtergrond informatie: https://www.anandtech.com...stops-all-7nm-development

De overstap van AMD naar TSMC was overigens eerder een gevolg dan een oorzaak. AMD was immers verplicht bij GlobalFoundries af te nemen. Voor een deel zijn ze dat nog steeds, zie 12nm Polaris.. Nu GlobalFoundries de stekker eruit trekt is AMD vrij om elders te shoppen (eerder was al een deel van het contract afgekocht door AMD).

[Reactie gewijzigd door sdk1985 op 30 juli 2024 17:57]

GloFo 22FDX kan -middels een ontwerptrucje dat nog weinig bedrijven gebruiken (Body Bias)- _nadat_ het uit de fabriek rolt, op en neer schakelen tussen ‘redelijk snel’ en ‘super megazuinig’. Ideaal voor IoT dat 99% van de tijd zuinig en stand-by moet zijn en 1% snel. Intel en TSMC poepten zo in hun broek dat ze als reactie 2 nietszeggende 22nm processen ertegenover hebben gezet, zonder genoemd body bias zijn die trager, en meer energie gebruikend, nog niet op de markt toen en niet gecertificeerd voor automotive.

Daar en bij RFSOI zit dus de unieke kracht van GloFo! Daar is tevens weinig concurrentie.
Maw, Global Foundries heeft geen rede om haast te hebben met zoiets moeilijks (duur) als 7nm, maar is het te verwachten dat ze wat verder in de toekomst wellicht wel 7nm gaan doen?
Of is het 'einde vd wet van Moore' inmiddels zo dramatisch dat een foundry compleet afhaakt mbt tot process verkleining?
Er zijn al een hele boel foundries afgehaakt, voor veel toepassingen is het inderdaad niet meer zinnig om de wet van Moore te volgen (bv als je geen 300 miljoen hebt liggen voor een ontwerp).
Maar is het te verwachten dat ze wat verder in de toekomst wellicht wel 7nm gaan doen?
Een ogenschijnlijk goede en simpele vraag; maar bij nadere beschouwing blijken het er eigenlijk 4!

De vraag is:
1) Wiens 7 nm zou GloFo eventueel verkopen?
2) Welk 7nm proces zou GoFo eventueel verkopen?
3) Aan wie?
4) Met hulp van wie?

TL;DR: De enige manier waarom GloFo in de toekomst succesvol aan 7nm zal gaan doen, is als die 4 zaken geregeld zijn.

1) --> Wiens proces: GloFo nam eerder ook al afscheid van haar 'eigen' 14nm proces, wat te duur en te laat was. In plaats daarvan namen ze het 14nm-proces van Samsung in licentie, dat Samsung had gemaakt voor smartphone SoC's. Op dat "niet voor CPU's bedoelde proces" is het hele huidige succes van AMD Ryzen gebaseerd! Ervanuit gaande dat GloFo niet haar eigen 7nm 'uit de motteballen haalt', moet TSMC, Intel of Samsung het in licentie geven. Intel zelf heeft veel problemen met haar 10nm node (net iets 'kleiner' dus ambitieuzer dan TSMC's/Samsung's); en waarom zouden ze het aan GloFo geven zodat die er AMD mee helpen kan? TSMC heeft het geld niet echt nodig. Samsung zou de enige zijn die dat zou kunnen doen.

2 --> Welk 7nm proces: Zoals genoemd: GloFo 14nm is Samsung's 14nm smartphone proces. Wel proces hangt dus af van de klanten. Zowel Samsung als TSMC ontwikkelen voor 7nm een 'smartphone' proces (SoC) en een "HPC" proces, dat staat voor "High Performance" en dat betekent in dit geval niet per se supercomputers (kan wel!), maar eigenlijk gewoon "Geschikt voor desktops en server CPU's / GPU's". Dus dat zijn er al twee. Tevens is Samsung marktleider in EUV; omdat ze vanwege hun financiële structuur (foundry cijfers komen niet 'los' naar buiten) hogere kwaliteits, snelheids- en stilstands-verliezen (~>50%) kunnen accepteren. TSMC en Intel beginnen pas met EUV als de verliezen laag zijn (<<20%).
7nm EUV is qua prestaties niet veel beter dan 7nm 'DUV' (193nm ArF licht), en heeft daarom niet zoveel klanten. Echter, 7nm 'DUV' van Samsung, vereist zeer veel stappen, en een zeer hoge nauwkeurigheid om een chip meerdere keren achter elkaar binnen enkele nm op dezelfde plek te leggen; omdat het in vier stappen 'belicht' moet worden; een beetje alsof je met een fototoestel uit 1900 4x achter elkaar vanuit de loss pols dezelfde fotoplaat wil belichten, en toch een scherpe foto houden . Daarom is dit proces zeer duur! Voor 7nm EUV zijn de kosten lager, dat kan met 1x belichten, maar de EUV machines zijn veel kostbaarder en je moet twee keer zoveel chips maken omdat je de helft moet weggooien. Dat brengt ons bij 3.

3) Aan wie:
--> Klanten die alleen in de VS mogen kopen, zoals de Amerikaanse defensie. Leuke business en superhoge marges, maar geen hoge volumes en superhoge eisen. Volgens mij gebruikt het leger in de VS ook mainframes van IBM, dus als dat uit Taiwan komt, is dat een potentieel probleem!
--> Samsung klanten die een 2e leverancier zoeken; dus die het risico niet willen lopen met lege handen te staan als de fabriek van Samsung overstroomt door een Tsunami of kapotgaat door een aardbeving, of tot voor kort bestond ook de angst: "door Noord Korea aanvalt". Dan is het handig een tweede leverancier met gelijk proces te hebben, maar die krijgen vaak de kruimels. Apple, Hisilicon (Huawei), Xilinx en Rockchip zijn vrij stevig getrouwd met TSMC. Dus vooral Qualcomm, dat nu spreid tussen Samsung en TSMC zou een kans zijn. Vooral door de oplopende ruzie tussen Qualcomm enerzijds en Z Korea (Samsung gerelateerd!), Taiwan (TSMC / Apple gerelateerd!) en China ('gewoon' Trump-gerelateerd, zie NXP) anderzijds.


4) Met hulp van wie: Intel's 14nm+ proces is ogeveer gelijk aan TSMC's / Samsungs 10nm proces. Intel's 14nm+++ proces is "in die klasse" veruit het beste proces voor CPU's. Op dit moment zelfs beter dan Intel 10nm. Waarom zijn van deze fabrieken dan eigenlijk bijna geen externe (niet-Intel) klanten?
Welnu: De 'chipontwerp software' moet de regels van jou proces hebben ingebakken. Die regels liggen vaak vast in een 'PDK' (proces development kit). Als een chipontwerp 300 miljoen kost, is het erg belangrijk dat je het zo geautomatiseerd mogelijk kan ontwerpen, 'compileren' en simuleren. 'Compileren' wil hier zeggen dat je het ontwerp op iets hoger niveau maakt, en de EDA-software maakt hem 'automatisch' op detail-niveau. Dit zijn vooral de spelers Cadence, Synopsys en Mentor (Siemens). Die gaan alleen investeren in het implementeren van de PDK van jou proces als ze veel klanten verwachten; dit heeft bij FDSOI zeker >5 jaar geduurd; en zelfs het 'Body Bias' trucje (van o.a. GloFo 22FDX) wordt nog niet volledig ondersteund in de EDA-software.

Vervolgens zijn er meestal een aantal firma's die bouwpakket-onderdelen op 'jou' proces ontwerpen, testen en beschikbaar stellen; het zogenoemde "IP ecosysteem". Bijvoorbeeld: CEVA maakt een DSP-bouwblok (wordt tegenwoordig verkocht als zijnde "AI accelerator"), test die uit op TSMC proces, en geeft dat bouwpakket-onderdeel daarna in licentie aan Apple. Als - zoals bij TSMC - honderd bedrijven "bouwblok-ontwerpen in licentie" leveren (groot IP ecosysteem) en er veel EDA-ondersteuning is, kan zelfs een totaal Chinees flut-bedrijf met een bouwpakketje een SoC in mekaar LEGO'en. Dat zag je bijvoorbeeld in het begin bij Samsung Exynos en later bij Hisillicon (Huawei): Op papier supergoede specs, in de praktijk in de wat realistischer benchmarks langzamer dan Apple / Qualcomm. Waarom? Omdat stiekem het moeilijke werk zit in het combineren en laten samenwerken van de bouwblokken (integratie), daar zijn Apple en Qualcomm meester in! Maar zelfs voor Apple met genoeg geld, scheelt het standaard beschikbaar zijn van geteste bouwblokken ze makkelijk een paar miljard aan ontwerp en test-kosten (dus anders zou die 300 miljoen nog vele malen meer zijn). Waarom heeft 's werelds beste 14nm-klasse 'foundry' (Intel 14nm+++) dus geen klanten? Welnu, ze hadden al niet veel klanten, dus weinig EDA-ondersteuning, weinig IP, dus niet interessant voor klanten, EDA / IP makers zien dat, dus weinig EDA en IP, dus weinig klanten enz....: Geen ecosysteem! Was afgelopen 10 jaar ook het verhaal waarom GloFo FD-SOI het aflegde tegen alle FinFET processen; na ca. 10 jaar is het eindelijk bijna geregeld*.

De Sony Ericsson Novathor op FD SOI proces was veel zuiniger en sneller dan alle concurrentie, toch werd het FD SOI platform toen geen succes! .

Fictief voorbeeld:
Voor kleinere bedrijven, waarvan GloFo er veel als klanten heeft, geldt:
In fact, it costs $271 million to design a 7nm system-on-a-chip, which is about nine times the cost to design a 28nm device, according to Gartner.
. Aha, dus als ik er 1 000 000 maak, kost het bij 7nm $271 ontwerpkosten per chip, bij 28nm maar $30. Voor veel toepassingen - dus klanten - is dat eerste niet acceptabel; als GloFo's klant een winstmarge van 50% wil maken moeten ze dat ontwerp bij de klant in rekening kunnen brengen voor $540. Voor 'IBM mainframe Z15" natuurlijk is dat geld peanuts dus totaal geen issue; maar dat is een uitzondering. Vandaar ook dus, dat we zien dat 7nm vooralsnog gebruikt wordt voor chip-ontwerp-blokken die >>10M x over de toonbank gaan, smartphones, AMD CPU's en nVidia / AMD GPU's dus. Als een bepaald type AMD processor maar 100k keer verkoopt is het niet erg: Het 'gedeelde' Zen-CPU blok veroopt met miljoenen; vandaar het belang van een 'gedeeld platform' waarbij een hele product-range gebruikmaakt van dezelfde 'kernen'. Voor kleinere oplages: Als een 'IP-bouwblok' in SoC's van 10 verschillende leveranciers eindigt, dan moeten die op hun beurt allemaal 1M stuk verkopen. Zonder 'bouwblokken' / gedeelde kernen (AMD Zen, nVidia Pascal / Volta cores, ARM Cortex A serie, Intel's Skylake-cores) was dit dus praktisch niet economisch haalbaar.

[Reactie gewijzigd door kidde op 30 juli 2024 17:57]

Dank voor de uitgebreide reactie, hiervoor kom ik op Tweakers.
Fantastisch verhaal! _/-\o_
Wow, 300 miljoen voor het ontwerp, wat een bedragen gaan er om in dit wereldje. :D
Power9 bestaat al lang, en er draaien op dit moment vele duizenden, wellicht wel miljoenen Power9 chips in datacententra en supercomputers.
Linux ? En met de aankondiging van de Blackbird door Raptor komt de Power9 ook binnen bereik van de poweruser: https://wiki.raptorcs.com/wiki/Blackbird

Hier zijn een aantal benchmarks van de Power 9 vergeleken met i9 en Threadripper:

https://www.phoronix.com/...-threadripper-core9&num=1
Ze geven de naam dus niet voor niets het nummer 9.
Dat betekent dat ze niet de nieuwste CPUs en GPUs e.d. kunnen produceren die gebruikt worden in computers/laptops, telefoons, e.d. De nieuwste CPUs en GPUs zullen waarschijnlijk altijd wel op de kleinst mogelijke node gemaakt worden, omdat ze dan het snelst zijn, en het zuinigst, etc. GF zal die dus niet meer kunnen bakken. Wel bijvoorbeeld oudere types CPUs of GPUs, bepaalde embedded CPUs, of allerhande support chips, die allemaal nog op een grotere node (12mm of groter) gemaakt worden.

Voor dat soort chips dat ze wel kunnen maken, is ook nog voldoende markt (o.a. AMD gebruikt 12/14nm nog steeds bij Zen2) maar de winsten op 7nm zijn waarschijnlijk een stuk groter dan op grotere nodes, terwijl de concurrentie er kleiner is, en nog meer nu GF niet meer meedoet..

Wellicht kunnen ze over een, of een paar jaar, alsnog op 7nm overstappen, als het procede wat meer gerijpt is. Alleen lopen ze op dat moment wel nog achter. En zonder de 7nm winsten van nu is het de vraag of ze die achterstand tzt in kunnen halen. Ze zullen waarschijnlijk dus nooit meer in staat zijn om aan de top van wat technologisch haalbaar is mee te doen.
Als ik het goed herinner kwam het door de hoge kosten van het ontwikkelen van 7nm. De kosten voor nieuwe processen worden exponentieel groter bij elke stap kleiner dat je gaat.
Ik had ook al gelezen dat binnenkort versie 10 uit zou komen.
Maar het zijn dure dingen volgens mij die chip kan 24 cores herbergen buitendat kan er terabytes aan intern geheugen aan aldus maximale haalbaar intern geheugen betrefd.Volgens mij staan ze helemaal bovenaan de lijst met snelste server en dat al jaren.bron:

power 9

https://en.wikipedia.org/wiki/POWER9

power 10

https://en.wikipedia.org/wiki/POWER10

veel leesplezier.
Op zich valt het met de prijzen van de processoren zelf nog wel mee. De scale-out variant met 8 cores kost $595 en dat is vergelijkbaar met het bedrag dat je voor een Intel Xeon betaalt. Het grootste probleem is de prijs van een moederbord of een systeem.

Hier kun je wat meer informatie en prijzen vinden op de site van Raptor Computing Systems: https://raptorcs.com. Er zijn nu al meer dan 1000 mensen die zo'n systeem hebben aangeschaft, dus er is in deze niche toch wel vraag naar. Ik hoop dat het nieuwe Blackbird moederbord wat goedkoper wordt dan de initiële $875, zodat ik er op termijn ook een kan aanschaffen. En dan kijk ik geïnteresseerd verder naar POWER10.
Is er ooit nog echt iets terecht gekomen van OpenPOWER? Om een serieuze concurrent van Intel te zijn moeten deze systemen door meer dan enkel IBM aangeboden worden.
Mixed verhaal tot nu toe - er zijn veel bedrijven aangesloten bij de OpenPOWER alliance, en er zijn inmiddels zijn er wel diverse systemen ontwikkeld, en voor spelers als nVidia en Google is het in principe een goed alternatief voor Intel om achter de hand te hebben (Google heeft inmiddels een aantal POWER servers in productie), maar qua daadwerkelijke verkoopaantallen heeft nog niemand enige successen geclaimed, en het is nogal onwaarschijnlijk dat IBM een succesverhaal geheim zou houden.

Maar dit kan allemaal veranderen - Intel had altijd een voorsprong qua performance en kosten vanwege hun productietechnologie, waar IBM telkens minstens een generatie achterliep. Nu Intel gestruikeld is over de 10nm transitie zien die POWER9 chips er ineens heel leuk uit. De combinatie van nVidia en IBM/POWER is ook een logische alliantie in de HPC wereld.
De Power processoren zijn momenteel gewoon in een heel ander segment actief naast de x86/Xeon’s van bijvoorbeeld Intel.

De huidige Power processoren zijn dan ook helemaal geen Workstation vervangers. Ze bedienen een eigen segment momenteel maar dat segment verliest terrein door verandering van applicatie landschap. Waar Power heer en meester in is, is RAS. (Reliability, Availability en Serviceability samen met de verticale performance schaling en laten deze zaken nu net minder belangrijk worden bij onder andere het nieuwe horizontaal schalen van applicaties.

* GeeMoney werkt al 14 jaar met IBM Power en AIX.

Ter indicatie van de verticale schaalbaarheid. De E980 biedt tot 192 cores en 1536 threads met 64TB memory, en maar liefst 768 PCIe G3 expansion slots (192 per node, max 4 nodes)

OpenPOWER komt wat mij betreft in Nederland nog niet echt van de grond. Ook de Little Endian Linux distro’s op Power nemen nog geen grote vlucht, met name door het nog kleine aanbod aan software al is het al wel beter dan Big Endian op Power.

Ik ben benieuwd welke markt ze denken in te stappen.

[Reactie gewijzigd door GeeMoney op 30 juli 2024 17:57]

Wat voor toekomst zie jij dan nog voor POWER systemen? Zelf vind ik dat IBM vrij laat met zijn Power.org en OpenPOWER initatieven is gestart, op het moment dat het kalf eigenlijk al is verdronken. Linux/PPC64LE heeft nu ook pas de prioriteit gekregen boven AIX, terwijl dat allang had kunnen gebeuren. Hoe goed AIX (en HP-UX en Solaris) ook zijn, het blijkt een steeds kleinere markt te zijn.

Er zijn nu wel scale-out en scale-up varianten van de POWER9 processoren die PCI-E 4.0 en NVLink ondersteunen en daarnaast veel geheugenbandbreedte hebben. Maar doordat er lange tijd geen workstations beschikbaar waren, is veel software niet geoptimaliseerd. Daar begint nu eindelijk iets aan te veranderen door OpenPOWER leden zoals Raptor Computing Systems alsook Google en Rackspace aan de serverkant.

Wat ik zelf het interessantst vind is dat IBM, Oracle, HP, AMD, Nvidia en andere bedrijven allemaal lid zijn van de RISC-V Foundation. Wat weerhoudt ze ervan de processoren die ze hebben deze nieuwe instructieset te laten ondersteunen en een nieuwe golf van Linux-compatibele processoren te lanceren?

Fujitsu heeft immers hetzelfde gedaan met hun processoren voor de Post-K supercomputer die nu in plaats van SPARC de ARM instructieset ondersteunt met hergebruik van veel blokken uit hun SPARC64 processoren.
Wat ik zelf het interessantst vind is dat IBM, Oracle, HP, AMD, Nvidia en andere bedrijven allemaal lid zijn van de RISC-V Foundation. Wat weerhoudt ze ervan de processoren die ze hebben deze nieuwe instructieset te laten ondersteunen en een nieuwe golf van Linux-compatibele processoren te lanceren?
Al die bedrijven staan er ietwat anders in:
- HP is denk ik permanent genezen van zelf cpu's maken na de kater van Itanium, ze betalen zich nog steeds blauw aan Intel om de boel draaiend te houden
- Oracle heeft natuurlijk al een geweldig goede RISC chip, en had zonder problemen door kunnen gaan met de SPARC versie Linux, dat ze daar niet toe hebben besloten, dat lijkt me teken genoeg dat ze ook geen nieuwe RISC-arch icm Linux gaan doen. Het is x86 Linux, Exadata to the max.
- IBM heeft de x86 verkocht dus is er maar 1 paard over om op te wedden: it's POWER (on Linux, want geen hond stapt nu nog in AIX natuurlijk) or bust.
- nVidia heeft de cash niet, heeft nul ervaring met high-end cpu design, en is nu een ideale partner voor IBM om de combo POWER + AI-accelerators te ontwikkelen. Als IBM ooit de POWER chipdesign biz afstoot (om bv puur op software te richten), dan zie ik nVidia wel toehappen, maar zelf beginnen aan RISC chips...als ze dat werkelijk wilden, dan waren ze wel aggressiever doorgegaan met die Tegra ARM business richting high-end schalen.
- AMD zou erin kunnen stappen maar heeft geen software stack waartegen je de chips kan ontwikkelen. Weinig cash en het is 1 ding om relatief eenvoudige scale-out chips als de Ryzen/Threadrippers te ontwikkelen, het high-end verhaal is andere koek en vergt grote investeringen. Bovendien, de x86 niche is verbazend leuk als je enige concurrent struikelt. De RISC markt is een slagveld.
De markt is al jaren dalende in Nederland voor Power. In the USA doet de Linux op Power wel goede zaken begreep ik en voornamelijk in AI/Big Data installaties, die software is namelijk met accelerators wel goed beschikbaar.

Oracle vertikt het om software voor PPC64LE te releasen ivm hun eigen sparc/exadata/oda hardware en het bijhouden van meerdere software streams is erg kostbaar.

Het landschap veranderd en dus de eis naar verticale schaling neemt drastisch af. Betrouwbaarheid en servicability zijn ook veel minder belangrijk. Er wordt gewoon een nieuw podje opgespint in notime die autonoom het cluster joined.

Ik verdien er goed mijn brood mee (juist in deze dalende markt) en heb liefde voor het platform maar ze hebben de boot gemist en ik verwacht niet dat ze dat nog goed gaan maken eerlijk gezegd.
De koop van Red Hat was dan ook logisch in mijn ogen.

[Reactie gewijzigd door GeeMoney op 30 juli 2024 17:57]

Ik denk idd dat de oude AIX, z en i markt net als bv Solaris/SPARC nog een goede 15 jaar een leuke melkkoe blijft, maar de hoeveelheid nieuwe klanten is vrijwel nul.

Het OpenPOWER gebeuren zal enkel gaan lopen als die combinatie van POWER9 chips en AI-focused accelerators echt significant beter is dan wat de concurrentie heeft. Het is nog een beetje afwachten of dat segment werkelijk heel hard gaat lopen, maar de hardware is iig beschikbaar.

Oracle gaat idd niks leuks voor POWER doen lijkt me, die gaan hun grootste concurrent echt niet in het zadel helpen. SPARC/Solaris gaat langzaam naar legacy (jammer want het zijn absoluut geweldige chips), en verder proberen ze iedereen zo aggressief mogelijk naar hun eigen Oracle cloud (met scale-out x86) te migreren.

De on-premise markt (voor nieuwe klanten uiteraard, niet voor legacy Solaris) lijken ze min of meer op te geven, daar mogen Fujitsu, IBM en HPE waarschijnlijk om gaan vechten. Ik weet ook niet hoe groot die nog is, anno 2018. Als je nu begint, ga je werkelijk nog in on-premise 'big iron' investeren?

[Reactie gewijzigd door Dreamvoid op 30 juli 2024 17:57]

Eh zeg ik dan iets over workstations? POWER is voornamelijk legacy AIX en i (nog altijd een zeer lucratieve markt), en voor nieuwe toepassingen voornamelijk in de HPC/AI sfeer, waar ze oa nVidia's accelerators servicen. Inderdaad, scale up ipv scale out.
Drukke boel daar bij TSMC, niet al te best voor overige bakkers welke moeite hebben met 7nm & kleiner.

[Reactie gewijzigd door Jonathan-458 op 30 juli 2024 17:57]

De ene 7nm is de ander niet.
Veranders niks aan het feit. Eigenlijk op Intel na zijn ze best redelijk te vergelijken. En momenteel heeft Intel er nogal moeite mee, is GF uit de strijd gestapt, en zijn dus alleen TSMC en Samsung over. Op fab gebied is TSMC verschrikkelijk veel groter als Samsung, dus ik vraag me af hoe lang het duurt voordat Samsung de handdoek in de ring gooit en ook bekend maakt dat ze niet nog kleiner gaan.
TSMC is half zo groot als Samsung Semiconductor - vorig jaar $29 mld omzet versus $60 mld omzet.

Qua investeringen (in nieuwe fabs/etc) is het verschil kleiner, $2.6 mld versus $3.4 mld. Die twee zijn aardig aan elkaar gewaagd.

[Reactie gewijzigd door Dreamvoid op 30 juli 2024 17:57]

Samsung Semiconductors is echter niet Samsung Foundries. Als we deze erbij pakken: https://press.trendforce.com/press/20180524-3106.html, die een schatting hebben gemaakt van de omzet van Samsung Foundries, dan is het 16 miljard omzet in eerste helft voor TSMC, en 2 miljard voor Samsung. En natuurlijk, de rest van Samsung is enorm groot, maar ik denk niet dat die de behoefte hebben om geld te gaan pompen in verliesgevende takken. Als Samsung dus 3.4 miljard per jaar investeert, met een halfjaar omzet van 2 miljard, dan kan dat nooit uit.

Zie bijvoorbeeld ook deze: https://www.statista.com/...tor-foundries-by-revenue/, dan is het direct duidelijk waarom ik ernstige twijfels heb hoelang ook maar één andere partij TSMC kan bijhouden, vooral nu dat Intel achter loopt.
Je focust hier enkel op de foundry business, maar het chips bakken voor anderen is maar een klein deel van de business voor Samsung Semiconductors, de bulk wordt onder hun eigen naam verkocht en dat brengt ook gewoon geld binnen waaruit de investeringen gedaan worden. Net zoals Intel ook maar een zeer klein bedrag binnen haalt uit hun foundry business (die staan niet eens in de top 10), maar toch investeren ze bijzonder veel in nieuwe procestechnologie.

GlobalFoundries draait idd wel op 100% foundry inkomsten, en die lijken idd af te haken.
Ik neem aan dat toekomstige POWER processoren ook bij TSMC geproduceerd zullen worden. Voor workstationtoepassingen zijn er nu ook Talos moederborden evenals volledige systemen van bijvoorbeeld Raptor Computing Systems die redelijk geprijsd zijn tegenover Intel systemen met vergelijkbare specificaties.

Zelf draai ik nu Debian en Fedora in QEMU om te kijken wat er qua software werkt en waar nog aan gewerkt moet worden om het een werkbaar alternatief te maken voor x86 workstations.
Dit zorgt alleen in een niche voor mogelijk een fractie meer marktaandeel, de bedrijven die POWER systemen draaien in deze tijd doen dat vaak vanwegen lagere Oracle licentiekosten en niets meer dan dat.
Dat is wel erg kort door de bocht en ook nog eens niet waar.
De Power processoren hebben een factor 1.0 voor Oracle Database licenties terwijl op Intel een factor 0.5 geldt.
Ook krijg je bij Oracle Linux en de Premium Support Oracle Clusterware en Database “gratis” . Dat zijn producten die op Power alleen onder de Enterprise licentie vallen en zoals gezegd Database een factor 1.0 heeft. (Voor 1 Power core koop je dus 2 Intel core licenties af)

Veel bedrijven met kritieke en/of grote workload waar RAS ook een belangrijke rol speelt hebben vaak een Power staan. Veel bedrijven migreren er nu vandaan (waar mogelijk) omdat nieuwe applicaties een andere insteek hebben en dus die “Power factoren” geen meerwaarde meer bieden.

Noem een bank/verzekeraar/vliegveld/pensioenfonds van enige omvang en ze hebben ongetwijfeld een Power staan. In Nederland kan ik je uit eigen hand verzekeren dat elke grote bank en verzekeraar ze ook nu nog heeft (Power8/Power9).

[Reactie gewijzigd door GeeMoney op 30 juli 2024 17:57]

Wat je zegt klopt maar je kan op de virtualisatielaag bij POWER trucjes uithalen waardoor het effectief goedkoper is dan intel. Geloof me, het bedrijf waar ik werk verdient er veel geld aan, het is ongeveer 1/3 van onze business om die business cases te maken.

Je hoeft mij niet te vertellen wie er wel/geen POWER meer heeft staan maar het is een uitstervend iets, wij zien de trend naar beneden al bijna 10 jaar. Bij alles behalve de grootste bedrijven gaat het 9 v/d 10 keer om Oracle licenties en soms een stukje emotie en kennis. Maar kennis is meestal juist een van de redenen om ermee te stoppen.
Je bent in de war met SPARC, voor POWER betaal je juist hoge Oracle licensiekosten. Waar POWER wel goedkoop voor is, is (surprise) IBM's software stack.
Nope, dat klopt niet als je het goed doet, wij verdienen er een goed deel van ons geld mee. :) Wij zeggen zelfs dat Oracle het POWER platform in leven houd met zijn Oracle licenties, van wat ik zie zou 80-90% van de kleine klanten direct met IBM stoppen als Oracle niet goedkoper was op POWER.
Ze hebben toch nog steeds een core factor van 1.0 op POWER tov 0.5 bij SPARC?
Volgens mij 1.0 tov 0.75 (sparc). Het gaat erom hoe je op de virtualisatielaag de boel aan de LPARS hangt, wat op VMware/Hyper-V bakken met geld kost kost op POWER gewoonweg veel minder voor dezelfde performance, als je het goed inricht.
Volgens mij 1.0 tov 0.75 (sparc).
Nee SPARC (en x86) zit nog steeds op een core factor van 0.5, en POWER8/9 op 1.0, dat hakt er qua kosten aardig in. Het is nog steeds vrij problematisch, scale-up POWER vs SPARC blijft het gunstiger om bij SPARC te blijven, en x86 is weliswaar minder performant als scale-up maar een factor 2 per core zit er toch ook weer niet tussen.

Uiteraard zijn er klanten die om andere redenen niet weg willen van POWER, maar qua Oracle licensiekosten is het toch wel suboptimaal.
Je moet het anders zien.
Ze zitten al op POWER (daarom zijn het klanten van ons) en het overstappen op Intel kost meer dan het blijven op POWER omdat wij weten hoe wij POWER zo kunnen inrichten dat de core factor niet van toepassing is zoals jij er naar kijkt.
Het is voor POWER klanten niet relevant wat SPARC kost omdat dit voor hun geen optie is, geen kennis van, geen gecertificeerde mensen, geen ervaring met support etc etc...geloof mij maar dat het echt gaat om Oracle kosten. Het is lachwekkend om te denken dat onze klanten voor POWER kiezen voor een andere reden dan Oracle aangezien ze mij gewoon vertellen waar het over gaat.
Nee dat snap ik, maar die klanten kijken dan ongetwijfeld toch met een ietwat scheef oog naar die lage core factor van SPARC :) ook al is het de moeite niet om anno 2018 nog over te stappen.

[Reactie gewijzigd door Dreamvoid op 30 juli 2024 17:57]

De manier van ontsluiting naar je virtualisatielaag is helemaal niet van invloed op je Oracle licenties.
Het enige wat je kan doen om het aantal licenties te beperken is om capping/pooling toe te passen.
Dat is geen truuk maar een gegeven. Je hoeft op die manier niet de hele machine af te kopen aan licenties maar een LPAR cappen op 0,2 kost je gewoon 1 licentie. Een pool van 1 maken zorgt ervoor dat je wel 5x een LPAR van 0,2 mag wegzetten voor 1 licentie. Of 1 van 1,0 met x aantal databases.
Als je echter LPARS hebt die je kan cappen op 0,2 zou ik nu al een project starten naar x86. Capping en pooling is namelijk ook toegestaan met Oracle Linux. Of kijken naar MySQL/PostgreSQL op x86.

Zeker de kleine machines met een handvol LPARS (VM’s moeten we ze nu eigenlijk noemen) met Oracle erop zou ik als eerste migreren. Het zijn juist de grote jongens en of de maatwerk LPARS/VM’s die de uitdaging vormen.

PS. Wij kennen elkaar vermoed ik wel :) als je bedrijf eindigt op “ions” en begint met een B?

[Reactie gewijzigd door GeeMoney op 30 juli 2024 17:57]

Dat vind ik wel interessant om te lezen. Waarom maakt Oracle het niet goedkoper om hun database en middleware op x86 of SPARC te draaien? Zelf heb ik alleen af en toe met Oracle op AIX/POWER, Solaris/SPARC en HP-UX/IA64 te maken gehad op mijn werk en daarnaast was het toch voornamelijk Red Hat en Windows op x86.

En ik heb zelf meer interesse in POWER vanwege de mogelijkheid om er Linux op te draaien voor HPC/AI toepassingen. Maar zoals anderen hier al zeiden is dat in Nederland niet echt aan de orde en valt het nog maar te bezien of dat echt van de grond komt.

Ik vraag me af of er hier überhaupt mensen zijn met een Talos II of IBM POWER9 systeem, terwijl vorige maand nog het OpenPOWER summit in Amsterdam gehouden is.
Linux op POWER is zeker wel een ding, in beperkte mate ook in Nederland. Ik mag niet zeggen waar maar wij hebben een RedHat Linux OpenPOWER omgeving neergezet met Spectrum Scale voor wetenschappelijke doeleinde, 5 ongeloofelijk snelle nodes met all-flash storage. Voor hun toepassingen was POWER geschikter dan intel. Maar het zijn uitzonderingen. POWER blijft een geweldig platform, naar mijn mening zeker icm AIX wat er perfect op aansluit.
Zie je nog veel nieuwe AIX klanten? Als ik het zo zie zijn dat vooral legacy dingen, en gaan alle nieuwe POWER klanten rechtstreeks naar (idd RedHat) Linux, al helemaal nu RedHat nu onder de vleugels van IBM zelf zit.
Nee, nieuwe AIX klanten zie je eigenlijk niet meer. Het zijn klanten die er al jaren mee werken die er vaak vanaf willen maar er door licentie kosten of software die niet zomaar gepoort kan worden vanaf kunnen. Een Baan omgeving uit het jaar prik zonder onderhoud op AIX uit 2003.
Baan, dat is een naam die ik lang niet meer gehoord heb :) Maar idd, de business zit nog vol met allemaal legacy spul waar je een goede boterham aan kan verdienen.
Yup, oude rommel kan best wat geld opleveren maar het is, over het algemeen, niet echt een inspirerende business om mee bezig te zijn, je moet naast dat werk echt wat leuks en nieuws te doen hebben.
Ik heb meerder Power9 systemen al weggezet maar daar komt allemaal geen Linux op of AI/HPC/Big Data.
Betreft allemaal lifecycle management en/of maatwerk omgevingen die nog niet klaar zijn met het alternatief.

Op dit item kan niet meer gereageerd worden.