Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

ARM en TSMC werken aan 7nm-chips met cache-coherent interconnect

Door , 27 reacties, submitter: Squee

TSMC werkt samen met ARM, Xilinx en Cadence aan een testchip die over een cache-coherent interconnect voor accelerators beschikt. De op 7nm geproduceerde ARM-chip moet zo naadloos samenwerken met fpga's.

TSMC verwacht de tape-out van de op 7nm geproduceerde finfet-chip in het eerst kwartaal van 2018 en de eerste testchips zouden vervolgens in de tweede helft van volgend jaar geproduceerd worden. Volgens het samenwerkingsverband is er steeds meer behoefte aan accelerators in datacenters, vanwege de voordelen op gebied van verbruik en omvang. Onder andere voor bigdata-analyse, machine learning, in-memory databaseverwerking en zoektoepassingen worden steeds vaker accelerators ingezet. Onder andere door Microsoft.

De chip wordt opgetrokken rond ARM's DynamicIQ, de opvolger van big.Little die flexibele configuraties van processorkernen mogelijk maakt. Cadence zorgt voor de controller voor de cache-coherent interconnect en Xilinx levert zijn Virtex UltraScale+-fpga. De interconnect moet voor hoge bandbreedte, lage latency en toegang tot gedeeld geheugen zorgen bij het gebruik van zowel ARM-chips als fpga's. De cache-coherent interconnect, of ccix, werd vorig jaar aangekondigd. Naast genoemde bedrijven ondersteunen ook Qualcomm, Mellanox, AMD, IBM en Huawei de technologie.

Door Olaf van Miltenburg

Nieuwscoördinator

12-09-2017 • 16:56

27 Linkedin Google+

Submitter: Squee

Reacties (27)

Wijzig sortering
Iemand die mij kan uitleggen waarom men zo graag wil afstappen van x86? Wat zijn de beperkingen?
Iemand die mij kan uitleggen waarom men zo graag wil afstappen van x86? Wat zijn de beperkingen?
TL;DR: Te duur, te weinig keuze en flexibiliteit en te weinig samenwerking. Volgens mijn onderbuik heeft het niets met de 'oude logge' x86 instructieset te maken (omdat de ARM-instructieset steeds met complexere instructies richting CISC is uitgebreid en de twee nu sterk op elkaar lijken), maar dat kan ik niet met feiten staven.

x86 lijdt aan: Gebrek aan (1) competitie, (2) flexibiliteit en (3) ecosysteem (4) geen keuze voor TSMC / geen geloofwaardige foundry. Eigenlijk een beetje 1 pot nat maar ik zal ze toch proberen te splitsen:

1) Alleen Intel, AMD en Via hebben een x86-licentie, nieuwe bedrijven kunnen er vziw geen kopen, en VIA is niet meer competitief. Er zijn dus geen x86-processoren die ontworpen worden in lage-lonen landen, en geen Intel-CPU's (80% van de x86-markt?) die geproduceerd worden in lage-lonen landen, en juist de ontwerpkosten zijn een steeds groter gedeelte van de kostprijs van een SoC / CPU als gevolg van de miniaturisatie.
Bij Intel zit je in de 'Intel-silo', het werkt vaak alleen met Intel-technologie. CCIX/GenZ zijn bijvoorbeeld verbindings-technologieën waarbij onderdelen van verschillende leveranciers aan elkaar gekoppeld worden, zoals ook bijv. USB / PCIe; maar Intel doet niet mee aan CCIX/GenZ; zij hebben alleen 'Intel-only'-EMIB. Om een FGPA aan een Intel-CPU te koppelen met goede snelheid, moet je dus wel een Intel FPGA (Altera Stratix) kopen. Die lopen over het algemeen qua miniaturisatie 1 jaar achter op Xilinx.

4) Volgens mij kan je bij x86 ook niet kiezen voor een Aziatische foundry, maar ik weet niet of dat dit een contractuele beperking is of alleen maar een 'door historie zo gegroeide situatie'.

Verder zit er een export-beperking op technologie van de 'nieuwste' node, en om die reden kunnen Chinezen vaak niet de kleinste / snelste en nieuwste x86-cpu's kopen. Juist bij ARM kan je kiezen voor de goedkoopste foundry, als je TSMC en Samsung te duur vindt kies je voor de overburen van TMSC (UMC), of op het vasteland van China is SMIC de grootste. Met ARM kan je ook als onervaren SoC-startup een joint-venture starten met een 'bestaand en ervaren bedrijf' om een nieuwe server SoC te ontwerpen op bestelling. Bovendien is er in Azië de vrees voor spyware in x86, terwijl ze bij ARM kunnen controleren hoe het ontwerp in elkaar zit; reden dus dat ze bouwen aan non-x86 supercomputers; zo is ook de no. 1 van de top 500 op dit moment non-x86 (maar ook geen ARM overigens; Fujitsu en [url=https://www.top500.org/news/mont-blanc-project-teams-with-cavium-and-bull-to-build-arm-based-supercomputer/Cavium/Bull[/url] werken wel aan ARM-supercomputers).

2) Behalve dat je geen licentie kan krijgen van Intel op hun intsructieset (x86), kan je ook geen licentie krijgen op het ontwerp van hun CPU (u-arch), laat staan dat je het 'halve' ontwerp in licentie kan nemen en deze kan 'tweaken'; dit alles kan bij ARM wel. Over FGPA's gesproken: Juist de 'LEGO'-eFGPA is in opkomst, hierbij kan je het ontwerp van een FPGA kopen, deze verbinden met een CPU-ontwerp en dan laten maken bij een foudry; net zoals iemand een CPU-ontwerp bij ARM kan kopen, een GPU ontwerp bij Imagination of Vivante, en kan laten bakken bij TSMC of Samsung. Bij Intel heb je de keuze voor eFPGA (nog?) niet, geen LEGO dus. Belangrijk bij dit 'LEGO' is dat ook geheugentechnologieen zoals mogelijk HBM via CCIX gaan werken, om deze reden zitten Micron, SK Hynix en mogelijk ook Samsung ook bij het CCIX-consortium.

3/4) Vooral TSMC heeft een zeer groot ecosysteem aan kant en klare electronica-ontwerpen (IP-blokken) waaraan Intel absoluut niet kan tippen (Voorbeeld 2011). Een beetje dezelfde manier waarop Linux ontiechelijk veel meer hardware ondersteunt dan Windows: Het platform is meer open, en een hele rits hardware-leveranciers werkt samen aan Linux ondersteuning. Al deze kant en klare electronica-ontwerpen zijn getest op het TSMC-proces, zoals nu dus ook dit Cadence-CCIX-blok. Maar Synopsys heeft ook pas een kant en klaar TSMC CCIX-blok aangekodigd. Voorbeeldje van leden van TMSC's IP alliantie hier.

Geen geloofwaardige foundry: Intel's fabs produceren alleen voor Intel, en om die reden zijn Intel's processen geoptimaliseerd voor Intel CPU's. Wil je een complete SoC maken, een GPS module of GPU, dan ben je bij Intel's fabs aan het verkeerde adres. Intel is als een Chinees voetbalteam: De allersnelste, allerbeste en duurste aanvaller (CPU) gekocht voor veel geld, maar helaas geen team aan andere componenten dat ook als team opereert (SoC) om de aanvaller snel genoeg en van genoeg aanvoer te voorzien; waardoor het alsnog verliest van het gemiddelde Bundesliga-team die niet die dure aanvaller hebben.

Als ik de geruchten mag geloven is LG pas weggelopen bij de Intel 10nm foundry (zoek maar waar de Nuclun 3 blijft: Alle aangekondigde topmodellen van LG hebben Qualcomm-procs van TSMC/Samsung); effectief heeft Intel 10nm hiermee geen 'bekende' externe klanten meer. Dit geeft er zeer weinig hoop op dat het toch al twee jaar vertraagde Intel-10nm proces een goed en beheerst proces is, dus ook minder hoop dat x86 'zonder twijfel de allerbeste toekomst' heeft. Immers, als je het voordeel van 'het beste maakproces' wegneemt, is er veel minder reden om voor x86 te kiezen.

[Reactie gewijzigd door kidde op 12 september 2017 20:49]

De beperkingen van een x86 t.o.v. een Arm, bedoel je? Een x86 heeft minder performance per watt, en trekt dus meer stroom voor dezelfde taak. Een x86 is complexer, en heeft dus meer wafer oppervlak nodig, en is dus duurder.

Een groot voordeel van de x86 is voorlopig dat hij (veel) sneller is. Hoewel de snelste Arm's inmiddels de onderkant van het x86 bereik aantikken, zijn de topmodellen nog onaantastbaar.
Ik had altijd begrepen dat de instructie set van ARM een stukje beperkter is waardoor bepaalde berekeningen aanzienlijk meer clock cycles kosten. Ik denk (kijkend naar de smartphones) niet dat dit de beperkende factor is voor de doorsnee consument
Je beschrijft CISC vs RISC, wat als onderscheid al ruim twintig jaar geen relevantie meer heeft.
Alle moderne processoren gebruiken andere technieken.
Nee, het klopt nog steeds wel. Intel heeft nog steeds een voorkeur voor ontwerpen waarin je een bak transitoren gebruikt om het aantal IPC te verhogen. Zelfs een simpele multiply kost minder cycli, maar meer picoJoules.
1 van de belangrijkste punten voor mij is dat er vandaag slechts 2 grote spelers op de x86 markt zijn waarbij 1 een dominante positie hebt. Op de ARM markt heb je dat niet. Dat resulteerd in een snellere ontwikkeling en lagere prijzen.

En uiteindelijk maakt het zelfs niet meer uit of ARM in de buurt komt op gebied van prestaties, de meeste mensen zullen tijdens het gebruik van hun computer zelden of nooit hoog in CPU gebruik gaan. We merken vandaag al dat er veel meer tijd wordt doorgebracht op ARM powered devices dan op de computer die thuis nog staat.
Het grote voordeel van x86 is dat iedereen het kent en dat er veel goede compilers voor zijn. Het probleem met x86 is dat de instructieset oud is. Kijk maar eens in de IA manual. Afhankelijk van 16 bit, 32 bit of 64 bit word length heb je verschillende instructies, en de manual staat stampvol met exceptions.

Op zich is dit alleen direct een probleem met compiler bouwers, maar wat je ziet is dat een cleane implementatie van een RISC architectuur op lagere clockspeed eenzelfde performance kan halen als een IA-32 CISC op hogere clockspeeds.

Daarnaast ondersteunt een x86 nog altijd bijv. real mode, enkel voor backwards compatibility. Letterlijk niemand gebruikt dat meer.

[Reactie gewijzigd door JackBol op 12 september 2017 17:36]

Eh nee. Je ziet dat effect niet, om de simpele reden dat de x86 instruction decoder er uOps van maakt die door de interne RISC kern verwerkt worden. Idee is origineel van Cyrix, opgepikt door AMD in de K5/6, en door Intel gebruikt vanaf de Pentium Pro tijd.

Historisch was het grote nadeel van de x86 zijn beperkte register-set. Dat is tegenwoordig op twee manieren opgelost: register renaming, en de x86-64 ISA.
Voor zover ik hier gehoord en gelezen heb is X86 al dood. Er is X86-64 (waarin amd & intel aan elkaar genaaid zijn) maar da's heel weinig van de processor, zit al propvol accelerators waarin amd pushed naar innoverende hsa en intel naar (weeral) cache oplossingen. Wordt ook al jaren niet meer aan geinnoveerd behalve pipelanes, prefetch, cache, firmware etc.
Er zijn ook wat zorgen aan het ontstaan over enkele kenmerken in de x86 architectuur. te weten de ME ( Management Extentions, ookwel bekend als de Intel Backdoor )
Intel ME heeft helemaal niets met de architectuur te maken en kan je perfect implementeren op een ARM platform.
Dat kan maar zit daar op dit moment niet, maar het maakt inmiddels wel deel uit van recente x86 processoren.
En ARM heeft al jarenlang TrustZone. Er is daarom geen enkele reden om Intel ME te implementeren op ARM, dat zou dubbel werk zijn.
ME is toch wel iets anders dan Trustzone.
ME is een ongecontroleerde coprocessor die zelf toegang heeft tot ALLE hardware in de CPU en die een encrypted binary blob draait, en ook zelfstandig toegang kan hebben tot een "out of band".
communicatie kanaal naar buiten toe.
Om ME te stoppen moeten er buitensporig veel zaken geregeld worden. Als de ME niet tijdig "correct" aangezet wordt zal het systeem worden afgesloten/rebooten.

Trust zone is een gedocumenteerde omgeving die bestaat uit hardware assist om een afscheiding te kunnen maken tussen een beschermd en onbeschermd gebied. met een Open Source reference implementatie...
http://www.arm.com/products/security-on-arm/trustzone

Nauwelijks vergelijkbaar.
Xilinx heeft al een 16nm variant met ARM A53 + Mali gpu... De Zynq MPSoC UltraScale+ https://www.xilinx.com/pr...ynq-ultrascale-mpsoc.html .
Van relatief klein tot enorm met bijv. Dual 4K60fps encoder/decoder etc... de collectie IP Cores die je er standaard bij krijgt is ook al best uitgebreid.
Dat klopt, maar die chip is meer gericht op embedded systemen. Mediaspelers of zelfs smartphones.
Deze chip wordt veel meer high-end. Veel meer gericht op bijv. cluster computing. Big data, machine learning,etc. Daar is de mpsoc niet zo geschikt voor.
De MPSoC is wel degelijk heel geschikt voor deep/machine learning etc. De MPSoC is er zelfs voor ontwikkeld... https://www.xilinx.com/applications/megatrends/machine-learning.html

Voor een mediaspeler / telefoon is de MPSoC een totale overkill...
Die bron laat niet zien dat de MPSoC voor machine learning is ontwikkeld.

Als je kijkt naar de MPSoC productpagina van Xilinx, dan zie je heel andere applicaties staan: Motion control (CG serie), telecommunicatie (EG serie) en video toepassingen (EV serie).
Ook de webpagina over de MPSoC architectuur heeft het niet over machine learning, maar over heel andere toepassingen.

Toen ik zelf in de prof video industrie werkte heb ik de Zynq al toegepast in producten, maar we liepen er toen tegenaan dat die geen hardware H265 codec had. Die moesten we als soft-core inkopen, en die core nam veel PL resources in beslag. Xilinx kondigde ons toen al aan dat ze in de opvolger van de Zynq wel een H265 codec zouden stoppen, specifiek voor onze markt.

Ik begrijp wel dat Xilinx de MPSoC toch promoot voor machine learning. Machine learning is een emerging market, waar op dit moment veel geld in te verdienen is. En de MPSoC is het 'beste' wat ze op dit moment voor deze markt te bieden hebben. Maar het MPSoC platform is er eigenlijk niet helemaal voor zo effectief voor. Vandaar de reden (denk ik) dat Xilinx samenwerkt in dit TSMC project: om een beter product te kunnen bieden voor HPC toepassingen.

[Reactie gewijzigd door MeMoRy op 14 september 2017 17:05]

Het begin van het einden van x86?

Vraag me alleen af hoe ARM het effect vanQuantum Tunneling kan voorkomen.
Dat hoor ik al jaren maar x86 is er nog steeds.

Zoveel software is nog niet geschikt voor arm dat gaat nog wel even duren als het ooit gebeurd.
Het punt wat ik wilde maken is dat we ARM nu op 7nm kunnen produceren terwijl we al moeite hebben met x68 op 14 nm te kunnen maken. En als dat niet zou uitmaken hoe voorkomt ARM dan Quantum Tunneling in hun transistoren? x86 zal gebruikt worden zolang het kan maar ook deze dino zal ooit sneuvelen.

[Reactie gewijzigd door rickboy333 op 12 september 2017 17:39]

Zou je niet blind staren op de marketing kreten zoals 7nm. Ligt er maar net aan hoe ze dat meten.

Veel belangrijker zijn de performance en het verbruik. Zeker qua performance haalt arm het nog niet bij wat x86 op dit moment neerzet.
Er is vandaag enorm veel software geschikt voor ARM, denk maar aan alle software op telefoons en een hele hoop embedded devices. Het is dus zeker niet dat er weinig ervaring met het platform is. Daarnaast heeft Microsoft ondertussen al aangetoond dat het niet beschikbaar zijn van een native ARM port ook geen groot struikelblok meer is.

x86 zal de komende jaren niet verdwijnen, maar ik verwacht wel dat men stilaan aan de dominantie van het platform op de server en desktopmarkt gaat beginnen knibbellen.
Met de komst van Windows 10 S en daardoor hopelijk een (wat betere) groei van UWP apps zou de overstap voor de simpele gebruiker steeds makkelijker moeten zijn naar ook ARM gebaseerde (Windows) systemen. Sinds de gemiddelde thuisgebruiker daar waarschijnlijk wel genoeg aan heeft.

De echte grote applicaties komen misschien dan vanzelf wel (een Photoshop bijvoorbeeld).

Windows 8 RT was destijds gewoon een flater door de rare GUI van W8 en beschikbaarheid van (goede) UWP apps.
Verre van het begin van het einde van x86. Gooi je de klokfrequentie van ARM omhoog dan stijgt het verbruik van ARM ook exponentieel. Daarnaast heeft x86 een hele lading IO connectivity. Een telefoon chip heeft een minder brede PCI bus, geen GBit Ethernet controller, etc. etc. Dat kost ook allemaal stroom. Bouw je een ARM chip met al die features en gelijke performance dan zit het verbruik in de buurt van x86.
Dat zit dus grotendeels in de fpga, mocht je dat willen... maar ik ben het met je eens: alles dat toggled wordt warm en kost stroom.

Op dit item kan niet meer gereageerd worden.


Apple iPhone X Google Pixel 2 XL LG W7 Samsung Galaxy S8 Google Pixel 2 Sony Bravia A1 OLED Microsoft Xbox One X Apple iPhone 8

© 1998 - 2017 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Hardware.Info de Persgroep Online Services B.V. Hosting door True

*