Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 36 reacties
Bron: Aces Hardware

Aces Hardware bericht dat Silicon Graphics, Inc. de R16000 processor heeft ge´ntroduceerd. Deze MIPS-core draait op 700MHz en is voorzien van 64KB on-die L1 cache en 4MB extern L2 cache. De chip is geschikt voor 32 en 64-bit software, en gebruikt een 200MHz FSB (3,2GB/s) en ge´ntegreerde PCI-controller, voor een rechtstreekse verbinding van 1,6GB/s met de videokaart. Net als de rest van de R1x000-serie is dit product ontworpen om weinig warmte uit te stralen. De voorganger van dit beestje - R14000A - had een vermogen van 17 Watt nodig op 600MHz. Ondanks deze bescheiden warmteafgifte scoort deze chip bijna de helft van de SPECfp/int-punten die een 4,6 keer zo hoog geklokte Pentium 4 2,8GHz haalt. De nieuwe R16000 zal net als de R14000A gebruikt worden in de SGI Fuel workstations:

SGI Fuel The Silicon Graphics Fuel visual workstation maximizes the performance of your desktop applications while offering you unprecedented price/performance value. A premium blend of industry-leading technology from SGI, Silicon Graphics Fuel features the latest MIPS R16000TM processor and the unparalleled VProTM 3D graphics system for IRIX in a new high-bandwidth architecture. Drive your creativity and productivity to a new level with Silicon Graphics Fuel.
Moderatie-faq Wijzig weergave

Reacties (36)

Deze MIPS-core draait op 700MHz en is voorzien van 64KB on-die L1 cache en 4MB extern L2 cache
Op de site van SGI staat wel dat de CPU 4MB "secondary" cache krijgt maar niet dat het cache geheugen extern geplaatst is en niet intern, zoals de meeste huidige CPU's dat hebben.

Ik zou het ook erg vreemd vinden, 4MB is dan wel een erg leuke hoeveelheid, doordat het extern geplaatst is zijn het apparte geheugen chips en die kunnen vaak niet even hoog schalen als de CPU dat kan. Goed voorbeeld is de P3 Katmai, daar draait het L2 cache minder snel dan de CPU core dat doet.

Daardoor heb je dus relatief minder aan de 4MB dan je op het eerste gezicht zou denken.

Mij had het beter geleken om iig toch 512KB aan on-die L2 cache te gebruiken en dan bijvoorbeeld 2 of 3MB aan L3 cache te pakken.
Ondanks deze bescheiden warmteafgifte scoort deze chip bijna de helft van de SPECfp/int-punten die een 2,8GHz (4,6 keer zo hoog geklokte) Pentium 4 haalt.
Mij lijkt het vergelijken van de twee CPU's een beetje overbodig, iedereen die een beetje de markt volgt weet dat Intel bij de P4 voor hoge MHz'en is gegaan i.p.v. IPC en dat daardoor een P4 op gelijke kloksnelheid minder presteerd.

Daarnaast gebruikt de P4 de x86 architectuur wat vandaag de dag niet meer een van de meest krachtige architecturen is. Men had deze CPU beter kunnen vergelijken met de PowerPC 970 van IBM. Ook een 64 bit CPU die in staat is om 32 bit programma's te draaien en ook op dezelfde doelgroep gericht volgens mij.

(Ik begrijp wel dat de zin alleen maar moet aanduiden dat je niet naar de MHz'en alleen moet kijken, maar dan had men beter de Athlon kunnen pakken IMO omdat de P4 nu eenmaal een erg slechte IPC heeft vergeleken met andere CPU's).
Mij lijkt het vergelijken van de twee CPU's een beetje overbodig, iedereen die een beetje de markt volgt weet dat Intel bij de P4 voor hoge MHz'en is gegaan i.p.v. IPC en dat daardoor een P4 op gelijke kloksnelheid minder presteerd.
Maar die test kijkt toch naar wat de CPU kan doen en niet naar het aantal MHz dus is het volgens mij gewoon een goede vergelijking ook al zijn de CPU's totaal anders :)
Maar die test kijkt toch naar wat de CPU kan doen en niet naar het aantal MHz dus is het volgens mij gewoon een goede vergelijking ook al zijn de CPU's totaal anders :)
P4 heeft een andere architectuur dan de R16000 waardoor elke test weer anders kan uitpakken. Je moet ook nog eens indenken dat de R16000 een dedicated machine is (beeld), terwijl de P4 op meer platformen moet presteren en ook nog eens bedoeld is voor de all-round consument: denk aan gamen, WAV naar MP3 omzetten, surfen op het web, tekstverwerken en videofragmenten omzetten. Dit zijn dus allemaal dingen die de consument wilt doen en gaat daarvoor niet een systeem kopen wat buiten hun budget en doelgroep valt :).
Mij had het beter geleken om iig toch 512KB aan on-die L2 cache te gebruiken en dan bijvoorbeeld 2 of 3MB aan L3 cache te pakken.
denk je dat ze dat bij SGI niet konder bedenken ofzo? klaarblijkelijk heeft het toch voordeel om 4MB extern te hebben. Waarschijnlijk heeft het voordeel bij het draaien van specifieke software (CAD sw o.i.d.)
De voorganger van dit beestje - R14000A - had een vermogen van 17 Watt nodig op 600MHz. Ondanks deze bescheiden warmteafgifte scoort deze chip bijna de helft van de SPECfp/int-punten die een 4,6 keer zo hoog geklokte Pentium 4 2,8GHz haalt.
Door de cache niet on-die te plaatsen wordt de chip zelf ook een heel stuk koeler en presteert hij toch goed omdat het 4 MB chache is. Alleen ik zie het voordeel van deze chips niet in, behalve dat ze een snelle grafische bus hebben. Als je een p4 (northwood) underclockt tot 1,4 Ghz heb je bijna de zelfde warmte afgifte.....

reactie op Beaves:
Ik zou het ook erg vreemd vinden, 4MB is dan wel een erg leuke hoeveelheid, doordat het extern geplaatst is zijn het apparte geheugen chips en die kunnen vaak niet even hoog schalen als de CPU dat kan. Goed voorbeeld is de P3 Katmai, daar draait het L2 cache minder snel dan de CPU core dat doet.
Het L2 cache draait ok meestal niet op volledige kloksnelheid, daarvoor is het L1 cache.. Maar omdat deze processor op 'maar' 700 Mhz loopt hoeft de cache ook niet zo snel te zijn. Tegenwoordig zitten er al geheugen chippies op videokaarten die op 1 Ghz draaien. Het kan dus best zijn dat het cache wel of full-speed loopt :).
RAM op 1 ghz? De GF4 heeft volgens mij maximaal ongeveer 350 mhz DDR RAM
Tja Dat het niet ondie is is natuurlijk minder maar zoals dat tussen de Katmai en de CuMine ook het geval zal zijn het wordt waarschijnlijk gecompenseerd door die hoeveelheid.
dus 4MB extern vs 1 ß 2MB ondie

4MB ondie is ook 'n hele opgave en kosten plaatje en Yield verlagende beleid keuze.
De GPU in de ps2 heeft dan weer wel 4MB geheugen d'rin dus zo onmogelijk is dat toch bij lange na niet.
Ik denk niet dat het de vraag is of je het erin kan proppen ... "tuurlijk is dat mogenlijk". Alleen je moet ook rekeninghouden met de hoeveelheid ruimte die je hebt. Op plekken waar je transistors plaatst kun je geen (cache) geheugen plaatsen en visa versa. Als je je die-size groter zou maken kun je er volgens mij veel MB's aan L1 cache bij kunnen pluggen (in theorie) echter is het zo dat je je die-size zo klein mogenlijk wilt houden / maken.
de cache bestaat zelf ook uit transistors.
het is zo dat bij het ontwerpen van een processor mee wordt genomen dat er bijv 1mb on-die cache in komt. ze gaan niet een cache-loos processor maken en dan kijken hoeveel er nog bij kan, dat is gewoon een guideline van de hogere piefen, hup wij willen 256kb cache, zorg maar dat het goed in de processor past. daarom is het maken van een processor een enorm gepuzzel, je hebt verschillende vierkanten/rechthoeken die je samen moet voegen tot 1 groot vierkant/rechthoek maar sommige delen moeten naast elkaar komen, of boven elkaar etc. daar zijn ze een hele tijd mee bezig

<edit>
overigens de reden dat de chipbakkers de die size zo klein mogelijk willen houden is dat er dan minder transistoren zijn en dus minder kans per processor op kapotte/foutieve transistoren en dus hogere yields.
Op de site van SGI staat wel dat de CPU 4MB "secondary" cache krijgt maar niet dat het cache geheugen extern geplaatst is en niet intern, zoals de meeste huidige CPU's dat hebben.

Ik zou het ook erg vreemd vinden, 4MB is dan wel een erg leuke hoeveelheid, doordat het extern geplaatst is zijn het apparte geheugen chips en die kunnen vaak niet even hoog schalen als de CPU dat kan. Goed voorbeeld is de P3 Katmai, daar draait het L2 cache minder snel dan de CPU core dat doet.
on die-cache of off-die cache het zal voor de snelheid vast wel wat uitmaken maar niet in de richting die jij zegt. een cache chip is enorm simpel. als je naar zon "blueprint" van een p3 cumine-tualatin of p4 kijkt zie je relatief grote egale blokken, dat is de cache, simpel om te ontwikkelen dus. het moet dus niet zo moeilijk zijn om een high speed off-die cache chip te ontwikkelen. de cache chip wordt namelijk niet meer afgeremd door langzamera onderdelen van de processor. het probleem echter van off-die cache is dat het op dezelfde snelheid altijd langzamer zal zijn dan een even grote hoeveelheid on-die cache, simpelweg omdat alle info de die uit moet, over een printje, de cache in. anders gaat het gewoon supersnel over een kleine afstand door de die.
bij de pii en piii katmai was het probleem geloof ik dat de cache voor(toendertijd) grote hoeveelheid extra transistors zou zorgen die de yields enorm omlaag zou drijven, bovendien liep de cache vaak op 1/2 of 2/3 van de snelheid van de processor zelf. een van de redenen hiervoor is dat het gewoon goedkoop is terwijl je performance toch ongeveer linear stijgt met je aantal mhz, van pii liep dat dus mooi door in de piii katmai. t verschil tussen die 2 is ook heel erg klein, en het zijn beiden nog cpu's van de 6e generatie(686).

het was dus relatief makkelijk om de processor snelheid op te voeren omdat er minder obstakels waren in de processor zelf. en als je ziet dat zowel intel(piii katmai) als amd(athlon classic) deze strategie hanteerden zou dat wel eens goed mogelijk kunnen zijn.

verder is het niet zozeer "even de cache hoeveelheid opvoeren", de processor moet er natuurlijk wel gebruik van kunnen maken, een fictieve p1 1ghz met 16mb cache klinkt indrukwekkend maar veel meer dan een piii 500 cumine zal hij niet kunnen doen. ook simpelweg "ff" L3 cache support inbouwen is niet zo simpel als het lijkt.
Intel had met de PPro destijds al een CPU met on-chip level 2 cache (niet helemaal on-die, het was dacht ik een aparte laag). Het nadeel van deze CPU's was dat ze de hele CPU weg konden donderen als OF de cache niet deugde OF de rest niet deugde, en dat zorgde voor dramatisch lage yields (en dus peperdure procs).

Daarom heeft men toen de slot-1 interface bedacht (CPU op printplaatje, cache chips apart ernaast), zodat de CPU en de cache chips afzonderlijk getest konden worden en pas later samengevoegd. Die cache chips liepen op minder dan de kloksnelheid van de CPU (2/3, 1/2), voornamelijk omdat cachegeheugen (SRAM, geen SDRAM!) van >200 MHZ in eerste instantie onbetaalbaar was.

Nou was dat ook niet zo'n probleem, want cachegeheugen is uiteindelijk ook maar een lapmiddeltje om de bottelneck van de memory bus op te vangen (met een memorybus die evenveel instructies per seconde kan aanleveren als je proc kan verwerken is cache overbodig, mits latenties acceptabel blijven).

Die bottelneck was ten tijde van de PII-233 veel kleiner (factor 3,5 snelheidsverschil bus-cpu) dan nu (factor 5,5 bij PIV 3,06 of zelfs 7,5 bij Athlon 2400+), vandaar dat grote caches nu veel interessanter zijn dan toen. PIV presteerde niet voor niets zoveel beter met 512KB ipv 256KB level-2 cache. Hammer samples met 1MB level-2 cache doen het qua memory performance ook enorm goed...
Wil jij nooit meer van dit soort uitspraken doen? :D, ik lig hier bijna op de grond :'(
en ge´ntegreerde PCI-controller, voor een rechtstreekse verbinding van 1,6GB/s met de videokaart.
Zit er nou een PCI videokaart in ? Das toch best traag ook al is dit systeem niet voor spellen bedoeld ? :)

Hier staan de uitgebreide specs: http://www.sgi.com/workstations/fuel/tech_specs.html
Sta stil bij wat je zelf zegt :z

1.6GB/s - noem je dat traag :? De snelste AGP implementatie komt niet boven de 1.066 GB/s...
Je kan wel een 30 GB/s bus hebben maar als je kaart dat niet kan vullen heb je er nog weinig aan he :)
Ik denk dat ze bij SGI daar wel over nagedacht hebben en niet zomaar lukraak beginnen met een dure computer te onwikkelen. Alles zal op elkaar zijn afgesteld en de componenten zullen elkaar zeer goed begrijpen en aanvullen.
High-end SGI systemen gebruiken geen GF2MX PCI hoor :o

Het meeste nog lijken de kaarten op 3DLabs gevallen- niet ontworpen om relatief simpele vormen en textures op hoge snelheid rond te smijten, waarbij vooral de bandbreedte naar de on-card memory belangrijk is (games dus), maar veel complexere vormen en textures te renderen, waarbij de bandbreedte tussen kaart en systeem (CPU) veel belangrijker is.

Oftewel, die 1.6GB/s krijgt hij heus wel vol :)
Ik denk dat 4 MB cache wel een beetje veel voor de consumenten markt is. Is denk ik bedoelt om op 'aparte' plekken een computer te kunnen gebruiken. Zoals je ook had kunnen zien als je even geklikt had:

-MCAD
-Medical Imaging
-Scientific Visualization
-3D Animation
-Oil and Gas (seismic interpretation)
-Visual Simulation
-Geospatial imaging

Volgens mijn zit er een onboard videokaart in en die zal wel via PCI-bus worden aangestuurd. En agp 8* trekt 2.0 GB/s dus 1,6 GB/s is op zich wel voldoende denk ik hoor.
Zit er nou een PCI videokaart in ? Das toch best traag ook al is dit systeem niet voor spellen bedoeld ?
Er bestaat geen PCI-standaard met een bandbreedte van 1,6GB/s, dus waarschijnlijk gebruikt SGI hiervoor een andere type verbinding. De integratie in de processor zorgt verlaagt de latencies waardoor de capaciteiten van de processor en videokaart efficiŰnter benut kunnen worden.

In de specs staat trouwens dat er twee 66MHz, 64-bit (533MB/s) en twee 33MHz, 64-bit (266MB/s) PCI slots aanwezig zijn. PCI is dus niet per definitie traag (133MHz PCI-X heeft zelfs net zoveel bandbreedte als AGP4x).
SGI gebruikt voor zijn workstations geen agp of pci graphics.
die pcibus is alleen maar voor wat uitbreidingskaartjes. overigens gebruikt sgi al een tijdje standaard 64bits pci... niks mis mee dus.
tja, waarschijnlijk is dit voor de server markt bedoeld en dan is een video kaart toch een stuk minder belangrijk....
Server markt ? :D

Dit is een workstation voor 2/3D programma's :)
Prachtige prestaties van SGI, maar neit echt rendabel als je mij vraagt.

Er wordt vermeldt dat de R16000 in de Fuel workstations wordt gebruikt. Naar mijn mening is de vermogenconsumptie in een workstation niet echt zo'n knelpunt.
Dus is het volgens mij interessanter om x86 gebaseerde oplossingen te gebruiken die nog eens een aantal malen goedkoper zijn.

Echter in een MP-systeem / supercomputer zou dit wel interessant zijn. Dan pas is de vermogenconsumptie van belang. Maar men gaat steeds meer aan de slag met grote clusters x86 systemen. De vermogenconsumptie is vele malen groter, maar wederom een afweging tussen aanschafprijs en onderhoudskosten.
IRIX draait ook zo lekker soepel op x86 he..

het gaat in deze machines niet om de cpu kracht. SGI maakt machines waarin *alles* op elkaar afgestemd is.

als voorbeeld:
Een oude o2 r5k heeft maar 180 of 200mhz cpu kracht.
in software draait zo'n ding ongeveer 2-3 fps divx (NTSC).
Maar door de UMA en de ICE kun je weer volledig soepel fullscreen divx kijken... toch handig he zo'n grafisch systeempje dat programmeerbaar is al naar gelang je doel...

SGI systemen zijn totaal *niet* vergelijkbaar met peecee's.
Ondanks deze bescheiden warmteafgifte scoort deze chip bijna de helft van de SPECfp/int-punten die een 2,8GHz (4,6 keer zo hoog geklokte) Pentium 4 haalt.

Zegmaar gewoon datie gelijk is aan een 1,6Ghz proc ofzo :+.
2x 1,6 = 3.2
2x 1,4 = 2,8

dus hij is gelijk aan een 1400 MHz CPU ;)
Met een klein verschilletje: een XP1700 stookt 50 watt en een P4 1400 stookt 64 watt. Wat een R16K doet blijkt niet uit het artikel, maar veel meer dan de 17 watt van z'n voorganger zal dat niet zijn. P4 1400 prestaties voor minder dan de helft van de hitte.

Femme weet waarom dat goed is. :)
performance in de specFp/Int is iets minder lineair denk ik
Ondanks deze bescheiden warmteafgifte scoort deze chip bijna de helft van de SPECfp/int-punten die een 4,6 keer zo hoog geklokte Pentium 4 2,8GHz haalt.
"scoort de helft v/d punten van een 4,6x zo hoog geklokte P4 2,8 GHz"

Ten eerste vraag ik mij af waarom dit zo opgeschreven is, want dit is gelijk aan:"Scoort net zo hoog als een 2,3x zo hoog geklockte P4 2.8GHz"

Gooien met grote getallen noem ik dit....

En ten 2e zou ik graag willen weten waar deze info vandaan komt, ik heb de site van Aces Hardware en SGI doorgezocht en geen dergelijke statement kunnen vinden.
Kan aan mij liggen dat ik niet goed genoeg gezocht heb.


Maar ik vind dat er onnodig overdreven met hoge getalen gegooid wordt.(Marketing?)
Voor de rest vind ik SGI's vette machines, maar ik wil dan ook cijfers/benchmarks zien die niet aangedikt zijn.

"de helft van 4,6x zo hoog blablabla" klinkt heel mooi en groot en snel, maar is nog steeds 2,3x zo hoog...
Hij scoort de helft van het aantal punten in de test, in tegenstelling tot de Pentium 2,8Ghz die 4,6x zo snel geklokt is (2800/600=4,6).
Ik ben toch benieuwd wat zo'n bak voor score zou krijgen bij bijv. een PcMark of een 3DMark (als deze hierop al werkt). Zou, gekeken naar de geheugenbandbreedte, toch redelijk leuk moeten zijn! :+
Ach, ik weet niet. De vorige fuel met een dual 500Mhz werd er op 3D performance uhm.. 'ietwat' uitgeblazen door een dual xeon PCtje van nog geen 10% van de prijs. Iets met rondjes lopen en heel hard eromheen zeg maar. Zolang SGI de MIPS mensjes (want nee, dat zijn niet dezelfde) niet kan overtuigen om workstation CPUs te maken (4MB cache is leuk... voor servers) heeft SGI toch nog wat problemen. Ze gaan dan ook niet voor niets over op Itanium2, zelfs met hun Origin/Onyx lijn... erg benieuwd wat dat gaat doen en of dat SGI kan redden. Enige reden dat ze nu nog overeind blijven is imho door gelden van DoD (dat is Department of Defense, niet die andere :))
niet inpakken hier opeten :D
Hmm, voorganger was 17 watt, dus ik schat deze op 20 watt. Passief gekoeld dus waarschijnlijk :Y)

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True