Door Wouter Tinus

Chiptovenaars aan het werk: patchen op 45nm

26-09-2007 • 09:30

57

Singlepage-opmaak

Errata en conclusie

Hoe goed Intel ook zijn best doet, een chip zo complex als Penryn kan nooit helemaal perfect zijn, althans niet zonder er nog een paar jaar langer aan te werken. Sommige problemen worden daarom softwarematig opgelost door middel van microcode- of bios-updates. Andere problemen - meestal degenen die tijdens het uitvoeren van willekeurige instructies worden ontdekt - worden helemaal niet opgelost. Ofwel omdat men denkt dat de omstandigheden zo bizar zijn dat niemand ze ooit zal tegenkomen in de praktijk, ofwel omdat de potentiële gevolgen zo klein zijn dat het niet de moeite waard is om op te lossen.

Alles wat men in de labs vindt wordt wel gepubliceerd. Voor de eerste commercieel beschikbare versie van Core 2 Duo zijn in totaal 112 van deze zogeheten 'errata' bekend. Intel gebruikt die term omdat het 'bugs' een te groot woord vindt. Bugs zijn er om opgelost te worden, maar van de meeste errata hoeft vrijwel niemand wakker te liggen. Bijvoorbeeld:

With respect to the retirement of instructions, stores to the uncacheable memory-based APIC register space are handled in a non-synchronized way. For example if an instruction that masks the interrupt flag, e.g. CLI, is executed soon after an uncacheable write to the Task Priority Register (TPR) that lowers the APIC priority, the interrupt masking operation may take effect before the actual priority has been lowered. This may cause interrupts whose priority is lower than the initial TPR, but higher than the final TPR, to not be serviced until the interrupt enabled flag is finally set, i.e. by STI instruction. Interrupts will remain pending and are not lost.

Deze zomer zijn 39 van dit soort punten opgelost in de nieuwe G0-stepping, maar er is ook een nieuwe gevonden. Ondanks het feit dat er dus nog steeds 74 bekende 'fouten' in de chip zitten, zullen de meeste mensen beamen dat ze nergens last van hebben, wat betekent dat de mensen in het validatielab hun werk goed hebben gedaan.

* Conclusie

Het ontwikkelen van een processor neemt al snel drie tot vier jaar in beslag, waarbij men zich in het laatste jaar voor de introductie alleen nog maar bezighoudt met testen en perfectioneren. Het valideren begint echter niet pas op het moment dat de eerste chip terugkomt uit de fabriek, net zo min als het ophoudt zodra een product eenmaal op de markt is. Ook komt het maar zelden voor dat de processor als geïsoleerd onderdeel getest kan worden: vaak moet de chipset tegelijkertijd worden getest, wat de zaken nog een stuk complexer maakt.

Wat we in dit artikel hebben laten zien is dus maar een klein deel van het totale traject, maar hopelijk is daardoor wel duidelijk geworden dat er een groot verschil is tussen het hebben van samples en het daadwerkelijk klaar zijn voor de introductie van een product. Het feit dat Intel vorige week een machine op het podium had staan die het zinnetje 'Hi, I am Nehalem. I am only three weeks old, and I am already talking.' kon oplezen is weliswaar bemoedigend, maar het komende jaar zal deze chip nog een uitgebreid traject moeten ondergaan voor hij klaar is om uitgebracht te worden.

Intel validatie slide
Een chronologisch overzicht van de verschillende stappen in het validatieproces

Reacties (57)

57
52
13
11
0
10
Wijzig sortering
De 'tape', die eigenlijk naar de fabriek gestuurd zou worden om de eerste fysieke versie van de chip te laten maken, ligt nu ergens in een kluis stof te verzamelen.
Bij NXP, voorheen Philips, gaan de chipontwerpen vziw bij tape-out al jaren niet meer op een fysieke tape naar de fabriek maar worden gewoon over het intranet verzonden - zal bij Intel toch niet anders zijn?
Die fabriek ligt nogal wat kilometers van de plaats waar ze de ontwerpen maken. Dus een intranet is daar niet echt een optie voor. En over internet verzenden is ook niet zo heel veilig en volgensmij willen ze echt niet dat die informatie ergens opgepikt wordt.
De waarheid ligt ergens in het midden. Er worden inderdaad geen fysieke tapes meer gebruikt om ontwerpen naar de fabriek te sturen, maar gewoon een snelle VPN-verbinding. De nostalgische term 'tape-out' wordt echter nog steeds gebruikt om die mijlpaal aan te duiden en backups/archieven van dit soort dingen worden nog wel met tapestreamers gemaakt. Vandaar dat het woord tape ook tussen aanhalingstekens staat :).
Er worden inderdaad geen fysieke tapes meer gebruikt om ontwerpen naar de fabriek te sturen, maar gewoon een snelle VPN-verbinding.
Ik kan me net voorstellen dat ze dit via VPN over het internet doen. Ze hebben zeker hun eigen "pijpen" liggen. Mogelijk dat ze de data hier encrypt overheen sturen. Hun informatie is veel en veel te belangrijk.

De meeste grote multinationals gebruiken eigen lijnen ipv het internet voor koppeling tussen hun locaties.
Wouter Tinus heeft helemaal gelijk. In mijn werk in een fab hebben we regelmatig data files van een paar honderd megabyte (tot zelfs 2GB!!!) opgestuurd over het netwerk. Dit kan zijn naar Taiwan, USA of Frankrijk, maakt niet uit. Dit duurt een paar uur (nooit langer dan 1 dag!) en de data is over gestuurd. Tapes daar doen we niet meer aan. Tapes heb ik in de afgelopen 10 jaar nog nooit gezien (behalve als back-up dan).

De meeste data gaat nog naar de fabrikanten van de maskers voor chip fabrikatie. Deze data is vele Giga bytes groot voor een complexe chip in 90nm technologie. En ook dit gebeurt via het netwerk. Dit kost vaak een hele dag, maar dat is nog steeds sneller dan een tape fysiek opsturen naar de andere kant van de wereld.
Tja, maar iedereen houd wel vast aan de nostalgische term "Tape-Out" volgens mij. :+ Bij ons heet het ook nog steeds zo, maar ik kan me niet indenken dat UMC er blij van gaat worden als we daadwerkelijk tapes zouden gaan sturen. :D

Overgens erg leuk artikel. Zulke dingen worden altijd gewaardeerd.

Ik vraag me overgens af of de heren van Intel met het woord "Shuttle" niet gewoon testwafer bedoeld hebben aangezien dat bij ons de gebruikte term is. (Ik weet overgens niet waar die term eigenlijk vandaan komt, zal wel een zelfde nostalgische achtergrond hebben als tape-out.)
Kan het alleen maar eens zijn met alle bovenstaande lovende reacties!
Geweldig om dit soort dingen te lezen! Erg intressant.

Mijn complimenten voor de auteur! Zeer begrijpelijk geschreven.
Anoniem: 206066 28 september 2007 01:03
Prima achtergrond artikel. Indd erg leuk om het ontwerp en ontwikkeling van deze chip eens van wat dichter bij te bekijken. Onvoorstelbaar op wat voor niveau ze nu met die speciale apparatuut dingen in die chip kunnen veranderen als daar aanleiding voor is ipv een hele nieuwe chip te bakken waar e.e.a aan veranderd is.
Interessant artikel om te lezen. Meest interessante vind ik toch wel dit:
Dit gebeurt door bepaalde chemicaliën in de laserstraal te verdampen en zo direct de chip in te schieten. Met een corrosieve oplossing kunnen verbindingen worden verbroken, terwijl metalen en silicium gebruikt kunnen worden om nieuwe structuren aan te leggen.
Krijg ik een futuristisch gevoel bij :9
Deze techniek is al vrij oud. Het heet FIB, of te wel focused ion beam (http://en.wikipedia.org/wiki/Focused_ion_beam). Dit gebruiken alle chip fabrikanten al jaren.
Bij mij gebruiken ze volgens mij altijd een laser voor het verbreken van verbindingen, bij Intel blijkbaar corrosieve oplossingen. Wat zou daar het voordeel van zijn?
Voor m'n gevoel is een laser nauwkeuriger.
Volgensmij worden in de meeste FABs alleen FIB's gebruikt om zowel verbinding te verbreken of te herstellen. Dit komt omdat de spot grote van een FIB zeer klein kan zijn. Over het algemeen zijn laser spot sizes veel groter.
De corrosieve oplossingen worden door/in de laserstraal verdampt en met dezelfde straal 'aangebracht' (is wat ik uit die tekst opmaak).
Knap, als je het mij vraagt ;)
Volgens mij haal je nu opzettelijk aangelegde 'bruggen' op de 'pad' waarop de die zit en de verbindingen in de die zelf door elkaar.

Een laser is voor die tweede veel te grof. Je brand je halve chip weg met zo'n ding.
Bovendien wilden ze het record van het Merom-team verbeteren, dat er in geslaagd was om binnen dertig minuten Windows te booten op de A0-versie van Core 2 Duo. Er was die nacht goed nieuws en slecht nieuws: Penryn werkte, maar het duurde zes uur om Windows aan de praat te krijgen.
Mijn C2D boot windows binnen 30 seconden, ik hoop die van jouw ok ;). Hadden ze speciale instellingen zodat de tijd van het booten van windows langer duurt?
Hadden ze speciale instellingen zodat de tijd van het booten van windows langer duurt?
Nee, ze moesten alleen maar het allereerste fysieke exemplaar van een nieuwe processor met een paar honderd miljoen transistors debuggen (in ieder geval ver genoeg om Windows te kunnen starten).

In softwaretermen is dat de vergelijken met het programmeren van een operating systeem zonder tussentijds te compileren en het dan 30 minuten na de eerste build op te laten starten.

[Reactie gewijzigd door Wouter Tinus op 23 juli 2024 06:28]

Dat is natuurlijk niet helemaal waar, aangezien het ontwerp wel virtueel wordt getest voordat ze een echt tastbare testversie gaan produceren. :)
Met een model op een computer valt ook niet alles te voorspellen hoor. Als jij nu een perfect softwaremodel voor een 22nm processor weet te schrijven, dan denk ik dat intel jou een miljoenencontract aan bied om bij hun te komen werken voor al hun softwaremodellen van processors. Want het lijkt me nogal onmogelijk om nu precies te voorspellen hoe alles zich op 22nm gedraagt, hetzelfde probleem hebben ze natuurlijk met 45nm gehad.
Je moet het meer lezen als: het duurde 30 minuten voordat ze windows AAN DE PRAAT hadden. Dus het is niet zo dat opstarten van Windows 30 minuten duurde. Maar na 30 minuten klooien met instellingen, aansluitingen etc. kregen ze Windows aan de praat. Wat natuurlijk een goede prestatie is met een nieuwe chip!

[Reactie gewijzigd door Luuk1983 op 23 juli 2024 06:28]

Altijd leuk, een kijkje in de keuken... en wat er al verteld wordt, het is maar het topje van de bekende ijsberg.

Misschien om eens een keer stukje te filmen (indien mogelijk natuurlijk) :)
In verband met concurrentiegevoelige dingen waar men daar mee bezig is mochten er binnen helaas geen foto's of video's gemaakt worden. De plaatjes die in dit artikel staan zijn van Intel zelf afkomstig :).
doet weer denken aan die keer dat Femme bij Dane-Elec langs mocht, daar moest ook elke foto gekeurd worden door het bedrijf. :)

Mooi artikel, het geeft een erg mooi beeld van iets waar je normaal niet zo snel iets van zult zien/lezen. Erg interessant om te lezen dit.
Erg interessant stuk tekst. Hulde aan Tweakers.net voor dit artikel.

Maar wat ik mij wel afvraag: Wordt dit artikel nou eerst van top tot teen door Intel bestudeerd voordat dit geplubiceert mag worden? En zo ja, is dit met betrekking tot bedrijfsgevoelige informatie enzo?
Nee, dit artikel is niet van te voren door Intel gelezen. Wel hebben ze natuurlijk tijdens de rondleiding en gesprekken goed opgepast dat ze ons niet te veel informatie gaven c.q. dingen lieten zien die echt geheim waren. Het was ook duidelijk dat het personeel van te voren was gewaarschuwd om vertrouwelijke documenten weg te stoppen en computers te locken ;).

[Reactie gewijzigd door Wouter Tinus op 23 juli 2024 06:28]

Wel hebben ze natuurlijk tijdens de rondleiding en gesprekken goed opgepast dat ze ons niet te veel informatie gaven c.q. dingen lieten zien die echt geheim waren.
Ik ga er vanuit dat Intel dit soort rondleidingen wel vaker geeft, en precies weet wat ze wel en niet zeggen en laten zien.
Het was ook duidelijk dat het personeel van te voren was gewaarschuwd om vertrouwelijke documenten weg te stoppen en computers te locken .
In een groot bedrijf als Intel, met vast veel personeelsleden die niet alles hoeven te weten, zou dat toch eigenlijk standaard procedure moeten zijn? mensen werken op een need2know basis, en verder ligt kennis zo veel mogelijk 'op slot'. Had je werkelijk de indruk dat't normaal meer open was? Dat verbaasd me.
Ik kom wel 's bij [....ok, laat ik het behoorlijk technologische bedrijven noemen. zal hier gaan namen zetten] binnen, en zodra je op een op-zich niet technische afdelingen binnenkomt maar die wel tot veel relevante data toegang hebben, schrik je van het aantal wachtwoorden op de post-it's....

Truus de tiepmiep heeft soms/vaak geen benul van de waarde van de informatie die ze aan het archiveren is.
Anoniem: 234368 26 september 2007 11:01
De clockspeed loopt hier behoorlijk hoog, zoals al eerder in de tekst vermeld:

Dit zou een 65nm-versie van de Pentium 4 worden met een extreem lange pipelinne 940 tot 50 stappen) om kloksnelheden van 7GHz of zelfs nog meer te kunnen halen.

Dit belooft een mooie toekomst in de snelheden die kunnen behaald worden.
Alleen ben dan wel benieuwd hoe ze de warmte dan onder de duim gaan houden aangezien meestal hoe sneller hoe meer warmteproductie. Ik zie niet snel iedereen met Pipe met vloeibare stikstof in zijn huiskamer staan. We zien tegn die tijd weer wel wat ze daarvoor hebben uitgevonden.
Dit project is dus ook niet doorgegaan hè ;)
Maar de kennis zal vast en zeker niet verloren zijn gegaan!

Of het bruikbaar is (geweest) in andere projecten, dat zullen we waarschijnlijk wel nooit te horen krijgen.
Nee, daarom is de pipeline nu weer ingekort tot maximaal ongeveer 20. Lange pipelines hebben namelijk grote nadelen.
Prachtig stukje tekst, echt op en top Tweaker.

Toch fantastisch wat die mensen kunnen. Verkeersdrempels die schokken veroorzaken :+ Leuk :D
Erg interessant! Leuk om een kijkje in de keuken te krijgen. Hulde!

Op dit item kan niet meer gereageerd worden.