IBM introduceert chip-morphingtechnologie eFuse

Bij het bakken van processors is het altijd mogelijk dat er achteraf toch een foutje in het ontwerp of in het productieproces zat. Tot nu toe konden alle chips dan weggegooid worden en moest er een complete set nieuwe maskers gemaakt worden, een kostenpost van enkele miljoenen euro's. Chipontwerper en -fabrikant IBM heeft voor dit probleem een oplossing gevonden: eFuse. Door bepaalde delen van de processor dubbel uit te voeren, kan als er in één van beide delen een fout blijkt te zitten een elektrische zekering verbroken worden, waardoor het tweede deel inwerking treedt. Op deze manier rollen er toch goede chips van de band en dat scheelt weer een hoop geld.IBM logo (vrijstaand)

Deze mogelijkheid om fouten te repareren, blijft ook werken als de CPU de fabriek uit is en bij iemand thuis in een computer zit. Onder andere de nieuwe Power5-processors zijn al uitgerust met deze techniek. Volgens IBM kan eFuse zelfs gebruikt worden om bijvoorbeeld het energieverbruik van een chip af te stemmen op de taken die uitgevoerd worden. In een animatie wordt zelfs getoond hoe de nieuwe techniek een chip kan behoeden voor oververhitting. Als de processor te heet wordt, brandt er een zekering door die een tweede processor-core beschikbaar maakt, zodat de belasting gedeeld wordt. Waarom deze tweede core niet meteen beschikbaar is, zodat de belasting meteen gedeeld kan worden, is niet helemaal duidelijk.

Het idee om bepaalde delen van een chip uit te schakelen is niet nieuw. In 2002 experimenteerde IBM al met deze techniek om niet werkende rijen en kolommen in geheugenchips uit te schakelen. Hiervoor werd een laser gebruikt. Bij het verbreken van de zekering bleven echter wat brokstukken achter in de chip die de verbindingen af en toe weer herstelde of andere delen van de chip beschadigden. Tegenwoordig gebruikt IBM daarom een andere techniek om de zekeringen te verbreken: elektromigratie. Normaalgesproken is dit een ongewenst effect in chips, door de stroom elektronen slijten verbindingen langzaam weg. Voor het verbreken van de zekeringen is dit fenomeen juist ideaal: er blijven geen brokstukken achter en de verbinding blijft verbroken.

IBM's eFuse
Doordat de eerste processor-core oververhit raakt, is de rechter eFuse verbroken. Daardoor is de tweedeprocessor-core geactiveerd, zodat de belasting gedeeld wordt.

Door Matthijs Abma

01-08-2004 • 13:36

28

Bron: IBM

Reacties (28)

28
27
14
5
1
2
Wijzig sortering
Voor wie wil weten hoe zo´n fuse er uit ziet.

http://micro.magnet.fsu.edu/creatures/pages/gooddiefuse.html
(als joke bedoeld maar het is wel een echte fuse)

Het idee om chipdelen uit te schakelen is al tamelijk oud. Wat die reconfigureerbaarheid betreft. Een non resettable fuse lijkt me alleen interessant voor processoren die in dedicated systemen worden geplaatst. Bij normale multi purpose processoren zoals de intel en amd pc cores zul je een soort neural net achtige structuur moeten maken die zowel paden kan maken als verbreken. Heb nog een paar pers berichten gevonden maar allemaal dezelfde info zoals in het bericht hierboven. Heb het vermoeden dat dit principe niet bedoeld is om normale stervelingen hun processor te laten herconfigureren maar voor bedrijven die er duizenden kopen.
Of in de winkel:

Wilt u een Intel of een een AMD core in uw nieuwe cpu?
Waarom deze tweede core niet meteen beschikbaar is, zodat de belasting meteen gedeeld kan worden, is niet helemaal duidelijk.
In dit soort systemen zijn softwarelicenties gebaseerd op de rekenkracht die in de machine zit.
Wanneer een bepaalde cpu te heet wordt (door bijv. een defecte koeler of warme omgevingstemperatuur) wordt de helft van de load van die cpu opgevangen door een reserve-cpu. Het is dus niet zo dat je de dubbele cpu-capaciteit krijgt bij oververhitting. Dan zouden namelijk de licentiekosten omhoog gaan.
Waarom deze tweede core niet meteen beschikbaar is, zodat de belasting meteen gedeeld kan worden, is niet helemaal duidelijk.
Inderdaad nogal vaag. Is natuurlijk handig als mensen weer gaan uitvinden hoe ze dit zelf kunnen activeren. Alleen geen idee of je daar echt voordeel aan hebt... :)
Waarom? Omdat dit natuurlijk een groot marketing verhaal is waar je niet zo veel aan hebt :)

Zou ook niet weten waarom ze tweekeer zoveel ruimte innemen om die vervolgens (normaal) niet te gebruiken. Is natuurlijk onzinnig, want dan kun je op 1 wafer maar de helft zoveel chips bakken, en dat kost veel meer geld.

(en zoals hieronder al ergens gezegd is, een ontwerpfout zul je er niet mee oplossen, want die zit dan in beide delen - tenzij je weer 2x zoveel geld uit gaat geven aan een ander ontwerp van de 2e core, en dat lijkt me ook niet de bedoeling).

Wellicht gaat het meer de kant op van de GPU's waarin ze afhankelijk van de yield pipelines uit kunnen schakelen en die dan als 'budget' kunnen verkopen. Dan kun je de yield die je normaal weg kan gooien toch nog verkopen... (Maar dan is het niet dynamisch, tijdens 'runtime')

Of het moet tijdens development van die dingen zijn, dat ze niet steeds een prototype hoeven te bakken, maar met 1 chip de diverse voltages en circuits kunnen 'tunen'. Wat dat voor zin in het eindproduct heeft weet ik echter nog steeds niet.
Activeren of de-activeren ?

Ik zie het al gebeuren.... een Windows based PC waar een bepaald virus zonder problemen op binnenraakt via de welgekende wegen, en dan kijkt of de betreffende CPU eentje is die 'aangepast' kan worden, en dan even de nodige "zekeringen' gaat opblazen...

Wordt heel leuk.... :(
Het lijkt me in dat geval beter om dit te regelen via een jumper op het moederbord. Dat het moederbord een soort signaal naar de processor stuurt...

Maar dan krijg je weer "user errors" :+
Als de processor te heet wordt, brandt er een zekering door die een tweede processor-core beschikbaar maakt, zodat de belasting gedeeld wordt. Waarom deze tweede core niet meteen beschikbaar is, zodat de belasting meteen gedeeld kan worden, is niet helemaal duidelijk.
Dus eigenlijk heb je een andere CPU die misschien trager werkt als ie n keer te heet is geworden, omdat die verbinding niet meer terug kan of zo?
Anoniem: 43668 @Ruuddie1 augustus 2004 16:45
juist sneller, je opent namelijk een tweede core, die ook gaat meerekenen en twee cores rekenen veel sneller dan één.
Ik denk die 2e core is geen exacte kopie van de eerste core. Lijkt me wel n heel vreemde stap als IBM dat zou doen; 100% dual core pas laten werken bij overhitting.
Er moet wel een nadeel aan zitten...
een foutje in het ontwerp
en
Door bepaalde delen van de processor dubbel uit te voeren
Lijkt mij dat je een ontwerp fout heb in het eerste gedeelte dat deze in het andere deel ook zit. Dan helpt het geen moer om er 1tje uit te schaken en kan je alsnog naar de tekentafel..

Het klinkt wel leuk, maar ik vind het weinig praktisch
Inderdaad, bij een fout ontwerp zuller de kapotte chips toch echt weggooit moeten worden (indien een microcode/BIOS update het niet kan herstellen) en nieuwe maskers moeten worden gemaakt.

Het enige fabricage voordeel is dat je door bepaalde dingen dubbel uit te voeren hogere yields kan halen. Maar dat wordt al vaker gedaan (denk aan de extra L3 cache op de Itanium, en het uitschakelen van eventueel kapotte pipelines op Ati en nVida chips).
Kijk en dat is nou net het leuke van deze toepassing. Net als een FPGA kan je dus extra logica toevoegen om bepaalde niet goed werkende delen van de chip te vervangen door een programmeerbaar deel. Dat is dus heel wat anders dan een blok geheugen uitschakelen of een aantal pipelines uit te zetten.
Anoniem: 105176 1 augustus 2004 13:40
En dan gaan de tweakers 1x eff oververhitten.
En klaar 2 cores }>
het is grappig maar serieus is dat wel iets wat tweakers gaan doen ja, zover ik weet was er toch ook in intel chips ofzo ..zoiets mogelijk ? zeg maar firmware update ? het is in iig mogelijk om dit soort chips te progammeren bij de gebruiker thuis .. is dit wel iets wat je wilt ?
Als de zekering zich weer herstelt als die afkoelt schakelt het systeem weer over op één core.

Dt lijkt mij een mooie manier om stroom te besparen als er geen zwaar rekenwerk van dat ding verwacht wordt. Maar dan zou het stadium "te heet" wel erg snel bereikt moeten worden.
Ha! Eindelijk heeft het inbranden nut!!

Gewoon ff de fan stilhouden voor een minuutje en je hebt een dual-core systeem:p
Dit wordt in veel meer CPUs/ICs toch al gebruikt?
Volgens mij doen AMD en Intel het ook, vooral in cache areas. Van de negen cache areas hebben ze er maar acht nodig (bijvoorbeeld) en bij een defecte area kunnen ze die dus gewoon uitschakelen.
En bij GPUs kunnen ze kapotte pipelines uitschakelen. Maar dit zal wel op een andere manier gebeuren.

Plus deze methode kan ook bij de consument thuis worden toegepast :)

edit:
can ----> kan
Anoniem: 87832 2 augustus 2004 09:47
Zoals ik het begrijp gaat het hier niet om twee volledige cores maar slechts het dubbel uitvoeren van de gevoelige delen van één core. De delen van de core die bijvoorbeeld het meest mislukken tijdens productie van de wafers.

Het gegeven dat een backup circuit een doorgebrande circuit kan overnemen is wellicht leuk maar het duidt toch vooral op slechte constructie van de CPU dat het zomaar kán doorbranden.

Ik hoop in ieder geval dat er dan wel een alarm wordt afgegeven aan het systeem; als circuit #1 doorbrand met een specifieke taak dan kan je er de donder op zeggen dat backup circuit #2 met dezelfde taak ook snel zal overlijden.

Op dit item kan niet meer gereageerd worden.