je hoeft geen expert te zijn om te weten dat de yields van de gt200 relatief laag zullen zijn.
hij is gewoon groot, sterker nog, een van de grootste chips ooit gemaakt op een bulk process.
Dat is het punt juist, dat moet je wel zijn.
Er is nergens, maar dan ook echt helemaal nergens informatie te vinden over yields bij moderne procedee's. Dit is een belangrijk geheim van chipbakkers, die ze alleen af zullen geven aan vaste klanten. Zolang we niet weten of we hier te maken hebben met tientallen procenten, procenten of zelfs tienden van procenten kunnen we helemaal niets zeggen over yields van welke chip dan ook op welk procedee dan ook bij welke chipbakker dan ook.
Daaruit volgt natuurlijk dat er ook niets over G200 te zeggen valt. Je hebt het over groot (Wat is groot? Wat is tè groot?), maar yields zijn voornamelijk afhankelijk van ontwerp, niet van grootte.
Uiteraard zitten er dan nog steeds meer fouten/onvolkomenheden in een grote chip dan in een kleinere, maar zolang we niet weten over wat voor percentages aan yields we uberhaupt praten kunnen we nog niets zeggen. Zou NVIDIA er wakker van liggen als ze 20% slechtere yields hebben vanwege de grote? Ongetwijfeld. Zouden ze wakker van liggen van 0,2% slechtere yields? Denk het toch niet.
(En als je nu komt met "0,2% slaat nergens op" argument wil ik ook graag harde cijfers zien waarom het nergens op slaat
)
Tot slot is er nog het argument te bedenken dat een complex ontwerp als dat van G200 meer fouten bevat dan RV770, maar ook daar komt een gebrek aan cijfers roet in het eten gooien. We weten niet hoe belangrijk dit is voor de yields, we weten niet hoe goed NVIDIA is (al dan niet in vergelijking met AMD), we weten niet hoe snel NVIDIA dit soort problemen heeft kunnen herkennen en kunnen oplossen in opeenvolgende revisies, we weten niet wat de impact van een volwassener procedee (65nm vs 55nm) is geweest op G200 vs RV770, enzovoort.
Dus je kan zeggen wat je wilt met het "je hoeft geen expert te zijn" argument, Uiteindelijk is er geen enkele grond waar je het op baseert. Ik stel dus voor om NVIDIA gewoon te geloven wanneer ze zeggen dat yields beter waren dan verwacht, en daarnaast stel ik voor om het gezonde verstand van NVIDIA topmensen te vertrouwen toen ze de keuze maakten om (wetend hoe goed de yields ongeveer zouden worden) G200 gewoon in productie te laten gaan.
EDIT:
Het spijt me, maar je verhaal wordt steeds inconsistenter. Even op een rijtje wat je volgens mij zegt:
1 - Redundantie is nodig vanwege de grootte van G200
2 - Redundantie is een probleem vanwege de extra transistors en dus extra grootte en dus extra (onnodige) kosten
3 - ATI heeft een voordeel omdat ze geen redundantie nodig hebben.
Alle drie zijn echter niet waar. Eerst 2, want dat is de basis van dit verhaal. Redundantie is een kostenoverweging die wordt genomen bij het ontwerp van een chip. De ontwerpers berekenen simpelweg de kosten van een chip als er geen redundantie-structuren aanwezig zijn, en de kosten met verschillende vormen van redundantie. Uiteindelijk krijg je dan gewoon een geschat percentage functionele chips per wafer (geen redundantie = meer chips maar lagere yields, meer redundantie = minder chips maar meer yield). Uiteindelijk krijg je gewoon een kosten/baten analyse welke methode de beste resultaten zal geven.
Dit betekent echter ook dat redundantie niet een probleem is. Het is gewoon een afweging met voordelen en nadelen, en die kunnen netjes op een rijtje gezet worden, waarna een keuze gemaakt kan worden.
1 dan vervolgens. G200 is te groot en dus is redundantie nodig. Dit is het grootste probleem aan je hele stelling, want het is niet waar. GTX280 maakt helemaal geen gebruik van coarse redundantie. Alle SIMD clusters die op G200 zitten zijn in gebruik bij GTX280. Dit is welliswaar niet het geval bij GTX260, maar dat is dan ook niet de topkaart. ATI maakt het verschil door wel of geen GDDR5 te gebruiken bij 4870 en 4850, NVIDIA door minder clusters. Is dit een fout in G200? Ik zie niet in waarom. Het laat NVIDIA toe meer chips te gebruiken en het staat ze toe GTX280 toch echt krachtig te maken (het alternatief zou volgens jou een kleinere chip zijn, dus minder performance).
Overigens is redundantie helemaal niet gebonden aan chipgrootte. Het kan (zie 2) net zo goed gebruikt worden in kleine chips, wanneer het betere yields geeft.
3 dan ten slotte. AMD heeft een voordeel omdat ze geen redundantie nodig hebben. Wat natuurlijk al onzin is omdat NVIDIA het ook niet nodig heeft, althans niet in jouw definitie. Wat je echter vergeet is dat hoewel ATI en NVIDIA geen coarse redundantie gebruiken, ze gebruiken waarschijnlijk wel fine-grained redundantie. Er zijn geen extra clusters die ingeschakeld kunnen worden als een ander cluster niet werkt, maar er zijn ongetwijfeld andere stukken logica dubbel die wel kunnen worden ingeschakeld als het nodig is. Zo las ik laatst nog ergens (heb zo geen link meer) dat RV770 eigenlijk een extra SP per cluster zou hebben.. Als er iets mis gaat met de productie kan deze extra SP worden gebruikt, anders wordt deze uitgeschakeld.
Ook hier is echter niets van te zeggen. Het ontwerp van deze chips is wederom geheim, dus hoeveel redundante transistoren er in de chips van ATI en NVIDIA zitten is net zo geheim. We kunnen dus ook niet zeggen wie de meest effectieve redundantiestrategie heeft gekozen.
[Reactie gewijzigd door Snoitkever op dinsdag 13 januari 2009 16:08]
"ATI asserted that a very large GPU, without the use of repair structures or harvesting (two techniques I’ll describe in a bit) may only have a 30% yield. That means for every 100 GPUs produced on a single wafer, only 30% of them would be fully functional and could be sold as advertised. Manufacturing these complex circuits is particularly expensive, those fab plants easily cost a couple of billion dollars to build and thus having most of your wafer go to waste isn’t really a good way of running a business.
Thankfully there are ways to improve that crappy 30% yield to a value north of 90%. The first is a technique generally known as repairability. The idea behind repairability is simple: build redundancy into your design. If you have a unit with 10 shader processors, actually build 11 but use one as a spare should there be a defect in any of the remaining processors. The same technique is often used for on-die memory, include additional cells so that a defect in one part of a cache won’t render the entire chip unusable. There are tradeoffs here however, if you build in too much repairability then you run the risk of having a die that’s large but offers no additional performance benefit. If you don’t build in enough repairability then your yield suffers.
Harvesting is another technique that all of you are quite familiar with, although its street name is feature binning. The idea here is that you assume that only a small percentage of the die on a wafer will be completely functional, but instead of throwing away the ones that aren’t fully functional, you disable features and sell them as a lower end part. For example, if your target architecture has 10 shader processors but only 30% of your production will have 10 working shader processors but 50% of the production will have 8 working units you’d sell a model with 10 SPs and a model with 8 SPs, the latter being at a reduced cost. This way instead of throwing away 70% of the wafer, you only throw away 20% - and if possible you could make a third SKU with fewer number of functional SPs and use close to 100% of the wafer.
Yields do improve over time, and what eventually happens if you build a product relying on harvesting is you hurt yourself financially. In the example above where you have two configurations of the same die, yields will eventually improve to the point where your 8 SP die could just as easily have 10 functional SPs but you have to sell them as reduced functionality parts because you’ve built up market demand for them. In a sense, you’re selling something worth $1 for $0.80. You could always create a new version of the chip with a smaller die, but that takes additional engineering resources, time and money.
The most recent public example of die harvesting was actually with NVIDIA’s GT200. The GeForce GTX 260 was simply a harvested version of the GTX 280 with 192 SPs vs. 240. As yields improved, NVIDIA introduced the GeForce GTX 260 Core 216 with 216 SPs. Note that NVIDIA didn’t use any repairability for the shader processors on GT200 there are no more than 240 functional SPs on a GT200 die, but that’s because NVIDIA would rely on harvesting anyway - if any of the 240 SPs didn’t work the chip would be branded as a GTX 260 or Core 216.
This is in stark contrast to RV770 where both versions of the GPU were functionally identical, the only differences were clock speeds and power requirements. But from a die standpoint, ATI didn’t have to sell any reduced versions of the chip to keep yields high.
Note that whether or not a company has to rely on harvesting doesn’t really impact the end user. In this case, the GeForce GTX 260 Core 216 actually benefitted the end user as it manages to deliver the same sort of value that AMD does with the Radeon HD 4870. It isn’t ideal for NVIDIA financially and if a company has to rely on harvesting for too long it will eventually take its toll, but I suspect that in the GT200 case NVIDIA will bail itself out with a 55nm revision of GT200 before things get too bad.
ATI didn’t want to build a GPU that would rely on excessive repair and harvesting to keep yields high. And then came the killer argument: building such a GPU was no longer in the best interests of its customers."
uit een
interview met Carrell Killebrew van ati over de rv770.