Die 16 textures per pass kan die (R9500) wel degelijk.

Je haalt hier wat dingen door elkaar. Het simpele "8 pipes met 1 TMU = 8 textures per pass, dus dit moet-ie twee keer doen (waarschijnlijk de loopback die jij bedoelt) is 16 textures per pass" gaat hier niet helemaal op. Op die fiets zou eigenlijk alleen de NV30 echt DX9.0 compliant zijn omdat-ie 8 pipes met elk 2 TMU's heeft (dus geen 'loopback' nodig). Maar zo werkt het dus niet helemaal.
Je hebt een pass en je hebt een (clock)cycle. Dit zijn niet dezelfde dingen.
De kaart doet net alsof elke pipeline 16 texture units heeft. Hij heeft namelijk 16 records die elk 1 texture adres/grootte kan onthouden. We weten allemaal dat de kaart maar 1 texture unit per pipeline heeft, dus zullen er meerdere
cycles nodig zijn om de rest van de pass af te maken.
Elke pipeline kan maar 1 texture in 1 cycle verwerken (8 pipes + 1 TMU per/pipe architectuur). Hij begint met 1 texture, dit wordt opgeslagen in zo'n record. Dan gaat-ie terug doet er nog een laag overheen (dit is de volgende cycle). Ook dit wordt opgeslagen. We zitten nu op 2 textures... Daarna weer een laag, dan nog eentje...Dus in totaal kan-ie per pass 16 verschillende textures toepassen, want hij heeft namelijk 16 records waar elke cycle in kan worden opgeslagen.
Het werkt op dezelfde manier als een CPU met 1 enkele FPU meer dan 1 instructie kan uitvoeren. Zo werken de TMU's in de 9700 en 9500. En daardoor kan de 9500 wel degelijk 16 textures per pass toevoegen zelfs al heeft-ie maar 4 pipes.
Overal waar je zoekt naar de 9500 zal er staan dat-ie 16 textures per pass kan doen. Denk je nou echt dat ATi zo stom zou zijn om te claimen dat zelfs de gewone simpele 9500 met 4 pipes ook echt DX9.0 compliant is (en dus aan de eis voldoet van 16 textures per pass) als hij dat niet zou zijn?
Edit: typo's + "clock" voor "cycle" gezet ter verduidelijking