Het hercoderen van MPEG2 videobeelden naar het MPEG4 DivX formaat is één van de sterke punten van de Pentium 4, waarbij ook de eigenschappen van RDRAM goed naar voren komen. Het mooie van FlaskMPEG is dat verschillende methoden van coderen gekozen kunnen worden, zodat de effecten van uitbreidingen van de instuctieset zoals MMX en SSE2 zichtbaar gemaakt kunnen worden. Gemiddeld zien we dat de performance in frames per seconde met 5% toeneemt. De verhoogde bandbreedte van de Colusa chipset speelt hierin waarschijnlijk de grootste rol. Het valt op dat SSE2 met lage kwaliteit veel trager is dan middelmatige of hoge kwaliteit. Dit lijkt echter een bug in Flask zelf zijn, aangezien het ook op het Pentium 4 systeem gebeurde. Hieronder vindt je een tabel met de behaalde resultaten en een screenshot met het record:
Nu we weten dat Foster dankzij de 860 chipset meer bandbreedte heeft en door middel van Jackson Technology beter presteert dan de Pentium 4 kunnen we nog eens kijken naar een derde methode waarmee de snelheid van de chip opgeschroefd kan worden; optimalisaties. Intel heeft altijd beweerd dat speciaal gemaakte software significant beter zal draaien op de Pentium 4. Met 'speciaal gemaakt' bedoelen we in dit geval niet in assembly geschreven SSE2 routines, maar doodsimpele compiler-instellingen. Het is een zeer kleine moeite om die te gebruiken en ze zorgen ervoor dat de code die gegenereerd wordt toegespitst is op de sterke punten van de Pentium 4 en rekening houdt met de zwakkere.
Intel is al geruime tijd aan versie 5.0 van haar compilers en performance analyser aan het werken. Deze bieden naast speciale opties voor de Pentium 4 ondersteuning voor de IA-64 architectuur. Tim Wilkens, de maker van ScienceMark, was zo vriendelijk om ons te voorzien van speciale versies van zijn benchmark, gemaakt met de laatste beta-versie van deze nieuwe compiler. ScienceMark is een wetenschappelijke benchmark. Wat er precies gedaan wordt met de virtuele vloeibare Argon moleculen is ons niet helemaal duidelijk, maar dat is dan ook niet van levensbelang. Het feit dat een 1,5GHz Pentium 4 bijna twee minuten zoet is met het rekenwerk zegt genoeg over de complexiteit van de handelingen. De geoptimaliseerde executables verrassen ons echter positief:
We zien hier helemaal links het resultaat van de normale executable, die vrij te downloaden is. QxW en QaxW zijn geoptimaliseerde versies, gecompileerd door de laatste beta van de Intel 5.0 compiler. Ondanks het feit dat de broncode van de drie programma's exact gelijk is en ze dus allemaal hetzelfde werk verrichten zijn de geoptimaliseerde versies bijna twee keer zo snel klaar. Een snelheidswinst van bijna 100% door een simpele recompile belooft veel goeds voor de toekomst van de Pentium 4, maar helaas is het niet alleen maar rozegeur en maneschijn:
Dit moet pijn doen. Ondanks de geweldige resultaten van de compiler bij de ene test lijdt de tweede test zwaar. Het effect is hier zelfs omgedraaid, QaxW en QxW zijn bijna twee keer zo traag als de originele versie, die de Pentium III is geoptimaliseerd. De verklaring hiervoor is dat ScienceMark voor een compiler een erg raar programma is, met constructies die normaalgesproken zeer zelden voorkomen. Tim Wilkens werkt samen met Intel aan het verbeteren van de performance en het fixen van bugs. Hoewel een zeer recent uitgebrachte versie al beter werkt was de versie ten tijde van testen slechts in staat om twee van de vier belangrijke tests te compileren. Dat is ook de reden dat het originele programma een veel beter eindresultaat heeft als de geoptimaliseerde versies; deze missen een aantal tests:
* = Ontbrekende tests veroorzaken lagere score |
De compiler is dus nog verre van af, maar heeft bewezen dat zeer indrukwekkende resultaten mogelijk zijn. Hoewel allerdaagse applicaties waarschijnlijk niet de enorme snelheidswinsten die bovenste grafiek van ScienceMark laat zien zullen halen is het verschil waarschijnlijk duidelijk te merken. Mensen die bang zijn dat optimalisatie voor de Pentium 4 hun Pentium III of Athlon systeem trager zal maken hoeven zich niet al te veel zorgen te maken. Hoewel QxW onmiddelijk crasht laat QaxW gelijksoortige performance-effecten zien als op de Pentium 4, alleen minder extreem. Bovendien heeft de compiler ook de mogelijkheid om voor de Athlon te optimaliseren.