Door Wouter Tinus

Intel Foster sneak preview

FlaskMPEG & ScienceMark

Het hercoderen van MPEG2 videobeelden naar het MPEG4 DivX formaat is één van de sterke punten van de Pentium 4, waarbij ook de eigenschappen van RDRAM goed naar voren komen. Het mooie van FlaskMPEG is dat verschillende methoden van coderen gekozen kunnen worden, zodat de effecten van uitbreidingen van de instuctieset zoals MMX en SSE2 zichtbaar gemaakt kunnen worden. Gemiddeld zien we dat de performance in frames per seconde met 5% toeneemt. De verhoogde bandbreedte van de Colusa chipset speelt hierin waarschijnlijk de grootste rol. Het valt op dat SSE2 met lage kwaliteit veel trager is dan middelmatige of hoge kwaliteit. Dit lijkt echter een bug in Flask zelf zijn, aangezien het ook op het Pentium 4 systeem gebeurde. Hieronder vindt je een tabel met de behaalde resultaten en een screenshot met het record:

Nu we weten dat Foster dankzij de 860 chipset meer bandbreedte heeft en door middel van Jackson Technology beter presteert dan de Pentium 4 kunnen we nog eens kijken naar een derde methode waarmee de snelheid van de chip opgeschroefd kan worden; optimalisaties. Intel heeft altijd beweerd dat speciaal gemaakte software significant beter zal draaien op de Pentium 4. Met 'speciaal gemaakt' bedoelen we in dit geval niet in assembly geschreven SSE2 routines, maar doodsimpele compiler-instellingen. Het is een zeer kleine moeite om die te gebruiken en ze zorgen ervoor dat de code die gegenereerd wordt toegespitst is op de sterke punten van de Pentium 4 en rekening houdt met de zwakkere.

Intel is al geruime tijd aan versie 5.0 van haar compilers en performance analyser aan het werken. Deze bieden naast speciale opties voor de Pentium 4 ondersteuning voor de IA-64 architectuur. Tim Wilkens, de maker van ScienceMark, was zo vriendelijk om ons te voorzien van speciale versies van zijn benchmark, gemaakt met de laatste beta-versie van deze nieuwe compiler. ScienceMark is een wetenschappelijke benchmark. Wat er precies gedaan wordt met de virtuele vloeibare Argon moleculen is ons niet helemaal duidelijk, maar dat is dan ook niet van levensbelang. Het feit dat een 1,5GHz Pentium 4 bijna twee minuten zoet is met het rekenwerk zegt genoeg over de complexiteit van de handelingen. De geoptimaliseerde executables verrassen ons echter positief:

We zien hier helemaal links het resultaat van de normale executable, die vrij te downloaden is. QxW en QaxW zijn geoptimaliseerde versies, gecompileerd door de laatste beta van de Intel 5.0 compiler. Ondanks het feit dat de broncode van de drie programma's exact gelijk is en ze dus allemaal hetzelfde werk verrichten zijn de geoptimaliseerde versies bijna twee keer zo snel klaar. Een snelheidswinst van bijna 100% door een simpele recompile belooft veel goeds voor de toekomst van de Pentium 4, maar helaas is het niet alleen maar rozegeur en maneschijn:

Dit moet pijn doen. Ondanks de geweldige resultaten van de compiler bij de ene test lijdt de tweede test zwaar. Het effect is hier zelfs omgedraaid, QaxW en QxW zijn bijna twee keer zo traag als de originele versie, die de Pentium III is geoptimaliseerd. De verklaring hiervoor is dat ScienceMark voor een compiler een erg raar programma is, met constructies die normaalgesproken zeer zelden voorkomen. Tim Wilkens werkt samen met Intel aan het verbeteren van de performance en het fixen van bugs. Hoewel een zeer recent uitgebrachte versie al beter werkt was de versie ten tijde van testen slechts in staat om twee van de vier belangrijke tests te compileren. Dat is ook de reden dat het originele programma een veel beter eindresultaat heeft als de geoptimaliseerde versies; deze missen een aantal tests:

* = Ontbrekende tests veroorzaken lagere score

De compiler is dus nog verre van af, maar heeft bewezen dat zeer indrukwekkende resultaten mogelijk zijn. Hoewel allerdaagse applicaties waarschijnlijk niet de enorme snelheidswinsten die bovenste grafiek van ScienceMark laat zien zullen halen is het verschil waarschijnlijk duidelijk te merken. Mensen die bang zijn dat optimalisatie voor de Pentium 4 hun Pentium III of Athlon systeem trager zal maken hoeven zich niet al te veel zorgen te maken. Hoewel QxW onmiddelijk crasht laat QaxW gelijksoortige performance-effecten zien als op de Pentium 4, alleen minder extreem. Bovendien heeft de compiler ook de mogelijkheid om voor de Athlon te optimaliseren.


Nintendo Switch (OLED model) Apple iPhone SE (2022) LG G1 Google Pixel 6 Call of Duty: Vanguard Samsung Galaxy S22 Garmin fēnix 7 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2022 Hosting door True

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee