Cachingprestaties (2)
Een gedetailleerde analyse van de read cache is mogelijk met de Read Response Surface van AnalyzeDisk. Deze test bestookt de harde schijf met een voorspelbare stroom van willekeurige referenties met een goede verdeling van lokaliteit. Lokaliteit is het verschijnsel dat opeenvolgende benaderingen van de harde schijf dikwijls dicht in de buurt van elkaar liggen en daardoor goede mogelijkheden bieden voor caching.
In de grafieken bevinden zich op de y-as de responstijd, op de x-as de "distance" en op de z-as de "stride". De stride is de ruimtelijke relatie in sectoren en de distance is de spatiële (tijdsgebonden) relatie in referenties tot de originele benadering. De invloed van de cache is zichtbaar bij benaderingen die dicht in de buurt liggen van het origineel, dus met een korte stride en een kleine distance. In de grafieken is het gebied met een distance van 1 tot 64K van belang. De invloed van prefetching is zichtbaar bij een stride groter dan 0, de invloed van de read cache is zichtbaar bij een negatieve stride. Ter verduidelijking volgt hier de Engelstalige omschrijving van deze test:
Alle hier geteste adapters zijn in staat om te cachen tot een distance van 256 referenties. De verschillen manifesteren zich voornamelijk in het bereik van de stride die gecached kan worden en de responstijd waarmee de gegevens door de cache worden geserveerd. We hebben in de onderstaande grafieken weer de resultaten van de tests met vier schijven in RAID 5 genomen. De 3ware 9550SX-12 levert prima prestaties met lage responstijden tussen strides van -128 tot 128. Wel is er een bult zichtbaar rond het gebied van 0 strides en een distance van meer dan 256 referenties. Dit verschijnsel komt ook bij de andere kaarten in meer of mindere mate voor.

AMCC 3ware 9550SX-12
Een opmerkelijk fenomeen doet zich voor bij de adapters van Areca. Hoewel het dal iets minder breed is dan bij de 3ware 9550SX-12 hebben de Areca's wel een bijna verwaarloosbare responstijd rond het gebied van 0 strides. Het maakt nauwelijks uit hoeveel referenties er in de tussentijd hebben plaatsgevonden, zolang de opgevraagde data op dezelfde sector ligt als die van de huidige benadering kan de Areca-firmware hem uit de cache vissen. Het cache-algoritme hanteert dus een strategie die in het verleden opgevraagde gegevens zolang mogelijk in de cache houdt. In de grafiek is dit fenomeen zichtbaar in de vorm van een gele spleet die door de z-as loopt. Verschillen tussen de responstijd van de Areca ARC-1280 met 512MB cache en de ARC-1160 met 256MB en 1GB cache zijn nauwelijks zichtbaar.

Areca ARC-1160 256MB

Areca ARC-1160 1GB

Areca ARC-1280
De LSI Logic MegaRAID SATA 300-8X produceert een nette grafiek met een relatief beperkte piek rond het gebied met 0 strides en een distance van meer dan 256 referenties. De caching verschilt qua bereik van de strides weinig met de andere goed presterende controllers. Minder goed zijn de resultaten van de HighPoint RocketRAID 2320. Hij cached minder breed (strides tussen -64 en 64) hij heeft een grotere bult rond 0 strides bij een distance van meer dan 256 referenties.

LSI Logic MegaRAID SATA 300-8X

HighPoint RocketRAID 2320
De responstijden van de Promise SuperTrak EX16350 zijn matig. Over het gehele gebied scoort deze kaart slechter dan zijn opponenten. Alleen in de strook met een stride van 0 en een distance tot 128 referenties levert de SuperTrak EX16350 rappe responstijden met een vergelijkbare felgele kleur als de andere adapters. Daarbuiten is er sprake van een oranje kleur die een responstijd van meer dan 0,5 ms representeert. Ook in de breedte is de SuperTrak EX16350 minder sterk. Strides die buiten de range van -64 tot 64 sectoren liggen worden minder snel beantwoord dan bij de andere adapters. Verder heeft de SuperTrak EX16350 een stevige paarse piek rond het gebied van -2 tot 1 strides en een distance van 512 tot 8K referenties.

Promise SuperTrak EX16350
In de grafieken bevinden zich op de y-as de responstijd, op de x-as de "distance" en op de z-as de "stride". De stride is de ruimtelijke relatie in sectoren en de distance is de spatiële (tijdsgebonden) relatie in referenties tot de originele benadering. De invloed van de cache is zichtbaar bij benaderingen die dicht in de buurt liggen van het origineel, dus met een korte stride en een kleine distance. In de grafieken is het gebied met een distance van 1 tot 64K van belang. De invloed van prefetching is zichtbaar bij een stride groter dan 0, de invloed van de read cache is zichtbaar bij een negatieve stride. Ter verduidelijking volgt hier de Engelstalige omschrijving van deze test:
Read Response Surface
The effectiveness of the caching algorithm is evaluated by a locality response surface. The region of locality the cache effectively encompasses can readily be identified, and some of the caching algorithm specifics can also be identified.
The cache locality response surface is computed from a probabilistic stream of random references with proper locality distribution. The mean service time is computed as a function of the locality stride and distance.
Reference stream locality can be summarized as the probability of the first occurrence of an access to a block s blocks away from the current one occurring within the next 1/2d to d disk accesses. We refer to s as the stride (spacial relationship) of the access and d as the distance (temporal relationship). The drive response surface graph plots the mean service time as a function of this stride and distance. Since caches are known to rely on locality for their performance, plotting the service time as a function of this locality is a useful evaluation of cache performance. This graph can give much insight into the inner workings of the caching algorithms.
The response surface is presented as two different projections of a three dimensional surface with stride and distance as the base axes and the mean service time as the height. Typically, the cache performance can be seen as a region of fast access time near the origin (short stride and small distance), and the prefetch unit is manifest as a region of fast access for stride>0 and distance>0. The size of the region of fast access represents the caching algorithm's effectiveness, and the shape of the region is dependent on the particular caching and prefetching algorithm used. Often, vendors trade off some regions of cache performance for others in the hope that most workloads have more accesses that fall in these regions. The cache should be designed so that it covers the largest possible region of the locality surface that typical workloads exhibit features in.
The effectiveness of the caching algorithm is evaluated by a locality response surface. The region of locality the cache effectively encompasses can readily be identified, and some of the caching algorithm specifics can also be identified.
The cache locality response surface is computed from a probabilistic stream of random references with proper locality distribution. The mean service time is computed as a function of the locality stride and distance.
Reference stream locality can be summarized as the probability of the first occurrence of an access to a block s blocks away from the current one occurring within the next 1/2d to d disk accesses. We refer to s as the stride (spacial relationship) of the access and d as the distance (temporal relationship). The drive response surface graph plots the mean service time as a function of this stride and distance. Since caches are known to rely on locality for their performance, plotting the service time as a function of this locality is a useful evaluation of cache performance. This graph can give much insight into the inner workings of the caching algorithms.
The response surface is presented as two different projections of a three dimensional surface with stride and distance as the base axes and the mean service time as the height. Typically, the cache performance can be seen as a region of fast access time near the origin (short stride and small distance), and the prefetch unit is manifest as a region of fast access for stride>0 and distance>0. The size of the region of fast access represents the caching algorithm's effectiveness, and the shape of the region is dependent on the particular caching and prefetching algorithm used. Often, vendors trade off some regions of cache performance for others in the hope that most workloads have more accesses that fall in these regions. The cache should be designed so that it covers the largest possible region of the locality surface that typical workloads exhibit features in.
Alle hier geteste adapters zijn in staat om te cachen tot een distance van 256 referenties. De verschillen manifesteren zich voornamelijk in het bereik van de stride die gecached kan worden en de responstijd waarmee de gegevens door de cache worden geserveerd. We hebben in de onderstaande grafieken weer de resultaten van de tests met vier schijven in RAID 5 genomen. De 3ware 9550SX-12 levert prima prestaties met lage responstijden tussen strides van -128 tot 128. Wel is er een bult zichtbaar rond het gebied van 0 strides en een distance van meer dan 256 referenties. Dit verschijnsel komt ook bij de andere kaarten in meer of mindere mate voor.

AMCC 3ware 9550SX-12
Een opmerkelijk fenomeen doet zich voor bij de adapters van Areca. Hoewel het dal iets minder breed is dan bij de 3ware 9550SX-12 hebben de Areca's wel een bijna verwaarloosbare responstijd rond het gebied van 0 strides. Het maakt nauwelijks uit hoeveel referenties er in de tussentijd hebben plaatsgevonden, zolang de opgevraagde data op dezelfde sector ligt als die van de huidige benadering kan de Areca-firmware hem uit de cache vissen. Het cache-algoritme hanteert dus een strategie die in het verleden opgevraagde gegevens zolang mogelijk in de cache houdt. In de grafiek is dit fenomeen zichtbaar in de vorm van een gele spleet die door de z-as loopt. Verschillen tussen de responstijd van de Areca ARC-1280 met 512MB cache en de ARC-1160 met 256MB en 1GB cache zijn nauwelijks zichtbaar.

Areca ARC-1160 256MB

Areca ARC-1160 1GB

Areca ARC-1280
De LSI Logic MegaRAID SATA 300-8X produceert een nette grafiek met een relatief beperkte piek rond het gebied met 0 strides en een distance van meer dan 256 referenties. De caching verschilt qua bereik van de strides weinig met de andere goed presterende controllers. Minder goed zijn de resultaten van de HighPoint RocketRAID 2320. Hij cached minder breed (strides tussen -64 en 64) hij heeft een grotere bult rond 0 strides bij een distance van meer dan 256 referenties.

LSI Logic MegaRAID SATA 300-8X

HighPoint RocketRAID 2320
De responstijden van de Promise SuperTrak EX16350 zijn matig. Over het gehele gebied scoort deze kaart slechter dan zijn opponenten. Alleen in de strook met een stride van 0 en een distance tot 128 referenties levert de SuperTrak EX16350 rappe responstijden met een vergelijkbare felgele kleur als de andere adapters. Daarbuiten is er sprake van een oranje kleur die een responstijd van meer dan 0,5 ms representeert. Ook in de breedte is de SuperTrak EX16350 minder sterk. Strides die buiten de range van -64 tot 64 sectoren liggen worden minder snel beantwoord dan bij de andere adapters. Verder heeft de SuperTrak EX16350 een stevige paarse piek rond het gebied van -2 tot 1 strides en een distance van 512 tot 8K referenties.

Promise SuperTrak EX16350
Volgende pagina (CPU-belasting en random I/O performance - 9/14)
