Onderzoekers van IBM zijn er in geslaagd om in 43 minuten de gpfs-metadata van 10 miljard bestanden uit te lezen, onder andere door de metadata op flashgeheugen te plaatsen. Het vorige record is met een factor 37 verbroken.
Waar IBM in 2007 nog een record zette met het uitlezen van de gpfs-metadata van 1 miljard bestanden in drie uur, lukte Big Blue dat nu met 10 miljard bestanden in drie kwartier, zo heeft het bedrijf bekendgemaakt. Gpfs, voluit het General Parallel File System, is IBM's bestandssysteem voor clustercomputing. Eén bestand wordt door gpfs op meerdere fysieke locaties opgeslagen; het snel kunnen interpreteren van metadata is cruciaal voor de prestaties.
Het record werd behaald met een cluster van tien IBM xSeries-servers met elk een dual-quadcore-cpu en 32GB geheugen; de metagegevens werden geplaatst op vier ssd-arrays van Violin Memory. De gegevens waren in totaal 6,5 terabyte groot. De Violin-arrays waren alle met pci-express aan twee IBM-servers gekoppeld, die op hun beurt via infiniband door een 24 ports-switch van SilverStorm aan elkaar werden geknoopt.
Bij het verbroken record waren de gegevens nog op een harddisk geplaatst; mede door de metadata op flashgeheugen te zetten werd dit record behaald. Bovendien zijn de gpfs-algoritmes sinds 2007 verbeterd.