Een onderzoeksteam van Microsoft Research heeft naar eigen zeggen het MinuteSort-benchmarkrecord gebroken. Deze benchmark meet hoe snel datasets binnen een cluster van opslagsystemen kunnen worden gesorteerd.
Het nieuwe record voor de MinuteSort-benchmark werd op 1,4TB gebracht, bijna een verdrievoudiging van het oude record, dat op 500GB stond en sinds 2009 in handen was van Yahoo. Bovendien werd gebruikgemaakt van aanzienlijk minder hardware; in plaats van 5624 harde schijven op 1406 computers werden 1033 schijven op 250 systemen gebruikt.
Om het benchmarkrecord in handen te krijgen werd een nieuw model toegepast op het sorteren van data, flat datacenter storage geheten. In dit model, gebaseerd op een platte hiërarchie, wisselen alle systemen binnen een netwerk continu data uit. Microsoft Research bouwde daarvoor systemen die met een snelheid van 2GB/s data zowel konden versturen als ontvangen. Daarnaast werd gebruikgemaakt van een remote file system.
Volgens Microsoft zijn de behaalde sorteerprestaties niet alleen beter dan die van Mapreduce- en Hadoop-systemen, maar kan de technologie breed ingezet worden. Zo wordt het flat datacenter storage-model nu gebruikt om de zoekmachine Bing te versnellen. Daarnaast ziet Microsoft mogelijkheden om zijn sorteermodel toe te passen bij systemen waarbij enorme hoeveelheden data verwerkt moeten worden, zoals onderzoek naar medicijnen, dna-structuren en andere wetenschappelijke toepassingen.