Storageleverancier Capricorn Technologies meldt dat het ruim een petabyte aan opslagcapaciteit heeft geïnstalleerd bij het Internet Archive. Capricorn, dat gespecialiseerd is in zeer goedkope storage, was tot 2004 nog onderdeel van de archieforganisatie, die vooral bekend is van zijn WayBack-machine waar zo'n veertig miljard webpagina's voor gearchiveerd zijn.
De PetaBox-machines die voor de opslag zijn gebruikt, bestaan uit simpele 1U-nodes die per kast van veertig stuks geleverd zijn. Elke node heeft een VIA mini-ITX bord met bijpassende 1GHz-processor en 512MB RAM aan boord; voor de eigenlijke data zijn vier Hitachi-hd's van 250 of 400GB per stuk ingebouwd. De nodes zijn opmerkelijk energiezuinig: voor de anderhalve petabyte die nu in gebruik is, is 'maar' ongeveer 50kW nodig, ofwel 80W per node van 1,6TB.
Om ook de total cost of ownership zo laag mogelijk te houden zijn alle aansluitingen en bedieningsorganen aan de voorkant van de kast gemonteerd. Verder is afgezien van technieken als RAID en hotswap. CEO C.R. Saikley: 'Dergelijke technieken schalen maar heel moeilijk door als je in de orde van grootte van petabytes bezig bent. Bovendien geven ze ons net zoveel problemen als ze oplossen.' Alle maatregelen bijelkaar betekenen dat het Internet Archive voor anderhalve petabyte rond de drie miljoen dollar moest neerleggen; dat komt neer op een kostprijs van ongeveer twee dollar per gigabyte. Daar komt het personeel nog wel bij, maar het volledige serverpark kan momenteel door één fulltimer en één parttimer beheerd worden - en die zijn ook nog buitenproportioneel veel tijd aan oudere systemen kwijt.