De beheerders van The Internet Archive claimen dat zij inmiddels het meest uitgebreide historische softwarearchief ter wereld hebben opgebouwd. Wel zou de verzamelde meta-informatie nog te wensen overlaten.
De non-profitorganisatie poogt met een digitale bibliotheek zo veel mogelijk relevante data op het internet veilig te stellen. In oktober 2012 maakte The Internet Archive bekend dat het al 10 petabyte aan data in zijn archieven had opgeslagen. Deze data werd over een periode van zestien jaar verzameld.
The Internet Archive bevat vooral muziek, boeken, afbeeldingen en websites. De site zou in de laatste jaren echter te weinig hebben gedaan aan het verzamelen van software. Om hieraan een einde te maken is onder andere Jason Scott van de non-profitorganisatie bezig geweest om uit diverse bronnen software veilig te stellen in de digitale archieven. Daarbij is onder andere software uit de FTP Site Boneyard, Shareware CD Archive, Fileplanet, Tucows, Tosec en het Disk Drives-archief binnengehaald. Inmiddels zou The Internet Archive terabytes aan software hebben ingezameld. Volgens Scott is het archief van de organisatie inmiddels uitgegroeid tot het grootste softwarearchief ter wereld.
Hoewel The Internet Archive nu een respectabele hoeveelheid software gearchiveerd heeft, zou de bijbehorende meta-informatie nog ongestructureerd zijn. Zo bevat de verzamelde data ook veel handleidingen, maar missen deze de nodige structuur.