Ik vind dit een interessante gedachte en vraag me af in hoeverre het waar is. Aangenomen dat je uit de context kunt afleiden dat het om een audio- of videobestand moet gaan (dat kunnen we de digitale archeologen nog wel toedichten, denk ik) in hoeverre kun je de boel dan opnieuw afleiden uit de bestanden?
Dat is al een hele aanname. Hoe ga je die context acterhalen als je geen apparatuur hebt om de data uit te lezen?
Het zal ongetwijfeld een lastige klus zijn, maar het gaat in dit geval niet om bestanden die opzettelijk onleesbaar gemaakt zijn met encryptie.
We gaan hard de kant op dat álle data vrijwel altijd versleuteld is. Als het niet de DRM van de video zelf is, dan is het onderliggende bestandssyteem of blockdevice mogelijk versleuteld, en misschien wel alle drie tegelijk. Daarom moeten we er nu actief werk van maken dat we ook archiveren op een toekomstveilige manier.
Het neemt ook aan dat alle software die de boel kan afspelen somehow verdwenen is en niet meer te reverse engineeren.
Daar ga ik inderdaad van uit. Als kennis niet verloren is gegaan dan hebben we geen archeologen nodig om de kennis opnieuw te ontdekken. Als ik zie hoe snel computers veranderen kan ik me moelijk voorstellen dat we over zeg 3000 jaar nog weten wat mp3 is of de software er voor hebben.
Ik denk dat het een lastige, omslachtige, tijdrovende klus zou zijn, maar dat je door zorgvuldig werk en analyse uiteindelijk wel de formaten zou kunnen reverse engineeren, of in ieder geval goed genoeg bij benadering om er weer enige audio/video uit te kunnen halen.
In theorie is veel mogelijk, maar de vraag is of we het ook echt gaan doen of dat het te langzaam en tijdrovend is. Kijk eens naar hoeveel gedoe we hebben moet boeken van 2000 jaar geleden. Een chip is oneindig veel fragieler dan een stuk papyrus. Ik denk dat er domweg te veel schade gaat zijn om daar nog echt veel data af te halen of te begrijpen hoe de chip werkt.
Als er ooit iemand een enkele diskette met een MP3 in de woestijn vindt is het hopeloos, maar als er genoeg verschillende bestanden zijn (laten we zeggen dat iemand een keer over de YouTube-vault struikelt) is het een ander verhaal.
Hoe stel je dat voor je? Er is niet één grote HD waar je alle content van youtube gaat vinden. Die data is verdeeld over miljoenen HD's die in tienduizenden servers zitten die over de hele wereld zijn verspreidt en die allemaal een paar snippers data bevatten. Er is geen vault.
Je zou mijn eerste bericht ook kunnen uitleggen als een oproep om zo'n vault te bouwen.
Ik denk dat het verdwijnen van de data zelf en/of het onleesbaar worden van de datadragers een groter probleem is (dat laatste ook al dan niet dankzij DRM en/of encryptie).
Ja en nee, ik denk ook veruit de meeste dat verloren zal gaan, maar ik denk dat terugredeneren hoe onze CPU's, GPU's etc werken nóg veel lastiger is.
[Reactie gewijzigd door CAPSLOCK2000 op 29 juni 2025 13:27]