Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 77 reacties
Bron: Technology Review, submitter: T.T.

Bij Technology Review is een artikel verschenen met een beschouwing over de 'Myth of Doomed Data'. Daarmee wordt gedoeld op de angst voor het verlies van data doordat het bestandsformaat ervan niet meer courant is. Het stuk is geschreven door Simson Garfinkel, auteur van twaalf boeken over de betekenis van IT voor de hedendaagse samenleving. De aanleiding was een gesprek dat hij had met David Stork, die als directeur van de wetenschappelijke afdeling van Ricoh een idee ontwikkeld heeft waarmee digitale archieven op z'n minst vijftien jaar toegankelijk zouden moeten kunnen blijven. Het grote angstbeeld dat digitaal bewaarde gegevens na verloop van tijd niet meer leesbaar zijn vanwege het feit dat het opslagmedium of de bestandsindeling achterhaald zijn, is volgens de beide heren op niets gebaseerd. Begin dit jaar werd die angst echter aangewakkerd door een bericht dat in de Britse krant The Observer verscheen.

The Domesday Book - William the Conqueror (gecomprimeerd)In 1986 begon de BBC aan een groots project om 'het Britse leven' vast te leggen. Dit archief, waaraan meer dan een miljoen mensen hun bijdrage leverden, werd digitaal opgeslagen op twee videodisks. De schijfjes werden door Philips speciaal voor het project ontwikkeld als onderdeel van een systeem genaamd VP 415 Videodisc Player. Ze bevatten meer dan driehonderd megabyte aan tekst en bovendien een grote hoeveelheid foto- en filmmateriaal. Het project werd genoemd naar het beroemde 'Domesday Book' waarin Koning William the Conqueror in 1086 al zijn bezittingen vast liet leggen. The Observer meldde in maart dat de disks onleesbaar waren, omdat de speciaal ontworpen computers verouderd waren en andere computers niet met de gegevens konden omgaan:

16 years after it was created, the Ł2.5 million [$4.3 million] BBC Domesday Project has achieved an unexpected and unwelcome status: it is now unreadable.... The special computers developed to play the 12-inch video discs of text, photographs, maps and archive footage of British life are - quite simply - obsolete.
As a result, no one can access the reams of project information - equivalent to several sets of encyclopaedias - that were assembled about the state of the nation in 1986. By contrast, the original Domesday Book - an inventory of eleventh-century England compiled in 1086 by Norman monks - is in fine condition ... and can be accessed by anyone who can read and has the right credentials.

CircuitsVolgens Stork en Garfinkel is er echter wegens verschillende argumenten geen reden tot zorg. Afgezien van de plannen van de Ricoh-ingenieur, die mooi klinken maar nog geen realiteit zijn, is de situatie niet zo ernstig als The Observer wilde doen geloven. De data op de Domesday-disks is namelijk niet voor eeuwig verloren. Een team van specialisten heeft de gegevens gekopieerd naar een moderner systeem en heeft een emulator ontwikkeld om de speciale computer die oorspronkelijk gebruikt werd na te bootsen. Garfinkel concludeert dat de kosten waarschijnlijk een groter probleem vormen dan de technische kanten. Volgens hem is de grootste les hiervan, dat het gebruik van bestandsformaten die geen standaard zijn, de grootste barričre vormt voor het behoud van data. Dat is op zich geen opzienbarende uitspraak.

HDD met bitsInteressanter is zijn stelling dat de sleutel voor het behoud van data ligt in openheid van standaarden en een goede documentatie daarvan. Volgens Garfinkel is het ondenkbaar dat documenten die vandaag de dag in PDF of in JPG worden opgemaakt over enkele tientallen jaren onleesbaar zijn. Daarvoor zijn de formaten te goed gedefinieerd en te wijd verbreid, zo denkt hij. Tot slot merkt de publicist nog op dat ook de fysieke gegevensdragers niet voor grote problemen zullen zorgen. Hij wijst op het feit dat muziekcd's uit 1980 nog steeds leesbaar zijn in de nieuwste dvd-spelers. Naar zijn idee is het logisch dat ook een nieuwe generatie van opslagmedia backwards compatible is, omdat een systeem dat geen gewone cd's kan lezen niet levensvatbaar zal zijn. Op den duur zal blijken dat electronische media stabieler en duurzamer zijn dan hun papieren versies, aldus Garfinkel.

Moderatie-faq Wijzig weergave

Reacties (77)

Mijn eerste document ooit gemaakt met WordStar (voor de oude rotten misschien nog bekend) kan ik nog steeds tevoorschijn halen hoor. Gewoon alles wat je bewaren wilt zorgvuldig mee zijn en netjes doorkopieren op nieuwe media als deze gewoongoed zijn. Ik heb reeds lange tijd geleden stapels 5,25inch diskettes op CD gezet. 5,25inch diskettes weggemikt. Niets verloren gegaan. Zo ook met alle mail die ik ooit ontvangen heb. Altijd outlook gebruikt. Nu nog steeds te lezen.
Kortom oude bestanden altijd omzetten naar nieuwe formaten zodra deze standaard worden en dan is er niets aan de hand.

Kortom digitale archieven gaan niet verloren zolang je ze maar onderhoud. Helaas is het niet zo als papier, dat je het alleen maar hoeft te bewaren. Je moet het onderhouden. Maar wat vroeger veel data was past nu op een hoekje van je harddisk. Dus er is niets tegen bewaren.
Doe ik ook, heb nog files uit 1997 op mijn PC staan. Allemaal gerarred en gesorteerd per maand. Nog een backup op CD-RW en als het wat meer word een DVD-RW :) En ik kan weer 5 jaar verder...
Ik geloof er niet in..
CD's uit de jaren 80 nog te lezen? Vast wel. Maar zelfgebrande CD's uit de vroegste jaren is al moeilijker. Vaker dan niet blijkt de kwaliteit van het medium zo slecht (in mijn ervaring) dat een disc binnen 10 jaar problemen krijgt.
Als je kijkt naar de duurzaamheid van papieren en perkamenten documenten, die honderden jaren overleven, vraag ik me echt af of de cd nou zoveel beter is..
ja, maar hoeveel papieren zijn er in de loop der tijd niet verloren gegaan? Wedden dat ze over 2000 jaar nog gerust werkende cds/dvds van ons terug kunnen vinden? Niet allemaal nee, maar wij vinden nu toch ook niet alles van vroeger?
Het is een kul artikel.
Cd's van 20 jaar geleden zijn nog op de huidige apparatuur te lezen. Dus het is geen probleem volgens de auteur.
Ja, maar wat nu als we op een nieuw medium overgaan?

Wie kan er nog 8" diskettes lezen? Of 4" tapes? Of de trommelgeheugens van de oude IBM mainframes? Of van mijn part de tikkerstrokes of simpele video-2000 tapes?

Er zijn 3 zaken waar op gelet moet worden:
- De apparatuur moet beschikbaar blijven.
- De media moeten niet verouderen, dus bruikbaar blijven.
- De bestandsformaten moeten ondersteund blijven.
Zelfgebrande CD's bleken al niet zo lang mee te gaan:
http://www.tweakers.net/nieuws/28386
Die boeken overleven ook alleen maar omdat ze goed bewaard worden... papier en vooral inkt vergaan zeer snel als ze aan zonlicht en vocht blootgesteld worden.
(beetje OT?)

Inderdaad. Ik heb een CD-fikker van mitsumi liggen, 4xspeed en die is al, pfff.... 5 jaar oud? Mijn gloedjenieuwe Sony CD Walkman D-Ne511 kon de CD's niet lezen GVD! 22 Mp3-cd's die je niet lezen kan... De CD's zijn nog prima.

Valt me wel op dat een goedkope Koreaanse mp3-cd speler alles vreet wat je erin stopt en de duurdere merken gaan moeilijk doen. Nu heb je natuurlijk kwaliteitsbehoud en moet je bep. dingen laten. Maar hier gaat het ook gewoon om dezelfde standaard. Van me Lite-on leest ie wel, met hetz. type CD-R, maar eentje gefikt met die oude Mitsumi leest ie niet. Zelfs nieuwere, betere typen CD-R
Op een CD kan in verhouding veel meer op. Op 1 CD passen (ongeveer) 716.800.000 tekens, zonder compressie. Je moet wel een heel groot boek of een stevige boekenplank hebben om zoveel in een boek te zetten. Verder is een CD goedkoper te maken, beter te kopieren enzovoort.

Maar voor langdurige opslag zijn boeken denk ik ook veel beter. Boeken zijn langer houdbaar, betrouwbaarder, enzovoort. Bij het project in het artikel konden ze denk ik ook beter een dik boek schrijven ofzo, 300 Megabyte aan tekst, ongeveer 307.200.000 tekens. Het is misschien een paar boeken, maar het is veel langer houdbaar.
Als je een diskette met WordPerfect 4 bestanden of zo hebt kan je die gewoon nog steeds in Word importeren (als je diskette het nog doet...)

GIF is ook al meer dan 15 jaar oud en is nog steeds overal leesbaar.

Je moet gewoon 'winnende' media kiezen.
Als je een diskette met WordPerfect 4 bestanden of zo hebt kan je die gewoon nog steeds in Word importeren (als je diskette het nog doet...)
Ten eerste bedoel je denk ik "als je nog een diskettestation hebt" ;)

Ten tweede:
Ik heb nog een paar word bestanden op een 7,25" floppy disk, nee geen 5,25, kun jij ze nog ff inlezen :?

Feit blijft dat je weet dat oude hardware er uit gaat en dat je het voor die tijd moet overzetten.

Echt belangrijke data kan altijd nog teruggehaald worden. Al moeten ze er speciaal de hardware en software voor bouwen, het kán. Zolang je er maar genoeg geld voor (over) hebt. :)
Ja.. ik heb nog een WERKENDE 7.25" floppy drive, die zit in een ouwe (werkende) IBM computer, samen met een 720k 3.5"floppy drive.

M.A.W. wie wat bewaard heeft wat (ik heb ook nog steeds m'n C64 en m'n atari ST met 10mb harddisk...

Hetzelfde geld voor UK.. als ze niet zo graag hun ouwe spullen wegmieteren dan hadden ze nog die disks kunnen lezen.
Je hoeft het niet eens weg te mieteren. Wat als de desbetreffende hardware defect is en er geen spare parts meer zijn??? ;)

Komt gerust wel eens voor dat een bepaalde leverancier failliet gaat, of overgenomen wordt door een ander bedrijf. Resultaat, oude productlijn wordt opgeheven en jouw toen malige state of the art hardware is niet meer te verkrijgen.. :)
Denk BV maar even aan Onstream.
Ik zou nog GRAAG wat 30 GB tapejes kopen... :'(

Maar ontopic: Het mag dan misschien niet zo'n vaart lopen (wat ikzelf betwijfel), maar voor de Archivarissen en archeologen en dat soort lui is het wel de "eeuw van de vluchtige data"..
Sorry, maar ik heb nog nooit van een 7.25 inch flop gehoord... Ook nog nooit gezien. Ik denk dat jullie het hebben over de 8 inch flops, welke echter, volgens mij, nooit in een PC ( intel achtig doosje ) hebben gezeten. De 5.25 inch en zelfs de 3.5 inch flops waren in den beginne van de PC-tijd al gemeengoed.

De 8 inch flops zijn ooit door IBM geintroduceerd in 1971 als "memory disk". In 1976 onstond de 5.25 inch disk en in 1980 kwam sony met de 3.5 inch disk. Allemaal dus al (ver) voor de geboorte van de IBM PC XT.

Maar inderdaad, wie niets weg gooit... zal inderdaad bij nog steeds werkende hard- en software nog steeds zijn data kunnen lezen.
Je moet gewoon 'winnende' media kiezen
Ik ben blij dat tenminste iemand de toekomst kan voorspellen. Want jij schijnt te van te voren weten wat de winnende media zijn. Kan je me ook uitleggen hoe dat gaat? Ik wil namelijk jouw methode toepassen op winnende staatsloten en winnende aandelen.

De ellende is natuurlijk dat een techniek die vandaag vreselijk winnend is, over een paar maanden volkomen oud kan zijn. Kijk maar eens naar het al genoemde Word Perfect. Een paar jaar geleden wist bijna niemand beter dan dat WP de computer was. Kunt je mij vertellen hoe ik Windows in WP installeer was een vraag die ik nogal eens kreeg. En binnen 1-2 jaar was WP min of meer verdwenen. Het is dat er nog converters voor zijn. Maar je moet ze wel apart installeren.

Als je dus niet op tijd de hele data set van heel de wereld op het 'nieuwe' systeem/drager overzet raak je stukken kwijt.
Ik beweer ook niet dat ik de toekomst kan voorspellen, maar bepaalde formaten, zoals CDROM zijn nu dusdanig ingeburgered dat ze over etterlijke jaren nog steeds te lezen zullen zijn. Net als LP's vroegen (en nu).
CDROM en LP zijn MEDIA, geen formaten
Je hebt het nu over redelijk eenvoudig te "reverse-engineren" bestandsformaten. Bij de laatste versies van Word wordt het al een heel stuk lastiger. Hoeveel moeite hebben andere moderne programma's niet om de laatste versies van MS Word bij te houden?

Met DRM wordt het nog veel en veel moelijker, zo niet volstrekt onmogelijk om belangrijke data uit een "antiek" bestand te vissen.

Deze Garfinkjel legt de vinger op de juiste plek: bestandsformaten moeten OPEN zijn en blijven. Van een open formaat kan elke randdebiel (met de bijhorende docs) achterhalen wat er in een file staat. Met gesloten bestandsformaten weet alleen de producent precies hoe een bestand in elkaar zit.
Op den duur zal blijken dat electronische media stabieler en duurzamer zijn dan hun papieren versies, aldus Garfinkel.
Dat ben ik toch echt niet met hem eens.

De mens schrijft al meer dan 2000 jaar, en verreweg de meeste teksten die bewaard zijn gebleven kunnen worden vertaald.

Als ik over 2000 jaar met een cd aan kom kun je die echt niet zo 1-2-3 meer inlezen. Daarvoor zul je dan speciaal hardware en software moeten laten maken. En dat is natuurlijk een dure aangelegenheid. Als ik echter met een boek aan kom zal ik die veel makkelijker kunnen laten vertalen.

Maar goed, mijn theorie gaat alleen op als er over 2000+ jaar een gegevensdrager van tegenwoordig word gevonden. Immers, alle belangrijke data zal toch worden overgezet naar een nieuw systeem als het oude systeem uit de tijd dreigt te raken? Dat dat bij de BBC niet is gebeurd lijkt me gewoon een erg domme fout...
Denk je dat jij wel dat je direct papieren van 2000 jaar oud kunt lezen? Je zult dan eerst een antieke taal moeten leren, sommige van deze talen zijn nooit helemaal vertaald, daarnaast kan het papier gaten bevatten, neit de gehele tekst bevatten of de tekst kan onder een laag vuil zitten of de inkt kan uitgelopen zijn waardoor je speciale apparatuur (waardonder computers) nodig hebt om het geheel weer leesbaar te maken.

Over 2000 jaar download je echter een antieke DVD speler (waarom een CD speler downloaden, als je een DVD kan hebben), je print hem op je 3D printer en je kunt de CD beluisteren.
Over 2000 jaar download je echter een antieke DVD speler (waarom een CD speler downloaden, als je een DVD kan hebben), je print hem op je 3D printer en je kunt de CD beluisteren.
Nofi, maar dat lijkt me niet echt een gedachtengang van 2 millennia verder... Waarom nog eerst een hardware-copy van die dvdspeler maken als het ook allemaal softwarematig kan.
Mijn idee zou zijn:
Gewoon door middel van ruimtelijke (3d) scanners maak je een beeld van het te lezen voorwerp (in dit geval een cd/dvd). Dat beeld kan dan door software die een dvdspeler emuleert (putjes lezen ed) uitgelezen worden en voilŕ. Lekker genieten van die ouwe klassieker (oid) in je virtual home-theater ;)

Maar ja, ook dat is misschien nog te 21ste-eeuws... :? ;)
Ja, hoor: ik heb een tijdje geleden een artikel gelezen (zoek de link wel op als je die wilt hebben) van een of andere gast die een LP onder de scanner heeft gelegd om er een .tif van te maken. Daarna software geschreven die de 'naald' emuleert om zo een .tif af te kunnen spelen.
(of ben je nog zo jong dat ik moet uitleggen wat een LP is?)
http://www.cs.huji.ac.il/~springer/
tadaa :Y)
't klinkt voor geen meter maar het is een begin :P
Ik het artikel werd al een mooi voorbeeld genoemd: dat boek dat 1000 jaar oud is, is nog steeds goed leesbaar. Die tijdspanne heeft digitale informatie nog niet meegemaakt. Wie weet wat er met CD-ROM's gebeurt als ze 1000 zomers en winters met temperatuurschommelingen, vochtigheid, etc. meemaken. Hoe groot is de kans dat de integriteit van elektronisch opgeslagen data wordt aangetast door virussen of wanbeheer in 1000 jaar. Ik weet het niet. Wie wel?
Gegevens gáán ook gewoon verloren. Men hoeft zich daarbij niet neer te leggen, maar ook niet zo wereldvreemd doen dat het verschrikkelijk gevonden wordt als je wat data verliest in bijv 20 jaar of langer.
Dat weet ik wel. Warmte en vocht doen CD rotten. Je kunt het zien aan de rand waar het metalen laagje begint te verdwijnen. En onleesbaar wordt binnen enkele jaren. Het hangt af van het klimaat waar je woont.
Het kan zelfs nog wel beter... Taal wat wij NU gebruiken is echt niet hetzelfde over 1000 jaar. Dan kan je alsnog even een oude taal leren, als het tegen die tijd al niet geautomatiseerd is.
Als je iedere 5 jaar de data inleest en converteert naar een moderner bestandsformaat en wegschrijft op een modern medium, dan zou je nergens last van hoeven te hebben. BMP, TIFF en JPG zou dan naar bijv. PNG en SVG, teksten in HTML en XML. En als daar weer wat nieuws is zet je het in dát formaat. Nu branden op DVD, maar over 3 jaar is alles waarschijnlijk in een blue-ray techniek. Kleine, korte stapjes dus.
Nee, de oplossing is veel simpeler, je moet een open bestandsformaat gebruiken dat zichzelf ook nog eens beschrijft.
XML dus.
Niet een gesloten MS versie natuurlijk.

Dit heb ik uit een artikel over de Delftse universitaire archieven, daar meldden ze dat ze erg blij zijn met OpenOffice.org en XML; de bestanden zijn gecomprimeerd asci en hebben een zelfbeschrijvende header.

Het is onzin om elke 5 jaar de bestanden te converteren, het is natuurlijk wel goed om elke 5 jaar een kopie te maken op een 'hedendaagse' drager, zodat je toegang hebt. Maar in de basis moet het bestandsformaat gewoon open zijn.
Met minder krijg je problemen, en meer dan dat is niet nodig.
Nee, de oplossing is veel simpeler, je moet een open bestandsformaat gebruiken
Helemaal mee eens, niets op aan te merken.
... dat zichzelf ook nog eens beschrijft.
XML dus.
Dat hoeft dus toch helemaal niet. Ga jij maar je MP3tjes lekker omzetten naar XML, ik ben benieuwd. Het gaat er dus om dat het bestandsformaat duidelijk omschreven is en goed gedocumenteerd. Dan kunnen wetenschappers over honderd jaar nog steeds je MP3tje decoden omdat de kans dat de documentatie verloren is wel heel erg klein is.
MP3 maakt wel kans om onleesbaar te worden, omdat het een proprietair formaat is (zeker nu IP wetgeving aanstuurt op oneindige duur van rechten).

Neem dan een echt open formaat voor audio. Ogg Vorbis is vrij toegankelijk en goed beschreven.

Zelfde voor video. Ogg Theora is nog beta, maar vrij toegankelijk en beschreven.
Weet je hoeveel terabytes aan data op deze aardbol opgeslagen ligt? Dat ga je niet even elke 5 jaar overzetten. Dan heb ik het natuurlijk over grote bibliotheken en archief systemen
Kan jij dan geen .txt of .tiff files lezen dan?
Zelfs voor oeroude wp troep zijn er conversie filters.
Je hebt de essentie niet helemaal begrepen geloof ik.
Gelukkig hebben de auteur en zijn bronnen het ook niet helemaal begrepen. Hoe kan je beweren dat er niets is om bezorgd om te zijn en dan beweren dat
... de sleutel voor het behoud van data ligt in openheid van standaarden en een goede documentatie daarvan.
Aangezien veel data in ondoorzichtige formaten (zoals MS Word's .doc) wordt opgeslagen is het wel degelijk terecht om je af te vragen of we daar over 10 jaar nog wat aan hebben.
Het idee is dat je bij de tijd blijft, zodat het nooit kán verouderen. Wat jij nu verteld is dat het bestand hetzelfde moet blijven en dat je het softwarematig oplost. Maar wat nou als het medium defect raakt waar het is opgeslagen? Het is digitaal hoor, het kan dus gekopieërd worden.

Lijkt mij toch een beter idee zoals WEBsel dit voorstelt, overstappen op andere media die de komende zoveel jaar nog te gebruiken is. Zodra er inderdaad weer een nieuw beter medium bestaat het hierop wegschrijven.

Tevens zijn backups hierbij van belang, als het bijvoorbeeld op hdds is opgeslagen, dan blijft het namelijk electronica en dat kan helaas altijd de geest begeven.
Dit artikel gaat over de zorgen over de levensduur van digitale bestandsFORMATEN. Niet van de media.
Misschien is het een goed idee om een "Steen van Roset" te maken (als ik de naam goed heb):

Een kist met daarin:
-Een 3 1/5 inch HD floppy disk
-Een 74 min CD
-Een DVD RW+
-Een analoge of digitale band
-Gesealde papieren documenten.
-Een harddisk
-Een USB pen
-Nog een paar andere formaten
Alles met exact dezelfde tekst, in het engels en chinees (de belangrijkste talen).

Als dan de hele wereld ooit nog eens ten onder gaat dan vinden later de Mars mannetjes de kist en kunnen ze door middel van alle verschillende formaten en talen alles wat ze op aarde vinden weer ontcijferen :*)
Het is de 'steen van Rosetta'...

close, but no cigar!

;)
<off-topic>
Humm... waarom er een screenshot in dit artikel staat van de film 'Hackers' is mij niet geheel duidelijk... :?
</off-topic>

Ik snap niet dat de BBC niet een oude pc kan neerzetten die het formaat kan inlezen en deze aansluit op een nieuwe PC d.m.v. een netwerk verbinding en de hele mik gewoon op DVD zet? Lijkt mij allemaal koek-en-ei... misschien denken wij nerds hier te gemakkelijk over?

Overigens lijkt mij dat een formaat als XML nooit onleesbaar wordt geizne het feit dat een mens, zie het met moeite, het bestand kan lezen... maar dat is maar 1 van de vele formaten die nooit weg gaan. Dat dacht je van CSV?
Humm... waarom er een screenshot in dit artikel staat van de film 'Hackers' is mij niet geheel duidelijk...
Euh, omdat een leuk beeld is om het begrip "digitaal" weer te geven, misschien...? (8>
Dat kan dus niet, omdat ze niet meer zo'n ouwe computer hebben. Bovendien: heb je wel eens een laserdisc gezien? Die dingen zijn net zo groot als een flinke langspeelplaat! Die stop je dus niet even in een computer.

Misschien kunnen ze eens langskomen. Ik weet nog een werkende laserdiscspeler te staan....
De BBC zou wellicht in staat moeten zijn alles om te zetten naar courantere bestandsformaten. Alles omzetten kost echter wel veel tijd en geld, en niet iedereen beschikt daarover.

Ik werk zelf voor een kleine culturele instelling, waar we eerder met Lotus hebben gewerkt. Een aantal jaren en duizenden bestanden later zijn deze niet te lezen door de moderne office-producten.
Ik zie hier dus best een groot probleem in.
omdat een systeem dat geen gewone cd's kan lezen niet levensvatbaar zal zijn
En toch ondersteunt tegenwoordig vrijwel geen stereo-toren meer standaard een lp.. En ook zie je steeds meer stero's waar het casette bandje vervangen wordt door de minidisc.

Om nog maar niet over de laserdisc te beginnen... de data die op die schijven staan is bijna niet meer af te spelen, omdat de spelers er nauwelijks meer zijn.

Over de bestandsformaten: Ik zou eerder alles opslaan als .txt (evt .html) en .bmp (evt raw data net als in digicam) dan in pdf jpeg. Je bestanden worden gedeeltelijk dan wat groter maar toch de kans dat ze over 1000 jaar .txt kunnen lezen schat ik toch groter dan dat ze .pdf kunnen lezen.

Verder denk ik ook niet dat het bestandsformaat de moeilijkste factor is, maar eerder het medium, om hier nog even op terug te komen, en dan bedoel ik niet eens of je nu een cd, dvd of harddisk pakt, maar eerder het bestandssysteem. Stel over 1000 jaar vinden ze een rond schijfje met allemaal gaatjes erin aan een kant.. en ze kunnen dat omtoveren naar 0-en en 1-en (op hun 1024 bit pc's :+) dan moeten ze nog weten waar het bestand begint en ophoudt. Hier heb je weer duidelijk een voordeel van .txt tegenover .pdf want door de 0-en en 1-nen te analyseren kun je dat er eerder uitfilteren.

Het beste is natuurlijk om bij de data een boekje te doen met gebruikershandleiding. (stap 1: U stopt de windows XP cd-rom in uw dvd-speler)
Idd... Probeer vandaag de dag maar eens je 8" of 5.25" floppen in te lezen. Ik heb hier (toevallig) een 8" floppydrive onder mijn bureau staan (mijn pc-kast is kleiner :)), maar dan nog heb ik geen idee hoe ik die op mijn computer moet aansluiten. De stapel 8" floppen die ik hier heb liggen zijn daarmee dan ook waardeloos geworden.

Het opzetten van een C64 of Atari of MSX emulator is ook zoiets. Het installeren van een emulator lukt dan nog wel, maar zet de cassettebandjes en de game-cardridges maar eens over naar je PC. Het downloaden van een 'backup' is dan een stuk makkelijker.
De houdbaarheid van het fysieke medium waarop alle informatie wordt bewaard lijkt me veel belangrijker.
Verschillende technieken voor data opslag kunnen ook gewoon beschreven worden zodat toekomstige generaties er nog mee uit de voeten kunnen.
Maar als je ziet dat bv boeken uit het begin van de 20e eeuw al door verzuring uit elkaar vallen, veel cd-r's na een paar jaar al onleesbaar zijn, en veel info op het internet ook nogal vluchtig van aard is, dan zou ik me daar veel meer zorgen over maken.
Volgens Garfinkel is het ondenkbaar dat documenten die vandaag de dag in PDF of in JPG worden opgemaakt over enkele tientallen jaren onleesbaar zijn. Daarvoor zijn de formaten te goed gedefinieerd en te wijd verbreid, zo denkt hij
Een woord: backwards compatible. Ontwikkel hard- en software die gewoon ook om kan gaan met oude formaten; Helaas zal dit niet altijd mogelijk zijn, dus verstandig is (zeker bij belangrijke data!!!) om een keer in de zoveel tijd een nieuwe kopie te maken, al was het maar voor de fysieke houdbaarheid!!!
Hier:
http://www.laserdiscarchive.co.uk/laserdisc_archive/ecodisc/ecodisc_ar ticle.htm
Is meer te lezen over het systeem
en er staan zelfs foto's bij.

de disk's zijn dus gewoon prima te lezen, alleen
er is geen systeem meer die het kan!

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True