British Library gaat oude boeken digitaliseren

De British Library heeft besloten om ruim honderdduizend boeken uit de negentiende eeuw te gaan digitaliseren. Naar verwachting zullen er over twee jaar 25 miljoen pagina's ingescand en opnieuw gepubliceerd zijn.

Als de productie eenmaal op gang is gekomen, zullen er per dag 50.000 bladzijden gescand en geanalyseerd worden. Uiteindelijk zullen alle gescande documenten bij elkaar 30 terabyte aan opslagruimte kosten. De gedigitaliseerde boeken zullen op twee manieren beschikbaar gesteld worden: allereerst via Microsofts Live Search Books en in een later stadium ook via de website van de British Library zelf. De boeken zullen volledig doorzocht kunnen worden, zo meldt de BBC.

Volgens Kristian Jensen, werkzaam bij de bibliotheek, is er tot de digitalisering besloten om docenten, studenten en scholieren eenvoudiger toegang te geven tot de werken die de basis vormen voor de boeken die heden ten dage geschreven en gelezen worden.

Naar verwachting zullen het met name de moeilijk verkrijgbare teksten zijn die veel voordeel zullen hebben van deze digitalisatie, aldus Jensen. Boeken die eeuwen geleden gepubliceerd zijn, maar vanwege allerlei redenen vrij snel uit de handel werden gehaald en sindsdien vrijwel niet meer gelezen worden, krijgen door dit project een tweede kans.

Eerder had de British Library reeds een groot aantal vroeg-Engelse boeken en werken uit de 18e eeuw via internet gepubliceerd. Verder zal de digitale collectie de komende tijd uitgebreid worden met één miljoen 18e eeuwse kranten en twee miljoen bladzijden uit 19e eeuwse dagbladen.

The Magdalen College Old Library / Oude bibliotheek met boeken

Door Harm Hilvers

Freelance nieuwsposter

28-09-2007 • 21:09

42

Bron: BBC News

Reacties (42)

42
38
12
5
0
3
Wijzig sortering
Een hoop oude boeken staan al digitaal, bijvoorbeeld de verhalen van Jules Vernes.

http://www.bookyards.com/

De meeste mensen vinden dat je geen boeken kunt lezen op je scherm, ik vind echter bijvoorbeeld oude geschiedenis boeken ideaal voor de dode uurtjes op mijn werk.
e-papier zou een oplossing kunnen zijn.
zodra dat voor de gewone man betaalbaar is, denk ik dat de bieb dan zijn deuren wel kan sluiten.
Nooit meer boeken die uitegeleend zijn. ;)
Jij hebt dus duidelijk nog nooit serieus een boek gelezen.

In een boek moet je kunnen bladeren, dit kan je nooit digitaliseren hoe goed het scherm ook is, het blijft nep. Hoe wil je 10 boeken vervangen die op je bureau liggen tijdens het maken van een werkstuk?
alt-tab (option-tab) ;)
Een klant van ons doet iets soortgelijks in nederland:

de digitale biblitotheek voor de nederlands letteren. (www.dbnl.org).
Zij zijn echter zeer klein en draaien volledig op subsidie en steun van diverse uni's en overheid.

50.000 pagina's per dag is echt een prachtige stap. Het is anders niet te doen om zoveel boeken te digitaliseren.
Anoniem: 223155 28 september 2007 21:20
Worden de boeken niet beschadigt door het scannen en het licht van de scanner?? Die boeken moet je toch met handschoenen enzo aanraken, of is dat alleen in de films :+
Ik heb op een beurs een keer een scanner gezien die prima met dit soort boeken om kon gaan. Het boek werd neergelegd, en de scan-unit hing ongeveer een meter boven het boek. Op deze manier heb je minimale handelingen nodig om alle pagina's te scannen. Het omslaan van de pagina's gebeurde nog met de hand overigens.
Maar op deze manier is het makkelijk om het boek eventueel in een luchtdichte transparante behuizing te leggen, en met handschoenen aan de pagina's om te slaan (denk aan een couveuse). Ook kun je eventuele (kleur)filters zo makkelijk aanbrengen.
Er zullen ook wel modellen zijn die automatisch pagina's kunnen omslaan, maar dit is natuurlijk wat moelijker bij de wat fragielere boeken.

Edit: Op deze site staat wat van deze apparatuur. Al zijn dit de wat simpelere modelletjes :)

[Reactie gewijzigd door Nyarlathotep op 23 juli 2024 19:25]

Misschien interessant voor sommigen om te zien hoe dat nou werkt. Een filmpje hier
En dan nog heb je problemen. Negentiende eeuws papier staat berucht om zijn slechte kwaliteit. Die kranten die ze willen inscannen brokkelen waarschijnlijk onder hun handen af. Dat is wellicht ook de reden dat ze ingescand worden, want het wordt steeds moeilijker zulk soort documenten te conserveren.
Ze kunnen gebruik maken van een soortgelijke "scanner/foto-apparaat" die google ook gebruikt. Deze maakt "foto's" van de boeken, die zonder aanraken worden omgeslagen.
Ik mag aannemen dat ze hier een leuke gevoelige scanner voor gebruiken, en op zich is licht niet zo schadelijk... Het zijn de zuren op je huid die ontzettend destructief zijn voor (oud) papier, vandaar die handschoenen. Neem ook niet aan dat ze hier een Randstadter voor aannemen :+
Ach, zelfs als dat echt heel schadelijk is, dan zijn ze daarna wel goed bewaard. Beter dan als ze maar in een kast verder weg staan te rotten. :)
En verder zijn er volgens mij van die scanners die automagisch heel voorzichtig de bladzijden kunnen omslaan. Dan hoeft niemand ze aan te raken ivm de huid-aanraking die juist zo slecht is geloof ik. (vandaar de handschoentjes in films) ;)

[Reactie gewijzigd door theborgnl op 23 juli 2024 19:25]

Mooie foto bij het artikel, maar waarom zit er gaas voor de boeken in de 2e kast? Zijn die verboden, of zo? 8)7
Denk eerder dat ze zo oud en van onschatbare waarde zijn dat ze standaard achter die tralies moeten staan. En dat op verzoek een medewerker een boek voor je er achter vandaan haalt.

[Reactie gewijzigd door Tjeerd op 23 juli 2024 19:25]

Nooit Harry Potter gezien? Die tralies zijn er om er voor te zorgen dat ze niet weg lopen of onschuldige voorbijgangers aanvallen. :+

[Reactie gewijzigd door psyBSD op 23 juli 2024 19:25]

Daar hebben ze al een hele mooie applicatie voor om de boeken te bekijken (gemaakt in Microsoft .NET 3.0 en WPF)

zie http://ttpdownload.bl.uk/browserapp.xbap

Je kan zelfs de paginas iets draaien en de weerspiegeling van het licht veranderd op de paginas. Da Vinci's Codex is bv te bekijken.
Inderdaad... een hele mooie applicatie. Waar ik dus niks mee kan op Firefox onder Linux. Ik mag hopen dat de British Library verder heeft gekeken dan leuke gadgets als weerspiegeling van het licht dat verandert op de pagina's en erover nagedacht heeft of het voor een overheidsorganisatie wel wenselijk is om mensen te verplichten een licentie op een bepaald OS te nemen om het cultureel erfgoed van hun land te kunnen bekijken.
Toch grappig dat je zo'n hele bibliotheek digitaal prima in je meterkast zou kunnen hebben ;)
En met een Sony Reader of een soortgelijk ebook-reader en een 2GB-kaart kan je een boekenkast in je jaszak meenemen.
Anoniem: 177370 @kmf29 september 2007 11:06
Ik heb zelf zo'n ding. Werkt fantastisch. Maar met boeken van 300 megabyte kan ie wat minder goed uit de voeten. 30 terabyte / 100,000 boeken = 300 MB per boek.

Ik hoop dat ze er ook nog tekstherkenning overheen gooien, anders heb je er zeker op een eReader en bij de search bar weinig aan.
Schitterend, eindelijk al deze zeer kostbare en prachtige literatuur verkrijgbaar voor iedereen. Soms is technologie om van te houden.
De boeken zullen volledig doorzocht kunnen worden.
Wat bedoelen ze hier nou? Worden de boeken ingescanned (als in: zoals ik ook kan scannen met mijn scannertje, zegmaar een .JPG bestand) of worden ze ingescanned met letterherkenning? (dus alleen de text in een textbestandje)
Het lijkt me moeilijk om letterherkenning toe te passen op oude (geschreven?) boeken. Dit is wel noodzakelijk om de boel 'doorzoekbaar' te maken. Als ze alleen besluiten de text te scannen verliest het boek natuurlijk veel waarde (handschrift, illustraties, etc.)
Anoniem: 132102 @_Teq_28 september 2007 21:39
Ook zonde rletterherkenning is dit al zeer nuttig natuurlijk. Daarnaast worden ze op deze manier in iede rgeval minder geraadpleegd. Het gaat overigens natuurlijk grotendeels om om gedrukte boeken, 19e eeuw is al ff na Gutenberg ;-)
19e eeuw is wel weer de eeuw waarin de kwaliteit van boeken niet zo goed is. Slechte inkt die inktvraat verzorgt gecombineerd met dun papier. Oudere boeken die stuk voor stuk werden gemaakt zijn vaak wat beter bewaard. Daar zijn er echter weer minder van.
De OCR (letterherkenning die je bedoelt) kan altijdt later op imagefiles (zoals jpg) worden toegepast. Het voordeel daarvan is dat de tektst dan eventueel op juiste spelling gecontroleerd worden door iemand die dat kan, wat nodig is bij oude taal.
Moderne boeken zullen weinig problemen geven.

Daarnaast hoeft er niet persé een scanner gebruikt te worden, een fotocamera is logischer voor de moeilijk handelbare boeken.

Een reden dat dit nog niet eerder gedaan is kan zijn, omdat er gewoonweg zeer grote opslagruimte voor nodig is, welke nu pas betaalbaar geworden is.

[Reactie gewijzigd door fevenhuis op 23 juli 2024 19:25]

ik lees ditzelfde bericht precies om de 2 maanden opnieuw? of ligt dat aan mij?
in ieder geval super initiatief.
jammer dat Google ook niet gewoon de database mag aanbieden, waarom zo vechten om de 'beste online bib'? waarom niet gewoon 1 Uberbib creeren?
Wie gaat dat betalen?
de adsense advertenties die je tussen hoofdstukken door krijgt te zien.
Dit was men al een beetje aan het doen, bij Adobe. Met Adobe Digital Editions en hun eBook Library.

Op dit item kan niet meer gereageerd worden.