British Library gaat oude boeken digitaliseren

De British Library heeft besloten om ruim honderdduizend boeken uit de negentiende eeuw te gaan digitaliseren. Naar verwachting zullen er over twee jaar 25 miljoen pagina's ingescand en opnieuw gepubliceerd zijn.

Als de productie eenmaal op gang is gekomen, zullen er per dag 50.000 bladzijden gescand en geanalyseerd worden. Uiteindelijk zullen alle gescande documenten bij elkaar 30 terabyte aan opslagruimte kosten. De gedigitaliseerde boeken zullen op twee manieren beschikbaar gesteld worden: allereerst via Microsofts Live Search Books en in een later stadium ook via de website van de British Library zelf. De boeken zullen volledig doorzocht kunnen worden, zo meldt de BBC.

Volgens Kristian Jensen, werkzaam bij de bibliotheek, is er tot de digitalisering besloten om docenten, studenten en scholieren eenvoudiger toegang te geven tot de werken die de basis vormen voor de boeken die heden ten dage geschreven en gelezen worden.

Naar verwachting zullen het met name de moeilijk verkrijgbare teksten zijn die veel voordeel zullen hebben van deze digitalisatie, aldus Jensen. Boeken die eeuwen geleden gepubliceerd zijn, maar vanwege allerlei redenen vrij snel uit de handel werden gehaald en sindsdien vrijwel niet meer gelezen worden, krijgen door dit project een tweede kans.

Eerder had de British Library reeds een groot aantal vroeg-Engelse boeken en werken uit de 18e eeuw via internet gepubliceerd. Verder zal de digitale collectie de komende tijd uitgebreid worden met één miljoen 18e eeuwse kranten en twee miljoen bladzijden uit 19e eeuwse dagbladen.

The Magdalen College Old Library / Oude bibliotheek met boeken

Vorig nieuwsartikel Volgend nieuwsartikel

Door Harm Hilvers

Freelance nieuwsposter

Feedback • 28-09-2007 21:09 42

28-09-2007 • 21:09

Bron: BBC News

Lees meer

Harvard University gaat grote Chinese boekcollectie digitaliseren Nieuws van 12 oktober 2009

Sharen van ingescande boeken is probleem voor uitgevers Nieuws van 2 juli 2008

Microsoft sluit deuren van boekzoekdienst Nieuws van 25 mei 2008

Bibliotheken gaan ebooks uitlenen Nieuws van 12 januari 2008

Onderzoek: internet wakkert bibliotheekbezoek aan Nieuws van 2 januari 2008

Microsoft en Google vernieuwen boekzoektools Nieuws van 4 juni 2007

Google laat ocr los op Indiase handschriften Nieuws van 23 mei 2007

Microsoft valt Google aan op copyright Nieuws van 6 maart 2007

Google wil informatie rivalen voor rechtzaak boekzoekdienst Nieuws van 4 december 2006

Franse rechtszaak tegen Google Books breidt zich uit Nieuws van 1 november 2006

Google staat downloaden oude boeken toe Nieuws van 30 augustus 2006

Duitse uitgever trekt rechtszaak tegen Google in Nieuws van 30 juni 2006

Franse uitgeverij klaagt Google Book Search aan Nieuws van 6 juni 2006

Amazon gaat op bestelling boeken drukken Nieuws van 22 mei 2006

Meer producten en artikelen

Economie en maatschappij Wetenschap Zoekmachines

IT-banen

Meer vacatures

Reacties (42)

-Moderatie-faq

Wijzig sortering

ewt 28 september 2007 21:47

Een hoop oude boeken staan al digitaal, bijvoorbeeld de verhalen van Jules Vernes.

http://www.bookyards.com/

De meeste mensen vinden dat je geen boeken kunt lezen op je scherm, ik vind echter bijvoorbeeld oude geschiedenis boeken ideaal voor de dode uurtjes op mijn werk.

Cyberslak @ewt • 28 september 2007 22:17

e-papier zou een oplossing kunnen zijn.
zodra dat voor de gewone man betaalbaar is, denk ik dat de bieb dan zijn deuren wel kan sluiten.
Nooit meer boeken die uitegeleend zijn.

Ame_thyst @Cyberslak • 28 september 2007 23:31

Jij hebt dus duidelijk nog nooit serieus een boek gelezen.

In een boek moet je kunnen bladeren, dit kan je nooit digitaliseren hoe goed het scherm ook is, het blijft nep. Hoe wil je 10 boeken vervangen die op je bureau liggen tijdens het maken van een werkstuk?

EdDeNtEr @Ame_thyst • 29 september 2007 01:33

alt-tab (option-tab)

hstuivenberg 29 september 2007 15:20

Een klant van ons doet iets soortgelijks in nederland:

de digitale biblitotheek voor de nederlands letteren. (www.dbnl.org).
Zij zijn echter zeer klein en draaien volledig op subsidie en steun van diverse uni's en overheid.

50.000 pagina's per dag is echt een prachtige stap. Het is anders niet te doen om zoveel boeken te digitaliseren.

Verwijderd 28 september 2007 21:20

Worden de boeken niet beschadigt door het scannen en het licht van de scanner?? Die boeken moet je toch met handschoenen enzo aanraken, of is dat alleen in de films

Nyarlathotep @Verwijderd • 28 september 2007 22:04

Ik heb op een beurs een keer een scanner gezien die prima met dit soort boeken om kon gaan. Het boek werd neergelegd, en de scan-unit hing ongeveer een meter boven het boek. Op deze manier heb je minimale handelingen nodig om alle pagina's te scannen. Het omslaan van de pagina's gebeurde nog met de hand overigens.
Maar op deze manier is het makkelijk om het boek eventueel in een luchtdichte transparante behuizing te leggen, en met handschoenen aan de pagina's om te slaan (denk aan een couveuse). Ook kun je eventuele (kleur)filters zo makkelijk aanbrengen.
Er zullen ook wel modellen zijn die automatisch pagina's kunnen omslaan, maar dit is natuurlijk wat moelijker bij de wat fragielere boeken.

Edit: Op deze site staat wat van deze apparatuur. Al zijn dit de wat simpelere modelletjes

[Reactie gewijzigd door Nyarlathotep op 23 juli 2024 19:25]

Maartenvs @Nyarlathotep • 29 september 2007 00:50

Misschien interessant voor sommigen om te zien hoe dat nou werkt. Een filmpje hier

kissyfur @Nyarlathotep • 30 september 2007 11:07

En dan nog heb je problemen. Negentiende eeuws papier staat berucht om zijn slechte kwaliteit. Die kranten die ze willen inscannen brokkelen waarschijnlijk onder hun handen af. Dat is wellicht ook de reden dat ze ingescand worden, want het wordt steeds moeilijker zulk soort documenten te conserveren.

kmf @Verwijderd • 28 september 2007 22:00

Ze kunnen gebruik maken van een soortgelijke "scanner/foto-apparaat" die google ook gebruikt. Deze maakt "foto's" van de boeken, die zonder aanraken worden omgeslagen.

FreezeXJ @Verwijderd • 28 september 2007 21:26

Ik mag aannemen dat ze hier een leuke gevoelige scanner voor gebruiken, en op zich is licht niet zo schadelijk... Het zijn de zuren op je huid die ontzettend destructief zijn voor (oud) papier, vandaar die handschoenen. Neem ook niet aan dat ze hier een Randstadter voor aannemen

theborgnl @Verwijderd • 28 september 2007 21:30

Ach, zelfs als dat echt heel schadelijk is, dan zijn ze daarna wel goed bewaard. Beter dan als ze maar in een kast verder weg staan te rotten.

En verder zijn er volgens mij van die scanners die automagisch heel voorzichtig de bladzijden kunnen omslaan. Dan hoeft niemand ze aan te raken ivm de huid-aanraking die juist zo slecht is geloof ik. (vandaar de handschoentjes in films)

[Reactie gewijzigd door theborgnl op 23 juli 2024 19:25]

poktor 28 september 2007 23:07

Mooie foto bij het artikel, maar waarom zit er gaas voor de boeken in de 2e kast? Zijn die verboden, of zo?

Tjeerd @poktor • 29 september 2007 07:53

Denk eerder dat ze zo oud en van onschatbare waarde zijn dat ze standaard achter die tralies moeten staan. En dat op verzoek een medewerker een boek voor je er achter vandaan haalt.

[Reactie gewijzigd door Tjeerd op 23 juli 2024 19:25]

Verwijderd @poktor • 29 september 2007 09:50

Nooit Harry Potter gezien? Die tralies zijn er om er voor te zorgen dat ze niet weg lopen of onschuldige voorbijgangers aanvallen.

[Reactie gewijzigd door Verwijderd op 23 juli 2024 19:25]

Matthijs Hoekstra 28 september 2007 22:48

Daar hebben ze al een hele mooie applicatie voor om de boeken te bekijken (gemaakt in Microsoft .NET 3.0 en WPF)

zie http://ttpdownload.bl.uk/browserapp.xbap

Je kan zelfs de paginas iets draaien en de weerspiegeling van het licht veranderd op de paginas. Da Vinci's Codex is bv te bekijken.

Verwijderd @Matthijs Hoekstra • 28 september 2007 23:57

Inderdaad... een hele mooie applicatie. Waar ik dus niks mee kan op Firefox onder Linux. Ik mag hopen dat de British Library verder heeft gekeken dan leuke gadgets als weerspiegeling van het licht dat verandert op de pagina's en erover nagedacht heeft of het voor een overheidsorganisatie wel wenselijk is om mensen te verplichten een licentie op een bepaald OS te nemen om het cultureel erfgoed van hun land te kunnen bekijken.

RedPixel 28 september 2007 21:14

Toch grappig dat je zo'n hele bibliotheek digitaal prima in je meterkast zou kunnen hebben

kmf @RedPixel • 28 september 2007 22:02

En met een Sony Reader of een soortgelijk ebook-reader en een 2GB-kaart kan je een boekenkast in je jaszak meenemen.

Verwijderd @kmf • 29 september 2007 11:06

Ik heb zelf zo'n ding. Werkt fantastisch. Maar met boeken van 300 megabyte kan ie wat minder goed uit de voeten. 30 terabyte / 100,000 boeken = 300 MB per boek.

Ik hoop dat ze er ook nog tekstherkenning overheen gooien, anders heb je er zeker op een eReader en bij de search bar weinig aan.

punishedbrains 28 september 2007 21:19

Schitterend, eindelijk al deze zeer kostbare en prachtige literatuur verkrijgbaar voor iedereen. Soms is technologie om van te houden.

_Teq_ 28 september 2007 21:26

De boeken zullen volledig doorzocht kunnen worden.

Wat bedoelen ze hier nou? Worden de boeken ingescanned (als in: zoals ik ook kan scannen met mijn scannertje, zegmaar een .JPG bestand) of worden ze ingescanned met letterherkenning? (dus alleen de text in een textbestandje)
Het lijkt me moeilijk om letterherkenning toe te passen op oude (geschreven?) boeken. Dit is wel noodzakelijk om de boel 'doorzoekbaar' te maken. Als ze alleen besluiten de text te scannen verliest het boek natuurlijk veel waarde (handschrift, illustraties, etc.)

Verwijderd @_Teq_ • 28 september 2007 21:39

Ook zonde rletterherkenning is dit al zeer nuttig natuurlijk. Daarnaast worden ze op deze manier in iede rgeval minder geraadpleegd. Het gaat overigens natuurlijk grotendeels om om gedrukte boeken, 19e eeuw is al ff na Gutenberg ;-)

Coju @Verwijderd • 30 september 2007 11:09

19e eeuw is wel weer de eeuw waarin de kwaliteit van boeken niet zo goed is. Slechte inkt die inktvraat verzorgt gecombineerd met dun papier. Oudere boeken die stuk voor stuk werden gemaakt zijn vaak wat beter bewaard. Daar zijn er echter weer minder van.

fevenhuis @_Teq_ • 29 september 2007 00:11

De OCR (letterherkenning die je bedoelt) kan altijdt later op imagefiles (zoals jpg) worden toegepast. Het voordeel daarvan is dat de tektst dan eventueel op juiste spelling gecontroleerd worden door iemand die dat kan, wat nodig is bij oude taal.
Moderne boeken zullen weinig problemen geven.

Daarnaast hoeft er niet persé een scanner gebruikt te worden, een fotocamera is logischer voor de moeilijk handelbare boeken.

Een reden dat dit nog niet eerder gedaan is kan zijn, omdat er gewoonweg zeer grote opslagruimte voor nodig is, welke nu pas betaalbaar geworden is.

[Reactie gewijzigd door fevenhuis op 23 juli 2024 19:25]

Verwijderd 28 september 2007 22:04

ik lees ditzelfde bericht precies om de 2 maanden opnieuw? of ligt dat aan mij?
in ieder geval super initiatief.
jammer dat Google ook niet gewoon de database mag aanbieden, waarom zo vechten om de 'beste online bib'? waarom niet gewoon 1 Uberbib creeren?

Verwijderd @Verwijderd • 28 september 2007 22:08

Wie gaat dat betalen?

kmf @Verwijderd • 29 september 2007 01:00

de adsense advertenties die je tussen hoofdstukken door krijgt te zien.

Shaggy_NL 28 september 2007 22:09

Dit was men al een beetje aan het doen, bij Adobe. Met Adobe Digital Editions en hun eBook Library.

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (42)

Sorteer op:

Weergave: