Japans lab ontwikkelt snelle boekscanner

Japanse onderzoekers hebben een snelle methode uitgevonden om boeken in te scannen. Het systeem maakt gebruik van een hogesnelheidscamera en een laser, en voor het inscannen is het voldoende om rap door de pagina's te bladeren.

Het snelle boekscansysteem is ontwikkeld door het Ishikaw Komuro Laboratory van de University of Tokyo. Dit lab is gespecialiseerd in onderzoek naar de parallelle verwerking van beeldsensorinformatie en gerelateerde toepassingen. Het systeem maakt gebruik van een camera, die door zijn framerate van 1000fps het snel door een boek bladeren kan bijhouden, een flitsopstelling voor een gecontroleerde belichting, en een laseraftaster die de geometrie van de pagina's in 3d kan meten.

Het beeldverwerkingssysteem, dat gezien het onderzoeksgebied van het Japanse lab waarschijnlijk gebruikmaakt van parallelle gegevensverwerking, kan zodoende tekst en beelden opslaan en herkennen ondanks beeldvervorming als gevolg van het omslaan van de pagina's. Het systeem maakt het scannen van boeken door zijn snelheid aanzienlijk goedkoper, al is het niet bekend hoeveel pagina's per minuut het systeem precies kan digitaliseren. De snelle scanner is nog niet geschikt voor kleurenscans.

Ook Google heeft, ten behoeve van zijn Books-dienst, technologie voor het scannen van boeken ontwikkeld. Bij het systeem van Google worden de pagina's automatisch omgeslagen. De Japanse onderzoeksinstelling gebruikt de high-speedcamera's overigens ook voor andere projecten. Zo toonde het lab recent een systeem van twee honkballende robots. De robot die de bal wegslaat, berekent zijn slag aan de hand van de beelden van de hogesnelheidscamera.

Japan snelle boekscanner 1000fps

Vorig nieuwsartikel Volgend nieuwsartikel

Door Pieter Molenaar

Feedback • 14-08-2009 14:46 48

14-08-2009 • 14:46

Lees meer

Japanse camera centreert snelbewegende objecten Nieuws van 19 juni 2013

Lasercamera kijkt om de hoek Nieuws van 18 november 2010

Robotcamera aapt bewegingen oogbol na Nieuws van 2 november 2010

Draagbare 'laser backpack' maakt 3d-modellen van omgeving Nieuws van 12 augustus 2010

Japans bedrijf brengt robot met Atom-cpu en Ubuntu uit Nieuws van 22 december 2009

Japanse onderzoekers demonstreren 'educatie-robot' Nieuws van 22 december 2009

'Europa werkt aan eigen versie Google Books' Nieuws van 29 november 2009

Boekenwinkel Google opent deuren in 2010 Nieuws van 16 oktober 2009

Harvard University gaat grote Chinese boekcollectie digitaliseren Nieuws van 12 oktober 2009

Sony kondigt nieuwe e-readers aan Nieuws van 5 augustus 2009

Details over twee onaangekondigde Sony-e-readers lekken uit Nieuws van 31 juli 2009

Barnes & Noble gaat Amazon met e-books beconcurreren Nieuws van 21 juli 2009

Amazon werkt aan Britse introductie van Kindle Nieuws van 16 juli 2009

Irex introduceert in 2011 e-reader met kleurenscherm Nieuws van 4 juni 2009

EU onderzoekt of Google Books auteursrechten schendt Nieuws van 29 mei 2009

Rapport: E-paper-markt in 2015 gegroeid naar 2,1 miljard dollar Nieuws van 24 mei 2009

Amazon brengt Kindle DX-reader met 9,7"-scherm uit Nieuws van 6 mei 2009

Google helpt Sony met aanval op Amazon Kindle 2 Nieuws van 20 maart 2009

Microsoft en Google vernieuwen boekzoektools Nieuws van 4 juni 2007

Google laat ocr los op Indiase handschriften Nieuws van 23 mei 2007

'Meer boekverkopen dankzij Google Book Search' Nieuws van 9 oktober 2006

Meer producten en artikelen

Camera's Fotografie en video R&d

Reacties (48)

-Moderatie-faq

Wijzig sortering

Mentox 14 augustus 2009 14:56

Deze technieken zijn broodnodig om alle informatie te behouden die we de afgelopen eeuwen hebben opgebouwd.

Nu nog een goede index creëren en de bibliotheek kan helemaal uit het straatbeeld verdwijnen, dan komt de bibliotheek enkel nog voor in (ingescande) boeken.

Ortep

@Mentox • 14 augustus 2009 15:01

Nu nog een goede index creëren en de bibliotheek kan helemaal uit het straatbeeld verdwijnen, dan komt de bibliotheek enkel nog voor in (ingescande) boeken.

Daar wordt al een paar jaar aan gewerkt hoor. Dit maakt het alleen maar wat sneller

http://www.gutenberg.org/wiki/Main_Page

Project Gutenberg began in 1971 when Michael Hart was given an operator's account with $100,000,000 of computer time in it by the operators of the Xerox Sigma V mainframe at the Materials Research Lab at the University of Illinois.

Hat zijn er inmiddels miljoenen

[Reactie gewijzigd door Ortep op 24 juli 2024 00:40]

Verwijderd @Mentox • 14 augustus 2009 15:08

Toch mogen we papier niet volledig achter ons laten. Als morgen een zonnestorm over Europa trekt kunnen we een gigantisch aantal gegevens verliezen wat een brandje niet zou kunnen doen.
Dus we doen er goed aan om ze naast elkaar te laten leven.

ItsValium @Verwijderd • 14 augustus 2009 15:20

We mogen en zullen waarschijnlijk nooit van het papieren boek af raken (toch niet in de nabije toekomst), er zijn tegenwoordig nog teveel mensen die opteren voor een papieren boek danwel voor de electronische versie ervan.

Wie weet verandert dit wel sneller dan we denken bij de komende generaties en zou de papierloze wereld wel sneller een realiteit zijn dan wij denken, maar ik zie het toch niet zo snel gebeuren. Denk maar aan de vele ouderen en niet zo ouderen die niet genoeg computergericht zijn om electronisch hun boeken te gaan lezen. Zelfs hier op het werk ken ik genoeg personen die alles op papier uitprinten ipv het op hun scherm te gaan lezen en ik spreek dan over niet zo'n oude mensen.

Om het even wat verder uit te diepen denk maar aan de juridische draagkrachten die tegenwoordig allemaal afhankelijk zijn van papieren documenten en dergelijke. Daar zal ook een degelijke oplossing moeten voor gevonden worden vooraleer we het papier vaarwel kunnen zeggen.

We zien wel wanneer, voor mij kan het alleszins niet snel genoeg komen.

Psilax @ItsValium • 14 augustus 2009 15:49

Zelfs als jongere lees ik graag uit een echt boek,
Er is nog geen electronische vervanging voor een echt goed leesboek, sommige lachen er mee, maar de geur en het uitzicht van een boek doet veel.

Ok voor IT zaken lees ik e-books maar dat wordt snel herleid naar bladeren dan echt grondig lezen omdat het gewoon niet comfortabel is om te lezen op een scherm in vgl met een boek. Misschien dat de laatste generatie e-readers al beterschap brengen, maar dat weet ik dus nog niet.

BarôZZa @Psilax • 14 augustus 2009 16:53

Een e-book reader met een e-ink scherm is even rustig voor je ogen als een gewoon boek. Zodra de apparaatjes nog wat verfijnder en goedkoper worden kunnen we het grootste deel van de gewone boeken afschrijven. Het wordt net zoiets als van LP/CD naar MP3. Je houdt altijd wat mensen die een emotionele waarde hechten aan het fysieke medium, maar de nieuwe generatie gaat voor de compactheid en het gebruiksgemak van het digitale medium.

Ik denk zelf dat het vooral hard gaat lopen zodra scholieren e-book readers gaan gebruiken ipv boeken. Die hoeven dan geen schooltas van 6kg mee te zeulen en zijn ook niet meer de helft van de tijd kwijt aan kaften, bladeren (wat was de BINAS toch een draak van een boek) etc.
Zij zullen opgroeien met het gemak van aantekeningen maken zonder een boek te beschadigen, direct naar de juiste pagina met behulp van een paar klikken (eventueel hyperlinks in de teksten) en draadloos de boeken binnenhalen. Ik denk dat zij totaal geen emotionele binding zullen hebben met logge boeken die je moet kopen, waarbij je een boekenlegger moet gebruiken etc.

Verwijderd @Verwijderd • 14 augustus 2009 15:21

Ik zie niet in wat een zonnestorm te maken heeft met het inscannen van boeken. Het bewaren van digitale gegevens is superieur aan die van papieren versie. Echter papier heeft wel een emotionele waarde die digitaal niet vaak kan "gekopieerd" woorden.

Jasper Janssen @Verwijderd • 14 augustus 2009 20:33

Een zonnestorm vernietigt digitaal bewaarde bestanden, is wat het er mee te maken heeft.

hackerhater @Jasper Janssen • 14 augustus 2009 22:18

Is dat niet alleen als er electrische stroom kan vloeien door hele lange kabel (cq hoogspanningskabels)?
Dan is het een kwestie van die servers even van het lichtnet af halen en de boeken zijn veilig

Webgnome @Verwijderd • 14 augustus 2009 15:46

Buiten dat.. voor de niet tweakers onder ons ( en dat zijn er nogal een hoop gezien over de gehele wereld bevolking) is het niet zo vanzelfsprekend dat dingen digitaal worden. Daarnaast het lezen van digitale boeken is nog steeds niet fijn vanaf een beeldscherm of je moet een reader kopen

Player1S @Verwijderd • 14 augustus 2009 15:12

tja aan de andere kant, als morgen een grote bibliotheek afbrand met zeldzame exemplaren kunnen ze op deze manier toch bewaard blijven.

En bij een goede zonnestorm is het verlies van "een paar boeken" vast niet het ergste wat er kan gebeuren

Xenomorphh 14 augustus 2009 14:53

het lijkt mij nou niet zo heel efficiënt hoe die man zo door dat boek bladert.. lijkt me dat er dan genoeg pagina's dubbel meegaan en dus niet gescant worden.. je moet dus als nog redelijk snel pagina voor pagina willen bladeren om een aanzienlijk aantal pagina's te krijgen..

m4-io @Xenomorphh • 14 augustus 2009 17:45

't Zal wel een handbeweging puur voor de foto zijn. In de praktijk zal iemand wel pagina voor pagina snel opslaan, maar dan wel zonder de noodzaak om op knopjes te drukken of de zaak 1 seconde stil te houden. Als je 300 paginas moet omslaan en elke omslag duurt 2 seconden dan is na iets meer dan 10 minuten het boek ingescanned.

Ga maar eens 300 paginas los inscannen met een flatbed en bestaande scanprogrammatuur en dan snap je wat voor enorme winst dit systeem oplevert.

(ruwweg 10 seconden per scan + uitknippen 10 seconden + plaatsen 2 seconden + verwijderen 2 seconden = 24 seconden per pagina als je als een gek werkt. Winst is in dat theoretische geval 22 seconden ; reductie van arbeidsduur met 92%. )

[Reactie gewijzigd door m4-io op 24 juli 2024 00:40]

fevenhuis @m4-io • 14 augustus 2009 17:51

Ik denk eerder dat de camera met 1000fps niet voor niets gebruikt is en dat men echt van plan is om met hoge snelheid boeken in te scannen/fotograferen. 10 minuten per boek lijkt op het eerste gezicht niet zoveel, maar als je velen duizenden boeken hebt wordt dat een heel ander verhaal.

Ze hebben allen nog geen hogesnelheids-paginabladermachine zo lijkt het.

stefanos1990 @fevenhuis • 14 augustus 2009 19:13

jah, maar je hoeft alleen de zeer zeldzame boeken 10 minuten te bladeren.
meer voorkomende boeken kan je gewoon de kaft van verwijderen en dan met wieltjes zoals in een printer de pagina's een voor een langs de camera laten schieten.

Mizitras @fevenhuis • 14 augustus 2009 23:19

Als je 6-boeken per uur maar kan doen, kan je die factor ook nog omlaaghalen, door een EXTRA toestel bij te plaatsen hé

Big Womly @Xenomorphh • 14 augustus 2009 15:00

Indien dit ooit op de markt gebracht zal worden, zal men het bladerproces ook wel geautomatiseerd hebben. Ik ben dan aan het denken aan de manier waarop je printer slechts 1 vel neemt van die hele stapel.
Lost ook meteen het probleem dat CyberSnooP stelde

[Reactie gewijzigd door Big Womly op 24 juli 2024 00:40]

Verwijderd @Big Womly • 14 augustus 2009 15:39

Dit soort machines worden al gebruikt, en die bladeren zelf. De Koninklijke Bibliotheek heeft hier al veel gebruik van gemaakt. Ik probeerde een link te vinden bij kb.nl, kan er echter zo snel geen vinden.
Normaal worden boeken gewoon kapot gesneden, maar als er maar 1 is wordt dat toch lastiger.
Het is wel een zeer prijzig proces....

jeroenboumans @Verwijderd • 14 augustus 2009 20:22

Dan nog gaat het hierbij om de informatie uit het boek. Het fysieke boek is in feite niks waard.

Mizitras @jeroenboumans • 14 augustus 2009 23:18

Niet geheel waar, kijk eens naar oude charters en boeken met de handgeschreven of in zeer lage oplage maar doch belangrijke werken.... Hier wil men de informatie wel uithalen, en zal men zeker in een gecontroleerde omgeving van licht, warmte en vocht, ze opslagen.

Kalief @Xenomorphh • 14 augustus 2009 15:08

Als tijdens het scannen de bladzijdenummers kunnen worden herkend dan kunnen overgeslagen (of zelfs missende) pagina's worden gedetecteerd.

Luxx @Kalief • 14 augustus 2009 17:58

Leuk en aardig, maar wat dan? moet je die handmatig gaan opzoeken? of gewoon 'een paar keer' bladeren totdat je alle pagina's hebt.
Handmatig zou't hele snelle process terugbrengen tot iets slooms, en een paar keer bladeren lijkt me niet te werken omdat't toch wel de 'klevende pagina's ' zullen zijn die iedere keer mis gaan.

Als foutcontrole werkt het wel, maar het detecteren van de paginanummers (voor zover die altijd 100% aanwezig zijn), is geen oplossing voor't probleem.

_Thanatos_ @Kalief • 14 augustus 2009 19:36

Handig voor boeken die geen bladzijdenummers hebben, of een vreemd soort nummering gebruiken (zoals in mobo-handleidingen vaak)...

GamingZeUs @Xenomorphh • 15 augustus 2009 12:52

Wij mensen staan er bekend op risicovolle handelingen te oefenen totdat ze makkelijk en goed gaan. Denk aan de kapper die mis kan knippen, en de chinees die de hele dag door spullen opvouwt.

De persoon die de pagina's omslaat krijgt ongetwijfeld op een gegeven moment een "perfecte" manier van omslaan, zodat het zaakje in een keer goed gaat. Verder pagina letter controle voor het geval dat.

Verwijderd 14 augustus 2009 14:55

Dit is een erg goede ontwikkeling.
Nu nog het principe omzetten in een consumenten apparaat.
Dan kan iedereen zijn boeken digitaal archiveren en gebruiken als ebooks.

Het kan ook heel erg handig zijn voor bibliotheken en scholen/universiteiten.
Vooral met boeken waar kostbare kennis in staat kunnen dan brand/rot veilig opgeslagen worden op externe servers en dergelijke.

Psilax @Verwijderd • 14 augustus 2009 15:41

Je hebt gelijk dat het intressant zou zijn om kennis te bewaren, maar dat is dus nu google ( en dacht microsoft ook) al aan het doen, maar die lopen al op het grootste probleem: auteursrechten.

Veel schrijvers willen niet dat hun boeken zomaar beschikbaar zijn in e-versie, want dan hebben ze niet zomaar zicht op de verkoop. Ik vermoed dat er dan wel beveiligingen zullen komen en extra taxen, maar heb die liever niet als ik een boek koop.

Jasper Janssen @Psilax • 14 augustus 2009 20:26

Daarom zou het dus juist mooi zijn als je het als particulier kan doen, want a) dan kun je je eigen spullen doen en b) als er net zo veel mensen zo'n setup hebben als er DVDrips kunnen maken wordt dat redelijk irrelevant.

Pmf1971 @Jasper Janssen • 14 augustus 2009 23:38

Pfff, als je een een electronische versie van een boek wilt maken dan snij je toch gewoon de rug eraf en ram je die hele stapel door een dubbelzijdige page-feed scanner...

Zo gepiept.

Dit google systeem is bedoelt voor boeken die ook nog heel moeten blijven na het scannen

Verwijderd @Pmf1971 • 15 augustus 2009 00:25

Ja, en het boek is daarna meteen waardeloos geworden... Geen optie voor bibliotheken.

Verwijderd @Verwijderd • 17 augustus 2009 14:14

Er worden nu al veel boeken ingescand. Ik heb 110GB aan digitale strips staan, en er is nog veel meer te krijgen. Populaire romans worden ook ingescand (Harry Potter 6 was binnen enkele uren na het begin van de verkoop al online te vinden, HP7 zelfs voor de officiele verkoopdatum al), en veel wetenschappelijk werk wordt tegenwoordig al elektronisch gepubliceerd, bv. op http://xxx.lanl.gov voor natuurkundige werken.

cc12 14 augustus 2009 21:35

In eerste instantie dacht ik dat ze een prototpye van een consumentenscanner hadden uitgevonden. Ik weet dat er al een tijdlang een consumentenversie bestaat, namelijk de Plustek OpticBook 3600/4600.

Wat ik mij wel afvraag is waarom er kopieerapparaten bestaan die in 1 keer met een flits een gehele pagina kunnen kopieren terwijl bij een scanner de gehele pagina langzaam wordt ingescand. Waarom wordt deze 'flitstechniek' niet toegepast in scanners?

jvdmeer @cc12 • 14 augustus 2009 22:23

Waarschijnlijk omdat het bladeren het meeste tijd kost. Dus je wint relatief weinig tijd door te flitsen.

Zelf vond ik de volgende oplossing voor het scannen van een boek echt fantastisch gevonden:

http://www.youtube.com/watch?v=hlOQuuLYavY

Pretbek @jvdmeer • 15 augustus 2009 00:21

Alleen het gaat dan nogal lang duren, daar tegen over staat dat je wel hoge kwaliteits scans hebt.

Ik vind het echt een super ding (uit dit nieuwsitem

), want je kunt er hier uiteindelijk zo veel mee. Het is i.d.d. zeer goed te combineren met e-books, maar ook met dagelijkse dingen. Ben wel bang dat het nog wel een paar jaartjes gaat duren voordat dit grootschalig in de consumentenmarkt terug te vinden gaat zijn. E-books komen net van de grond en moeten nog flink doorontwikkelen, deze techniek is er ook pas net.

Je zou hier bijvoorbeeld de krant mee kunnen scannen ( of tabloids ), vooral wanneer er door de oude-media gekozen gaat worden om exclusieve content te plaatsen in de papieren krant. Een ontwikkeling/discussie die ook al een tijdje gaan de is, gaat i.i.g. een hoop gebeuren op dit gebied.

Of notities van de colleges kunnen overnemen, zonder het kopiëren via een kopieerapparaat (niet altijd zuiver), gewoon delen via e-books, waar het gros van het studie materiaal in opgeslagen zit.

Verwijderd @cc12 • 15 augustus 2009 00:30

Wat ik mij wel afvraag is waarom er kopieerapparaten bestaan die in 1 keer met een flits een gehele pagina kunnen kopieren terwijl bij een scanner de gehele pagina langzaam wordt ingescand. Waarom wordt deze 'flitstechniek' niet toegepast in scanners?

Kosten.

Die "flits-scanners" scannen in 1x de hele bladzij in met een 2-dimensionale scanner, zoals bijvoorbeeld een fototoestel dat ook doet.

Zo'n "langzame scanner" heeft een 1-dimensionale scanner, die langzaam langs de pagina getrokken moet worden om de tweede dimensie te krijgen.

De eerste heeft een peperdure sensor, maar is vele malen sneller, en wordt ingezet in omgevingen (kantoren) waar de hoge prijs gerechtvaardigd is door de snelheid.

Daarnaast zou zo'n scanner een stuk groter worden, er moet genoeg ruimte zijn om in 1x de hele bladzijde te kunnen zien, daarom zie je het vooral in grote multifunctionals terug. Ik denk niet dat je een dergelijk mechanisme in een formaat flatbedscanner kunt krijgen.

[Reactie gewijzigd door Verwijderd op 24 juli 2024 00:40]

CyberSnooP 14 augustus 2009 14:50

Hoe kan dit goed gaan voor heel dicht bij de binnenmarge? Daar is het toch hardstikke donker en een vervelend perspectief voor de camera?

Uiteraard wel heel gaaf gedaan. Zou wel een video-demo van dit apparaatje willen zien als iemand zo door een boek heen flipt.

Verwijderd @CyberSnooP • 14 augustus 2009 15:16

uit het artikel:

een flitsopstelling voor een gecontroleerde belichting, en een laseraftaster die de geometrie van de pagina's in 3d kan meten.

Aikon 14 augustus 2009 15:19

Waarom zou er gebruik worden gemaakt van flitstechnologie en niet van, bij wijze van spreke, een bouwlamp? Bij 1000fps heeft het toch weinig nut om de lamp uberhaupt nog uit te zetten?

imqqmi

@Aikon • 14 augustus 2009 15:51

High speed cameras hebben doorgaans erg veel licht nodig. Ik kan me voorstellen dat een flitser meer licht kan produceren. Bovendien wordt een flitser niet zo heet als een monolight.

peidur 14 augustus 2009 15:26

Behalve dat het digitaal archiveren wordt toegepast voor boeken, is het archiveren van tijdschriften net zo belangrijk. De 'emotionele' of historische waarde van tijdschriften zijn minder hoog dan die van boeken. Daarom wordt er in archieven met een bepaald thema, bijvoorbeeld van een stad, technische achtergrond of wat dan ook, het artikel gescand, het orginele artikel wordt uit het tijdschrift gehaald en in zuurvrij papier opgeslagen in het archief.

Op deze manier zijn twee werelden gelukkig. Het artikel is voor iedereen beschikbaar en gemakkelijk terug te vinden. En voor de nostalgici is het orginele artikel ook bewaard gebleven.

jhellingman @peidur • 14 augustus 2009 16:45

Ik ben al jaren bezig met het scannen van een tijdschrift, De Aarde en haar volken, ziehier: http://www.pgdp.net/wiki/User:Jhellingman/De_Aarde

Erg snel gaat het niet, maar de meeste tijd zit in het proeflezen van de ge-OCR-de tekst, en daarna in het opschonen van gescande illustraties.

Orian @jhellingman • 14 augustus 2009 18:09

Zo, ziet er erg mooi uit. Weet je toevallig of het mogelijk is alles in een keer te downloaden (wat je tot nu toe gescand hebt)? Want nu moet ik alles een voor een aanklikken, en ik zou ze graag allemaal downloaden.

Jasper Janssen @jhellingman • 14 augustus 2009 20:34

Verrek, daar heb ik nog in geproofread.