Japans lab ontwikkelt snelle boekscanner

Japanse onderzoekers hebben een snelle methode uitgevonden om boeken in te scannen. Het systeem maakt gebruik van een hogesnelheidscamera en een laser, en voor het inscannen is het voldoende om rap door de pagina's te bladeren.

Het snelle boekscansysteem is ontwikkeld door het Ishikaw Komuro Laboratory van de University of Tokyo. Dit lab is gespecialiseerd in onderzoek naar de parallelle verwerking van beeldsensorinformatie en gerelateerde toepassingen. Het systeem maakt gebruik van een camera, die door zijn framerate van 1000fps het snel door een boek bladeren kan bijhouden, een flitsopstelling voor een gecontroleerde belichting, en een laseraftaster die de geometrie van de pagina's in 3d kan meten.

Het beeldverwerkingssysteem, dat gezien het onderzoeksgebied van het Japanse lab waarschijnlijk gebruikmaakt van parallelle gegevensverwerking, kan zodoende tekst en beelden opslaan en herkennen ondanks beeldvervorming als gevolg van het omslaan van de pagina's. Het systeem maakt het scannen van boeken door zijn snelheid aanzienlijk goedkoper, al is het niet bekend hoeveel pagina's per minuut het systeem precies kan digitaliseren. De snelle scanner is nog niet geschikt voor kleurenscans.

Ook Google heeft, ten behoeve van zijn Books-dienst, technologie voor het scannen van boeken ontwikkeld. Bij het systeem van Google worden de pagina's automatisch omgeslagen. De Japanse onderzoeksinstelling gebruikt de high-speedcamera's overigens ook voor andere projecten. Zo toonde het lab recent een systeem van twee honkballende robots. De robot die de bal wegslaat, berekent zijn slag aan de hand van de beelden van de hogesnelheidscamera.

Japan snelle boekscanner 1000fps

Door Pieter Molenaar

14-08-2009 • 14:46

48

Lees meer

Lasercamera kijkt om de hoek
Lasercamera kijkt om de hoek Nieuws van 18 november 2010
Sony kondigt nieuwe e-readers aan
Sony kondigt nieuwe e-readers aan Nieuws van 5 augustus 2009

Reacties (48)

48
47
37
1
0
0
Wijzig sortering
Deze technieken zijn broodnodig om alle informatie te behouden die we de afgelopen eeuwen hebben opgebouwd.

Nu nog een goede index creëren en de bibliotheek kan helemaal uit het straatbeeld verdwijnen, dan komt de bibliotheek enkel nog voor in (ingescande) boeken.
Nu nog een goede index creëren en de bibliotheek kan helemaal uit het straatbeeld verdwijnen, dan komt de bibliotheek enkel nog voor in (ingescande) boeken.
Daar wordt al een paar jaar aan gewerkt hoor. Dit maakt het alleen maar wat sneller

http://www.gutenberg.org/wiki/Main_Page
  • Project Gutenberg began in 1971 when Michael Hart was given an operator's account with $100,000,000 of computer time in it by the operators of the Xerox Sigma V mainframe at the Materials Research Lab at the University of Illinois.
Hat zijn er inmiddels miljoenen

[Reactie gewijzigd door Ortep op 24 juli 2024 00:40]

Anoniem: 196662 @Mentox14 augustus 2009 15:08
Toch mogen we papier niet volledig achter ons laten. Als morgen een zonnestorm over Europa trekt kunnen we een gigantisch aantal gegevens verliezen wat een brandje niet zou kunnen doen.
Dus we doen er goed aan om ze naast elkaar te laten leven.
We mogen en zullen waarschijnlijk nooit van het papieren boek af raken (toch niet in de nabije toekomst), er zijn tegenwoordig nog teveel mensen die opteren voor een papieren boek danwel voor de electronische versie ervan.

Wie weet verandert dit wel sneller dan we denken bij de komende generaties en zou de papierloze wereld wel sneller een realiteit zijn dan wij denken, maar ik zie het toch niet zo snel gebeuren. Denk maar aan de vele ouderen en niet zo ouderen die niet genoeg computergericht zijn om electronisch hun boeken te gaan lezen. Zelfs hier op het werk ken ik genoeg personen die alles op papier uitprinten ipv het op hun scherm te gaan lezen en ik spreek dan over niet zo'n oude mensen.

Om het even wat verder uit te diepen denk maar aan de juridische draagkrachten die tegenwoordig allemaal afhankelijk zijn van papieren documenten en dergelijke. Daar zal ook een degelijke oplossing moeten voor gevonden worden vooraleer we het papier vaarwel kunnen zeggen.

We zien wel wanneer, voor mij kan het alleszins niet snel genoeg komen.
Zelfs als jongere lees ik graag uit een echt boek,
Er is nog geen electronische vervanging voor een echt goed leesboek, sommige lachen er mee, maar de geur en het uitzicht van een boek doet veel.

Ok voor IT zaken lees ik e-books maar dat wordt snel herleid naar bladeren dan echt grondig lezen omdat het gewoon niet comfortabel is om te lezen op een scherm in vgl met een boek. Misschien dat de laatste generatie e-readers al beterschap brengen, maar dat weet ik dus nog niet.
Een e-book reader met een e-ink scherm is even rustig voor je ogen als een gewoon boek. Zodra de apparaatjes nog wat verfijnder en goedkoper worden kunnen we het grootste deel van de gewone boeken afschrijven. Het wordt net zoiets als van LP/CD naar MP3. Je houdt altijd wat mensen die een emotionele waarde hechten aan het fysieke medium, maar de nieuwe generatie gaat voor de compactheid en het gebruiksgemak van het digitale medium.

Ik denk zelf dat het vooral hard gaat lopen zodra scholieren e-book readers gaan gebruiken ipv boeken. Die hoeven dan geen schooltas van 6kg mee te zeulen en zijn ook niet meer de helft van de tijd kwijt aan kaften, bladeren (wat was de BINAS toch een draak van een boek) etc.
Zij zullen opgroeien met het gemak van aantekeningen maken zonder een boek te beschadigen, direct naar de juiste pagina met behulp van een paar klikken (eventueel hyperlinks in de teksten) en draadloos de boeken binnenhalen. Ik denk dat zij totaal geen emotionele binding zullen hebben met logge boeken die je moet kopen, waarbij je een boekenlegger moet gebruiken etc.
Ik zie niet in wat een zonnestorm te maken heeft met het inscannen van boeken. Het bewaren van digitale gegevens is superieur aan die van papieren versie. Echter papier heeft wel een emotionele waarde die digitaal niet vaak kan "gekopieerd" woorden.
Een zonnestorm vernietigt digitaal bewaarde bestanden, is wat het er mee te maken heeft.
Is dat niet alleen als er electrische stroom kan vloeien door hele lange kabel (cq hoogspanningskabels)?
Dan is het een kwestie van die servers even van het lichtnet af halen en de boeken zijn veilig
Buiten dat.. voor de niet tweakers onder ons ( en dat zijn er nogal een hoop gezien over de gehele wereld bevolking) is het niet zo vanzelfsprekend dat dingen digitaal worden. Daarnaast het lezen van digitale boeken is nog steeds niet fijn vanaf een beeldscherm of je moet een reader kopen
tja aan de andere kant, als morgen een grote bibliotheek afbrand met zeldzame exemplaren kunnen ze op deze manier toch bewaard blijven.

En bij een goede zonnestorm is het verlies van "een paar boeken" vast niet het ergste wat er kan gebeuren
het lijkt mij nou niet zo heel efficiënt hoe die man zo door dat boek bladert.. lijkt me dat er dan genoeg pagina's dubbel meegaan en dus niet gescant worden.. je moet dus als nog redelijk snel pagina voor pagina willen bladeren om een aanzienlijk aantal pagina's te krijgen..
't Zal wel een handbeweging puur voor de foto zijn. In de praktijk zal iemand wel pagina voor pagina snel opslaan, maar dan wel zonder de noodzaak om op knopjes te drukken of de zaak 1 seconde stil te houden. Als je 300 paginas moet omslaan en elke omslag duurt 2 seconden dan is na iets meer dan 10 minuten het boek ingescanned.

Ga maar eens 300 paginas los inscannen met een flatbed en bestaande scanprogrammatuur en dan snap je wat voor enorme winst dit systeem oplevert.

(ruwweg 10 seconden per scan + uitknippen 10 seconden + plaatsen 2 seconden + verwijderen 2 seconden = 24 seconden per pagina als je als een gek werkt. Winst is in dat theoretische geval 22 seconden ; reductie van arbeidsduur met 92%. )

[Reactie gewijzigd door m4-io op 24 juli 2024 00:40]

Ik denk eerder dat de camera met 1000fps niet voor niets gebruikt is en dat men echt van plan is om met hoge snelheid boeken in te scannen/fotograferen. 10 minuten per boek lijkt op het eerste gezicht niet zoveel, maar als je velen duizenden boeken hebt wordt dat een heel ander verhaal.

Ze hebben allen nog geen hogesnelheids-paginabladermachine zo lijkt het.
jah, maar je hoeft alleen de zeer zeldzame boeken 10 minuten te bladeren.
meer voorkomende boeken kan je gewoon de kaft van verwijderen en dan met wieltjes zoals in een printer de pagina's een voor een langs de camera laten schieten.
Als je 6-boeken per uur maar kan doen, kan je die factor ook nog omlaaghalen, door een EXTRA toestel bij te plaatsen hé ;)
Indien dit ooit op de markt gebracht zal worden, zal men het bladerproces ook wel geautomatiseerd hebben. Ik ben dan aan het denken aan de manier waarop je printer slechts 1 vel neemt van die hele stapel.
Lost ook meteen het probleem dat CyberSnooP stelde

[Reactie gewijzigd door Big Womly op 24 juli 2024 00:40]

Dit soort machines worden al gebruikt, en die bladeren zelf. De Koninklijke Bibliotheek heeft hier al veel gebruik van gemaakt. Ik probeerde een link te vinden bij kb.nl, kan er echter zo snel geen vinden.
Normaal worden boeken gewoon kapot gesneden, maar als er maar 1 is wordt dat toch lastiger.
Het is wel een zeer prijzig proces....
Dan nog gaat het hierbij om de informatie uit het boek. Het fysieke boek is in feite niks waard.
Niet geheel waar, kijk eens naar oude charters en boeken met de handgeschreven of in zeer lage oplage maar doch belangrijke werken.... Hier wil men de informatie wel uithalen, en zal men zeker in een gecontroleerde omgeving van licht, warmte en vocht, ze opslagen.
Als tijdens het scannen de bladzijdenummers kunnen worden herkend dan kunnen overgeslagen (of zelfs missende) pagina's worden gedetecteerd.
Leuk en aardig, maar wat dan? moet je die handmatig gaan opzoeken? of gewoon 'een paar keer' bladeren totdat je alle pagina's hebt.
Handmatig zou't hele snelle process terugbrengen tot iets slooms, en een paar keer bladeren lijkt me niet te werken omdat't toch wel de 'klevende pagina's ' zullen zijn die iedere keer mis gaan.

Als foutcontrole werkt het wel, maar het detecteren van de paginanummers (voor zover die altijd 100% aanwezig zijn), is geen oplossing voor't probleem.
Handig voor boeken die geen bladzijdenummers hebben, of een vreemd soort nummering gebruiken (zoals in mobo-handleidingen vaak)...
Wij mensen staan er bekend op risicovolle handelingen te oefenen totdat ze makkelijk en goed gaan. Denk aan de kapper die mis kan knippen, en de chinees die de hele dag door spullen opvouwt.

De persoon die de pagina's omslaat krijgt ongetwijfeld op een gegeven moment een "perfecte" manier van omslaan, zodat het zaakje in een keer goed gaat. Verder pagina letter controle voor het geval dat.
Anoniem: 125150 14 augustus 2009 14:55
Dit is een erg goede ontwikkeling.
Nu nog het principe omzetten in een consumenten apparaat.
Dan kan iedereen zijn boeken digitaal archiveren en gebruiken als ebooks.

Het kan ook heel erg handig zijn voor bibliotheken en scholen/universiteiten.
Vooral met boeken waar kostbare kennis in staat kunnen dan brand/rot veilig opgeslagen worden op externe servers en dergelijke.
Je hebt gelijk dat het intressant zou zijn om kennis te bewaren, maar dat is dus nu google ( en dacht microsoft ook) al aan het doen, maar die lopen al op het grootste probleem: auteursrechten.

Veel schrijvers willen niet dat hun boeken zomaar beschikbaar zijn in e-versie, want dan hebben ze niet zomaar zicht op de verkoop. Ik vermoed dat er dan wel beveiligingen zullen komen en extra taxen, maar heb die liever niet als ik een boek koop.
Daarom zou het dus juist mooi zijn als je het als particulier kan doen, want a) dan kun je je eigen spullen doen en b) als er net zo veel mensen zo'n setup hebben als er DVDrips kunnen maken wordt dat redelijk irrelevant.
Pfff, als je een een electronische versie van een boek wilt maken dan snij je toch gewoon de rug eraf en ram je die hele stapel door een dubbelzijdige page-feed scanner...

Zo gepiept.

Dit google systeem is bedoelt voor boeken die ook nog heel moeten blijven na het scannen
Ja, en het boek is daarna meteen waardeloos geworden... Geen optie voor bibliotheken.
Er worden nu al veel boeken ingescand. Ik heb 110GB aan digitale strips staan, en er is nog veel meer te krijgen. Populaire romans worden ook ingescand (Harry Potter 6 was binnen enkele uren na het begin van de verkoop al online te vinden, HP7 zelfs voor de officiele verkoopdatum al), en veel wetenschappelijk werk wordt tegenwoordig al elektronisch gepubliceerd, bv. op http://xxx.lanl.gov voor natuurkundige werken.
In eerste instantie dacht ik dat ze een prototpye van een consumentenscanner hadden uitgevonden. Ik weet dat er al een tijdlang een consumentenversie bestaat, namelijk de Plustek OpticBook 3600/4600.

Wat ik mij wel afvraag is waarom er kopieerapparaten bestaan die in 1 keer met een flits een gehele pagina kunnen kopieren terwijl bij een scanner de gehele pagina langzaam wordt ingescand. Waarom wordt deze 'flitstechniek' niet toegepast in scanners?
Waarschijnlijk omdat het bladeren het meeste tijd kost. Dus je wint relatief weinig tijd door te flitsen.

Zelf vond ik de volgende oplossing voor het scannen van een boek echt fantastisch gevonden:

http://www.youtube.com/watch?v=hlOQuuLYavY
Alleen het gaat dan nogal lang duren, daar tegen over staat dat je wel hoge kwaliteits scans hebt. :)

Ik vind het echt een super ding (uit dit nieuwsitem :P), want je kunt er hier uiteindelijk zo veel mee. Het is i.d.d. zeer goed te combineren met e-books, maar ook met dagelijkse dingen. Ben wel bang dat het nog wel een paar jaartjes gaat duren voordat dit grootschalig in de consumentenmarkt terug te vinden gaat zijn. E-books komen net van de grond en moeten nog flink doorontwikkelen, deze techniek is er ook pas net.

Je zou hier bijvoorbeeld de krant mee kunnen scannen ( of tabloids ), vooral wanneer er door de oude-media gekozen gaat worden om exclusieve content te plaatsen in de papieren krant. Een ontwikkeling/discussie die ook al een tijdje gaan de is, gaat i.i.g. een hoop gebeuren op dit gebied.

Of notities van de colleges kunnen overnemen, zonder het kopiëren via een kopieerapparaat (niet altijd zuiver), gewoon delen via e-books, waar het gros van het studie materiaal in opgeslagen zit. :)
Anoniem: 19339 @cc1215 augustus 2009 00:30
Wat ik mij wel afvraag is waarom er kopieerapparaten bestaan die in 1 keer met een flits een gehele pagina kunnen kopieren terwijl bij een scanner de gehele pagina langzaam wordt ingescand. Waarom wordt deze 'flitstechniek' niet toegepast in scanners?
Kosten.

Die "flits-scanners" scannen in 1x de hele bladzij in met een 2-dimensionale scanner, zoals bijvoorbeeld een fototoestel dat ook doet.

Zo'n "langzame scanner" heeft een 1-dimensionale scanner, die langzaam langs de pagina getrokken moet worden om de tweede dimensie te krijgen.

De eerste heeft een peperdure sensor, maar is vele malen sneller, en wordt ingezet in omgevingen (kantoren) waar de hoge prijs gerechtvaardigd is door de snelheid.

Daarnaast zou zo'n scanner een stuk groter worden, er moet genoeg ruimte zijn om in 1x de hele bladzijde te kunnen zien, daarom zie je het vooral in grote multifunctionals terug. Ik denk niet dat je een dergelijk mechanisme in een formaat flatbedscanner kunt krijgen.

[Reactie gewijzigd door Anoniem: 19339 op 24 juli 2024 00:40]

Hoe kan dit goed gaan voor heel dicht bij de binnenmarge? Daar is het toch hardstikke donker en een vervelend perspectief voor de camera?

Uiteraard wel heel gaaf gedaan. Zou wel een video-demo van dit apparaatje willen zien als iemand zo door een boek heen flipt.
uit het artikel:
een flitsopstelling voor een gecontroleerde belichting, en een laseraftaster die de geometrie van de pagina's in 3d kan meten.
Waarom zou er gebruik worden gemaakt van flitstechnologie en niet van, bij wijze van spreke, een bouwlamp? Bij 1000fps heeft het toch weinig nut om de lamp uberhaupt nog uit te zetten?
High speed cameras hebben doorgaans erg veel licht nodig. Ik kan me voorstellen dat een flitser meer licht kan produceren. Bovendien wordt een flitser niet zo heet als een monolight.
Behalve dat het digitaal archiveren wordt toegepast voor boeken, is het archiveren van tijdschriften net zo belangrijk. De 'emotionele' of historische waarde van tijdschriften zijn minder hoog dan die van boeken. Daarom wordt er in archieven met een bepaald thema, bijvoorbeeld van een stad, technische achtergrond of wat dan ook, het artikel gescand, het orginele artikel wordt uit het tijdschrift gehaald en in zuurvrij papier opgeslagen in het archief.

Op deze manier zijn twee werelden gelukkig. Het artikel is voor iedereen beschikbaar en gemakkelijk terug te vinden. En voor de nostalgici is het orginele artikel ook bewaard gebleven.
Ik ben al jaren bezig met het scannen van een tijdschrift, De Aarde en haar volken, ziehier: http://www.pgdp.net/wiki/User:Jhellingman/De_Aarde

Erg snel gaat het niet, maar de meeste tijd zit in het proeflezen van de ge-OCR-de tekst, en daarna in het opschonen van gescande illustraties.
Zo, ziet er erg mooi uit. Weet je toevallig of het mogelijk is alles in een keer te downloaden (wat je tot nu toe gescand hebt)? Want nu moet ik alles een voor een aanklikken, en ik zou ze graag allemaal downloaden.
Verrek, daar heb ik nog in geproofread.
OK.. ik kan het niet laten.... Need more input!! (in reactie op timdeh)
http://www.youtube.com/watch?v=OktSWoJugOs

[Reactie gewijzigd door dimi op 24 juli 2024 00:40]

Robin van bassie en adriaan kon dat toch al lang :+
Robin FTW! Die kon echt alles! :P
Anoniem: 307929 16 augustus 2009 14:58
Doet me denken aan Data (karakter uit Star-Trek: Next Generation) die een boek "leest".

Op dit item kan niet meer gereageerd worden.