Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 20 reacties
Bron: PCWorld

Google heeft een budget beschikbaar gesteld voor een project van de Dublin City University dat als doelstelling heeft om handgeschreven teksten automatisch om te zetten naar zijn digitale equivalent. Het originele idee is afkomstig van professor Alan Smeaton, die de afgelopen tijd aan een technologie heeft gewerkt om objecten in video’s automatisch door computers te laten herkennen op basis van isolatie van de objecten en vergelijking met een database. Toen hij in een opwelling de technologie ook uitprobeerde op afbeeldingen van de geschriften van een voormalige president van de VS, George Washington, bleek dit goed te werken om ook woorden te herkennen.

Ingang Google-vestiging in DublinNa deze onverwachte toepassing te hebben laten vallen bij enkele medewerkers van de Google-afdeling in Dublin, werd de interesse van de zoekgigant gewekt. Enkele demonstraties later besloot het bedrijf het project te financieren, waardoor Smeaton een jaar lang op drie locaties drie ŗ vier onderzoekers kan betalen die zich bezig zullen houden met de verdere ontwikkeling van deze toepassing. Het doel is hierbij om aan te tonen dat de automatische herkenning van woorden in geschreven teksten functioneel en schaalbaar is. Google heeft daarbij het recht om de technologie op te kopen, maar niet om deze voor zichzelf te houden. Alan Smeaton zal de resultaten van het project daarom ook publiceren via de reguliere wetenschappelijke kanalen.

Manuscript monnikOpmerkelijk detail van de toepassing is dat sommige teksten van Ierse monniken uit de 12e eeuw zich beter lenen voor automatische woordherkenning dan meer recent schrijfwerk. Monniken waren bijzonder consequent in hun schrijfwijze, en besteedden veel aandacht aan elk karakter. Het werk van George Washington is daarom een grotere uitdaging voor de technologie, aldus Smeaton.

Moderatie-faq Wijzig weergave

Reacties (20)

Opmerkelijk detail van de toepassing is dat sommige teksten van Ierse monniken uit de 12e eeuw zich beter lenen voor automatische woordherkenning dan meer recent schrijfwerk. Monniken waren bijzonder consequent in hun schrijfwijze, en besteedden veel aandacht aan elk karakter. Het werk van George Washington is daarom een grotere uitdaging voor de technologie, aldus Smeaton.
De techniek kijkt waarschijnlijk voor een deel naar structuur, en dan kan ik wel begrijpen dat eeuwenoude stukken (toen schrijven nog een kunst was!) makkelijker vertaalbaar zijn dan hedendaagse brouwsels.

Als ik zie wat sommige docenten (academici!) bij ons op school fabriceren, zouden zij een lesje tekstructuur van die monnik wel kunnen gebruiken.
Tja, de monniken hadden destijds ook wat meer de tijd voor hun schrijfwerk dan wij vandaag de dag. Logisch dat ze netter schreven.
Was een monnikenwerk.
Was niet dat ze meer tijd hadden, maar dat ze dat er voor namen.
Denk dat elke brief van toen en eeuwen later secuur gedaan zijn.
Omdat het een belang had.
Daarbovenop komt dat monniken de bijbel overschreven, dan is het net nog iets belangrijker om een consequente schrijfstijl te hebben.

Modern drukwerk heeft ook een consequente stijl.
Ik geef ze de uitdaging om bv doop boeken van de kerken uit de 18de eeuw door hun tekst herkenning te halen.
Die geschriften zijn zelfs voor een gemiddeld mens vaak nauwelijks te lezen :)
"Gaat van nu tot 0"
Denk dat 0 wel voor het jaar 0 zal staan, terwijl ik denk dat de (wetenschappelijke) werken van daarvoor ook zeker zo interessant zijn. :P
Het jaar 0 bestaat helemaal niet... :7
Met het jaar nul duidt men aan dat iets ouderwets of waardeloos is
Ik hoop niet dat de schrijver dit bedoelt.
Quote uit Wikipedia:
Het nulpunt van onze jaartelling is dus "oud-en-nieuw" van de overgang van 1 v. Chr. naar 1 na Chr.
1--1=2?
Lekkere logica.
De bibliotheek van AlexandriŽ stamt uit ongeveer 300 v.Chr., de tijd van de PtolemaeŽn. Assurbanipals bibliotheek in Nineve is gesticht rond 650 v.Chr., Ramses II stichtte ergens in 1200 v.Chr. een bibliotheek in Thebe en Hammurabi had er waarschijnlijk al eentje in 1750 v.Chr. in Borsippa.

Beetje geschiedenis kan geen kwaad. 8-)

Edit: die biliotheek van Celsius in Efeze is helemaal niet gebouwd in 1300 v.Chr., maar tussen 110 en 135 v.Chr.
jaar nul zit gewoon tussen -1 en +1 in :)

Nou weet ik niet hoe oud de bibliotheek van Alexandrie was, maar de Celcius bibliotheek in Efeze (Ephesus) is van 1300 v Chr.
(niet dat er nog veel boeken van over zijn, maar er zullen in wetenschappelijke kringen nog wel aardig wat werken circuleren)
@ koffiedick
Nee, daar zit dus geen jaar tussen :).

Je hebt dus eerst het jaar -1, dan oud en nieuw, en dat zit je gelijk in jaar 1.

Het jaar 0 bestaat niet, maar het nul/beginpunt van onze jaartelling is gedefineerd als de jaarwisseling tussen -1 en +1 :).
o, ok, het leek me zo logisch dat er tussen -1 en +1 een jaar tussen zou zitten net als tussen 1999 en 2001 :)

Zelf reken ik in cycli van 400 jaar dan maakt een jaartje meer of minder niet zo uit en ....dat gaat me veel makkelijker af. ;)


* 786562 koffiedick


---
edit
@ Mix, je hebt helemaal gelijk met die naamgeving. De naam Celsus is van de Romeinse senator van Asia, de bouw is in 110 begonnen. De bibliotheek van 2 verdiepingen werd niet zomaar gebouwd maar omdat er meer dan 10.000 "boeken" aanwezig waren die een plaats moesten krijgen in een "echte romeinse bibliotheek".

Efeze was trouwens de op 1 na grootste stad van het romeinse rijk.

(jammer dat google nu pas begint ;) )
Het jaar 0 is onlogisch als je kijkt hoe de jaartallen gedefinieerd zijn:

Neem een bepaalde gebeurtenis (zeg, de geboorte van Jesus). De 365 dagen na deze gebeurtenis noem je 'het eerste jaar na christus' geboorte', ofwel 'jaar 1'. De 365 dagen voor deze gebeurtenis noem je 'het laatste jaar voor christus' geboorte', ofwel 'jaar -1'.

Zoals je ziet is er geen ruimte voor een jaar 0. Dit komt dus omdat de jaartelling rond een gebeurtenis is gedefinieerd, niet rond een bepaald jaar dat we vervolgens als 0 (of 1) definieren.

edit: @edwardd

misschien, maar dat maakt voor de definitie en origine weinig uit. we moeten het maar doen met de schatting die gedaan is toen de kalender ingevoerd werd. we kunnen moeilijk steeds de kalender een paar jaar opschuiven als er nieuwe schattingen bekend worden :)
Volgens mij is jezus ook in het jaar 7 vc geboren
Willen ze nou ook geschreven teksten in video's gaan herkennen dus?

Wordt pas echt interessant als ze spraakherkenning op video's toepassen en op basis daarvan video's indexeren _/-\o_
Wordt al gedaan in Nederland, kijk naar dit werk bij de universiteit van amsterdam:
http://staff.science.uva.nl/~cgmsnoek/research.html

En kijk naar het project MultimediaN dat door de Nederlandse overheid wordt gesubsidieerd bij verschillende instituten, bedrijven en universiteiten:
http://www.multimedian.nl/
Ja, maar dan mist alsnog de context, dan wordt Sex voor de Buch geinterpreteerd als documentaire of talkshow over sex etc. etc.
Yes, nu wordt het handschrift van de dokter eindelijk ontcijferd!
Mja, dus binnenkort kunnen spam-botjes ook de visual confirmation lezen .. lekker :(

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True