Onderzoekers van het Huygens Instituut voor Nederlandse Geschiedenis hebben 3,8 miljoen euro subsidie gekregen van wetenschapsorganisatie NWO voor het ontwikkelen van digitale handschriftherkenning om het omvangrijke Nederlandse VOC-archief inzichtelijk te maken.
Met het geld gaan de onderzoekers de papierberg van de VOC ontsluiten, zodat het hele archief dat de VOC tussen 1602 en 1795 opstelde, 25 miljoen handgeschreven pagina's, digitaal doorzoekbaar wordt. Met de subsidie gaat het Huygens Instituut onder leiding van projectleider Matthias van Rossum software ontwikkelen om de handgeschreven documenten te ontcijferen en het oude Nederlands lees- en doorzoekbaar te maken. Het project heet Globalise.
De software moet met behulp van handschriftherkenning en machinelearning de sierlijk geschreven woorden herkennen op de oude documenten en deze vertalen in modern Nederlands. Ook zal het programma automatisch moeten zoeken naar alternatieven voor namen, omdat die in die tijd nog niet gestandaardiseerd waren en het moet rekening houden met plaatsen die onder andere namen in de documenten voorkomen dan we ze nu geven, zoals Formosa en Packan voor Taiwan. Daarvoor moet de computer getraind worden om niet alleen woorden, maar ook context te begrijpen.
Met het onderzoek hoopt het instituut nieuw inzicht te krijgen over de Nederlandse geschiedenis, maar ook over die van Afrika en Azië. Het koloniale archief van de VOC behoort volgens de onderzoeker tot de oudste bronnen over die regio's en doordat dit archief zo omvangrijk is, is lang niet alles bestudeerd door onderzoekers. "Een van de problemen waar historici tegenaan lopen is simpelweg de omvang van het archief", legt Matthias van Rossum uit in een video van NWO. "Als historicus in je eentje heb je daar gewoon jaren voor nodig om vragen te beantwoorden."
Uiteindelijk is het niet alleen de bedoeling dat wetenschappers van de digitale tools gebruik kunnen maken, maar iedereen. De software wordt ontwikkeld door het IISG, het Nationaal Archief, de Vrije Universiteit, het Huygens Instituut en de KNAW en de software wordt ook beschikbaar gesteld voor andere archieven, zodat die ook toegankelijk worden.
Het is een van de zes projecten die van de NWO een grote subsidie krijgen. Zo krijgt de faculteit Bètawetenschappen van de Vrije Universiteit 4,8 miljoen euro voor een vernieuwd laboratorium voor isotopen, krijgt de Universiteit Twente 2,2 miljoen euro voor een laboratorium voor energie-materialen en krijgt de afdeling Astrofysica van de Universiteit van Amsterdam 1,5 miljoen euro voor nieuwe camera's voor de Cherenkov Telescope Array. Het Dutch Institute for Fundamental Energy Research krijgt 2,5 miljoen euro voor een laboratorium dat onderzoek doet naar wanden van vloeibaar metaal voor kernfusiereactoren, er gaat 1,5 miljoen euro naar het Radboudumc voor een elektronenmicroscoop voor dynamische vastlegging van biomaterialen en tot slot krijgt de Universiteit Leiden 3,2 miljoen euro voor een onderzoek om toxische stoffen te meten.