Een voorbeeld van een door de computer 'gelezen' document
NOS Nieuws

Computer gaat priegelige handschriften mega-archief VOC lezen

"'t eylant Formosa sal worden een cooren-schuyre voor onse Nederlantse buytencolonien", jubelde een VOC-functionaris in 1637, na een opsomming hoeveel handelswaar het eiland, tegenwoordig Taiwan, had opgeleverd. Zijn bevindingen, nu nog verstopt in het omvangrijke VOC-archief, worden samen met soortgelijke documenten veel makkelijker vindbaar: wetenschapsorganisatie NWO stelt 3,8 miljoen euro beschikbaar om de papierberg beter te ontsluiten. Onderzoek dat nu nog jaren kan duren, zal tot een muisklik worden teruggebracht.

In het VOC-archief zijn de documenten verzameld die de handelsorganisatie tussen 1602 en 1795 wereldwijd opstelde, van Amsterdam en Middelburg tot Azië en Afrika. De 25 miljoen pagina's, die ongeveer 4 kilometer archiefruimte innemen, zijn door Unesco opgenomen in de Memory of the World-index.

"Het is wereldwijd een van de grootste archieven met de meeste informatie over dit deel van de geschiedenis voor grote delen van de wereld", legt projectleider Matthias van Rossum uit. "Momenteel zijn de mogelijkheden om onderzoek te doen beperkt, maar dit project gaat barrières opheffen, zodat iedereen het van achter het bureau diepgravend kan onderzoeken."

Google voor de VOC

Nu moeten onderzoekers de gescande documenten in priegelig eeuwenoud Nederlands nog handmatig doorworstelen. Met de miljoeneninvestering wordt software ontwikkeld die dat voor hen kan doen: zoeken wordt zo bijna even makkelijk als op Google.

De nieuwe software gaat niet alleen leren de sierlijke handschriften in soms vervaagde inkt te lezen, het zal ook het oude Nederlands in begrijpelijkere zoekresultaten omzetten. Er is zo'n vijf jaar uitgetrokken om de software te ontwikkelen.

Het programma houdt er verder rekening mee dat veel namen destijds nog niet gestandaardiseerd waren: een wetenschapper die zoekt op Nagasaki moet van de computer automatisch ook alle vermeldingen voor Nangesaky, Nangesaqui, Nangazackij en Nagnasakij terugkrijgen.

Daarnaast willen de softwareontwikkelaars er rekening mee houden dat genoemde plaatsen regelmatig onder andere namen in de documenten voorkomen. Wie onderzoek doet naar Taiwan wil meteen alle resultaten hebben voor Formosa (zoals de Portugezen het eiland noemden) en Packan (zoals het in China heet). Deze veranderingen moeten handmatig worden ingevoerd, een karweitje waar een crowdsourcingproject voor wordt opgezet.

Veel toepassingen

In plaats van alle miljoenen documenten zelf door te moeten worstelen, kunnen onderzoekers zo met één vraag alles terugvinden over de 4785 schepen die uitvoeren, in beeld brengen hoeveel suiker, porselein of tot slaaf gemaakten werden vervoerd of details opvragen over een handelspost in een bepaalde tijd.

De verwachting is dat het makkelijk doorzoekbaar maken van die informatie niet alleen nieuwe inzichten oplevert over de Nederlandse geschiedenis, maar ook over die van Afrika en Azië. In veel gevallen behoort het koloniale archief namelijk tot de oudste bronnen over die regio's. De VOC-verslagen kunnen als nooit tevoren inzicht geven in economische relaties, onderlinge machtsverhoudingen en gebruiken of religies.

Het is verder de bedoeling dat niet alleen wetenschappers van het archief gebruikmaken, maar ook het grote publiek, bijvoorbeeld voor stamboomonderzoek. De software, die wordt ontwikkeld door het IISG, het Nationaal Archief, VU, Huygens ING en de KNAW, zal bovendien beschikbaar worden gesteld voor andere archieven, zodat ook die toegankelijk gemaakt worden.

Deel artikel:

Advertentie via Ster.nl