Terugblik op 25 jaar eDepot
Tekst Remke Verdegem
Remke Verdegem is productowner productgroep Overheid & Archieven bij het Nationaal Archief
Terugkijkend op de afgelopen 25 jaar kan de conclusie niet anders zijn dan dat het fenomeen eDepot een enorme ontwikkeling heeft doorgemaakt: van een systeem dat in eerste instantie bedoeld was om digitale informatie duurzaam op te slaan naar een belangrijke schakel in de complete archiefketen. Met de introductie van Artificial Intelligence (AI) breekt een volgend tijdperk aan. We staan echt aan het begin van een digitale revolutie in archievenland.
Nog voor ik iets met het digitaal archief deed, wees de Rekenkamer in 1987 in haar rapport Archiefbeheer en -behoud bij het Rijk al op het belang van MLG’s in archiefbeleid. MLG’s zijn Machine Leesbare Gegevensbestanden ofwel computerbestanden. De Rekenkamer stelde destijds vast dat departementen en de betrokken diensten geen duidelijk inzicht hadden in de omvang, de jaarlijkse groei en de kosten van archiefvorming. En dat nog onvoldoende was nagedacht over het bewaren van gegevensdragers zoals beeldplaten, floppydisks, computerbanden, enzovoort. Ruim 10 jaar later, in 1998, startte ik als applicatieadviseur bij Concerndiensten van de toenmalige Rijksarchiefdienst. Concerndiensten werkte voor alle rijksarchieven in de provincie, inclusief het Algemeen Rijksarchief in Den Haag, nu het Nationaal Archief. In die periode groeide het besef dat we een voorziening misten voor het duurzaam toegankelijk houden van digitale informatie. Om dit handen en voeten te geven werd begin 1999 gestart met het realiseren van een functioneel ontwerp van een zogenoemd digitaal depot, het Project Depot 2000. Aan het ontwerp werd een kleine 2 jaar gewerkt: in 2000 werd het opgeleverd en vastgesteld.
‘MET AI LIGGEN ANDERE OPTIES IN HET VERSCHIET, ZOALS DOCUMENTHERKENNING’
The National Archives
Het functioneel ontwerp werd bewust in het Engels opgesteld om het te kunnen laten reviewen door een aantal Europese nationale archieven, waaronder het toenmalige Public Record Office van Engeland (tegenwoordig The National Archives, TNA). Nadat dat gebeurd was, hadden we een zak met geld nodig om deze voorziening daadwerkelijk te realiseren. Onze inschatting was ongeveer 10 miljoen gulden. Ja, het was inderdaad nog in het guldentijdperk. Dat lijkt wellicht heel veel geld, maar vergeet niet: daar moest niet alleen een heel team van ontwikkelaars en testers van worden betaald, maar ook de hardware, waaronder servers en de opslag, de back-up en de uitwijk. Die financiële middelen waren toen helaas niet voorhanden, waardoor de plannen tijdelijk in de ijskast verdwenen. The National Archives van Engeland had inmiddels wel gevraagd of het gebruik mocht maken van ons functioneel ontwerp. Zeker, geen probleem! Intussen werd een aantal mensen van de Rijksarchiefdienst, onder wie ik, van 2000 tot eind 2003 gedetacheerd bij ICTU, een onpartijdige advies- en projectenorganisatie binnen de overheid. ICTU werkt vanuit de overtuiging dat ict de overheid vooruithelpt bij maatschappelijke vraagstukken. We werden ingezet voor het project Testbed Digitale Bewaring, een onderzoek naar mogelijke bewaarstrategieën (migratie, emulatie en de toepassing van XML) voor het duurzaam toegankelijk houden van tekstdocumenten, spreadsheets, e-mailberichten en databases.
Safety Deposit Box (SDB)
Na afloop van het ICTU-project werd de Rijksarchiefdienst opgeheven met als insteek dat de regionaal historische centra moesten verzelfstandigen, bijvoorbeeld door te fuseren met een gemeentearchief of een waterschap. Inmiddels werd de urgentie nog meer gevoeld om te beschikken over een digitaal depot. De departementen vroegen hoe om te gaan met digitale informatie die vroeg of laat moest worden overgebracht naar het Nationaal Archief. De nieuwe afdeling Digitale Duurzaamheid werd gevraagd een marktonderzoek uit te voeren om te kijken of er kant-en-klare systemen waren die we zouden kunnen inzetten als digitaal depot, al dan niet aangevuld met maatwerk. We zijn rond 2005 gaan kijken bij de Koninklijke Bibliotheek, bij het Stadsarchief Rotterdam en bij The National Achives van Engeland. Bij TNA zagen we een systeem (Safety Deposit Box genaamd, afgekort SBD) waar we erg positief over waren. Op zichzelf logisch: het was gerealiseerd op basis van ons functioneel ontwerp uit 2000, de applicatie waar wij als Nationaal Archief ook graag over zouden beschikken. We konden deze als overheidsinstelling helaas niet zomaar afnemen van de leverancier Tessella. Dus startten we een aanbesteding, binnen een bestaande mantel.
De offerte van Sogeti, met Tessella als ondernemer, kwam als beste uit de bus. Het mooie van deze constructie was dat Tessella verantwoordelijk was voor het ontwikkelwerk, terwijl Sogeti aan de lat stond voor het functioneel testen van de opgeleverde software. Deze aanpak pakte goed uit, want daarmee werd voorkomen dat de slager zijn eigen vlees keurde. Ik was de projectmanager van het project Digitaal Depot en kan mij de meer dan levendige “discussies” tussen de ontwikkelaars van Tessella en de testers van Sogeti nog helder voor de geest halen. Het project Digitaal Depot ging in het voorjaar van 2006 officieel van start. Het eDepot van het Nationaal Archief werd op 8 november 2009 feestelijk in gebruik genomen met een live uitplaatsing door de toenmalige minister van Binnenlandse Zaken en Koninkrijksrelaties, Guusje ter Horst.
‘DE EERSTE VERSIE VAN HET EDEPOT WAS NIET KLAAR VOOR DUURZAME TOEGANKELIJKHEID’
Van standalone naar keten-denken
Deze eerste versie van het eDepot was vooral gericht op het betrouwbaar opslaan van digitaal archief. En die was zeker nog niet klaar voor het waarborgen van de duurzame toegankelijkheid van digitale overheidsinformatie voor toekomstige generaties onderzoekers, wetenschappers en journalisten. Om dat te bereiken moest het eDepot onderdeel worden van de archiefketens. De eerste keten die we zouden opleveren was openbaar digitaal archief. Deze keten omvat zowel het verwerven, beheren als het beschikbaar stellen van born digital archief. Dus vanaf het maken van afspraken met de zorgdrager/archiefvormer over vorm en inhoud van het over te dragen archief en opname in het eDepot tot en met het duurzaam beschikbaar stellen van digitaal archief via de website www.nationaalarchief.nl. Op basis van een vastgestelde ketenarchitectuur werden koppelingen gerealiseerd met andere componenten/applicaties in diezelfde keten, zodat uiteindelijk een werkend geheel werd opgeleverd. Na die eerste keten werden ook andere ketens opgeleverd, waar het eDepot een onmisbare schakel in was. Denk aan de keten Beperkt Openbaar Digitaal Archief. Hier werd een aparte module (e-BOM = elektronisch Beperkt Openbaar Materiaal) voor gerealiseerd om beperkt openbaar digitaal archief (zowel born-digital als gedigitaliseerd) op de studiezaal na toestemming beschikbaar te stellen.
Volgende stap
AI of kunstmatige intelligentie bootst menselijke intelligentie na. Dat gebeurt met een computersysteem dat taken kan uitvoeren waar normaliter menselijke intelligentie voor nodig is, zoals spraak en het herkennen van beelden. In het archiefwezen wordt AI vooral gebruikt om handschriften en tekst machineleesbaar te maken en zo de zoekmogelijkheden te vergroten. Het ontcijferen van handschriften in archieven is vaak een flinke uitdaging. Om gescande historische documenten digitaal leesbaar en doorzoekbaar te maken ontwikkelde het KNAW Humanities Cluster de transcriptiesoftware Loghi. De software is als open source beschikbaar. Het Nationaal Archief en het KNAW Humanities Cluster werken samen om Loghi verder te ontwikkelen. Het kunnen beschikken over een tool is een ding. Het integreren in het bestaande applicatielandschap is een heel ander verhaal. De aanroep van Loghi is inmiddels ingebouwd in het maatwerkdeel van het eDepot en voorzien van een heus Transcriptie Management Systeem, waarbij de verschillende stappen van het transcribeerproces gevolgd kunnen worden. Ook zijn verschillende rapportages gerealiseerd, zodat de gebruiker kan verantwoorden wanneer wat is getranscribeerd en met welk resultaat.
‘VOOR EEN FUNCTIONEEL ONTWERP VAN EEN DIGITAAL DEPOT WAS 10 MILJOEN GULDEN NODIG’
Belangrijke schakel
Terugkijkend op de afgelopen 25 jaar kan de conclusie niet anders zijn dan dat het fenomeen eDepot een enorme ontwikkeling heeft doorgemaakt: van een systeem dat in eerste instantie bedoeld was om digitale informatie duurzaam op te slaan naar een belangrijke schakel in de complete archiefketen. Met als doel om digitale informatie duurzaam toegankelijk te houden door de jaren heen. Waarbij de integriteit en authenticiteit van de digitale informatie vanzelfsprekend gewaarborgd moeten worden en waarbij AI wordt ingezet om het beschikbaar stellen en het zoeken in de enorme berg van digitale informatie te optimaliseren c.q. te vergemakkelijken. Andere opties met AI liggen in het verschiet, zoals documentherkenning. We staan echt aan het begin van een digitale revolutie in archievenland.