eDepot by design
Werken voor de eeuwigheid vraagt plan voor de toekomst
Tekst Wietse Bakker en Bram Klapwijk
Wietse Bakker is informatieadviseur en informatiemanager en Bram Klapwijk is informatieadviseur, beiden bij het Regionaal Archief Zuid-Utrecht
In 2021 staat het Regionaal Archief Zuid-Utrecht (RAZU) aan de vooravond van een Common Ground-aanpak voor het eDepot. Op het moment van schrijven zijn we met die aanpak halverwege. En we kunnen wel zeggen dat we mooi op schema liggen.
Duurzame toegankelijkheid, archiving by design en het nadenken over het splitsen van opslag en gebruik zijn hot topics in ons vakgebied. Dat nadenken doen we niet enkel vanuit een softwareperspectief maar juist voor maatschappelijke meerwaarde in de vorm van erfgoed en hoogwaardige herbruikbare informatie, en voor meer transparantie en betrouwbaarheid van de overheid. Maar hoe gaat dat in zijn werk, als je vanaf nul begint met deze idealen? Dat start bij het erkennen van de realiteit dat nog lang niet alle randvoorwaarden klaarliggen om gebruikt te worden. We werken daarom al sinds de start vanuit een tweesporenbeleid: 1) realisatie van een eDepot voor het RAZU op basis van componenten met inachtneming van zo veel mogelijk Common Ground-principes en 2) de samenwerking opzoeken om tot standaarden te komen die binnen Common Ground omarmd kunnen worden. Hierover zo meer.
Tabula rasa
Omdat we voor ons eigen eDepot zijn begonnen met een tabula rasa is archiving by design bij uitstek toepasbaar in ons traject. Dat betekent dat we een informatiearchitectuur hebben gemaakt op basis van de geldende landelijke architecturen en onze eigen visie op archivistiek. Daarnaast bevat de architectuur een eerste ontwerp van de verschillende componenten die wij verwachten te zien in een eDepot. Vanuit deze architectuurplaat bepaalden we vervolgens een begin- en tussentijds eindpunt, een zo geheten minimal viable product. Een goed ingerichte “onderkant”, met duidelijke informatiemodellen en metadata, leek ons het juiste startpunt. Al tijdens het opstellen van de architectuur hebben we besloten dat we onze metadataopslag op basis van linked data gaan opstellen en opslaan. De aanschaf van een triple store was daarmee de meest logische eerste stap. We hanteren hier, by design, een aantal belangrijke uitgangspunten:
- We behouden altijd het originele metadatabestand, zoals een XML-bestand of JSON-bestand. Deze slaan we op in de bestandsopslag. De metadata worden hieruit geëxtraheerd en als raadpleegbare, beheerbare en uitwisselbare afgeleide in de triple store opgenomen. Op deze manier kunnen we altijd het origineel aanbieden of zelf hergebruiken.
- We werken zo strikt mogelijk volgens landelijke en internationale standaarden. Door weinig tot geen eigen interpretaties of aanpassingen toe te passen, zijn onze data altijd te begrijpen en te ontsluiten volgens de standaarden op basis waarvan we ze hebben opgeslagen. Denk hierbij aan MDTO, PREMIS en Records in Contexts, in de toekomst uitgebreid met domeinspecifieke metadata zoals ORI en STOP/TPOD.
- We zorgen voor een flexibele en adaptieve ontsluiting. Koppelen via REST-API is een vereiste, maar daarnaast kunnen we met SPARQL-endpoints de uitwisseling van onze informatie op maat maken voor afnemers, zonder dat hier een uitgebreid en ingewikkeld koppelingsproces aan onze kant voor nodig is. Een gemeente kan op basis van MDTO-velden bepalen welke informatie ze snel tot haar beschikking wil hebben en een museum kan op basis van Records in Contexts informatieobjecten selecteren voor een tentoonstelling.
- Openbare informatie is direct openbaar en herbruikbaar. De triple store heeft een publiek toegankelijke portal waar alle openbare metadata direct toegankelijk zijn. Hoewel niet geschikt voor de gemiddelde gebruiker biedt dit component de data-gebruikers (bijvoorbeeld wetenschappers en journalisten) een directe toegang.
De triple store is onze centrale plek voor het informatieobjectenbeheer, zoals Jumelet het beschreef in zijn artikel over de nieuwe werkomgeving van het rijk. Daar hoort nog wat bij: objectopslag en beheersacties. Op het moment van schrijven is de inkoop van onze bestandsopslag, een ruwe object storage op basis van REST-API’s en het standaard S3-protocol, bijna afgerond. Dit component zal nauw samenwerken met de triple store, maar ook op basis van de metadata uit de triple store direct te benaderen zijn voor andere componenten. Hiermee werken we concreet aan de scheiding van opslag en gebruik: als een applicatie weet waar het informatieobject zich bevindt dan kan het, uitgaande van de juiste autorisaties, zonder tussenkomst van de overige componenten direct bij het informatieobject. De beheersmatige kant, het actief beheren en preserveren van digitale informatieobjecten, wordt in het komende jaar nader uitgewerkt en ingekocht. Dit doen we mede op basis van (inter)nationale standaarden voor preservering en archiefbeheer.
Blijven leren
Een traject als dit komt met veel kansen, maar ook met uitdagingen en leermomenten. Soms volgen deze leermomenten wekelijks, waardoor eerdere inzichten weer snel bijgesteld moeten worden. Enige flexibiliteit in het uitvoeringsproces is daarom wel nodig. Dat hebben we gelukkig voorzien met een agile werkwijze. Dit brengt ook veel nieuwe inzichten die we graag delen. Neem de competenties voor het uitvoeringstraject nu en het daadwerkelijke gebruik in de toekomst. Niet leunen op een leverancier voor je metadata-inrichting, maar zelf inrichten en daarbij uitgaan van (inter)nationale standaarden vereist diepe kennis over deze standaarden en de vertaling daarvan naar praktische informatiemodellen. Voor een goed gebruik van de triple store is begrip van linked data daarnaast noodzakelijk en is basiskennis programmeren zeer aan te raden voor zowel de inrichting van componenten alsook het omzetten van metadata naar de standaarden in linked data. Een andere, nog lastig in te schatten uitdaging, is het managen van de verschillende leveranciers. We streven naar zo min mogelijk koppelingen en maatwerk is een woord dat wordt geschuwd, toch zullen bijvoorbeeld updates in de ene component impact gaan hebben op de koppelingen met de andere component. Hoewel we hierover afspraken maken met leveranciers zal de proef pas op de som worden genomen zodra de situatie zich voordoet.
Samen ontwerpen
Samenwerken is meer dan enkel met de eigen gemeenten en leveranciers sparren over inrichting en ingebruikname. Voor het werken onder een architectuur en vanuit de visie Common Ground is een semantische en syntactische interoperabiliteit van levensbelang. Hiermee voorkomen we dat wat wij nu samenstellen een silo op zichzelf wordt. We werken hier vanuit ons realisatietraject sowieso aan, maar hebben een groep collega’s bij het Utrechts Archief, RHC Vecht en Venen en Regionaal Archief Rivierenland bereid gevonden om hier vanuit de archiefsector ook een rol in te nemen. Deze kerngroep Duurzame Toegankelijkheid en Common Ground werkt aan de principes en eisen voor voorziening(en) voor borging van duurzame toegankelijkheid binnen de informatiekundige visie Common Ground en bestaande referentiearchitecturen. In de praktijk werkt de groep samen aan een gemeenschappelijke interpretatie van (deel)toepassingen van duurzame toegankelijkheid die op een herbruikbare wijze worden gedeeld. Archiving by design pur sang dus, met resultaten die zowel archiefvormer als archiefbeheerder extra handvatten moeten geven voor de invulling van dit principe in hun eigen organisatie en informatielandschap. De kerngroep is op dit moment in een afrondende fase van de mapping van MDTO op PREMIS, de metadatastandaard voor digitale preservering. Zodra de mapping voltooid is, wordt deze voor een publieke review aangeboden.
Actieve houding
Archiving by design vraagt om een actieve houding van de informatieprofessional, ook als deze professional werkt bij een archiefdienst! Je hoeft niet vanaf nul te beginnen om je hiermee bezig te houden, ook bij bestaande eDepot-oplossingen loont het om met de archiefvormer en eindgebruiker al op voorhand by design te werken. Werken voor de eeuwigheid vraagt immers om een goed plan voor de toekomst.