Digitaal geboren archief toegankelijk maken

Een voorbeeld

Tekst Migiza Victoriashoop en Ilse Rombout

Migiza Victoriashoop en Ilse Rombout zijn respectievelijkis hoofd Collecties projectleider Digitale Toegankelijkheid bij Stadsarchief Amsterdam

In 2025 hingen de vlaggen uit bij het Stadsarchief Amsterdam, omdat het eerste volledig digitaal geboren particuliere archief gepubliceerd werd in de raadpleegomgeving: het COVID-19-archief van de Vrije Universiteit (VU). Tot dan waren enkel archieven die in hybride vorm waren aangeleverd toegankelijk gemaakt. Een ietwat overdreven feeststemming? Wellicht. Maar het was geen sinecure om dit archief te publiceren. Hoe het allemaal gelukt is en wat ze ervan geleerd hebben, daar nemen Ilse Rombout en Migiza Victoriashoop de lezer in mee.

Voordat we de materie induiken, is het goed om te vermelden dat we de aanpak omschrijven vanuit de expertise van het ontsluiten van archieven. In dit voorbeeld is bij het ontsluiten de bulk van het werk verricht, waardoor dat het meest praktische perspectief vormt. Moet daar nog steeds de bulk van het werk plaatsvinden? Daar komen de auteurs verderop in het artikel op terug.

Corona als hotspot

De coronaperiode was een maatschappij ontwrichtende gebeurtenis. Reden voor het Stadsarchief om het vast te stellen als hotspot, en zich daarmee te committeren aan het opnemen van archieven hierover. Daarnaast was COVID-19 ook als hotspot vastgesteld door de Selectielijst Universiteiten en Universitair Medische Centra 2020. Hierdoor heeft de Vrije Universiteit (VU), waarvan het Stadsarchief Amsterdam de archieven beheert, actief informatie verzameld bij de faculteiten, College van Bestuur, crisisteam, etcetera. Hoewel de VU van oorsprong een bijzondere onderwijsinstelling is, hebben ze ervoor gekozen om zich te conformeren aan de Archiefwet en de selectiedocumenten voor het hoger onderwijs te gebruiken. Dit vormde een goede basis om corona-informatie te verzamelen en duurzaam te gaan bewaren. Denk aan beleidsstukken, mails, video’s. Ze zijn allemaal in een Microsoft Teamsomgeving geplaatst en vervolgens geordend. Daarbij is onderscheid gemaakt tussen formeel vastgestelde stukken – van onder andere de Raad van Toezicht – en de faculteiten en diensten.

Opnemen in de collectie of niet?

Daar hoeven we niet geheimzinnig over te doen. Het COVID-19-archief van de VU is opgenomen. Maar daar is wel wat aan voorafgegaan. Bij het Stadsarchief begint de reis van ieder particulier archief bij de verwerving. In dit stadium wordt bekeken of het toegevoegd zal worden aan de collectie. Idealiter nemen we in dit stadium meteen de aanlevereisen voor digitaal geboren archief door. In het kader van digitaal geboren stukken liepen we er tegenaan dat die kennis eerder voorhanden was bij de ontsluiters. Doordat zij al eerder te maken hebben gehad met het bewerken, beschrijven en in laten lezen van digitaal materiaal, hadden ze een beter beeld van waarnaar gekeken moet worden om te bepalen of de archieven voldoen. Reden om deze expertise al vroeg in te zetten, met als gevolg dat er inzicht kwam in de bestandsformaten (mov, msg, mp4), mappenstructuur (het aantal lagen en de ordening) en het werk dat er na het overdragen van het archief nog gedaan moest worden. De volgende stap was ervoor zorgen dat het archief op de juiste manier werd aangeleverd door de VU. Daarvoor vormden de aanlevereisen de leidraad. Van eerdere hybride archiveren leerden we dat er in twee zaken met name veel tijd gaat zitten. Om te beginnen de bestanden. Eerder is de originele ordening van het COVID-19-archief genoemd. Die houden we zo veel mogelijk aan.

Losse bestanden

Maar wat te doen met de losse bestanden? Als we de eenheid van verdeling willen aanhouden, is het noodzakelijk geen losse bestanden en mappen in één map te ordenen. Het kwam voor dat in submappen – naast mappen – ook losse bestanden zaten. Om deze op te kunnen nemen in het eDepot, moeten deze bestanden in een map op het laagste niveau geplaatst worden, zodat deze map vervolgens aan een inventarisnummer gekoppeld kan worden. Overigens zien we regelmatig dat bestanden met een reden niet in een map aangeleverd worden: het zijn vaak werkbestanden of conceptversies, te vernietigen materiaal. Door hier vooraf afspraken over te maken met de VU, konden we het archief veel sneller toegankelijk maken. Daarna kwam de metadata. Hiervoor maakten we gebruik van een Excelbestand waar de archiefvormer onder andere metadata kon invoeren. Hier zijn ook meteen de rubrieken, groepen en inventarisnummers toegevoegd. De combinatie van de bestanden en het Excelbestand zijn als ‘pakketje’ aangeboden aan het Stadsarchief. Ook dit zorgde voor tijdwinst. Bij ontvangst controleerde de ontsluiter of de ordening een samenhangende structuur heeft, er geen dubbelen, concepten, werkdocumenten, niet te openen bestandsformaten of anderszins te vernietigen materiaal tussen zat. Maar ook dat mappen of bestanden waar bijvoorbeeld privacygevoelige of informatie die anderszins niet openbaar gemaakt mag worden inzit, duidelijk aangeduid zijn. Ook is er gekeken of extra metadata nodig zou zijn om voldoende context te bieden voor de (onder)zoekers. Deze metadata zijn – in overleg met de archiefvormer – bij het ontsluiten toegevoegd. Hierna is het archief ‘doorgegeven’ aan de eDepotbeheerder, die ervoor gezorgd heeft dat de metadata en bestanden aan elkaar gekoppeld werden en vervolgens via de toegang zichtbaar werden in de raadpleegomgeving.

Wat hebben we geleerd?

Na een moment van vreugde, omdat het archief raadpleegbaar was, kwam de evaluatie. Het is goed bevallen om een ontsluiter zo vroeg in het proces mee te laten kijken. Dit gaf goed inzicht in de inhoud van en werk dat er gedaan moest voor het COVID-19-archief. Ook kwam naar voren dat meer kennis over het bewerken van digitaal geboren archieven ook al bij de verwerving onmisbaar is (hoeveel Gb, losse bestanden) om voor een goede aanlevering te zorgen. Als het ware moet in die fase meer met een bril van ontsluiting naar archieven gekeken worden, ontsluiting by design. De losse bestanden zijn al eerder ter sprake gekomen. Dat deze op het laagste niveau in mappen gestopt moeten worden, bleek erg onlogisch. Vaak werd teruggeven: deze bestanden zitten toch al in een map, namelijk de hoofdmap? Om die reden wordt nu gekeken of het mogelijk is om hier een andere oplossing voor aan te bieden en zo het aanleveren makkelijker te maken.

Recordmanagement-tool

Ook als het gaat om de metadata wordt gekeken of het aanleveren makkelijker gemaakt kan worden. Inspiratie hiervoor wordt ook gehaald uit de bewerking van digitaal geboren overheidsarchieven door het inzetten van een recordmanagement-tool, waarmee je eenvoudiger aangeleverde archieven kunt bewerken. Om digitaal geboren archieven nog sneller te kunnen publiceren, verkennen we ook echt nieuwe mogelijkheden. Idealiter lezen we simpelweg alleen de mappenstructuur in om vervolgens samen met de minimale metadata te publiceren. Dan nemen we genoegen met minder data, maar versnellen we het publicatieproces enorm. We zien ook een toekomst in het gebruik van AI om metadata geautomatiseerd te verrijken. Verder zijn er tijdens deze casus vragen naar voren gekomen waar op dit moment nog geen eenduidig antwoord op is, en daarmee ook nog geen gestelde eisen. Te beginnen met videobestanden die uit meerdere bestanden bestaan en de manier waarop deze aangeleverd moeten worden. Een oplossing zou kunnen zijn om deze als .zip op te nemen. De andere vraag gaat over mails met bijlages. Deze komen regelmatig voor, maar moeten die worden opgenomen? En tot slot de bulk van het werk bij dit archief dat bij het ontsluiten kwam te liggen. De komende periode wordt gekeken of door het toepassen van ontsluiting by design meer over het archief inzichtelijk gemaakt kan worden, zodat een betere inschatting van het werk mogelijk is en de archiefvormer beter wordt begeleid. In vergelijking met voorheen hebben we nu veel inzicht in wat er goed gaat en wat er beter kan. Maar er zijn ook nog vragen te beantwoorden. En dat gaat zeker gebeuren, want er staan nog meer digitaal geboren archieven te wachten, zoals de podcastserie van rapper SugaCane. Hopelijk kan onze aanpak inspireren of juist waarschuwen om op een andere manier met dergelijke archieven om te gaan. We zijn benieuwd!

Deel dit artikel

Inhoud