Werken vanuit een gedeelde werkelijkheid?
DUTO-informatiemodel als Steen van Rosetta
Tekst Frank Smeets, Jasper Slob en Marjan Dik
Frank Smeets en Jasper Slob zijn adviseur kennisproducten bij het Nationaal Archief en Marjan Dik is projectleider informatiemanagement bij het Nationaal Archief
Het Nationaal Archief werkt aan een kennisproduct dat de samenwerking tussen informatiebeheerders en dataprofessionals eenvoudiger moet maken. Die twee groepen spreken niet altijd dezelfde taal. Deze taalkloof overbruggen? Het DUTO-informatiemodel zou een heel goede eerste stap kunnen zijn. Deze maakt deel uit van het Kennisproduct Duurzame toegankelijkheid van gegevens dat in december 2024 klaar zal zijn.
Het is het jaar 1822. Een Franse taalkundige springt een gat in de lucht. Hij heeft de code gekraakt die al eeuwenlang de geheimen van de Egyptische hiërogliefen verborg. Zijn sleutel? De Steen van Rosetta. Deze granieten steen werd door de troepen van Napoleon ontdekt tijdens diens Egyptische veldtocht. Op de steen staan teksten in verschillende talen en drie schriftsystemen: het hiërogliefenschrift, het Egyptische demotische schrift en het Oudgrieks. De verschillende schriften vertellen hetzelfde: een dankbetuiging van priesters aan farao Ptolemaeus V. Jean-François Champollion, de Fransman die de grondlegger van de egyptologie zou worden, besefte dat het om steeds dezelfde tekst ging. Door het oude Egyptische schrift te vergelijken met het wel bekend gebleven Oudgriekse alfabet, kon hij de hiërogliefen ontcijferen. En daarmee ook talloze andere teksten in dat schrift.
Complex probleem
Zonder nu te willen beweren dat wij ons voor een even complex probleem gesteld zien als Champollion destijds, is er toch een zekere overeenkomst met de werelden van informatie- en gegevensmanagement. In beide werelden bedoelt men vaak hetzelfde en streeft men dezelfde waarden en doelen na. Toch wordt dit in de praktijk niet altijd herkend. Alsof de ene partij zijn gedachten heeft opgetekend in hiërogliefen terwijl de ander zich heeft bediend van het Oudgrieks. Dat leidt tot onduidelijkheid over de relatie tussen Duurzame toegankelijkheid (DUTO) van overheidsinformatie en het beheren van gegevens. In de wereld van gegevensmanagement heerst bijvoorbeeld nog regelmatig de gedachte dat pas op het einde van de levenscyclus met archivering rekening gehouden moet worden. Of dat het alleen opgaat voor verschijningsvormen van informatie die eenvoudig leesbaar zijn voor mensen zoals MS-Office-documenten, pdf ’s en e-mails. De verwarring zit dan in de interpretatie van wat archivering betekent.
‘DE GRONDSTOF VOOR GEGEVENSMANAGEMENT EN INFORMATIEBEHEER IS DEZELFDE’
Een grondstof
De afstand tussen informatiebeheer en gegevensmanagement heeft een aantal oorzaken. Zo hebben de vakgebieden beide hun eigen ontstaansgeschiedenis en daardoor een eigen taalgebruik en methodieken. Ze zijn weliswaar inhoudelijk steeds dichter naar elkaar gegroeid, maar vaak zonder dat de professionals dat zelf beseften. Het vakgebied van informatiebeheer kent een voorgeschiedenis die geworteld is in een papieren wereld. Archivering vond veelal buiten de primaire en secundaire processen plaats. De archivering betekende daarbij meestal een verplaatsing van informatie uit een werkomgeving naar een omgeving onder beheer van archiefmedewerkers. De kantoorautomatisering zorgde voor toenemende digitalisering, maar de taakopvatting bleef nog steeds gebaseerd op oude werkwijzen. Een DMS werd bijvoorbeeld vaak niet anders gebruikt dan het fysieke archief en de focus lag voornamelijk op de documentaire neerslag van de informatie. Bij een financieel systeem dacht men misschien wel aan de facturen die in een DMS konden worden opgeslagen maar niet altijd aan de onderliggende databases met de journaalposten en de balansen.
Duurzaam toegankelijke gegevens
De afstand tussen informatiebeheer en gegevensmanagement heeft een aantal oorzaken. Zo hebben de vakgebieden beide hun eigen ontstaansgeschiedenis en daardoor een eigen taalgebruik en methodieken. Ze zijn weliswaar inhoudelijk steeds dichter naar elkaar gegroeid, maar vaak zonder dat de professionals dat zelf beseften. Het vakgebied van informatiebeheer kent een voorgeschiedenis die geworteld is in een papieren wereld. Archivering vond veelal buiten de primaire en secundaire processen plaats. De archivering betekende daarbij meestal een verplaatsing van informatie uit een werkomgeving naar een omgeving onder beheer van archiefmedewerkers. De kantoorautomatisering zorgde voor toenemende digitalisering, maar de taakopvatting bleef nog steeds gebaseerd op oude werkwijzen. Een DMS werd bijvoorbeeld vaak niet anders gebruikt dan het fysieke archief en de focus lag voornamelijk op de documentaire neerslag van de informatie. Bij een financieel systeem dacht men misschien wel aan de facturen die in een DMS konden worden opgeslagen maar niet altijd aan de onderliggende databases met de journaalposten en de balansen.
Duurzaam toegankelijke gegevens
Dit betekende dat dat de professionals in een organisatie die werkten met gegevens uit velerlei bedrijfssystemen, hun collega’s van informatiebeheer zelden troffen bij hun werkzaamheden. De focus van gegevensmanagement ligt ook meer op het in kaart hebben van de informatiebehoefte van de organisatie en stakeholders en hoe de organisatie daarin te ondersteunen, dan op het beheer van gegevens. De grondstof is voor gegevensmanagement en informatiebeheer echter dezelfde. De wereld van informatiebeheer heeft gaandeweg werkwijzen omarmd die aansluiten bij de vraagstukken in de digitale wereld. Het concept van archiveren by design1 is daar een goed voorbeeld van. Informatiebeheerders doen hun werk hiermee steeds meer aan de voorkant van het bedrijfsproces en werken daarbij steeds meer samen met andere vakmensen, zoals dataprofessionals. Het DUTO-raamwerk dat op dit moment wordt geactualiseerd, dient daarbij als een instrument.2 Vermijden van spraakverwarring is daarbij essentieel. Het Kennisproduct Duurzame toegankelijkheid van gegevens van het Nationaal Archief wil daarin voorzien met onder andere een gesprekswijzer om handvatten te bieden en elkaars taal te begrijpen, maar ook met een volwassenheidsmodel en overzicht van best practices.
‘HET VERMIJDEN VAN SPRAAKVERWARRING IS ESSENTIEEL’
DUTO-informatiemodel
De kern van de gesprekswijzer is het DUTO-informatiemodel. Dat model beschrijft de objecten die tot overheidsinformatie behoren. Met dit model kun je bijvoorbeeld de veelgestelde vraag beantwoorden of ruwe gegevens onder het regime van de Archiefwet vallen. Het geeft weer hoe (ruwe) gegevens deel uitmaken van overheidsinformatie en dat hiervoor ook de vereisten van duurzame toegankelijkheid van toepassing zijn. Bepalend is het feit dat ze zijn gecreëerd of ontvangen als onderdeel van de taakuitoefening van een overheidsorgaan.3 De vraag of het om informatie of gegevens gaat, is in het kader van duurzame toegankelijkheid niet relevant. Gegevens verschijnen namelijk niet zomaar uit het niets. Het gebruik van een gegeven kan tijdens zijn levenscyclus veranderen, maar nooit het feit dat het om overheidsinformatie gaat. Heel scherp gesteld: vanuit het perspectief van duurzame toegankelijkheid is die definitiekwestie een zijpaadje dat de aandacht afleidt van het eigenlijke vraagstuk: hoe realiseer je duurzame toegankelijkheid?
Datawarehouse
Denk bijvoorbeeld aan gegevens zoals die in een datawarehouse voor analyse gebruikt worden. De bewaartermijnen in de bronapplicatie die de gegevens levert, zijn vaak wel bekend, net als die van de verrijkte eindproducten die de organisatieonderdelen afnemen. Over het archiveren en beheren van de gegevenssets in een datawarehouse ontstaat echter nog weleens discussie. Beheermaatregelen worden daarbij niet altijd vanuit het perspectief van duurzame toegankelijkheid genomen, maar technisch beargumenteerd. De waarden in een database worden dan bijvoorbeeld bij een nieuwe import overschreven omdat het bewaren van alle oude gegevens het systeem behoorlijk kan vertragen. De gegevenssets in het datawarehouse zijn zelf net zo goed overheidsinformatie en vallen daarmee onder de Archiefwet. De context waarin het gegeven gebruikt wordt is weliswaar anders dan in de bron en het eindproduct; het heeft nog steeds een functie binnen het handelen van het overheidsorgaan. Het kan daarmee ook van belang zijn om het handelen te reconstrueren. Ook wanneer een besluit verantwoording vereist, kan het noodzakelijk zijn terug te grijpen op de informatie die de basis vormde voor de onderbouwing daarvan. En daarmee ook de gegevens die ooit hebben geleid tot een analyse. Dat kan dus betekenen dat oude gegevens toch bewaard moeten worden in overeenstemming met een bewaartermijn uit de geldende selectielijst. Of op zijn minst dat er een mechanisme bestaat om gebruikte gegevens te herleiden (bijvoorbeeld in de oorspronkelijke bron) wanneer dat nodig blijkt te zijn.
Afwegen en afstemmen
Voor de benodigde maatregelen om gegevens duurzaam toegankelijk te maken bestaat geen one-size-fits-all-oplossing. Deze kunnen alleen bepaald worden als alle stakeholders zijn meegenomen bij het inrichten van een informatiesysteem en alle belangen worden afgewogen. De belanghebbenden zijn uiteraard de eindgebruikers, maar ook al de vakgebieden in het i-domein, zoals privacy officers, security officers, dataspecialisten en informatie-beheerders. Als alle belanghebbenden in beeld zijn, bepaal je wie verantwoording draagt voor de gegevens in de verschillende stadia van het proces, hoe het gebruik van de gegevens daarin verandert en hoe het DUTO-raamwerk daarbij toegepast kan worden. Bij die afstemming kan verwarring ontstaan over de gebruikte begrippen en reikwijdte van DUTO. Waar de informatiebeheerder ruwe gegevens ziet als een onderdeel van een informatieobject, kan de dataspecialist die zien als een dataset die nog een transformatie moet ondergaan om de kwaliteit te verbeteren. Dan helpt het om terug te grijpen op instrumenten in het kennisproduct DUTO-gegevens, zoals een gesprekswijzer en een informatiemodel. Als een soort Steen van Rosetta, met sleutels om elkaars taal te begrijpen. Zo werken beide partijen vanuit een gedeelde werkelijkheid. Het werkt daarnaast ook een stuk efficiënter om niet elke keer discussies te voeren die afleiden van het zoeken naar mogelijke oplossingen.
- Handreiking archiveren by design | Nationaal Archief[303917870].
- DUTO-raamwerk | Nationaal Archief.
- Archiefwet 1995, artikel 1c, lid 1.