Hoe houd je zelflerende algoritmes duurzaam toegankelijk?
De broncode voorbij
Tekst Frank Smeets
Frank Smeets is adviseur kennisproducten bij het Nationaal Archief
Het Nationaal Archief ontwikkelt een handreiking voor het duurzaam toegankelijk maken en houden van algoritmes. Deze geeft gebruikers informatie over waarom dit onderwerp belangrijk is. En biedt praktische handvatten hoe zij dat kunnen aanpakken.
Wat is de zin van het bestaan? Deze vraag wordt niet alleen door het merendeel van de mensheid gesteld. In het sciencefictionboek The Hitchhiker’s Guide to the Galaxy ook door hyperintelligente pan-dimensionale buitenaardse wezens. Zij proberen antwoord op die vraag te krijgen door het ontwikkelen van een supercomputer met de naam Deep Thought. Het is een ingewikkelde vraag, dus de toegepaste kunstmatige intelligentie (AI) vereist enige rekenkracht en tijd. Maar na 7,5 miljoen jaar rekenen komt eindelijk het antwoord: de zin van het bestaan is 42. Resultaat: diep teleurgestelde hyperintelligente pan-dimensionale wezens. Teleurstelling of niet, zo hyperintelligent als de pan- dimensionale wezens zijn, vinden ze de kink in de kabel. Het blijkt dat de oorspronkelijke vraagstelling niet deugde. En de juiste vraagstelling, dat is de sleutel tot succes. Alleen dan kun je AI op een vruchtbare manier toepassen. Overigens, dat ze de prompt na 7,5 miljoen jaar nog konden achterhalen, mag best een aardig staaltje duurzame toegankelijkheid worden genoemd. Maar hoe maak je het dan duurzaam toegankelijk? Kunstmatige intelligentie is een geavanceerde toepassing van algoritmes. Het gebruik van deze algoritmes neemt steeds meer toe, ook bij de overheid. Dit heeft impact op de overheidsinformatie die met algoritmes wordt gecreëerd. En op de wijze waarop die informatie moet worden verantwoord. Het duurzaam toegankelijk maken van algoritmes is daarvoor een voorwaarde. Ook om te kunnen voldoen aan wet- en regelgeving, zoals de Europese AI-verordening en de AVG.
Broncode
Betekent het duurzaam toegankelijk maken van algoritmes alleen het bewaren van de broncode van een algoritme? Dat is niet het geval; het gaat om meer dan dat. Het gaat uiteindelijk om het kunnen verantwoorden van de informatie die door de overheid is gebruikt bij het uitvoeren van een wettelijke taak. En die met gebruik van een of meerdere algoritmes is gecreëerd. Daarvoor is het belangrijk om naar de hele levenscyclus van een algoritme te kijken. Daarbinnen worden de maatregelen getroffen om algoritmes op verantwoorde wijze te kunnen gebruiken. De informatie over deze maatregelen is ook vaak van belang voor duurzame toegankelijkheid. Het algoritmekader van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) onderscheidt hierbij in totaal acht fases. Dat begint bij de fase van de probleemanalyse. Hierin wordt onderzocht welk probleem het algoritme moet oplossen. Tot en met de laatste fase: de uitfasering.
‘HET IS BELANGRIJK OM NAAR DE HELE LEVENSCYCLUS VAN EEN ALGORITME TE KIJKEN’
Soort algoritme
In de genoemde fase van de probleemanalyse kun je bij de te archiveren informatie denken aan het volgende voorbeeld. Een toets die is uitgevoerd om bij een hoogrisicoalgoritme te kunnen bepalen of er grondrechten worden geschonden. Bij de latere beheerfase gaat het bijvoorbeeld om logbestanden waarmee gebeurtenissen worden geregistreerd die van invloed zijn op de werking. Ook het soort algoritme speelt een rol. Het kan betekenen dat een broncode gearchiveerd moet worden. Maar dat hoeft zeker niet altijd het geval te zijn. De broncode zal niet bij elk model nuttig zijn om te archiveren, als het überhaupt al gedownload kan worden. De trainingsdata waarmee het bijgetraind wordt, kan wel weer noodzakelijk zijn om een resultaat te kunnen reproduceren. Maakt een algoritme gebruik van een feedbackloop, dan is het van belang te kijken naar de output die wordt gemaakt.
Passende maatregelen
De maatregelen voor duurzaam toegankelijke algoritmes moeten net als bij andere overheidsinformatie passend zijn. Het ene algoritme is het andere niet. De doelen waarvoor algoritmes gebruikt worden verschillen. En daarmee ook de impact die ze kunnen hebben op de organisatie en maatschappij. Het nemen van passende maatregelen doe je met een risicobeoordeling. Wanneer de duurzame toegankelijkheid van de algoritmes niet op orde is, leidt dat tot risico’s op het gebied van publieke waarde, legitimiteit en organisatie. Door deze risico’s te wegen, kun je bepalen welk niveau van maatregelen proportioneel is in verhouding tot de impact die het gebruik van het algoritme voor duurzame toegankelijkheid heeft. De maatregelen kunnen op basis van de risico’s ook worden geprioriteerd. Het kan er zelfs toe leiden dat het passend is om geen maatregelen te nemen, als er slechts kleine risico’s zijn op het gebied van duurzame toegankelijkheid. Het management dat verantwoordelijk is, heeft dan de keuze om een risico op onderbouwde wijze te accepteren.
‘BINNEN HET ALGORITMEKADER LIGT DE NADRUK OP VERANTWOORD EN INTEGER GEBRUIK’
Handreiking
Het Nationaal Archief ontwikkelt een handreiking voor het duurzaam toegankelijk maken en houden van algoritmes. De handreiking DUTO-algoritmes is onderdeel van een groeiend aantal kennisproducten rondom het DUTO-raamwerk. Deze kennisproducten belichten specifieke toepassingen van duurzame toegankelijkheid van overheidsinformatie. De ontwikkeling ervan gebeurt in samenwerking met het werkveld. Onder andere met een redactiegroep bestaande uit experts die qua kennis en functie een representatieve vertegenwoordiging vormen. En die werken bij verschillende overheidsorganisaties. De handreiking DUTO-algoritmes is deels informerend. Dit met het oog op medewerkers bij de overheid die nog niet met duurzame toegankelijkheid van informatie bekend zijn. Daarnaast biedt het praktische handvatten aan informatieprofessionals om duurzame toegankelijkheid van algoritmes te realiseren. Naar verwachting wordt de handreiking in het voorjaar van 2026 afgerond. Gezien de snelle ontwikkeling van het onderwerp wordt de handreiking daarna ook actief beheerd om actueel te blijven.
Open source
Met de handreiking willen we ook zo veel mogelijk aansluiten bij het Algoritmekader van het ministerie van BZK. Het Algoritmekader is een hulpmiddel voor overheden die algoritmes gebruiken. Je vindt er wetten, regels, hulpmiddelen en vereisten en maatregelen. Binnen het Algoritmekader ligt de nadruk op verantwoord en integer gebruik van algoritmes. Het gaat daarbij onder andere om vragen zoals: wie is waarvoor verantwoordelijk, hoe voorkom je discriminatie (bias) en welke inkoopvoorwaarden spreek je af met externe partijen? De informatie in het Algoritmekader komt open source tot stand via GitHub. Dat wij, noch de buitenaardse wezens uit The Hitchhiker’s Guide to the Galaxy, er ooit in zullen slagen om de vraag over de zin van het bestaan te beantwoorden is onwaarschijnlijk. Maar het duurzaam toegankelijk maken van de gebruikte AI moet met de handreiking DUTO-algoritmes wel gaan lukken. Heb je vragen over deze of andere handreikingen, dan kun je deze stellen via het contactformulier op de website van het Nationaal Archief via https://ap.lc/zJKHs.