dinsdag 20 oktober 2020

Digitale archieven in de Cloud en CO2


zandkastelen of luchtkastelen?

Twee weken geleden -op vrijdag 9 oktober- was ik te gast in het programma van Bert van Leerdam, op de lokale Zeeuwse televisie, samen met de voorzitter van de Zeeuwse Milieufederatie, https://www.jenz-tv.nl/bert-en-zeeland-5 . Het gaat over de CO2-uitstoot van digitale informatie, opgeslagen in de Cloud. Per Terabyte is dat twee ton CO2 per jaar, en dat kun je weer compenseren door het aanplanten van 100 bomen. Het is een gecompliceerd vraagstuk, nu we steeds meer energie gaan gebruiken om onze digitale data toegankelijk te houden. Archiefselectie kan hier een belangrijke reductie teweeg brengen door ervoor te zorgen dat we alleen datgene bewaren, wat de moeite van het bewaren waard is, en overtollige verdubbelingen, concepten en onnutte data zo snel mogelijk vernietigen. 

Inmiddels ben ik gevraagd om te spreken op een KIA-presentatie, sessie 2 uit de webinarreeks “Toegankelijkheid organiseren”

Op dinsdag 17 november 2020 wordt vanuit de Kennisplatforms E-depot en Toegang tot data de tweede sessie georganiseerd uit de webinarreeks “Toegankelijkheid organiseren”. Ad van Heijst (VHIC), bevlogen en gepassioneerd spreker, neemt ons mee in zijn visie op archiefselectie en stelt daarbij kritische vragen!

Programma

  • 10.45 uur - Inloop in de Webex omgeving
  • 11.00 uur - Opening door de voorzitter
  • 11.05 uur - Ad van Heijst over de toegankelijkheid van data binnen en buiten het e-depot (inclusief ruimte voor vragen en discussie).
  • 12.25 uur - Afsluiting door de voorzitter
Uiterlijk 12.30 is de digitale bijeenkomst afgelopen.

Inhoud

Voor analoge archieven hebben we al een duidelijk beleid staan: we hebben vastgesteld wat we bewaren en wat we vooral niet bewaren. Denk aan de vernietigingslijsten, zodat de depots niet volstromen. Nu we steeds meer digitaal werken is de trend ontstaan om alles maar digitaal te bewaren. Het zonder selectiecriteria opslaan van ‘alle’ beschikbare data heeft echter nadelige consequenties voor de toegankelijkheid van de data, maar vooral ook voor het milieu. Archiefselectie vanaf de bron is daarom bittere noodzaak. Archiefselectie bij de bron begint met de invoering van een datamanagementbeleid. Ad van Heijst legt ons uit waarom archiefselectie voor digitale data noodzakelijk is en vraagt zich af of een e-depot wel de meest duurzame opslagmethode is voor digitale data.

Ad’s betoog heeft de subtitel “toegankelijkheid van data binnen en buiten het e-depot”. De strekking van het verhaal is dat we onszelf vanaf het begin af aan moeten afvragen:
  • Waarom willen we deze data opslaan?
  • Hoe willen we de data opslaan?
  • Hoe willen we de data toegankelijk houden?
  • Hoe lang willen we de data bewaren?
  • Hoe duurzaam is onze opslagmethode?
Om bij de kern deze keuzes te maken, raadt Ad aan om te beginnen met het opstellen van een datamanagementbeleid. Je moet hiervoor bij het ontwerp van de informatiesystemen beginnen en dus aan de voorkant van het proces zitten; daar waar de data ontstaat. Niet te onderschatten daarbij is de toenemende waarde van metadata voor records. Door gebruik te maken van de metadata die de reeds in gebruik zijnde systemen ons bieden, kun je met een minimale inspanning die metadata voor records creĆ«ren. Ad neemt ons mee door de metadata die straks al wordt meegenomen in het design van systemen, de minimale interne afspraken die hiervoor nodig zijn en hoe je deze meeneemt van de dynamische situatie naar het semi-statisch informatiebeheer. In het semi-statisch informatiebeheer ga je ontdubbelen en laat je de gegevens alvast ‘afkoelen’ alvorens je ze in bevroren, niet meer wijzigbare toestand in het e-depot opneemt. De data gaat dus door een trechter alvorens het in een e-depot belandt. Hij benadrukt hoe belangrijk het is om bij de ingest de metadata in het submission information package mee te nemen, zodat het archival information package, dat hierdoor ontstaat, steeds zonder gegevensverlies te migreren is naar andere systemen.

Dit alles kun je dus in beleid vormgeven. Daarbij is het goed om oog te houden voor de toekomst. Elke ambtenaar wordt zijn eigen archivaris. Dit betekent dat we niet alleen de processen als uitgangspunt moeten nemen, maar ook het netwerk aan mensen dat samenwerkt aan projecten. De belangrijkste informatie zit bij sleutelfiguren: zorg dat je die op tijd in beeld hebt. Als er een kunst is van het weggooien, zoals het rapport "De informatiehuishouding van het rijk in 2030"van FutureLab zegt, dan is er zeker ook een ‘kunst van het selecteren’ nodig, en niet te vergeten ‘de kunst van duurzaam bewaren’.

https://kia.pleio.nl/events/view/55815996/webinar-archiefselectie-voor-een-kern-zonder-ballast

Volgens Ad moeten er nieuwe technieken komen om informatie duurzaam op te slaan, de Cloud is voor hem geen oplossing; doemdenkers schatten dat in 2030, 30% van de totale energievoorziening gebruikt zal worden voor dataverkeer  en nu al verbruikt het internet 5 x meer energie dan heel BelgiĆ«, zie hier voor een  factcheck uit Knack.  

Eeuwig bewaren? Men is ermee bezig. In Spitsbergen, the Arctic World Archive,  https://arcticworldarchive.org/ , https://www.piql.com/updates/ en https://www.piql.com/githubs-code-now-stored-forever-on-piqlfilm/ .

Misschien een aardig onderwerp om met elkaar over van gedachten te wisselen en in organisaties een Data Minimizing Officer aan te stellen (ik noem hem maar even zo, omdat er ook al een Information en Security Officer rondlopen, ook zo een mooie Nederlandse naam....


Geen opmerkingen:

Een reactie posten