vrijdag 11 oktober 2019

Ook gegevensopslag draagt bij aan CO2-uitstoot



Wat weegt CO2? Gewichten: Kura Hulanda, Curacao

Steeds meer mensen beginnen zich zorgen te maken over het klimaat. Daarbij doet zich al snel de vraag voor wat wij vanuit het taakveld informatievoorziening en -beheer kunnen doen om de opwarming van de aarde te voorkomen, of binnen de perken te houden.

Pas geleden was het volgende artikel te vinden in de NRC: https://www.nrc.nl/nieuws/2019/09/19/ook-onze-digitale-rotzooi-moeten-we-hoognodig-opruimen-a3973824 . Het artikel geeft aan welke problemen zich voordoen met de opslag van digitale gegevens, binnen en buiten de cloud. Want ook buiten de cloud kost opslag energie, hardware en software. Energie die ook weer afgevoerd moet worden, omdat datacentra worden gekoeld. Per terabyte komt de uitstoot van de energie die met de opslag samenhangt, neer op 2 ton CO2. Dat vond ik interessant, zeker in een tijd waarin een stroming binnen de archivarissen zegt dat we alles moeten bewaren, dus geen informatie meer moeten selecteren.

Wat is eigenlijk 1 ton aan CO2, wat moet je doen om een ton CO2 uit te stoten? Volgens de Climat Neutral Group, die wordt geciteerd op verschillende websites, staat 1 ton CO2 gelijk aan het volgende:
·       Het verbranden van 319 liter diesel, of 6.000 km rijden met een dieselauto
·       7x retour vliegen naar Parijs, vanuit Amsterdam, per passagier 
·       Het verbruik van 300 kilo standaard kantoorpapier
·       16.000 km reizen met de trein
·       1,5 jaar ademhalen 
En dat dan: maal 2, voor elke terabyte aan gegevens in de Cloud. 

Hoe raak je die CO2 weer kwijt? Wel, een groeiende boom neemt per jaar 20 kilo aan CO2 op. Om dus twee ton aan CO2 te compenseren, moet je honderd bomen planten. 
Dat is nogal wat. Een gemeente die jaarlijks de notulen van de raad op beeld opneemt, heeft al snel meer dan 30 Terabyte per jaar aan beeldmateriaal opgeslagen. Waarvan het Nationaal Archief wenst in haar richtlijnen dat we die eeuwig gaan bewaren.

Dus we blijven eeuwig 60 ton CO2 uitstoten voor de notulen van dat ene jaar, want elk jaar komt er weer 60 ton bij. Die we voor de eeuwigheid bewaren, zie https://vng.nl/files/vng/nieuws_attachments/2013/20131010-videotulen.pdf , net als onze websites en zelfs de e-mail van onze sleutelfunctionarissen (zie ook deze site)
En de plantsoenendienst krijgt er een nieuwe taak bij: per jaar planten zij 3.000 nieuwe bomen om de digitale opslag van de raadsnotulen van dat jaar te compenseren.

Eeuwig, dat is heel lang! Zet het u al wat aan het denken? 
Dan gaan we verder. Naast de boven aangehaalde gegevens die we -door weinig doordacht beleid- verplicht zijn om te bewaren, bestaat er binnen onze administraties een veelvoud van verschillende verschijningsvormen van dezelfde gegevens. Onderzoeken wijzen erop dat de digitale gegevens die een organisatie beheert, veel ROT data omvat: redundant, obsolete en trivial. Oftewel overtollig, overbodig en onbekend. 
De onnodige gegevens op de schijven binnen uw organisatie worden in verschillende onderzoeken geschat op tussen de 80 en 90%. Zij kunnen zonder bezwaar worden vernietigd; als dat zou gebeuren, dan heeft een organisatie daar dus geen negatieve gevolgen van. Al in 2012 waarschuwden Rosenthal c.s. in hun uitgebreide studie “The Economics of Long-Term Digital Storage” ervoor dat de modellen om de prijs voor commerciële opslag in de cloud te bepalen, niet bruikbaar zijn voor de lange termijn. In tegenstelling tot wat vaak wordt gezegd, nemen de kosten op termijn alleen maar toe, zie ook een studie van VHIC “Wat kost duurzame digitale opslag”. 
Reden te meer om maatregelen te nemen en overtollige, onnodige en onbekende gegevens aan een nader onderzoek te onderwerpen.
1. We moeten gaan kijken hoe we onze informatiehuishouding efficiënt gaan inrichten. Daar ligt de basis van het vakgebied documentaire informatievoorziening: het efficiënt inrichten van de informatiehuishouding zodanig dat informatie op het juiste moment, aan de juiste persoon of groep personen, in de gewenste vorm, tegen aanvaardbare kosten kan worden geleverd. 
2. Daarbij moeten we verdubbelingen zo veel mogelijk vermijden en er routine van maken om procesapplicaties, schijven, mailboxen e.d. regelmatig te ontdubbelen en te schonen. Dat moet vanuit de AVG, vanuit de wettelijk voorgeschreven selectielijsten, maar helpt dus ook mee om CO2-uitstoot te vermijden.
3. Als we informatie gedurende een lange termijn opslaan, dienen we goed na te denken hoe lang we de informatie nodig hebben, hoe we de essentie uit de informatie halen (dus: schonen!), op welke media we het residu laten en dienen we een goede kosten-batenafweging te maken. Je zou hierbij het rekenmodel digitaliseringskosten kunnen gebruiken,
4. We moeten eens goed gaan nadenken of we wel alle informatie digitaal toegankelijk willen maken via het web en of er geen betere alternatieven zijn voor opslag. Het aloude bekende microfilm bijvoorbeeld. Uit de tijd? Volstrekt niet. De Europese Commissie is bezig met een enorm microfilmproject, waarbij computeroutput op microfilm wordt geplaatst in een depot in Spitsbergen . Want inderdaad, het Arctic World Archive….. is geplaatst op microfilm. Niet alleen om het kostenaspect. “Uw data is offline opgeslagen en buiten bereik van cyberaanvallen. In een rampenbestendige opslagplaats in een van de meest geopolitiek veilige plaatsen ter wereld. Breng eens een digitaal bezoekje, al kost surfen over het net natuurlijk ook CO2. Verder geeft de NARA op haar website aan microfilm te blijven gebruiken als opslagmedium. En waarom? Omdat microfilm een medium is met lage kosten, hoge betrouwbaarheid, bewezen heeft honderden jaren mee te gaan, een gestandaardiseerd medium is. Digitale beelden daarentegen bestaan uit een grote variëteit aan machinecodes die via hardware en programmatuur pas zichtbaar gemaakt kunnen worden. Om te vermijden dat informatie onleesbaar wordt, zal deze de komende jaren zeer vaak opnieuw moeten worden geformatteerd. De opslag van microfilm vraagt uitsluitend om een koele, droge plaats. Ter geruststelling: microfilm is in een handomdraai te digitaliseren.
5. Kies nooit voor een strategie “one size fits all” want die werkt niet.

Als de opslag van een terabyte aan gegevens in de cloud gelijk staat aan twee ton aan CO2-uitstoot, wordt het dan geen tijd om serieus werk te gaan maken van het schonen van onze informatiehuishoudingen en afscheid nemen van al die overtollige extra terabytes die we beheren? Om ons bewaarbeleid veel kritischer onder de loep te nemen? Nu hebben we niet alleen de AVG/GDPR als stok achter de deur, maar ook de klimaatschade die wij, informatieprofessionals, laten voortduren door alles maar te bewaren en ons niet bezig te houden met het op orde brengen van onze procesapplicaties, zaak- en documentsystemen, schijven en mailboxen. Het gaat niet om een éénmalige actie, maar om structurele verbeteringen in de informatiehuishouding.

En zeg niet dat het niet kan. Gewoon een kwestie van beginnen.