woensdag 28 december 2022

Public Spaces- eigen baas op het internet

 

De Mondothèque. Tekening gemaakt door Paul Otlet, l'Homme qui voulait classer la monde

Hoe afhankelijk is de overheid van haar leveranciers? Teams, OneDrive en SharePoint lijken door de Nederlandse overheid onveilig verklaard voor het Rijk en onderwijsinstanties, maar zijn dit niet.[1] Eerder waren er bezwaren tegen Google Workplace maar na het aanbrengen van de gewenste wijzigingen mag dit officepakket door de overheid wel weer gebruikt worden.  Frankrijk verbood echter dit jaar onderwijsinstellingen om gebruik te maken van Microsoft 365 en Google Workplace. En onlangs volgde Duitsland met een verbod op het gebruik van Microsoft Office 365 voor overheden.

In Nederland voerde Berenschot een onderzoek uit naar het gebruik van open source software door het Ministerie van BZK. Er is immers een Kamerbrief van 17 april 2020 die aangeeft dat de overheid haar broncode van open overheidssoftware actief openbaar moet maken. Dat komt omdat ook de broncode van software overheidsinformatie is en daarmee valt onder bereik van de Woo. Dit betekent dat

- de overheid open software uit eigen beweging openbaar moet maken, mits dit zonder onevenredige inspanning mogelijk is;

- de overheid hergebruik van de broncode zo veel mogelijk moet faciliteren;

- dus moet er een duidelijke licentie zijn met ieders rechten en plichten aangaande de broncode. 

Hierop zijn uiteraard uitzonderingen, die in de Woo worden genoemd: andere uitzonderingen zijn er niet.

Verder is er nog de Wet hergebruik overheidsinformatie die bedoeld is om de openheid en het hergebruik van gegevens, die door organisaties met een publieke taak worden beheerd, te verbeteren. Sinds 2019 is er de Europese PSI-richtlijn die vraagt om openbare data zoveel mogelijk herbruikbaar aan te bieden. De invulling is vooral gedaan door de Wet hergebruik overheidsinformatie. Ook software, door de overheid gemaakt, valt onder deze wet. Een goed toepasbare handleiding over open data is beschikbaar.

Overheden hebben inmiddels de mogelijkheid om zich te onttrekken aan de techreuzen: PublicSpaces. Een initiatief gestart door twee hoogleraren om een publieke ruimte te creeëren die niet bepaald wordt door de grote leveranciers. Waarin overheden data kunnen uitwisselen zonder het risico dat deze gekaapt worden door Facebook, Google of andere private partijen die de handel in persoonsgegevens zien als business model.  

Public Spaces -waartoe onlangs een Kamermotie aandrong om alle ministeries erbij te laten aansluiten- heeft als doelstelling om in 2026 elke publieke organisatie in Nederland gebruik te laten maken van digitale instrumenten die zijn ingericht conform publieke waarden, zoals deze zijn neergelegd in een Manifest.  Het gaat uit van vijf publieke kernwaarden:

-        Het afleggen van verantwoording: gebruikers zijn verifieerbaar en de herkomst van content is openbaar. Het ecosysteem van de software bewaart of bezit geen persoonlijke data van de gebruikers;

-        De gebruiker centraal stellen: privacy by design is de basis voor het ontwerp, zogenaamde dark patterns worden vermeden

-        Openheid: het software ecosysteem is even toegankelijk voor elke persoon, netwerk of organisatie en functioneert onafhankelijk van invloed van overheden of andere krachten;

-        Soeverein en automoom: dit betekent dat de gebruikers niet gezien worden als gebruikers gebruikers zijn geen producten en dat welzijn en  zelfbeschikkingsvermogen van gebruikers altijd voorop staat. Gebruikers hebben en houden volledige controle over hun persoonlijke data en hun interacties

-        Transparant: de gebruikte technologie en het bestuursbeleid van de software is volledig inzichtelijk en toetsbaar.

Een belangrijk initiatief van PublicSpaces vormen de PubHubs, gestart door twee hoogleraren José van Dijck (Geesteswetenschappen, Media en digitale samenleving) en Bart Jacobs (Digital Security Group, Ethiek en Politieke wetenschappen), die de Spinoza en Stevin premies wonnen in 2021. Een deel van het prijzengeld besteden zijn aan de ontwikkeling van PubHubs. PublicSpaces is hierbij  nauw betrokken.

In één zin: Publieke organisaties kunnen digitale hubs gebruiken voor interactie en communicatie met hun publiek. Als die hubs aan elkaar verbonden worden, ontstaat een (gedecentraliseerd) digitaal netwerk dat in principe de hele samenleving kan bestrijken.

De website vermeldt het volgende: De initiatiefnemers zijn gemotiveerd door de maatschappelijke behoefte aan een open (source), transparante, privacy-vriendelijke online omgeving waar publieke organisaties de verbinding met en tussen mensen mogelijk maken, onafhankelijk van commerciële partijen zoals Meta, Whatsapp en Instagram, Alphabet (Google en YouTube) en Twitter.

Een organisatie die meedoet zet binnen PublicSpaces een eigen -op open source ingerichte- hub op: een publieke infrastructuur waarin op eenvoudige manier dagelijks communicatie mogelijk is met de deelnemers aan de hub. Denk aan een patiëntengroep, een school die wil communiceren met ouders, een oudheidkundige vereniging, een kerkgenootschap. Doelgroep voor hubs zijn ook bijvoorbeeld gemeenten. Via de hub kan een gemeente communiceren met klanten, kan een  authenticatie worden ingericht met digitaal ondertekende, dus betrouwbare, content. Elke overheid kan aansluiten bij PublicSpaces. Er zijn al veel grote organisaties aangesloten: de KB, VPRO, Beeld en Geluid, NPO, Bibliotheek Midden-Brabant maar ook de gemeente Amsterdam.

De digitale spoelkeuken

Wie mee wil doen met PublicSpaces ondersteunt de publieke waarden, waar de gemeenschap van uitgaat. Men ondertekent het Manifest en verklaart om deze actief uit te dragen. De eigen digitale instrumenten worden door een zogenaamde ‘digitale spoelkeuken‘ gehaald om te bekijken of zij op open source zijn gebaseerd en zo niet, wat een open alternatief is voor de software. Dit principe is gebaseerd op het idee: ruim het internet op, begin bij jezelf. De spoelkeuken kent vier fasen:

1.      1. Inventarisatie: welke tools en diensten gebruiken we?

2.      2. Analyse: gebruiken we de tools echt? Waarvoor?

3.      3. Communicatie: deel de resultaten. Wat gaan we ermee doen?

4.      4. Transformatie: kunnen we overgaan tot open source software voor de tools en diensten of kunnen we uitleggen waarom we dat (nog) niet doen? Bij dit punt gebruiken we het ‘pas toe en leg uit’-principe.

Zo lever een organisatie al meteen een actieve bijdrage aan de groei van open sourcesystemen. Zij levert een contributie aan het netwerk en in ruil daarvoor mag het PublicSpaces badge worden gevoerd. Er is inmiddels al een lijst van tools die op basis van de spoelkeuken zijn gewaardeerd.  

Ten slotte: hoe word je lid?

Dit kan door het contactformulier in te vullen of via één van de coalitiepartners. Daarop volgt een gesprek tussen de PublicSpaces organisatie over de betekenis van het lidmaatschap voor beide partijen en bij positief resultaat treedt een organisatie toe tot het PublicSpaces collectief.

Alles met de bedoeling om te komen tot een beter internet



[1] Voordat iemand nu concludeert dat het gebruik van M365 dus ook in Nederland onwettig is: SLM Rijk heeft voor de Staat der Nederlanden een Rijksbrede Microsoft Business and Services Agreement afgesloten met aanvullende/andere voorwaarden en afspraken dan de OST en DPA van Microsoft waarop de DSK haar uitspraak baseert. Lees de factsheet Verwerkersovereenkomst tussen de Rijksoverheid en Microsoft op slmmicrosoftrijk.nl (https://slmmicrosoftrijk.nl/?smd_process_download=1&download_id=2662). Comment van Jos Hezemans “appels en peren”, 1 december 2022 op het geciteerde artikel uit AG.

woensdag 14 december 2022

Monitoring van opslagtechnieken: de preservation watch


Het eerste artikel in een serie over het monitoren van bestaande en innovatieve opslagtechnieken voor informatie zag vandaag het licht. Dit alles in het kader van een project dat deel uitmaakt van het
NDE-programma Preservation Watch. De resultaten worden gepubliceerd als blogposts op het KIA platform preservation en via de KIA Kennisindex Preservation Watch gedeeld. 

Media 2022 heeft de werkgroep Preservation Watch een opdracht uitgeschreven over het evalueren van bestaande en innovatieve opslagtechnieken. In deze opdracht worden nieuwe technieken voor erfgoedinstellingen geëvalueerd aan de hand van de Preservation Storage Criteria. We leggen een viertal bestaande en opkomende opslagtechnieken -tape, object storage, glas en DNA- naast deze criteria, om zo de opslagtechnieken met elkaar te vergelijken. Verder worden de evaluatiecriteria zelf tegen het licht gehouden om te zien of deze voldoen en of er misschien nog criteria ontbreken. Het maken van een overzicht van toonaangevende bronnen en websites op het gebied van opslagtechnieken maakt deel uit van de opdracht. 

Je kunt mijn blogs over dit onderwerp volgen via deze link. Overigens is KIA toch een site om regelmatig te bezoeken: zie ook onder andere de blogs van Rein van 't Veer over bestandsformaten

Inmiddels is ook de tweede blog geplaatst over het monitoren van bestaande en nieuwe opslagtechnieken.

zaterdag 12 november 2022

Datahygiëne draagt bij aan vermindering CO2-uitstoot

[Dit artikel werd eerder door mij gepubliceerd in Zeeland Business Magazine, maar blijft actueel. Digital Cleanup Day vindt in 2023 plaats op 18 maart, zie https://www.digitalcleanupday.org/ ]

Het verminderen van de CO2-uitstoot is één van de hoogste prioriteiten van de samenleving. Iedereen kan aan de oplossing van dit probleem bijdragen.

Overheden en bedrijven beheren informatie. Steeds vaker wordt gekozen voor digitale informatieopslag. Deze opslag zal dan grotendeels in de cloud plaatsvinden op servers van leveranciers, nu grote spelers in de markt geen andere software meer gaan aanbieden dan cloudsoftware, met de opslag van de data in diezelfde, sterk beveiligde, omgeving.

We hebben tot nu toe weinig oog gehad voor de ecologische gevolgen van het digitaal databeheer. Recente studies geven aan dat 1 terabyte aan data in de cloud wel 2 ton CO2-uitstoot genereert. Willen we dit neutraliseren, dan moeten we hiervoor 100 nieuwe bomen planten. Een juist geplante boom neemt 20 kilo CO2 per jaar op. Olifantsgras, waarmee onder andere rondom Schiphol wordt geëxperimenteerd, echter vier keer zoveel. 

Overheden dienen conform wettelijke voorschriften hun archieven in goede, geordende en toegankelijke staat te bewaren. Ook bedrijven zullen dit moeten doen op basis van onder meer het Burgerlijk Wetboek en de Belastingwetgeving en om de bedrijfsvoering zeker te stellen. Dit houdt in dat zij data, waarvan de opslag geen enkel doel meer biedt, in het kader van onder meer de AVG moeten vernietigen. Overheden proberen aan deze wettelijke verplichting te voldoen door de toepassing van gespecificeerde archiefselectielijsten met kracht van wet. Zij noch het bedrijfsleven hebben oog voor de enorme databergen die onnodig worden bewaard.

Studies, waaronder het Veritas Databergrapport uit 2016, tonen aan dat in mailboxen, op persoonlijke en gemeenschappelijke schijven en in procesapplicaties zich veel overbodige, dubbele en onbekende informatie bevindt. 80 tot 90% van deze data kan, of zelfs moet, worden verwijderd zonder dat de informatiekracht van de data teniet wordt gedaan. Integendeel: verwijdering van overbodige gegevens zou de informatievoorziening in organisaties zelfs dramatisch kunnen verbeteren en het beheer vereenvoudigen: wat niet beheerd hoeft te worden kost geen tijd, energie, opslagcapaciteit en servers. Organisaties komen doorgaans niet toe aan het bepalen welke data verwijderd kan en moet worden; daardoor blijft veel te veel data bewaard.

De gevolgen hiervan zijn voor het klimaat bedenkelijk. Wanneer bijvoorbeeld bij 3900 overheidsorganisaties. gemiddeld 2 TB aan overtollige informatie in de Cloud kan worden gereduceerd, levert dit een jaarlijkse besparing van 7.800 ton aan CO2, wat gelijk staat aan een compensatie met 390.000 bomen per jaar. Let wel: het gaat hierbij om data in de Cloud; wanneer eigen servers worden gebruikt, geldt één tiende van deze hoeveelheid.

Daarnaast telt Nederland rond de 1,8 miljoen bedrijven. Stel hier de mogelijke gemiddelde reductie op 1 TB, dan is de mogelijke jaarlijkse uitstootbesparing 3.600.000 ton CO2, te compenseren met het planten van 180.000.000 bomen. Let wel: voor data die zich niet binnen de cloud bevindt, is dit 1/10e , dus 18 miljoen bomen. Nu worden ook de enorme besparingen in het Veritasrapport aannemelijker.

Maar niet alleen de CO2-uitstoot vormt hier het probleem. Ook de energievoorziening die nodig is om al deze data beschikbaar te houden zal ons dwingen om onze data te gaan opruimen. Een recente studie van de ING-bank geeft aan dat in 2030 meer dan 30% van onze energievoorziening nodig zal zijn voor digitaal dataverkeer en -opslag. Nu al wordt geen nieuwe uitbreiding met datacenters in de regio Amsterdam toegestaan omdat dit het energieverbruik van de stad in gevaar brengt. We zullen in de toekomst gaan vechten om elektriciteit, nu windmolens dan wel voorzien in 10% van de energieproductie, maar deze hele productie nodig is om de datacenters te koelen en informatie rond te pompen van en naar onze computers. Dit terwijl we elektrisch willen gaan rijden, onze huizen in de winter willen verwarmen en ’s zomers meer zullen koelen door de opwarming: we gaan steeds meer energie gebruiken.

Weinigen beseffen dat het gebruik van een telefoon, waarmee gesurfd wordt op het internet, even veel stroom verbruikt als een modale koelkast als we een filmpje bekijken. De Guardian meldde op 26 november dat alleen al in Groot Brittannië per dag 64 miljoen onnodige “dank je wel” e-mails worden verzonden wat gelijk zou staan aan een emissie van 16.433 ton aan CO2 per jaar (821.000 jaarlijks te planten bomen). Informatie- en communicatietechnologie vragen vandaag de dag al 1500 terawattuur, dat is 10% van de wereldwijde electriciteitsproductie. Het streamen van muziek werd in 2016 al op 350 miljoen kilo CO2-uitstoot geraamd.

Als we bij onszelf nagaan hoeveel data we persoonlijk in de cloud hebben, dan wordt het tijd om een grote opruimactie te gaan houden in Nederland, niet alleen bij overheden en bedrijven, maar ook in persoonlijke digitale verzamelingen in de cloud. Alleen al het weggooien wat we niet meer nodig hebben is de moeite meer dan waard.

Overheden kunnen hierin een voorbeeld vormen en met enige inspanning komen tot een aanzienlijke datareductie, zonder dat dit de toegankelijkheid of het beheer van informatie zal bemoeilijken. We kunnen niet om datahygiëne heen: het is dringend noodzakelijk om in alle digitale omgevingen waar we werken, uitsluitend die informatie te bewaren die we ook werkelijk nodig hebben, vanuit welk gezichtspunt dan ook, en overbodige data te verwijderen. Daarbij zou gezocht moeten worden naar alternatieven van dataopslag, waarbij microfilm zich aandient als een betrouwbaar medium: de houdbaarheid daarvan wordt honderden jaren gegarandeerd (zie het Arctic World Archive, een initiatief van de Europese Commissie). Veel informatie wordt bewaard en nauwelijks meer geraadpleegd; het zou een goed alternatief zijn om deze informatie op microfilm te plaatsen en pas als een ruimer gebruik noodzakelijk is, deze te digitaliseren. Over bewaarstrategieën later meer. 

zaterdag 29 oktober 2022

Wie wordt uw gebruiker van de opgeslagen informatie?

 


Mirjam Mieras, 2015: hoeveel pinguins passen op een sjoelsteen. Beelden aan Zee. 

Het OAIS- digitaal depotmodel uitgelegd in nog geen 5 minuten... met referenties aan ISO 14721 en de internationale OAIS-wiki. Het artikel van Barbara Sierman over dit onderwerp vind je hier. Als je niet weet wie gebruiker wordt van de informatie, kun je dan een goed archiefsysteem bouwen?

maandag 24 oktober 2022

Gratis cursus over Artificiële Intelligentie aan de Open Universiteit


foto afkomstig van de expositie van Elmar Trenkwalder, "Tuin der lusten" die momenteel te zien is in Beelden aan Zee

Rechtswetenschapper mr. dr. Reijer Passchier geeft een college in de nationale cursus AI & Ethiek, een gratis online leerprogramma over de impact van Artificiële Intelligentie (AI) op de maatschappij. In de cursus behandelen wetenschappers vragen als: hoe codeer je ethiek? Wat betekent het om te solliciteren bij een robot? En: wat is er mis met Facebook?

De cursus bestaat uit 9 hoofdstukken waarin diverse experts de rol van docent op zich nemen. Reijer gaat in op de consequenties van AI voor de democratische rechtsstaat. Daarbij put hij uit het onderzoek dat hij aan de Open Universiteit en de Universiteit Leiden doet. Je kunt de cursus gratis volgen.

Data en algoritmen

De nationale cursus AI & Ethiek is bedoeld om een goed beeld te schetsen van hoe data en algoritmen worden ingezet, hoe dit zich ontwikkelt en wat de impact daarvan zou kunnen zijn op de maatschappij. 'Nauwelijks bekomen van de toeslagenaffaire en grove privacyschendingen door techbedrijven is het hoog tijd dat iedereen in Nederland snapt hoe AI werkt en welke ethische dilemma’s om de hoek komen kijken als data en algoritmen worden ingezet', aldus initiatiefnemer Jim Stolze. Deze module over Ethiek wordt mede mogelijk gemaakt door financiële steun van ICAI, het SIDN Fonds en het ministerie van Binnenlandse Zaken en Koninkrijksrelaties.

woensdag 28 september 2022

Informatiewetgeving: hoe houd ik overzicht?

Koning, keizer admiraal: archiveren kunnen ze allemaal!

Een handig overzicht van de informatiewetgeving voor het rijk vind je hier. Actuele informatie over de veranderingen op dit gebied vind je op het kennisplatform informatierecht. Zo is er momenteel van alles te doen rondom een nieuwe Kaderwet informatiehuishouding, waar o.a. ook de VNG voor pleit na de samenhang tussen generieke informatiewetten te hebben geanalyseerd. Voor wie het nog niet weet, er komt een nieuwe Archiefwet aan. Wil je op de hoogte blijven, vergeet dan zeker het uitstekende Breednetwerk niet en het Kennisnetwerk Informatie en Archief: waardevolle bronnen van informatie voor elke informatieprofessional en wie in de informatiehuishouding is geïnteresseerd. En er blijft elke dag wel wat te leren: kijk eens rond op de RijksAcademie voor Digitalisering en Informatisering van de Rijksoverheid RADIO.  

Heb jij ook tips? Laat ze me weten en we vullen deze tekst aan. 

woensdag 21 september 2022

Platform open overheid

Op 20 september 2022 is de nieuwe  websiteOpen-overheid.nl livegegaan. Dit is een initiatief van het Programma Open Overheid in samenwerking met ondersteunende organisaties binnen het Rijk. De website voorziet in het volledige aanbod van instrumenten, diensten en kaders waar rijksorganisaties mee aan de slag kunnen. De site is de basis voor het werken aan een open overheid. 

Onderwerpen die van toepassing zijn op het verbeteren van de informatiehuishouding en het streven naar een open overheid, zoals openbaarmaking en e-mailarchivering staan centraal en leiden de bezoeker naar bijbehorend aanbod. Je vindt er handige tools, kaders, diensten en handreikingen van verschillende organisaties overzichtelijk bij elkaar. Naar verwachting is de website voor het eind van het jaar zo goed als compleet.

'Los van het aanbod willen we bezoekers van de website ook aanzetten tot nadenken. Want wat betekent het nou echt om als ambtenaar en organisatie open en transparant te zijn? En welke vraagstukken horen daarbij? Open-overheid.nl zet mensen aan tot denken en doen. De koppeling die we maken met Kennisnetwerk Informatie en Archief (KIA) biedt bovendien de mogelijkheid om met elkaar in gesprek te gaan en praktijkvoorbeelden uit te wisselen', aldus Manuela Fun, projectleider van de nieuwe website. 

zaterdag 17 september 2022

Overzicht van nieuwe ontwikkelingen in de informatiehuishouding


De link brengt je bij een heel mooie leidraad die alle nieuwe ontwikkelingen binnen de Rijksoverheid in een overzicht plaatst: https://www.it-academieoverheid.nl/onderwerpen/i/informatieh... . Wil je eens een tour maken over de nieuwe houding ten opzichte van informatie bij het rijk neem dan een kijkje in RADIO, de nieuwe informatieacademie die is open gesteld voor alle overheden.

dinsdag 14 juni 2022

Metadata

Op de website van het Nationaal Archief is een heel mooie, complete uitleg te vinden over metadata. De eerste pagina hierover is https://www.nationaalarchief.nl/archiveren/kennisbank/metagegevens-0 . Deze verwijst door naar een pagina over MDTO (Metagegevens voor Duurzaam Toegankelijke Overheidsinformatie), waar alle aspecten die te maken hebben met metadata aan bod komen. Een aanrader voor wie het fijne hiervan wil weten: https://www.nationaalarchief.nl/archiveren/mdto#collapse-102667

zaterdag 11 juni 2022

Tante Lean en de PROA-analyse

Binnen de opleidingen van de VHIC faculty leren wij onze cursisten om te werken volgens de PROA- analyse: een handig hulpmiddel om een Probleem helder te krijgen, de Risico's in kaart te brengen die dit probleem oplevert voor de organisatie, de mogelijke Oplossing(en) te overwegen en hierover een Advies te geven. Duidelijk, praktisch en resultaatgericht. Tante Lean heeft hiervoor een template ontwikkeld, dat je op weg helpt bij je probleemoplossing. Wie hierover meer wil weten: het boek Wat is nu eigenlijk het probleem van Peter van Loevezijn is een goede start.  

donderdag 9 juni 2022

Breng de informatiebeheerder terug!


Opname van de zeven kennisbytes voor het RDDI over de basis van de informatiehuishouding, januari 2022, in de studio van Zeeland Business in Goes

Een interessant artikel uit RDDI Impact: breng de informatiebeheerder terug ! Als je dit uitbreidt met de  nieuwe gedragsregeling die je ook handhaaft (manager, besteed aandacht aan de verantwoording van de dossiers!) ontstaat een mooie combinatie om de informatie duurzaam toegankelijk te maken: vindbaar, beschikbaar, leesbaar, interpreteerbaar en toekomstbestendig opgeslagen. En zoek je een goede cursus om meer te leren over preserveren? Hier vind je een goede, gratis start.

woensdag 8 juni 2022

Een handige sitemap over informatiehuishouding


een digitaal archief dat VHIC onlangs kreeg aangeboden om te selecteren, volledig op memorysticks aangeleverd

Wil je kennis opfrissen, kijken hoe de huidige stand van zaken is of ben je op zoek naar handreikingen, handleidingen of handige tools? Kijk dan op https://www.informatiehuishouding.nl/sitemap 

donderdag 2 juni 2022

Archiveren by design voortaan onderdeel Kwaliteitskader CIO-oordelen

Uit de Nieuwsbrief Archiveren van het Nationaal Archief: Op 10 mei is het nieuwe Kwaliteitskader CIO-oordelen vastgesteld. Met dit kader toetsen CIO’s of grote ICT-activiteiten bij de rijksoverheid de juiste koers volgen. Er zijn twee aandachtsgebieden toegevoegd: informatiebeveiliging en privacy, en duurzame toegankelijkheid. Hierdoor maakt o.a. archiveren by design voortaan deel uit van de formele toetsing. lees meer

Het gebruik van kunstmatige intelligentie bij de selectie van digitale documenten


Het vereiste heel wat intelligentie om dit motorblok voor een Lego-Landrover in elkaar te knutselen. Gelukkig was er een handleiding van 370 pagina's bijgevoegd.

Dit document gaat over testen die zijn uitgevoerd door de National Archives van Groot Brittannië om kunstmatige intelligentie (AI-systemen) in te zetten bij archiefselectie. Conclusie is dat dit nog niet goed mogelijk is zonder de inzet van recordmanagers die kennis hebben van de archiefbescheiden in hun werkgebied. Systemen moeten aan de hand van een bepaalde dataset 'leren' welke documenten -aan de hand van door de recordmanager bepaalde karakteristieken- uitgeselecteerd kunnen worden. Dat leerproces moet goed door een recordmanager worden begeleid, anders zouden wel eens de verkeerde documenten worden geselecteerd.

Het proces vraagt technische kennis van de recordmanager. Dit betekent dat die nieuwe vaardigheden moet leren op het gebied van data-analyse en machine learning, wil een AI-systeem succesvol worden toegepast. We zullen er echt niet aan ontkomen om in de toekomst AI-systemen te gebruiken en machines te leren hoe informatie te selecteren. Dat begint al bij de archivering by design, wanneer we aan documenten met bepaalde karakteristieken default bewaartermijnen gaan koppelen. Echter, steeds zal gedurende het groeiproces waarin AI wordt gebruikt, verfijning nodig zijn, dus: de informatieprofessional moet zelf ook blijven leren op dit gebied.


https://cdn.nationalarchives.gov.uk/documents/using-ai-digital-selection-in-government.pdf


donderdag 19 mei 2022

Een nieuwe oplossing voor dataopslag: het DNA-formaat

 

Het bovenstaande bericht haalde ik uit Governance and Recordkeeping around the World van mei 2022. Opslag van gegevens op een nieuwe manier: in de vorm van DNA. 

Alle data van de wereld kunnen geplaatst worden in 100 gram DNA met het volume van een chacoladereep. Het Nationaal Archief van Frankrijk bewaart op haar servers meer dan 70.000 gigabytes aan documenten, foto’s, video’s, emails…. “Elk jaar hebben we meer terabytes. Er zijn miljarden bestanden. We verwachten dat we in de komende twee tot drie jaar de grens van 200 Terabytes zullen overschrijden” zegt Béatrice Herold, directeur belast met digitale conservering. 

Het Nationaal Archief van Frankrijk is niet de enige die zijn hoop stelt op deze nieuwe technologie. Microsoft bijvoorbeeld heeft een machine ontwikkeld die automatisch digitale informatie wegschrijft in DNA. Hiervoor maakten onderzoekers gebruik van het biotechnisch bedrijf Twist, een van de leiders in synthetisch DNA. “Het probleem is het reduceren van de kosten, zo verklaart de directeur van Twist, Emily Leproust. “Vandaag de dag zijn de kosten van opslag in DNA-formaat € 1000 per megabyte, terwijl die voor een terabyte op een harde schijf € 100 bedragen. Dat zijn dus nog steeds onvergelijkbare grootheden. Servers hebben echter een grote ecologische voetafdruk, dus wanneer je deze kleine capsule ziet, ga je dromen over de capaciteit om grote hoeveelheden informatie op te slaan.”

Om deze kosten te reduceren moet dus nog heel wat werk worden verzet voordat er sprake kan zijn van een kostenefficiënt systeem. Maar volgens Emily Leproust zal de DNA-technologie de datasector behoorlijk veranderen. DNA is erg traag bij de recall voor hergebruik. We willen het echter gaan gebruiken voor langetermijnopslag, 60% van de datacenters doen niet anders. Langetermijnarchivering zal in de toekomst gaan gebeuren via opslag in DNA-formaat. De andere 40%, waar de informatie op elk moment snel beschikbaar moet zijn, zal op harde schijven en snelle geheugens blijven plaatsvinden.”

woensdag 9 maart 2022

Digitale Schoonmaakdag 19 maart


c'est le ton qui fait la musique


In mijn vorige post "Waar rook is, is informatie", was ik wat te scheutig met het planten van bomen. Dit is bij deze gerectificeerd en er is een nul weggehaald in de berekening. Zo klopt het weer.

Maar heb je jezelf ooit gerealiseerd hoeveel digitale rommel we met ons allen verzamelen in kantoren en -niet te vergeten- thuis? Al die vergeten e-mails, foto’s, verlopen documenten, whatsappberichten…

En heb je ooit nagedacht wat dit alles kost aan beheer?

Digitale data lijkt dan wel te zweven in de ruimte, maar dat is natuurlijk niet zo. Elke byte wordt vaak meerdere keren opgeslagen, om verlies te voorkomen. Wordt hiervoor een magnetische schijf gebruikt in de Cloud, dan kost dit elektriciteit. Die moet worden opgewekt door windmolens, zonnepanelen, maar ook kolen- kern- en biomassacentrales. Niet zo erg milieuvriendelijk dus, want die stoten weer CO2 uit.

 Niet alle digitale data is nuttig en de moeite van het bewaren waard. Veel is digitale rommel die ook moet worden beheerd. Het wordt opgeslagen op servers, ontsloten door software, duurzaam toegankelijk gehouden op nanoseconden afstand. Getransporteerd door netwerken, kabels, routers en wat al niet meer. Je vindt de rommel terug op persoonlijke schijven, in mailboxen, in social media, in kantoorapplicaties, samen met de belangrijke data, die we vaak niet meer kunnen terugvinden als we zoeken doordat er zoveel ‘ruis’ meekomt. De servers worden zo warm, dat ze moeten worden gekoeld, met kostbaar drinkwater. De rommel leidt ertoe dat we te lang moeten zoeken, gemiddeld zijn we daar onder werktijd twee uur per dag mee bezig.  Met andere woorden: digitale rommel kun je beter niet hebben.

Inmiddels hebben we al zo veel data dat het internet -met de systemen die ervoor nodig zijn- elk jaar 900 miljoen ton CO2 uitbraakt. Wil je dat compenseren, dan moet je 450 miljoen bomen planten. Elk jaar worden dat er meer, want het internet groeit nog steeds en vreet in Nederland nu al meer energie dan alle windmolens samen kunnen opbrengen.

We moeten dus verzinnen hoe duurzaam om te gaan met digitale informatie, zowel privé als in onze organisaties. Daarvoor is de Digital Cleanup Day bedoeld, die dit jaar op 19 maart plaatsvindt. Een grote schoonmaak van alle digitale bestanden, door iedereen. Het idee erachter is: als we allemaal onze onnodige data weggooien dan beperken we niet alleen de CO2-uitstoot, maar verlengen we ook de levensduur van onze machines. Onze systemen draaien beter. Als we dan ook erop letten minder afhankelijk te worden van onze digitale hulpmiddelen dan gaan we misschien geconcentreerder, efficiënter werken, zonder afleidingen, en krijgen we meer voldoening van ons werk.

Wat je niet nodig hebt, hoef je niet op te slaan. Dat is de gedachte achter Digital Cleanup Day: hou grote schoonmaak op je computer, je tablet en je telefoon. Eerder onderzoek heeft aangetoond dat slechts 15% van de data die een bedrijf bijhoudt, bedrijfskritisch is. De rest is overbodig, onnodig of onbekend qua herkomst. De waarde zou daarom tegen het licht moeten worden gehouden. Het is juist de niet-bedrijfskritische data die we tijdens World Cleanup Day willen aanpakken. Wat we weggooien hoeven we niet meer te beheren, dus levert geen CO2-uitstoot en zoekruis meer.

De site over het project, https://www.digitalcleanupday.org/ , geeft voorbeelden hoe je hiermee als bedrijf aan de slag kunt gaan. Dat kan als volgt:

1.      Bepaal wat rommel is en wat niet: niet elk concept is rommel, soms moet je concepten bewaren om te herleiden hoe iets tot stand is gekomen. Dit vraagt kennis van de materie!

2.      Breng in kaart waar je digitale rommel zich bevindt: kijk in je backups, je e-mails, je vervallen documenten: alles wat op je server staat en inje mailbox komt hiervoor in aanmerking.

3.      Organiseer een digitale cleanup. Leer je medewerkers wat digitale rommel is en organiseer de CleanupDay samen. Stimuleer ze om hun persoonlijke en groepsbestanden te schonen. Maak IT tot medewerker in dit project. Begin met een inventarisatie wat er op dat moment is, zodat je aan het eind van de dag kunt vertellen wat er geschoond is (ooit lukte het ons in een project om 100% data terug te brengen tot 60%, wat een jaarlijkse structurele besparing opleverde in een nieuw Cloudcontract van 4 ton).  

4.      Hou het idee om regelmatig te schonen levend:

a.      Als een project is afgerond: schoon het projectdossier op

b.      Als de bewaartermijn van het project is afgerond: vernietig het dossier volgens de voorschriften

c.       Organiseer je werkruimte en hou die netjes

d.      Kies je communicatiekanalen: welk kanaal is het meest effectief in welke situatie?

e.      Werk systematisch, zorg voor voldoende focus. Zet regelmatig je social media en mail uit en laat weten wanneer je beschikbaar bent

f.       Leer je collega’s digitaal werken; wissel slimmigheden uit

g.      Systemen, nieuwsbrieven en andere digitale zaken die je niet gebruikt? Doe ze weg.

De site geeft nog meer ideeën hoe je persoonlijk en in de bedrijfsomgeving beter met digitalisering kunt omgaan. Het is als met de reclame voor kaas in het verleden: wat er niet aan komt, hoeft er ook niet af. Dus na de Digitale Schoonmaak gaan we op digitaal dieet! 

dinsdag 8 maart 2022

Waar rook is is informatie

 


Ceci c'est vraiment une pipe

Het verminderen van de CO2-uitstoot is één van de hoogste prioriteiten van de samenleving. Iedereen kan aan de oplossing van dit probleem bijdragen.

Overheden en bedrijven beheren informatie. Steeds vaker wordt gekozen voor digitale informatieopslag. Deze opslag zal dan grotendeels in de cloud plaatsvinden op servers van leveranciers, nu grote spelers in de markt geen andere software meer gaan aanbieden dan cloudsoftware, met de opslag van de data in diezelfde, sterk beveiligde, omgeving.

We hebben tot nu toe weinig oog gehad voor de ecologische gevolgen van het digitaal databeheer. Recente studies geven aan dat 1 terabyte aan data in de cloud wel 2 ton CO2-uitstoot genereert. Willen we dit neutraliseren, dan moeten we hiervoor 100 nieuwe bomen planten. Een juist geplante boom neemt 20 kilo CO2 per jaar op.

Overheden dienen conform wettelijke voorschriften hun archieven in goede, geordende en toegankelijke staat te bewaren. Ook bedrijven zullen dit moeten doen op basis van onder meer het Burgerlijk Wetboek en de Belastingwetgeving en om de bedrijfsvoering zeker te stellen. Dit houdt in dat zij data, waarvan de opslag geen enkel doel meer biedt, in het kader van onder meer de AVG moeten vernietigen. Overheden proberen aan deze wettelijke verplichting te voldoen door de toepassing van gespecificeerde archiefselectielijsten met kracht van wet. Zij noch het bedrijfsleven hebben oog voor de enorme databergen die onnodig worden bewaard.

Studies, waaronder het Veritasrapport uit 2015, tonen aan dat in mailboxen, op persoonlijke en gemeenschappelijke schijven en in procesapplicaties zich veel overbodige, dubbele en onbekende informatie bevindt. 80 tot 90% van deze data kan, of zelfs moet, worden verwijderd zonder dat de informatiekracht van de data teniet wordt gedaan. Integendeel: verwijdering van overbodige gegevens zou de informatievoorziening in organisaties zelfs dramatisch kunnen verbeteren en het beheer vereenvoudigen: wat niet beheerd hoeft te worden kost geen tijd, energie, opslagcapaciteit en servers. Organisaties komen doorgaans niet toe aan het bepalen welke data verwijderd kan en moet worden; daardoor blijft veel te veel data bewaard.

De gevolgen hiervan zijn voor het klimaat bedenkelijk. Wanneer bijvoorbeeld bij 3900 overheidsorganisaties. Gemiddeld 2 TB aan overtollige informatie in de Cloud kan worden gereduceerd, levert dit een jaarlijkse besparing van 7.800 ton aan CO2, wat gelijk staat aan een compensatie met 390.000 bomen per jaar. Let wel: het gaat hierbij om data in de Cloud; wanneer eigen servers worden gebruikt, geldt één tiende van deze hoeveelheid.

Daarnaast telt Nederland rond de 1,8 miljoen bedrijven. Stel hier de mogelijke gemiddelde reductie op 1 TB, dan is de mogelijke jaarlijkse uitstootbesparing 3.600.000 ton CO2, te compenseren met het planten van 1.800.000 bomen. Let wel: voor data die zich niet binnen de cloud bevindt, is dit 1/10e , dus 180.000 miljoen bomen. Nu worden ook de enorme besparingen in het Veritasrapport aannemelijker.

Maar niet alleen de CO2-uitstoot vormt hier het probleem. Ook de energievoorziening die nodig is om al deze data beschikbaar te houden zal ons dwingen om onze data te gaan opruimen. Een recente studie van de ING-bank geeft aan dat in 2030 meer dan 30% van onze energievoorziening nodig zal zijn voor digitaal dataverkeer en -opslag. Nu al wordt geen nieuwe uitbreiding met datacenters in de regio Amsterdam toegestaan omdat dit het energieverbruik van de stad in gevaar brengt. We zullen in de toekomst gaan vechten om elektriciteit, nu windmolens dan wel voorzien in 10% van de energieproductie, maar deze hele productie nodig is om de datacenters te koelen en informatie rond te pompen van en naar onze computers. Dit terwijl we elektrisch willen gaan rijden, onze huizen in de winter willen verwarmen en ’s zomers meer zullen koelen door de opwarming: we gaan steeds meer energie gebruiken.

Weinigen beseffen dat het gebruik van een telefoon, waarmee gesurfd wordt op het internet, even veel stroom verbruikt als een modale koelkast als we een filmpje bekijken. De Guardian meldde op 26 november 2020 dat alleen al in Groot Brittannië per dag 64 miljoen onnodige “dank je wel” e-mails worden verzonden wat gelijk zou staan aan een emissie van 16.433 ton aan CO2 per jaar (82.100 jaarlijks te planten bomen). Informatie- en communicatietechnologie vragen vandaag de dag al 1500 terawattuur, dat is 10% van de wereldwijde electriciteitsproductie. Het streamen van muziek werd in 2016 al op 350 miljoen kilo CO2-uitstoot geraamd.

Als we bij onszelf nagaan hoeveel data we persoonlijk in de cloud hebben, dan wordt het tijd om een grote opruimactie te gaan houden in Nederland, niet alleen bij overheden en bedrijven, maar ook in persoonlijke digitale verzamelingen in de cloud. Alleen al het weggooien wat we niet meer nodig hebben is de moeite meer dan waard.

Overheden kunnen hierin een voorbeeld vormen en met enige inspanning komen tot een aanzienlijke datareductie, zonder dat dit de toegankelijkheid of het beheer van informatie zal bemoeilijken. We kunnen niet om datahygiëne heen: het is dringend noodzakelijk om in alle digitale omgevingen waar we werken, uitsluitend die informatie te bewaren die we ook werkelijk nodig hebben, vanuit welk gezichtspunt dan ook, en overbodige data te verwijderen. Daarbij zou gezocht moeten worden naar alternatieven van dataopslag, waarbij microfilm zich aandient als een betrouwbaar medium: de houdbaarheid daarvan wordt honderden jaren gegarandeerd (zie het Arctic World Archive, een initiatief van de Europese Commissie). Veel informatie wordt bewaard en nauwelijks meer geraadpleegd; het zou een goed alternatief zijn om deze informatie op microfilm te plaatsen en pas als een ruimer gebruik noodzakelijk is, deze te digitaliseren.