inforoads: Hoe betrouwbaar is het Internet

zaterdag 24 januari 2015

Hoe betrouwbaar is het Internet

In The New Yorker verscheen een interessant artikel over internet: The Cobweb- Can the Internet be Archived? van de hand van Jill Lepore. Een artikel dat de moeite van het lezen waard is.

Het artikel begint met het neerhalen van MH17, waarbij Igor Girkin, een separatist, een bericht plaatste op het internet met de tekst: We haalden juist een vliegtuig naar beneden, een AN-26. Een boodschap die enkele uren later al weer verdwenen was, maar wel in de Way Back Machine belandde. Zo worden nog enkele voorbeelden genoemd van informatie, die plotseling verdween. En dat zet me aan het denken.

Er zijn veel risico's en gevaren aan de digitalisering, waar we momenteel ondoordacht mee omgaan. Is jouw computer al eens gehackt, of zijn je bestanden gegijzeld? Dat is het moment waarop je toch iets anders gaat denken over informatiebeveiliging en digitale gegevensopslag. En wat als het je organisatie overkomt. Hoe slordig gaan we tegenwoordig met documenten en metadata om. Hoe moeilijk wordt het om een genomen besluit te reconstrueren, te zien wie welke wijzigingen aanbracht, op welk moment mensen op de hoogte waren van een bepaalde beslissing. We houden steeds minder rekening met het archiveren: de digitale chaos wordt steeds groter en we concentreren ons niet meer op een goede verslaglegging van de gebeurtenissen, maar 'laten de boel de boel' en sturen de archivaris en de afdeling DIV de laan uit omdat ze niet meer zouden passen in deze moderne tijd.

Ik ben er nog niet zo zeker van of digitale gegevensopslag wel zo veilig, en duurzaam is. De reden is als volgt: altijd hebben we een nieuwe techniek verwelkomd als de Haarlemmerolie, die alle problemen zou oplossen. Nooit is zo een techniek daartoe in staat gebleken; elke techniek heeft weer gezorgd voor nieuwe, eigen problemen. Daarom moeten we, willen we duurzaam bewaren, -toch zeker de eerste tijd!- mikken op meerdere technieken. Het zou kunnen zijn dat we belangrijke besluiten tóch op papier vastleggen, in dossiers, al klinkt dat nu wellicht belachelijk (daar denkt de Rekenkamer van de Provincie Noord-Brabant trouwens anders over). Of dat we digitale informatie via een andere analoge techniek toch loskoppelen van de digitale bron, al is het maar om ooit erop te kunnen terugvallen dat het document ongewijzigd is gebleven in de loop der tijd, niet is gehackt en veranderd of verminkt. Want als het nu al mogelijk is om van bedrijven informatiebestanden te gijzelen, dan komt er nog heel wat andere miserie op ons af.

Een paar feiten uit het artikel van Jill Lepore:

- de gemiddelde levensduur van een webpagina is honderd dagen;

- een webpagina hoeft niet opzettelijk verwijderd te worden om te verdwijnen, al gebeurt dit wel met hele sites: denk aan MySpace, GeoCities en Hyves). Kijk eens in de WayBack Machine en toets in: www.vhic.nl. Je ziet dat deze site 126 keer is vastgelegd, maar ga nu eens kijken wàt er is vastgelegd en hoe vaak je leest: helaas is deze informatie niet binnengehaald. Wat is zo een archief waard? Neem de proef op de som en probeer het eens vanaf 1999, toen wij onze eerste website lanceerden.

- lees over de link rot en content drift, samen ook wel reference rot genoemd. Neem eens een willekeurige wetenschappelijke publicatie en klik op de voetnoten die verwijzen naar een internetpagina: meer dan 50% van de URL's zal het niet meer doen. In de medische tijdschriften tussen 1997 en 2012 werkt een op de vijf links niet meer. En wat gebeurt er als dit bewijs verdwijnt? Er wordt dan wel gewerkt aan permalinks, maar ik moet eerst zien dat het werkt.

- Pas nu begint men zich zorgen te maken, over het verdwijnende internet. Maar wat als we het internet gaan archiveren? Slaan we alles op, of maken we selecties, en wie maakt die selecties dan? The Library of Congress archiveert alle tweets die er ooit verschijnen, maar wat een rotzooi zit daar tussen! Sinds die tijd wordt de Library ook wel The Museum of Crap genoemd....

Internet is prachtig; ik zou het niet kunnen missen. MAAR: we weten niet wat we moeten bewaren, we weten niet hoe we moeten selecteren, we weten niet welke tools we nodig hebben om terug te kunnen vinden, om te filteren, we weten niet hoe om te gaan met de chaos, die zo enorm veel groter is dan wat jij in je mailbox hebt; van een omvang die niet te bevatten is. En willen we wel alles bewaren? Zou je niet blij zijn dat bepaalde informatie onvindbaar wordt, of gewoon verwijderd? Iedereen doet toch wel eens een domme uitspraak waaraan hij of zij niet meer wil worden herinnerd, moet dat allemaal toegankelijk blijven?

Ik denk dat het juist een taak is van de informatiebeheerder/specialist om op dit punt vragen te blijven stellen over de veiligheid en de betrouwbaarheid van informatie en te werken aan een betrouwbaarder archief dan we nu hebben. Dat ligt volgens mij niet in het uitsluitend wedden op het digitale paard, zolang internet nog onbetrouwbaar is.

Blijf kritisch.

http://www.newyorker.com/magazine/2015/01/26/cobweb

https://archive.org/

http://www.binnenlandsbestuur.nl/digitaal/nieuws/digitaal-geheugenverlies-dreigt-voor-noord.9458277.lynkx