zondag 4 november 2012

Tabellarisch ontsluiten


 

Het gaat niet om het zoeken naar gegevens, maar om het vinden van informatie en dan wel zo snel mogelijk, want we leven in een gehaaste tijd. Dat vinden lukt niet altijd even goed, omdat we niet consequent zijn in het toekennen van metadata, de vind-elementen, en omdat we niet consequent zijn in het maken van keuzes welke documenten we willen opslaan.
 
Eerst moeten we documenten maken. Zorg dat van alle gebeurtenissen waarvoor verantwoording en bewijs nodig is, documenten worden opgemaakt en opgeslagen. Bepaal met elkaar welke die verantwoordingsdocumenten zijn, zo mogelijk maak je er macro’s voor, of templates. Leg dit vast in je informatiebeheerplan/documentair structuurplan. Vat dus een overeenkomst die is totstandgekomen door een langdurige mailwisseling samen in een overeenkomst, dat voorkomt moeilijkheden in de toekomst.

De tweede stap is dan om te bedenken hoe we deze documenten willen terugvinden. Deze opmerking zal hoongelach opleveren van de vrije denkers, maar een zoekmachine werkt beter als deze weet in welke structuur te zoeken. Structuur aanbrengen hoeft niet veel tijd te kosten. Structuur aanbrengen doe je via een ordeningsstructuur: een stelsel van hiërarchisch gerangschikte elementen, waarmee informatieobjecten kunnen worden geordend volgens van tevoren vastgestelde criteria. Een informatieobject is een op zichzelf staand geheel van gegevens met een eigen identiteit, bijvoorbeeld een boek, tijdschrift, database, foto, webpagina, website, wiki of blog. De manier van kijken [het niveau van bekijken] bepaalt wat we als informatieobject zien: het kan dus zowel een tijdschrift zijn als een artikel uit dat tijdschrift.

Het toekennen van metadata werkt momenteel niet goed omdat we van elementen gebruik maken die soms meerdere interpretaties kennen, zoals werkprocessen of zaaktypen.

We moeten dus gebruik maken van elementen waarbij persoonlijke interpretatie is uitgesloten.

Er zijn enkele eenvoudige principes die mensen al eeuwenlang hanteren bij het terugvindbaar maken van informatie. Die zijn gebaseerd op het LATCH/V-principe (ook wel PATCH/V genoemd). Je hoeft er geen groot congres aan te wijden en ze zijn snel aan te leren, ook aan niet-vakgenoten. Merkwaardigerwijze ben ik ze nog niet in studieboeken over ons vak tegengekomen, maar ze staan in de documentanalyse die ooit is opgesteld door dr. Groeneveld, destijds bibliothecaris van de Technische Hogeschool Delft (in 1923 al, een tiental jaren geleden rijkelijk vermeerderd door de heer B.A.B. Schmitz). Zie hiervoor ook http://suntrec.salzburgresearch.at/projects/LATCHBrowser/ ; bij een zoektocht op Internet vond ik ook het volgende: http://www.latebytes.nl/2008/04/vijf-mogelijkheden-tot-het-ordenen-van-informatie/ 

PATCH staat voor: Plaats-Alfabet-Tijd-Categorie [onderwerp]-Hiërarchie (bij LATCH staat de L voor Locatie).

Als toelichting het volgende. In een document zijn gegevens te vinden die je kunnen helpen bij het terugvinden, maar ook kun je aan een document elementen toevoegen waardoor je het terugvinden gemakkelijker maakt. Dat kun je heel eenvoudig doen: ga in Word naar document- eigenschappen en kijk welke eigenschappen je aan het document dat je maakt kunt toevoegen. In OpenOffice kan dit ook trouwens; de eigenschappen worden meegenomen in een PDF die je maakt van het document; in PDF kun je verdere documenteigenschappen toevoegen.

We gaan nu een of meer documentenmacro’s maken, waarin de eigenschappen die wij belangrijk vinden worden toegevoegd . Documentverrijking heet dat. Deze elementen blijven aan het document hangen bij migratie, bij conversie en bij elke andere vorm van overzetting naar een nieuw medium in de toekomst. Ze zitten als het ware in het document opgesloten, bevinden zich niet in een tabel buiten de documentenverzameling.  

Ik neem het document als uitgangspunt, en niet de zaak, dat mag duidelijk zijn. Zaaksgewijze ordening is subjectieve ordening en subjectiviteit sluit ik zo veel mogelijk uit.

Een document bevat bijvoorbeeld NAW-gegevens. Heb je die, dan kun je het document terugvinden samen met andere documenten van de persoon met die naam en dat adres. Hiervan maken we een tabel of beter: hiervoor gebruiken we een tabel.

Wordt in een documentinhoud een plaatsaanduiding gegeven, dan wordt die Plaats opgenomen in de kenmerken van het document. Ook deze plaatsaanduidingen halen we zo mogelijk uit een tabel, liefst met de coördinaten van de plaatsaanduiding toegevoegd. Zo kunnen we het document automatisch toevoegen aan een geografisch systeem en is het via een klik op de kaart terug te vinden.

De tweede sorteermogelijkheid is het Alfabet. Namen zouden gemakkelijker sorteerbaar moeten zijn. Email heeft daarin een ware ramp veroorzaakt, doordat iedereen net weer op een andere manier namen weergeeft. Hier zouden we dus weer een regel moeten invoeren en die is er ook: de ABC-regels. Ook van namen maken we een tabel.

Tijd. Als in een document een bepaalde tijdsperiode wordt genoemd, gebruik hiervoor dan een standaard: JJMMDD (jaar maand dag). Hou die standaard aan, tenzij je in een internationaal bedrijf werkt, dan zou de tijdsaanduiding wel eens kunnen zijn JJDDMM. Maak daarover een vaste afspraak en werk vanaf dat moment ook volgens die afspraak. Wij gebruiken binnen ons bedrijf de aanduiding JJMMDD; de reden is dat dan documenten automatisch sorteren.

Categorie. Soms kan het handig zijn om documenten in te delen naar categorieën. Dit kunnen onderwerpen zijn, zaken, of projecten. Hiervoor zijn soms algemene tabellen beschikbaar, zoals bijvoorbeeld de Zaaktypencatalogus die er is voor verschillende gremia, in het model-dsp voor Nederlandse Gemeenten of in de i-Controler. Aan de hand daarvan maken we onze eigen tabel.

Dan is er nog Hiërarchie. Je kunt een zoeksysteem opbouwen met hoofd- en subklassen. Ontologieën, taxonomieën, classificaties en gecontroleerde woordsystemen werken op die manier, maar ook wiki’s. Veel van dit soort systemen zijn beschikbaar; het zou echter het laatste moeten zijn waar je aan denkt, omdat het doorgaans systemen zijn voor geoefende geesten en omdat hierbij subjectieve elementen insluipen.

En dat alles noemen we dan tabellarisch ontsluiten: ontsluitingskenmerken toevoegen, die je in tabellen bewaart om ze te kunnen hergebruiken. Nu kun je alles terugvinden op een eenvoudige manier: op naam van aanvrager, op naam van project of traject, op naam van de zaak of op zaaknummer, op naam van het werkproces, op tijdsperiode, op locatie. De machine sorteert. De tabellen bevinden zich buiten de documenten, de elementen waarop de tabel reageert binnen het document.

Zo heb je dus meteen een oplossing voor je dossier (de schriftelijke neerslag van een zaak) en voor verzamelingen binnen dat dossier (naar persoon, naar project, naar proces, naar object) en over het dossier heen. Dat alles zo nodig begrensd naar tijd.

Wat we nu nog nodig hebben is een tabel van Vertrouwelijkheden: wie mag welke informatie inzien? Daarvoor gebruiken we bijvoorbeeld de active directory van Windows.

Laten we het leven simpeler maken. Dat bespaart veel werk en kosten. Moet je toch eens zien wat een geld we verkwisten aan systemen, waarbij we pakketten van eisen laten schrijven zo dik als telefoonboeken. En nog kunnen we belangrijke documenten niet terugvinden.

Dienstverlening begint bij handelen en daarbij moeten we bureaucratie vermijden. Probeer dus documenten te vermijden, handel zo direct mogelijk zaken af.

Is vastlegging van feiten, meningen en conclusies nodig, leg deze dan vast in een document. Zorg dus dat je documenten opmaakt met zo mogelijk een herkenbare, vaste formuliervorm en waarin staat wie het opmaakt, waarover het gaat (welke persoon, welke locatie, welke gebeurtenis). Laat deze gegevens niet over aan databasesystemen, die steeds wisselen. Zorg dat je de documenten goed beschrijft, zo geautomatiseerd mogelijk, door gegevens uit je DMS direct in de uitgaande brief over te nemen bijvoorbeeld. Zorg dat de metadata van documenten in de documenten zelf zitten, en niet in een ander systeem. Op basis daarvan kunnen dan zoekmachines indexen aanmaken, en ook in de zoekmachine ben je onafhankelijk. Zo heb je nooit conversieproblemen wanneer je naar een andere leverancier zou overstappen; nu zit je vaak in een lock-in of heb je te maken met een dure conversie, die vaak zelfs niet alle gegevens overneemt.

Maar dan zijn we er nog niet. Waar blijft de inbreng van gebruikers? Laat iemand die een document opstelt daar zelf tags aan toevoegen, eigen trefwoorden. Geef daar ruimte voor in systemen. Dat is echter korte termijnpolitiek, want tags worden vergeten en veranderen in de tijd.

De LATCH-gegevens blijven staan als een huis, waarmee de duurzame toegankelijkheid sterk wordt bevorderd.

 

Geen opmerkingen:

Een reactie posten