Deze bijdrage is geschreven vanuit het idee, dat het zo jammer is wanneer de geschiedenis van de informatiewetenschap wordt vergeten. Om die reden een hommage aan de helden van de bibliografie: Dewey, Otlet en de filosofen, die met ordening begonnen.
Toegankelijk maken en behoud van informatie zijn twee elementen, die niet los van elkaar kunnen worden gezien. Het behoud van zowel het medium, de vorm als de taal waarin de informatie is gegoten, is een middel om het uiteindelijke doel te realiseren: de toegankelijkheid. De behoefte aan toegankelijkheid is de enige reden en rechtvaardiging voor behoud. Wat ontoegankelijk wordt bewaard wordt zinloos bewaard. Dat is de reden waarom de begrippen preservation and access steeds gezamenlijk worden gebruikt. Digitale gegevensopslagmedia moeten we vooralsnog tot de minst betrouwbare media aller tijden beschouwen. Microfilm daarentegen is het meest betrouwbare medium van opslag. Het medium is volledig gestandaardiseerd, de film is desnoods met een vergrootglas leesbaar en bewijst zich al gedurende meer dan honderdvijftig jaar.[1] De verwachting is dat digitalisering zal leiden tot behoorlijke investeringen in beheer. Toch is microfilm momenteel not done: dat heeft hoofdzakelijk te maken met de toegankelijkheid, het chemische proces waarin de film wordt aangemaakt en de snelle toegankelijkheid van digitale media.
Metadata is data over data. De term komt uit de informatiewetenschap, uit de theorie van database managementsystemen. Databases bevatten gestructureerde gegevens. Metadata beschrijven welke groepen gegevens in de database zijn opgeslagen, hoe ze zijn gestructureerd, welke vorm ze hebben, wie ze creëerde, wie ze mag inzien, wijzigen of vernietigen. Metadata zijn in de database zelf opgeslagen, in de datadictionary en datadirectory. In systeemtermen spreken we van een metadatasysteem als deelsysteem van een informatiesysteem.
Metadata hebben verschillende functies: ze zijn onmisbaar bij systeemontwerp, systeembeheer en voor het terugvinden van gegevens. Dit laatste is duidelijk te zien in een formele zoekopdracht voor een relationele database in SQL (Structured Query Language): Select <columname(s)> from <tablename>.
Ook voor minder gestructureerde informatieobjecten zoals tekstdocumenten, kaarten en fotomateriaal is metadata relevant. Denk bijvoorbeeld aan de namen en andere attributen van bestanden. Aan deze formele metadata kan ook beschrijvende informatie toegevoegd worden.
Metadata structureren en beschrijven informatiebronnen. Ze worden toegekend, en/of ontleend aan een document. Ontlenen we metadata aan een document, dan spreken we over derived indexing, bij toekennen over assigned indexing. Hoe meer metadata we aan documenten kunnen ontlenen des te beter: dit kan automatisch en kost ons dus geen extra werk.
Hoe groter een collectie wordt, des te belangrijker wordt het om documenten te ontsluiten door hieraan metadata toe te voegen. Dit kan door het toekennen van indextermen: classificatienummers of trefwoorden, al dan niet via een systeem gecontroleerd (gecontroleerd trefwoordensysteem of thesaurus). Deze termen worden ondergebracht in een logisch schema, waarin gelijksoortige zaken op onderwerp bij elkaar worden gebracht. Het opstellen van een dergelijk schema wordt classificeren genoemd (het opstellen van een klassement), het toepassen van dit indelingsschema is het klasseren (het toekennen van een plaats van een document in een verzameling). Via het schema leveren we producten die gerekend worden tot de documentatie, wat wordt omschreven als “het leveren van toegang tot de inhoudelijke kennis van documenten, vooral van gedeelten van gedrukte documenten en zonder beperkingen tot welke collectie dan ook”.[2]
Het maken van indexschema’s dateert van oude tijden en stamt uit de filosofie. Otlet noemde de classificatie van kennis de hoogste intellectuele activiteit. De mens ordent zijn omgeving en deelt de menselijke kennis in. Deze indeling is echter steeds cultuur- en tijdsgebonden. Er wordt gezocht naar overeenkomsten en verschillen van objecten en naar de relatie waarin deze objecten staan ten opzichte van elkaar. Naar de uitkomsten van het denkproces worden de objecten gegroepeerd in klassen.
De classificatieleer komt voort uit de filosofie. Plato (427 – 347 v.Chr.) concludeerde dat de menselijke kennis te verdelen was in drie klassen: het fysische (het waarneembare of bestaande); de ethiek en de logica. Aristoteles (384 – 322 v.Chr.) herschikte deze hoofdgroepen in de ethica (hieronder de wetenschap van de economie, de politiek en het recht), de kunst en de theoretische kennis (wiskunde, fysica en theologie).
Praktische toepassingen van de classificatie dateren ook al vanuit de oudheid. De verzameling kleitabletten van de Assyrische koning Assurbani-pal (669 - 626 v.Chr.) werd verdeeld in zes groepen: geschiedenis, wetten, wetenschap, magie, dogma en overlevering.
Ptolemeus Stoter stichtte in opdracht van Alexander de Grote in de derde eeuw v.Chr. de bibliotheek van Alexandrië. Deze Tempel der Wijsheid zou 700 jaar later verwoest worden en bevatte naar verluid 500.000 boekrollen. De bibliothecaris Callimachus (310- 240 v.Chr.) stelde de Pinakes op, een catalogus van 120 delen van de boekrollen in de bibliotheek met de categorieën dichtkunst, geschiedenis, filosofie, redekunst en diversen.[3]
Nadat omstreeks 1450 de boekdrukkunst werd uitgevonden, ontstond een eerste informatie-explosie.[4] Een belangrijk werk op classificatiegebied werd in 1545 gepubliceerd, toen de universele wetenschapper Konrad Gesner de Bibliotheca Universalis uitgaf. Dit werk bestaat uit drie delen: als eerste een alfabetische lijst van de door hem beschreven auteurs, als derde een alfabetische lijst van de onderwerpen die worden beschreven en een tweede deel, het Pandectarium genaamd. Dit deel omvat 21 boeken en geeft een rangschikking van de onderwerpen der wetenschap in een systematisch verband. De hoofdindeling van het Pandectarium ontleende hij aan Satyricon van Martinus Capelle (± 440 n.Chr.). Deze indeling is gebaseerd op twee hoofdgroepen: de woordkunst, Trivium genaamd omdat zij bestaat uit de drie delen taalkunde, logica en redekunst en de wetenschap der dingen, het Quadrivium, die het viertal meetkunde, rekenkunde, astronomie en kunst omvatte. Gebieden die door Gesner werden uitgebreid met geschiedenis, theologie, medische wetenschap e.a.
Dan duurt het tot de 17e eeuw voordat Francis Bacon (1561-1620) in zijn boek Advancement of Human learning (1605) een classificatie opstelt, die zeer invloedrijk is geweest en - alhoewel in omgekeerde vorm - tot op de dag van vandaag wordt gebruikt door bibliotheken. Bacon’s argumentatie voor deze classificatie was als volgt:
De mens doet met de zintuigen indrukken op van buiten. Deze indrukken worden opgeslagen in het geheugen. Zolang het geheugen deze indrukken alleen als feiten kan terugroepen, zijn dit herinneringen zonder meer. Wordt door de herinnering de verbeeldingskracht opgewekt, dan wordt de fantasie actief. Zodra de geest de herinneringen gaat analyseren, bekritiseren en onderverdelen, dan wordt het terrein van de filosofie betreden.
Uitgaande van deze redenering ontwierp hij een classificatie, gebaseerd op drie hoofdklassen:
1. geschiedenis (herinnering aan de feiten die voorbij zijn)
2. kunst (de fantasie)
3. filosofie (het analyseren van werkelijkheid en verbeeldingskracht).
Elke hoofdklasse werd systematisch in subgroepen onderverdeeld.
Bacon’s opvattingen, die hij breedvoerig heeft beargumenteerd, werden later door Immanuel Kant (1724 – 1804)[5] verbeterd. Kant stelde dat de mens door gewaarwording komt tot waarneming, daarna komt tot begrip, tot kennis, tot wetenschap en uiteindelijk tot wijsheid.[6]
Uit de filosofische ordening ontstond de bibliografische ordening, op basis waarvan in eerste instantie het boekenbezit, later documenten van uiteenlopende aard, werden toegankelijk gemaakt.
Eind 19e eeuw nam de hoeveelheid publicaties, vooral van wetenschappelijke en technische literatuur, wederom explosief toe. Als reactie ontstaat vanaf 1880 de bibliotheek- en documentatiebeweging, een internationaal georganiseerd streven om publicaties efficiënt toegankelijk te maken. Het beheer van deze informatie had verschillende aspecten. Er waren efficiënte en betrouwbare technieken nodig voor het verzamelen, het behoud, het ordenen, beschrijven of representeren, selecteren (terugvinden, terughalen), reproduceren (kopiëren) en verwijderen van documenten. Deze activiteiten werden traditioneel aangegeven met de term bibliografie.[7]
Begin 20e eeuw werd het woord documentatie steeds meer toegepast in Europa. Vanaf 1920 wordt het begrip algemeen gebruikt als verzamelbegrip voor bibliografie, wetenschappelijke informatiedienstverlening, records management en archiefwerkzaamheden. Later wordt dit verzamelbegrip ook wel documentaire informatievoorziening genoemd, waaronder worden begrepen: “de documentaire activiteiten die betrekking hebben op het ontsluiten van primaire bronnen, de producten van secundaire literatuur die daarop betrekking heeft en de attendering op zowel primaire als secundaire bronnen”.[8]
Het toegankelijk maken van het boekenbezit via classificatie krijgt onder invloed hiervan een meer praktische betekenis. Het boek was de basisvorm waarin informatie werd verpakt, zoals de website dit nu is. Informatie werd als boek gedrukt, gedistribueerd en ter beschikking gesteld. De classificatie rangschikte de boeken naar de onderwerpen, die zij behandelden. Er kwamen steeds meer boeken, dus werd het belangrijker deze te rangschikken naar overeenkomsten en verschillen. Ook behandelden boeken meerdere onderwerpen en werd het daarom nodig om deze boeken, die maar op één plaats konden worden weggezet, via meerdere ingangen toegankelijk te maken. Boeken en delen daaruit werden opgevraagd naar hun onderwerp. De classificatie zou de onderwerpen logisch moeten rangschikken. Dit alles diende handmatig te gebeuren en de ontwikkeling van het standaard-bibliotheekfiche eind van de twintigste eeuw was een revolutionaire vinding: informatie werd muteerbaar en dupliceerbaar.
In 1876 verscheen Dewey’s Decimal Classification, een systeem voor het toegankelijk maken van bibliotheken. Melville Louis Kossuth Dewey (1851 – 1932)[9] gebruikte voor het indelen van het boekenbezit van de bibliotheek van het Amherst College (waar hij bibliothecaris was) de door Francis Bacon opgestelde indeling van de wetenschap, maar dan in een omgekeerde en uitgebreide volgorde. Hij voegde tevens een opzienbarende vernieuwing toe: het principe van de decimale notatie.
Elke classificatie maakt, ter onderscheiding van de onderdelen, gebruik van symbolen, waaronder letters, cijfers, wiskundige- en diacritische tekens. Cijfers hebben op letters vóór dat zij door elke cultuur op dezelfde manier worden geïnterpreteerd en ook dat de schrijf- en leeswijze in elke cultuur dezelfde is, van links naar rechts. De vinding van Dewey is niet dat hij voor zijn stelsel van bibliotheekrubricering cijfers koos, maar dat hij gebruik maakte van decimalen, waardoor de cijfers als rangwoorden kunnen worden gebruikt. Anders dan bij hele getallen het geval is, blijft bij decimalen door achtervoeging van een nieuw cijfer het nieuwe getal als ranggetal toch steeds zijn plaats behouden achter het oorspronkelijke decimale getal. Wanneer we decimale getallen rangschikken, dan nemen zij automatisch een bepaalde volgorde aan:
0,2
0,268
0,3
0,487
0,54
0,541
Hele getallen zouden als rangorde aannemen:
2
3
54
268
487
541
Door gebruik te maken van deze eigenschap van breukcijfers maakte Dewey als eerste een classificatie, die het mogelijk maakte klassen onbeperkt uit te breiden, zonder dat er hernummering van eenmaal gegeven aanduidingen nodig zou zijn. De onderverdeling gebeurt steeds door gebruik van duizendtallen.
Na Dewey zijn meerdere classificaties gevolgd. Cutter kwam in 1879 met de Expansive Classification, ook gebaseerd op een decimaal stelsel, maar dan aangeduid met een combinatie van letters in plaats van cijfers. Herbert Putman ontwierp in 1901 de Library of Congress Classification (nog steeds toegepast in de Congress-bibliotheek te Washington), Duff Brown publiceerde in 1906 zijn Subject Classification die vooral in Engeland gunstig werd ontvangen, S.R. Ranganathan, bibliothecaris te Madras ontwikkelde in 1933 de Colon Classification en H.E. Bliss ontwierp een systeem voor de bibliotheek van New York, in 1940 uitmondend in “A Bibliographic Classification”.[10]
Uit de Dewey Decimal Code ontstond in Europa, bij het Institut International de Bibliographie te Brussel, de in 1905 gepubliceerde Universele Decimale Classificatie. Dewey en de anderen maakten een bibliotheekclassificatie, in Brussel werd daarvan een bibliografisch systeem gemaakt, te gebruiken voor vele andere doeleinden: administratie en registratuur[11], indeling van grote documentatiecollecties, wettenverzamelingen e.d. Hierop gaan we in de volgende paragraaf dieper in, gezien de invloed die deze classificatie nog steeds heeft op de manier waarop hedendaagse –traditionele, papieren- informatie wordt toegankelijk gemaakt. De UDC en de bijbehorende documentencollectie worden momenteel gezien als “het papieren Internet”, of Internet-avant-la-lettre[12]
Paul Otlet (1868-1944)[13], jurist, werd gedurende zijn studie geconfronteerd met de wanordelijke staat waarin de literatuur van de sociale wetenschappen zich bevond. Samen met de jurist Henri la Fontaine stichtte hij in 1895 het Institut international de Bibliographie (IIB), de latere International Federation for Information and Documentation[14] (FID[15]). In datzelfde jaar hoort hij tijdens een verblijf in Oostende spreken over de decimale classificatie van Dewey. [16] In London bekijkt hij vervolgens in het British Museum het daar aanwezige exemplaar en samen met La Fontaine neemt hij het besluit deze classificatie te gebruiken voor het toegankelijk maken van de bibliografieën die zij op dat moment in productie hebben. Ze verkrijgen van Dewey het recht om uitgaven van de Dewey Classification onder de naam Universele Decimale Classificatie te verzorgen in alle talen, behalve de Engelse. In 1905 verschijnt de eerste uitgave.
Otlet en La Fontaine zijn zeer actief geweest in de feministische-, de internationale- en vredesbeweging. In 1907 richtten zij l’Office centrale des associations internationales op. Hun activiteiten op het gebied van de wereldvrede leidden tot oprichting van de League of Nations en de Organisation for Intellectual Cooperation, die voorafging aan de Unesco[17] [18] . Dat binnen de League of Nations de nadruk lag op documentatie werd over het algemeen maar matig gewaardeerd. “Once it comes to be believed in League circles that salvation could be found in a perfect card index, and that the unruly flow of international politics could be canalized into a set of logically impregnable abstract formulae inspired by the doctrines of nineteenth-century liberal democracy, the end of the league as an effective political instrument was in sight”.[19] In vakkringen wordt Otlet beschreven als de vader en de grote promotor van documentatie “en al is zijn overspannen plan tot aanleg van een universele wereldbibliografie op kaartjes een tragi-komische mislukking geworden - een bibliografische ruïne van vijftien miljoen fiches - vaststaat dat Otlet in menig opzicht een zeer groot man in ons vak is geweest.[20]
Otlet was de grondlegger van de informatiewetenschap. Hij ontwikkelde in zijn lange loopbaan een enorme reeks publicaties[21], waarvan het boek “Traité de Documentation” (1934) zeer belangrijk is. Hij beschrijft in zijn werk uitgebreid de noodzaak van een internationaal systeem voor het gebruik van informatie, vanaf de creatie van documenten en het maken van een ingang op het document in het zoeksysteem[22] tot het ontwikkelen van nieuwe vormen van publicatie, van het beheer van bibliotheken, archieven, musea en andere informatiebestanden tot de ontwikkeling van gezamenlijke universele encyclopedia van de wetenschap, waarin alle kennis was ondergebracht die tot op dat moment onbeheersbaar en ontoegankelijk was. De toegang tot dit systeem werd geleverd door de Universele Decimale Classificatie, beheerd door het Office de Documentation, door een nieuw principe voor het indexeren en opslaan van informatie (het monografische principe, waarin uitsluitend nieuwe kennis werd toegevoegd aan reeds bestaande kennis) en door het gebruik van gestandaardiseerde microfilm, waardoor informatie snel terug te zoeken was en snel te dupliceren. Hij speculeerde al op on-line communicatie, op conversie van tekst naar spraak en omgekeerd, beschreef de specificaties van via een netwerk aan elkaar verbonden werkstations, alhoewel hij deze terminologie nog niet kende. Wat hij voorstelde was in wezen conceptueel niet anders dan het internet van vandaag. Uiteindelijk zou volgens hem een Universeel Netwerk voor Informatie en Documentatie ontstaan, waarin mensen toegang hadden via multimedia werkstations die helaas in zijn tijd nog niet waren uitgevonden: ziehier het internet avant la lettre.
Otlet kwam tot het inzicht dat de manier waarop boeken werden vervaardigd kennisvermeerdering tegenhield. Een citaat[23] :
“Een boek is niet meer dan een enkele, doorlopende lijn die afgebroken wordt op het einde van de pagina en weer doorloopt op een andere pagina, tot ook deze weer afgebroken wordt.
Documenten moeten ontdaan worden van de structuur van conventionele documenten. Hun inhoud zou als het ware moeten worden bevrijd door ze te de-componeren en opnieuw samen te stellen volgens het monografisch principe. Dit is het probleem waarmee alle kennissystemen kampen: de strijd tussen vorm en inhoud.” [24]
Otlet stelde in zijn “Traité” onder meer het volgende:
- Boeken vertegenwoordigen slechts een deel van de wetenschappelijke gegevens en dus slechts een deel van de wetenschap.
- Boeken vertegenwoordigen zowel ware als onjuiste kennis: boeken bevatten fouten.
- Boeken herhalen hetzelfde méér dan eens (boeken hebben een repeterend karakter).
- Boeken brengen informatie uit verschillende bronnen niet samen, maar verdelen en versplinteren informatie.
- Boeken rangschikken informatie niet naar belangrijkheid.
De inhoud van de informatiebronnen (boeken, delen van boeken, in een later stadium tijdschriften) en de conclusies die getrokken konden worden uit de inhoud dienen onderdeel te worden van de collectieve kennis van de mensheid. Om die reden was de persoon van de auteur volgens Otlet onbelangrijk, maar ging het om de nieuwe kennis, die een boek aan bestaande kennis toevoegde. Deze componenten werden in het systeem opgenomen, de andere niet, aangezien zij niets toevoegden.
Om het monografische principe met de miljoenen kaarten en bladen toegankelijk te houden was een systeem nodig. Het zoeksysteem werd gevormd door de omgewerkte Dewey Decimal Classification, de Universele Decimale Classificatie.[29] Buckland[30] noemt de UDC in dit geval “the assistance processor: a retrieval mechanism (or: collection of retrieval mechanisms)” voor een effectieve toegang tot de database aan documenten.
De systeemkaart was een essentieel onderdeel van de technologie tot het beschikbaar maken en opnieuw herverdelen van informatie in de wereldencyclopedie. De kaart was te manipuleren, te ordenen, te herschikken, te verdubbelen, op meerdere plaatsen onder te brengen en te verwijderen zonder dat het systeem geweld werd aangedaan. In 1914 bevatte deze ficheverzameling, als ingang op een omvangrijke documentatieverzameling, 11 miljoen fiches, eind 1930 waren dit er 15 miljoen.
De verzameling van miljoenen fiches en bijbehorende documentatie was destijds ondergebracht in het Palais Mondial, een onderdeel van het Palais du Cinquantenaire, (momenteel nog steeds als expositieruimte in gebruik) waar het Mundaneum gevestigd was. “Dit internationale centrum organiseert collecties van wereldwijd belang. Deze collecties zijn het Internationale Museum, de Internationale Bibliotheek, de Internationale Bibliografische Catalogus en de Universele Documentaire Archieven. Deze collecties moeten gezien worden als één universeel systeem voor de documentatie, als encyclopedisch overzicht van het geheel der menselijke kennis”. Het initiatief miste een behoorlijke financiële grondslag en werd grotendeels betaald uit het privévermogen van Otlet. In 1924 vond de nieuw aangetreden Belgische regering dat men de aan het IIB beschikbaar gestelde ruimte beter kon gebruiken en werd het instituut het gebruik opgezegd. Kort daarna werd ze wederom toegelaten, en in 1934 werden Otlet en La Fontaine definitief verbannen naar een oud universitair gebouw in het Leopoldpark, waar het instituut tot in de zeventiger jaren gevestigd bleef, terwijl het gebouw en de verzamelingen op een ontluisterende wijze in verval raakten. Tonnen aan materiaal zijn in de loop der decennia verloren gegaan, met name in de Tweede Wereldoorlog en gedurende de vijftiger en zestiger jaren, toen de collectie verspreid werd over diverse opslagplaatsen. Tot enkele jaren geleden de Waalse gemeenschap zich over de restanten ontfermde en in Mons een nieuw museum werd opgericht, Mundaneum genaamd, waar momenteel archivarissen en documentalisten, de meeste op vrijwillige basis, bezig zijn de ficheverzameling met behulp van de computer te ontsluiten en de in deplorabele staat verkerende bijbehorende documentatie te conserveren.
foto: een stripverhaal. Foto genomen tijdens reis door India.
Toegankelijk maken en behoud van informatie zijn twee elementen, die niet los van elkaar kunnen worden gezien. Het behoud van zowel het medium, de vorm als de taal waarin de informatie is gegoten, is een middel om het uiteindelijke doel te realiseren: de toegankelijkheid. De behoefte aan toegankelijkheid is de enige reden en rechtvaardiging voor behoud. Wat ontoegankelijk wordt bewaard wordt zinloos bewaard. Dat is de reden waarom de begrippen preservation and access steeds gezamenlijk worden gebruikt. Digitale gegevensopslagmedia moeten we vooralsnog tot de minst betrouwbare media aller tijden beschouwen. Microfilm daarentegen is het meest betrouwbare medium van opslag. Het medium is volledig gestandaardiseerd, de film is desnoods met een vergrootglas leesbaar en bewijst zich al gedurende meer dan honderdvijftig jaar.[1] De verwachting is dat digitalisering zal leiden tot behoorlijke investeringen in beheer. Toch is microfilm momenteel not done: dat heeft hoofdzakelijk te maken met de toegankelijkheid, het chemische proces waarin de film wordt aangemaakt en de snelle toegankelijkheid van digitale media.
Metagegevens als begrip
Metadata is data over data. De term komt uit de informatiewetenschap, uit de theorie van database managementsystemen. Databases bevatten gestructureerde gegevens. Metadata beschrijven welke groepen gegevens in de database zijn opgeslagen, hoe ze zijn gestructureerd, welke vorm ze hebben, wie ze creëerde, wie ze mag inzien, wijzigen of vernietigen. Metadata zijn in de database zelf opgeslagen, in de datadictionary en datadirectory. In systeemtermen spreken we van een metadatasysteem als deelsysteem van een informatiesysteem.
Metadata hebben verschillende functies: ze zijn onmisbaar bij systeemontwerp, systeembeheer en voor het terugvinden van gegevens. Dit laatste is duidelijk te zien in een formele zoekopdracht voor een relationele database in SQL (Structured Query Language): Select <columname(s)> from <tablename>.
Ook voor minder gestructureerde informatieobjecten zoals tekstdocumenten, kaarten en fotomateriaal is metadata relevant. Denk bijvoorbeeld aan de namen en andere attributen van bestanden. Aan deze formele metadata kan ook beschrijvende informatie toegevoegd worden.
Metadata structureren en beschrijven informatiebronnen. Ze worden toegekend, en/of ontleend aan een document. Ontlenen we metadata aan een document, dan spreken we over derived indexing, bij toekennen over assigned indexing. Hoe meer metadata we aan documenten kunnen ontlenen des te beter: dit kan automatisch en kost ons dus geen extra werk.
Hoe groter een collectie wordt, des te belangrijker wordt het om documenten te ontsluiten door hieraan metadata toe te voegen. Dit kan door het toekennen van indextermen: classificatienummers of trefwoorden, al dan niet via een systeem gecontroleerd (gecontroleerd trefwoordensysteem of thesaurus). Deze termen worden ondergebracht in een logisch schema, waarin gelijksoortige zaken op onderwerp bij elkaar worden gebracht. Het opstellen van een dergelijk schema wordt classificeren genoemd (het opstellen van een klassement), het toepassen van dit indelingsschema is het klasseren (het toekennen van een plaats van een document in een verzameling). Via het schema leveren we producten die gerekend worden tot de documentatie, wat wordt omschreven als “het leveren van toegang tot de inhoudelijke kennis van documenten, vooral van gedeelten van gedrukte documenten en zonder beperkingen tot welke collectie dan ook”.[2]
Het maken van indexschema’s dateert van oude tijden en stamt uit de filosofie. Otlet noemde de classificatie van kennis de hoogste intellectuele activiteit. De mens ordent zijn omgeving en deelt de menselijke kennis in. Deze indeling is echter steeds cultuur- en tijdsgebonden. Er wordt gezocht naar overeenkomsten en verschillen van objecten en naar de relatie waarin deze objecten staan ten opzichte van elkaar. Naar de uitkomsten van het denkproces worden de objecten gegroepeerd in klassen.
Filosofische ordening
Praktische toepassingen van de classificatie dateren ook al vanuit de oudheid. De verzameling kleitabletten van de Assyrische koning Assurbani-pal (669 - 626 v.Chr.) werd verdeeld in zes groepen: geschiedenis, wetten, wetenschap, magie, dogma en overlevering.
Ptolemeus Stoter stichtte in opdracht van Alexander de Grote in de derde eeuw v.Chr. de bibliotheek van Alexandrië. Deze Tempel der Wijsheid zou 700 jaar later verwoest worden en bevatte naar verluid 500.000 boekrollen. De bibliothecaris Callimachus (310- 240 v.Chr.) stelde de Pinakes op, een catalogus van 120 delen van de boekrollen in de bibliotheek met de categorieën dichtkunst, geschiedenis, filosofie, redekunst en diversen.[3]
Nadat omstreeks 1450 de boekdrukkunst werd uitgevonden, ontstond een eerste informatie-explosie.[4] Een belangrijk werk op classificatiegebied werd in 1545 gepubliceerd, toen de universele wetenschapper Konrad Gesner de Bibliotheca Universalis uitgaf. Dit werk bestaat uit drie delen: als eerste een alfabetische lijst van de door hem beschreven auteurs, als derde een alfabetische lijst van de onderwerpen die worden beschreven en een tweede deel, het Pandectarium genaamd. Dit deel omvat 21 boeken en geeft een rangschikking van de onderwerpen der wetenschap in een systematisch verband. De hoofdindeling van het Pandectarium ontleende hij aan Satyricon van Martinus Capelle (± 440 n.Chr.). Deze indeling is gebaseerd op twee hoofdgroepen: de woordkunst, Trivium genaamd omdat zij bestaat uit de drie delen taalkunde, logica en redekunst en de wetenschap der dingen, het Quadrivium, die het viertal meetkunde, rekenkunde, astronomie en kunst omvatte. Gebieden die door Gesner werden uitgebreid met geschiedenis, theologie, medische wetenschap e.a.
Dan duurt het tot de 17e eeuw voordat Francis Bacon (1561-1620) in zijn boek Advancement of Human learning (1605) een classificatie opstelt, die zeer invloedrijk is geweest en - alhoewel in omgekeerde vorm - tot op de dag van vandaag wordt gebruikt door bibliotheken. Bacon’s argumentatie voor deze classificatie was als volgt:
De mens doet met de zintuigen indrukken op van buiten. Deze indrukken worden opgeslagen in het geheugen. Zolang het geheugen deze indrukken alleen als feiten kan terugroepen, zijn dit herinneringen zonder meer. Wordt door de herinnering de verbeeldingskracht opgewekt, dan wordt de fantasie actief. Zodra de geest de herinneringen gaat analyseren, bekritiseren en onderverdelen, dan wordt het terrein van de filosofie betreden.
Uitgaande van deze redenering ontwierp hij een classificatie, gebaseerd op drie hoofdklassen:
1. geschiedenis (herinnering aan de feiten die voorbij zijn)
2. kunst (de fantasie)
3. filosofie (het analyseren van werkelijkheid en verbeeldingskracht).
Elke hoofdklasse werd systematisch in subgroepen onderverdeeld.
Bacon’s opvattingen, die hij breedvoerig heeft beargumenteerd, werden later door Immanuel Kant (1724 – 1804)[5] verbeterd. Kant stelde dat de mens door gewaarwording komt tot waarneming, daarna komt tot begrip, tot kennis, tot wetenschap en uiteindelijk tot wijsheid.[6]
Uit de filosofische ordening ontstond de bibliografische ordening, op basis waarvan in eerste instantie het boekenbezit, later documenten van uiteenlopende aard, werden toegankelijk gemaakt.
Bibliografische ordening
Eind 19e eeuw nam de hoeveelheid publicaties, vooral van wetenschappelijke en technische literatuur, wederom explosief toe. Als reactie ontstaat vanaf 1880 de bibliotheek- en documentatiebeweging, een internationaal georganiseerd streven om publicaties efficiënt toegankelijk te maken. Het beheer van deze informatie had verschillende aspecten. Er waren efficiënte en betrouwbare technieken nodig voor het verzamelen, het behoud, het ordenen, beschrijven of representeren, selecteren (terugvinden, terughalen), reproduceren (kopiëren) en verwijderen van documenten. Deze activiteiten werden traditioneel aangegeven met de term bibliografie.[7]
Begin 20e eeuw werd het woord documentatie steeds meer toegepast in Europa. Vanaf 1920 wordt het begrip algemeen gebruikt als verzamelbegrip voor bibliografie, wetenschappelijke informatiedienstverlening, records management en archiefwerkzaamheden. Later wordt dit verzamelbegrip ook wel documentaire informatievoorziening genoemd, waaronder worden begrepen: “de documentaire activiteiten die betrekking hebben op het ontsluiten van primaire bronnen, de producten van secundaire literatuur die daarop betrekking heeft en de attendering op zowel primaire als secundaire bronnen”.[8]
Het toegankelijk maken van het boekenbezit via classificatie krijgt onder invloed hiervan een meer praktische betekenis. Het boek was de basisvorm waarin informatie werd verpakt, zoals de website dit nu is. Informatie werd als boek gedrukt, gedistribueerd en ter beschikking gesteld. De classificatie rangschikte de boeken naar de onderwerpen, die zij behandelden. Er kwamen steeds meer boeken, dus werd het belangrijker deze te rangschikken naar overeenkomsten en verschillen. Ook behandelden boeken meerdere onderwerpen en werd het daarom nodig om deze boeken, die maar op één plaats konden worden weggezet, via meerdere ingangen toegankelijk te maken. Boeken en delen daaruit werden opgevraagd naar hun onderwerp. De classificatie zou de onderwerpen logisch moeten rangschikken. Dit alles diende handmatig te gebeuren en de ontwikkeling van het standaard-bibliotheekfiche eind van de twintigste eeuw was een revolutionaire vinding: informatie werd muteerbaar en dupliceerbaar.
Bibliografische classificatiesystemen
In 1876 verscheen Dewey’s Decimal Classification, een systeem voor het toegankelijk maken van bibliotheken. Melville Louis Kossuth Dewey (1851 – 1932)[9] gebruikte voor het indelen van het boekenbezit van de bibliotheek van het Amherst College (waar hij bibliothecaris was) de door Francis Bacon opgestelde indeling van de wetenschap, maar dan in een omgekeerde en uitgebreide volgorde. Hij voegde tevens een opzienbarende vernieuwing toe: het principe van de decimale notatie.
Elke classificatie maakt, ter onderscheiding van de onderdelen, gebruik van symbolen, waaronder letters, cijfers, wiskundige- en diacritische tekens. Cijfers hebben op letters vóór dat zij door elke cultuur op dezelfde manier worden geïnterpreteerd en ook dat de schrijf- en leeswijze in elke cultuur dezelfde is, van links naar rechts. De vinding van Dewey is niet dat hij voor zijn stelsel van bibliotheekrubricering cijfers koos, maar dat hij gebruik maakte van decimalen, waardoor de cijfers als rangwoorden kunnen worden gebruikt. Anders dan bij hele getallen het geval is, blijft bij decimalen door achtervoeging van een nieuw cijfer het nieuwe getal als ranggetal toch steeds zijn plaats behouden achter het oorspronkelijke decimale getal. Wanneer we decimale getallen rangschikken, dan nemen zij automatisch een bepaalde volgorde aan:
0,2
0,268
0,3
0,487
0,54
0,541
Hele getallen zouden als rangorde aannemen:
2
3
54
268
487
541
Door gebruik te maken van deze eigenschap van breukcijfers maakte Dewey als eerste een classificatie, die het mogelijk maakte klassen onbeperkt uit te breiden, zonder dat er hernummering van eenmaal gegeven aanduidingen nodig zou zijn. De onderverdeling gebeurt steeds door gebruik van duizendtallen.
Na Dewey zijn meerdere classificaties gevolgd. Cutter kwam in 1879 met de Expansive Classification, ook gebaseerd op een decimaal stelsel, maar dan aangeduid met een combinatie van letters in plaats van cijfers. Herbert Putman ontwierp in 1901 de Library of Congress Classification (nog steeds toegepast in de Congress-bibliotheek te Washington), Duff Brown publiceerde in 1906 zijn Subject Classification die vooral in Engeland gunstig werd ontvangen, S.R. Ranganathan, bibliothecaris te Madras ontwikkelde in 1933 de Colon Classification en H.E. Bliss ontwierp een systeem voor de bibliotheek van New York, in 1940 uitmondend in “A Bibliographic Classification”.[10]
Uit de Dewey Decimal Code ontstond in Europa, bij het Institut International de Bibliographie te Brussel, de in 1905 gepubliceerde Universele Decimale Classificatie. Dewey en de anderen maakten een bibliotheekclassificatie, in Brussel werd daarvan een bibliografisch systeem gemaakt, te gebruiken voor vele andere doeleinden: administratie en registratuur[11], indeling van grote documentatiecollecties, wettenverzamelingen e.d. Hierop gaan we in de volgende paragraaf dieper in, gezien de invloed die deze classificatie nog steeds heeft op de manier waarop hedendaagse –traditionele, papieren- informatie wordt toegankelijk gemaakt. De UDC en de bijbehorende documentencollectie worden momenteel gezien als “het papieren Internet”, of Internet-avant-la-lettre[12]
De Universele
Decimale Classificatie
Paul Otlet (1868-1944)[13], jurist, werd gedurende zijn studie geconfronteerd met de wanordelijke staat waarin de literatuur van de sociale wetenschappen zich bevond. Samen met de jurist Henri la Fontaine stichtte hij in 1895 het Institut international de Bibliographie (IIB), de latere International Federation for Information and Documentation[14] (FID[15]). In datzelfde jaar hoort hij tijdens een verblijf in Oostende spreken over de decimale classificatie van Dewey. [16] In London bekijkt hij vervolgens in het British Museum het daar aanwezige exemplaar en samen met La Fontaine neemt hij het besluit deze classificatie te gebruiken voor het toegankelijk maken van de bibliografieën die zij op dat moment in productie hebben. Ze verkrijgen van Dewey het recht om uitgaven van de Dewey Classification onder de naam Universele Decimale Classificatie te verzorgen in alle talen, behalve de Engelse. In 1905 verschijnt de eerste uitgave.
Otlet en La Fontaine zijn zeer actief geweest in de feministische-, de internationale- en vredesbeweging. In 1907 richtten zij l’Office centrale des associations internationales op. Hun activiteiten op het gebied van de wereldvrede leidden tot oprichting van de League of Nations en de Organisation for Intellectual Cooperation, die voorafging aan de Unesco[17] [18] . Dat binnen de League of Nations de nadruk lag op documentatie werd over het algemeen maar matig gewaardeerd. “Once it comes to be believed in League circles that salvation could be found in a perfect card index, and that the unruly flow of international politics could be canalized into a set of logically impregnable abstract formulae inspired by the doctrines of nineteenth-century liberal democracy, the end of the league as an effective political instrument was in sight”.[19] In vakkringen wordt Otlet beschreven als de vader en de grote promotor van documentatie “en al is zijn overspannen plan tot aanleg van een universele wereldbibliografie op kaartjes een tragi-komische mislukking geworden - een bibliografische ruïne van vijftien miljoen fiches - vaststaat dat Otlet in menig opzicht een zeer groot man in ons vak is geweest.[20]
Otlet was de grondlegger van de informatiewetenschap. Hij ontwikkelde in zijn lange loopbaan een enorme reeks publicaties[21], waarvan het boek “Traité de Documentation” (1934) zeer belangrijk is. Hij beschrijft in zijn werk uitgebreid de noodzaak van een internationaal systeem voor het gebruik van informatie, vanaf de creatie van documenten en het maken van een ingang op het document in het zoeksysteem[22] tot het ontwikkelen van nieuwe vormen van publicatie, van het beheer van bibliotheken, archieven, musea en andere informatiebestanden tot de ontwikkeling van gezamenlijke universele encyclopedia van de wetenschap, waarin alle kennis was ondergebracht die tot op dat moment onbeheersbaar en ontoegankelijk was. De toegang tot dit systeem werd geleverd door de Universele Decimale Classificatie, beheerd door het Office de Documentation, door een nieuw principe voor het indexeren en opslaan van informatie (het monografische principe, waarin uitsluitend nieuwe kennis werd toegevoegd aan reeds bestaande kennis) en door het gebruik van gestandaardiseerde microfilm, waardoor informatie snel terug te zoeken was en snel te dupliceren. Hij speculeerde al op on-line communicatie, op conversie van tekst naar spraak en omgekeerd, beschreef de specificaties van via een netwerk aan elkaar verbonden werkstations, alhoewel hij deze terminologie nog niet kende. Wat hij voorstelde was in wezen conceptueel niet anders dan het internet van vandaag. Uiteindelijk zou volgens hem een Universeel Netwerk voor Informatie en Documentatie ontstaan, waarin mensen toegang hadden via multimedia werkstations die helaas in zijn tijd nog niet waren uitgevonden: ziehier het internet avant la lettre.
Otlet kwam tot het inzicht dat de manier waarop boeken werden vervaardigd kennisvermeerdering tegenhield. Een citaat[23] :
“Een boek is niet meer dan een enkele, doorlopende lijn die afgebroken wordt op het einde van de pagina en weer doorloopt op een andere pagina, tot ook deze weer afgebroken wordt.
Documenten moeten ontdaan worden van de structuur van conventionele documenten. Hun inhoud zou als het ware moeten worden bevrijd door ze te de-componeren en opnieuw samen te stellen volgens het monografisch principe. Dit is het probleem waarmee alle kennissystemen kampen: de strijd tussen vorm en inhoud.” [24]
Otlet stelde in zijn “Traité” onder meer het volgende:
- Boeken vertegenwoordigen slechts een deel van de wetenschappelijke gegevens en dus slechts een deel van de wetenschap.
- Boeken vertegenwoordigen zowel ware als onjuiste kennis: boeken bevatten fouten.
- Boeken herhalen hetzelfde méér dan eens (boeken hebben een repeterend karakter).
- Boeken brengen informatie uit verschillende bronnen niet samen, maar verdelen en versplinteren informatie.
- Boeken rangschikken informatie niet naar belangrijkheid.
Teksten dienen daarom naar zijn mening gedecomponeerd te worden.[25] De kennis moet worden opgeslagen in zogenaamde universele boeken, voor elke discipline één. Dit zou een permanent ge-update encyclopedie zijn. Het zou een systematische, complete, actuele registratie vormen van alle feiten met betrekking tot een bepaald kennisgebied. Het zou worden samengesteld door alle relevante elementen uit talloze publicaties samen te brengen. Het universele boek diende overzichten te bevatten van feiten, catalogi van ideeën en de nomenclaturen van systemen en theorieën. Het zou verschillende wetenschappelijke gegevens onderbrengen in tabellen, diagrammen en schema’s. Het zou de gegevens illustreren met tekeningen, facsimilés en documentaire foto’s.[26]
In de Traité beschrijft hij systematisch de verschillende niveaus van informatie die deze nieuwe vorm van encyclopedie zou bevatten:
1. Encyclopedische documentaire dossiers, samengesteld uit pamfletten en uittreksels of delen van publicaties zonder dat er verder iets aan wordt gewijzigd.
2. Analoog aan 1 zouden “kaartdossiers” bestaan: documentaire dossiers, op kaarten overgenomen.
3. Encyclopedische kaarten of bladen zouden die informatie bevatten die zodanig gepubliceerd is dat deze direct in de encyclopedie kan worden opgenomen (dus: losbladige publicaties in een gestandaardiseerde vorm).
4. Encyclopedische atlassen (geen atlassen in de conventionele zin van het woord, maar eerder allocators, die we later zullen tegenkomen), bestaande uit tabellen en lijsten waarin belangrijke componenten uit de encyclopedie systematisch en via diagrammen met elkaar in verband wordt gebracht. De atlas vormt dus een soort navigatiesysteem tussen de verschillende databases.[27]
Als laatste was er het “ultieme werk van de documentatie”, bestaande uit een proces van encyclopedische classificatie (la codification). Classificatie was het “condenseren, generaliseren en samenstellen” van gegevens die gerelateerd waren aan bepaalde documenten. Een begripsonderwerp werd samengebracht in een cijfercombinatie, die weer een basis zou vinden in de Universele Decimale Classificatie. De nieuwe universele encyclopedie waarin al deze elementen waren verenigd zou collectief worden samengesteld door een netwerk van wetenschappers uit de gehele wereld volgens internationaal geaccepteerde methoden. Alle vooruitgang in kennis zou van dag tot dag worden vastgelegd.
In de Traité beschrijft hij systematisch de verschillende niveaus van informatie die deze nieuwe vorm van encyclopedie zou bevatten:
1. Encyclopedische documentaire dossiers, samengesteld uit pamfletten en uittreksels of delen van publicaties zonder dat er verder iets aan wordt gewijzigd.
2. Analoog aan 1 zouden “kaartdossiers” bestaan: documentaire dossiers, op kaarten overgenomen.
3. Encyclopedische kaarten of bladen zouden die informatie bevatten die zodanig gepubliceerd is dat deze direct in de encyclopedie kan worden opgenomen (dus: losbladige publicaties in een gestandaardiseerde vorm).
4. Encyclopedische atlassen (geen atlassen in de conventionele zin van het woord, maar eerder allocators, die we later zullen tegenkomen), bestaande uit tabellen en lijsten waarin belangrijke componenten uit de encyclopedie systematisch en via diagrammen met elkaar in verband wordt gebracht. De atlas vormt dus een soort navigatiesysteem tussen de verschillende databases.[27]
Als laatste was er het “ultieme werk van de documentatie”, bestaande uit een proces van encyclopedische classificatie (la codification). Classificatie was het “condenseren, generaliseren en samenstellen” van gegevens die gerelateerd waren aan bepaalde documenten. Een begripsonderwerp werd samengebracht in een cijfercombinatie, die weer een basis zou vinden in de Universele Decimale Classificatie. De nieuwe universele encyclopedie waarin al deze elementen waren verenigd zou collectief worden samengesteld door een netwerk van wetenschappers uit de gehele wereld volgens internationaal geaccepteerde methoden. Alle vooruitgang in kennis zou van dag tot dag worden vastgelegd.
Een metadatasysteem als eerste software?
Otlet noemde zijn nieuw bedachte methode om bronnenmateriaal te organiseren bibliografie volgens het Monografisch Principe. Dit principe zien we voor het eerst in “Die Brücke” vermeld als Prinzip der Monographisierung.[28] Het zou een eerste stap zijn in het documentair proces. Om nieuwe kennis te categoriseren, verdeelde hij de wetenschap in feiten, interpretatie van feiten, statistieken en informatiebronnen. Als we op deze manier een boek zouden de-componeren en elk hoofdstuk van een wetenschappelijk boek interpreteren dan zou volgens Otlet duidelijk worden op welk moment nieuwe kennis aan het wereldrepertoire van kennis wordt toegevoegd. De tekstblokken waarin dit gebeurt kunnen dan op kaarten worden vermeld, waarop direct de relaties met andere kennisgebieden worden aangegeven.
Otlet noemde zijn nieuw bedachte methode om bronnenmateriaal te organiseren bibliografie volgens het Monografisch Principe. Dit principe zien we voor het eerst in “Die Brücke” vermeld als Prinzip der Monographisierung.[28] Het zou een eerste stap zijn in het documentair proces. Om nieuwe kennis te categoriseren, verdeelde hij de wetenschap in feiten, interpretatie van feiten, statistieken en informatiebronnen. Als we op deze manier een boek zouden de-componeren en elk hoofdstuk van een wetenschappelijk boek interpreteren dan zou volgens Otlet duidelijk worden op welk moment nieuwe kennis aan het wereldrepertoire van kennis wordt toegevoegd. De tekstblokken waarin dit gebeurt kunnen dan op kaarten worden vermeld, waarop direct de relaties met andere kennisgebieden worden aangegeven.
De inhoud van de informatiebronnen (boeken, delen van boeken, in een later stadium tijdschriften) en de conclusies die getrokken konden worden uit de inhoud dienen onderdeel te worden van de collectieve kennis van de mensheid. Om die reden was de persoon van de auteur volgens Otlet onbelangrijk, maar ging het om de nieuwe kennis, die een boek aan bestaande kennis toevoegde. Deze componenten werden in het systeem opgenomen, de andere niet, aangezien zij niets toevoegden.
Om het monografische principe met de miljoenen kaarten en bladen toegankelijk te houden was een systeem nodig. Het zoeksysteem werd gevormd door de omgewerkte Dewey Decimal Classification, de Universele Decimale Classificatie.[29] Buckland[30] noemt de UDC in dit geval “the assistance processor: a retrieval mechanism (or: collection of retrieval mechanisms)” voor een effectieve toegang tot de database aan documenten.
De systeemkaart was een essentieel onderdeel van de technologie tot het beschikbaar maken en opnieuw herverdelen van informatie in de wereldencyclopedie. De kaart was te manipuleren, te ordenen, te herschikken, te verdubbelen, op meerdere plaatsen onder te brengen en te verwijderen zonder dat het systeem geweld werd aangedaan. In 1914 bevatte deze ficheverzameling, als ingang op een omvangrijke documentatieverzameling, 11 miljoen fiches, eind 1930 waren dit er 15 miljoen.
De verzameling van miljoenen fiches en bijbehorende documentatie was destijds ondergebracht in het Palais Mondial, een onderdeel van het Palais du Cinquantenaire, (momenteel nog steeds als expositieruimte in gebruik) waar het Mundaneum gevestigd was. “Dit internationale centrum organiseert collecties van wereldwijd belang. Deze collecties zijn het Internationale Museum, de Internationale Bibliotheek, de Internationale Bibliografische Catalogus en de Universele Documentaire Archieven. Deze collecties moeten gezien worden als één universeel systeem voor de documentatie, als encyclopedisch overzicht van het geheel der menselijke kennis”. Het initiatief miste een behoorlijke financiële grondslag en werd grotendeels betaald uit het privévermogen van Otlet. In 1924 vond de nieuw aangetreden Belgische regering dat men de aan het IIB beschikbaar gestelde ruimte beter kon gebruiken en werd het instituut het gebruik opgezegd. Kort daarna werd ze wederom toegelaten, en in 1934 werden Otlet en La Fontaine definitief verbannen naar een oud universitair gebouw in het Leopoldpark, waar het instituut tot in de zeventiger jaren gevestigd bleef, terwijl het gebouw en de verzamelingen op een ontluisterende wijze in verval raakten. Tonnen aan materiaal zijn in de loop der decennia verloren gegaan, met name in de Tweede Wereldoorlog en gedurende de vijftiger en zestiger jaren, toen de collectie verspreid werd over diverse opslagplaatsen. Tot enkele jaren geleden de Waalse gemeenschap zich over de restanten ontfermde en in Mons een nieuw museum werd opgericht, Mundaneum genaamd, waar momenteel archivarissen en documentalisten, de meeste op vrijwillige basis, bezig zijn de ficheverzameling met behulp van de computer te ontsluiten en de in deplorabele staat verkerende bijbehorende documentatie te conserveren.
Al vanaf het begin van hun arbeid waren Otlet en zijn collega’s ervan overtuigd dat standaardisatie noodzakelijk was om tot een snelle verspreiding en internationale samenwerking te komen. Bibliografieën zouden in een standaardformaat worden gepubliceerd, met uitsluitend aan één zijde tekst, elk blad voorzien van een UDC-classificatienummer en een standaard-perforatie. De publicaties konden dan worden verknipt en op fiches geplakt om in het Repertorium te worden geplaatst. Otlet experimenteerde met de publicatie van bibliografieën op losse vellen papier. Hij haalde dit idee uit Nelson’s Perpetual Loose-Leaf Encyclopedia, die in 1905 voor de eerste keer verscheen.[31] Rayward noemt in zijn artikel "The case of Paul Otlet, pioneer of information science” de UDC als het eerste grote softwarepakket.[32] De UDC, nog steeds in gebruik bij veel bibliotheken en door een Consortium met behulp van vele wetenschappers up-to-date gehouden, gaf toegang tot de fichecatalogus.[33] Deze fiches gaven op hun beurt –indien er meer informatie voorhanden was- een verwijzing naar de verblijfplaats van het document.
Om het mogelijk te maken om de database van 13 miljoen fiches te doorzoeken werden primitieve concepten voor zoekstrategieën geformuleerd, zoals de Booleaanse operatoren (NT narrower Term, BT Broader term).[34]
Het systeem van Otlet en La Fontaine was eigenlijk de voorbode van een internationaal documentmanagementsysteem waarbij vanaf de creatie van een registratie (dit is: een beschrijving van een document) in een catalogus het document bekend is en wordt geordend naar onderwerp. Met deze systematiek was het mogelijk om grote documentverzamelingen te beheersen en beheren, zoals museale collecties, bibliotheken en archieven. Deze instellingen zouden als kennisagentschappen met elkaar in verbinding staan waardoor een gezamenlijke universele wereldencyclopedie mogelijk werd: alle kennis die de mens bezat, zou daarin worden ondergebracht. Centraal hierbij waren enkele elementen:
- De Universele Declimale Classificatie.
- Een nieuw informatie-instituut: het Office de Documentation.
- Een nieuw systeem voor het indexeren en de opslag van informatie: het monografisch systeem.
- De sterk gecomprimeerde informatie, opgeslagen op microfilm.
Internet avant la lettre. Een terechte aanduiding voor dit imposante werk waaraan door Otlet werd doorgewerkt tot op hoogbejaarde leeftijd, misschien tegen beter weten in. Dat momenteel Otlet is herontdekt, onder meer door Google, die het Mundaneum sponsort, vormt een reden om deze pionier niet te vergeten.
Een complicerende factor in zijn tijd was dat alle activiteiten handmatig dienden te worden verricht en dat de communicatietechniek nog tot volle wasdom moest komen. Er waren geen computers, noch voorboden daarvan. Door de gebrekkige infrastructuur was het erg moeilijk om de collectie te raadplegen. Wilde iemand het systeem bevragen – zo hij of zij al van het bestaan op de hoogte was - dan diende een brief te worden geschreven met een zoekvraag gesteld in UDC-termen. Deze werd ontvangen te Brussel en daar werden de fiches gezocht met het antwoord. Deze antwoorden dienden te worden overgenomen in een conceptantwoord, waarna de fiches terug in de verzameling werden geplaatst en de brief werd verzonden. Met behulp van Internet is deze tijdrovende activiteit teruggebracht tot luttele seconden.
Een nadeel van de UDC is de gebruiksonvriendelijkheid, bezien vanuit de persoon die niet bekend is met de systematiek. Classificaties zijn slechts toegankelijk voor ingewijden. Ze zijn samengesteld uit kunsttaal, en ook deze taal diende weer ontsloten te worden.
Een belangrijke karakteristiek van de UDC is de veeltaligheid. Er bestaan geautoriseerde uitgaven in 20 talen met volledige, middelgrote en verkorte uitgaven en specifieke deelcodes. Een netwerk van internationale revisiecommissies zorgt voor een peer-reviewsysteem waarin voorstellen als P-note worden bekend gemaakt en na autorisatie worden tot Extensions and Corrections to the UDC.
Van kunsttaal naar natuurlijke taal
Indien we echter een eindgebruiker in staat willen stellen om zelf informatie te zoeken, neemt de behoefte aan natuurlijke taal toe. Hiervoor werden woordsystemen ingericht, gebaseerd op trefwoorden.
Een trefwoord is een woord of een combinatie van woorden waarmee een onderwerp in een document nauwkeurig wordt aangeduid. Trefwoordsystemen verschillen van een classificatie doordat zij niet in hun context bij elkaar worden gezet, maar alfabetisch worden gerangschikt op basis van de opeenvolging van de letters van een woord. De eerder genoemde Cutter ontwikkelde al in een vroeg stadium (1876) de Rules for a dictionary catalog om eenheid te brengen in het gebruik van trefwoorden.
Trefwoorden kunnen vrij worden toegekend (vrije of ongecontroleerde trefwoorden) of er wordt een lijst voor afgesproken, de standaard-trefwoordenlijst. In een dergelijke lijst worden afspraken gemaakt over het gebruik van homoniemen en synoniemen, de zie- en zie ook verwijzingen.
In de documentatie wordt het gebruik van trefwoorden bij het toegankelijk maken van deelonderwerpen in documenten als een bevrijding ervaren. Een voorstudie om het systeem toe te passen is niet nodig; nieuwe woorden zijn gemakkelijk in het systeem in te passen, dus de flexibiliteit is gegarandeerd.
Toch wil de gebruiker ook documenten in een bepaalde samenhang tot elkaar blijven zien. Er worden in een bibliotheek niet voor niets hoofdklassen gevormd naar onderwerp, op basis waarvan de boeken dan nader worden ingedeeld. We zien dus beide systemen naast elkaar voorkomen.
Om het mogelijk te maken om de database van 13 miljoen fiches te doorzoeken werden primitieve concepten voor zoekstrategieën geformuleerd, zoals de Booleaanse operatoren (NT narrower Term, BT Broader term).[34]
Het systeem van Otlet en La Fontaine was eigenlijk de voorbode van een internationaal documentmanagementsysteem waarbij vanaf de creatie van een registratie (dit is: een beschrijving van een document) in een catalogus het document bekend is en wordt geordend naar onderwerp. Met deze systematiek was het mogelijk om grote documentverzamelingen te beheersen en beheren, zoals museale collecties, bibliotheken en archieven. Deze instellingen zouden als kennisagentschappen met elkaar in verbinding staan waardoor een gezamenlijke universele wereldencyclopedie mogelijk werd: alle kennis die de mens bezat, zou daarin worden ondergebracht. Centraal hierbij waren enkele elementen:
- De Universele Declimale Classificatie.
- Een nieuw informatie-instituut: het Office de Documentation.
- Een nieuw systeem voor het indexeren en de opslag van informatie: het monografisch systeem.
- De sterk gecomprimeerde informatie, opgeslagen op microfilm.
Internet avant la lettre. Een terechte aanduiding voor dit imposante werk waaraan door Otlet werd doorgewerkt tot op hoogbejaarde leeftijd, misschien tegen beter weten in. Dat momenteel Otlet is herontdekt, onder meer door Google, die het Mundaneum sponsort, vormt een reden om deze pionier niet te vergeten.
Een complicerende factor in zijn tijd was dat alle activiteiten handmatig dienden te worden verricht en dat de communicatietechniek nog tot volle wasdom moest komen. Er waren geen computers, noch voorboden daarvan. Door de gebrekkige infrastructuur was het erg moeilijk om de collectie te raadplegen. Wilde iemand het systeem bevragen – zo hij of zij al van het bestaan op de hoogte was - dan diende een brief te worden geschreven met een zoekvraag gesteld in UDC-termen. Deze werd ontvangen te Brussel en daar werden de fiches gezocht met het antwoord. Deze antwoorden dienden te worden overgenomen in een conceptantwoord, waarna de fiches terug in de verzameling werden geplaatst en de brief werd verzonden. Met behulp van Internet is deze tijdrovende activiteit teruggebracht tot luttele seconden.
Een nadeel van de UDC is de gebruiksonvriendelijkheid, bezien vanuit de persoon die niet bekend is met de systematiek. Classificaties zijn slechts toegankelijk voor ingewijden. Ze zijn samengesteld uit kunsttaal, en ook deze taal diende weer ontsloten te worden.
Een belangrijke karakteristiek van de UDC is de veeltaligheid. Er bestaan geautoriseerde uitgaven in 20 talen met volledige, middelgrote en verkorte uitgaven en specifieke deelcodes. Een netwerk van internationale revisiecommissies zorgt voor een peer-reviewsysteem waarin voorstellen als P-note worden bekend gemaakt en na autorisatie worden tot Extensions and Corrections to the UDC.
Van kunsttaal naar natuurlijke taal
Indien we echter een eindgebruiker in staat willen stellen om zelf informatie te zoeken, neemt de behoefte aan natuurlijke taal toe. Hiervoor werden woordsystemen ingericht, gebaseerd op trefwoorden.
Een trefwoord is een woord of een combinatie van woorden waarmee een onderwerp in een document nauwkeurig wordt aangeduid. Trefwoordsystemen verschillen van een classificatie doordat zij niet in hun context bij elkaar worden gezet, maar alfabetisch worden gerangschikt op basis van de opeenvolging van de letters van een woord. De eerder genoemde Cutter ontwikkelde al in een vroeg stadium (1876) de Rules for a dictionary catalog om eenheid te brengen in het gebruik van trefwoorden.
Trefwoorden kunnen vrij worden toegekend (vrije of ongecontroleerde trefwoorden) of er wordt een lijst voor afgesproken, de standaard-trefwoordenlijst. In een dergelijke lijst worden afspraken gemaakt over het gebruik van homoniemen en synoniemen, de zie- en zie ook verwijzingen.
In de documentatie wordt het gebruik van trefwoorden bij het toegankelijk maken van deelonderwerpen in documenten als een bevrijding ervaren. Een voorstudie om het systeem toe te passen is niet nodig; nieuwe woorden zijn gemakkelijk in het systeem in te passen, dus de flexibiliteit is gegarandeerd.
Toch wil de gebruiker ook documenten in een bepaalde samenhang tot elkaar blijven zien. Er worden in een bibliotheek niet voor niets hoofdklassen gevormd naar onderwerp, op basis waarvan de boeken dan nader worden ingedeeld. We zien dus beide systemen naast elkaar voorkomen.
Met deze constatering zijn we aangeland aan het einde van de handmatige ontsluitingsactiviteiten. De komst van de computer zou alles veranderen: in plaats van pre-coördinatief documenten te ontsluiten, werd het mogelijk om dit post-coördinatief te doen.
Daarover meer in een volgende bijdrage.
[29] In Nederland: Universele Decimale Classificatie- tabellen. (Alphen aan den Rijn 1989).
[30] Visions of Xanadu: Paul Otlet (1868 – 1944) and Hypertext. W. Boyd Rayward, JASIS 45 (1994): 235 – 250.
[31] Ook bij Die Brücke van Wilhelm Oswald bestond het idee om een encyclopedie te ontwikkelen via een systeem van kaartindexen, gekoppeld aan de microfotografische bibliotheek van Robert Goldschmidt (zie hierover meer Das Gehirn der Welt (1912). Oswald streefde in Duitsland een gelijksoortig idee als dat van Otlet na.
[32] Dit is niet terecht: zo er al van het eerste softwarepakket gesproken kan worden, ligt de eer bij Melvil Dewey, die immers ook de catalogus gebruikt om het boekenbezit toegankelijk te maken.
[33]International Federation for Documentation, Index to UDC Editions, FID Publications: an 80 Year Bibliography, 1895-1975. (FID 1975). 87 - 90.
[34] Enkele cijfers: in 1895 bevatte het Universele Bibliografische Repertorium 400.000 fiches, in april 1934 waren dat er 15.646.346. Het Universal Iconographic Repertory (bestaande uit illustratief materiaal) omvatte in 1912 250.000 items, gebaseerd op materiaal van het Institut International de Photographie, waarin de collectie van de fotograaf Ernst Potter is opgenomen. Het Encyclopedic Repertory of Files (waarin samengestelde materialen die te maken hadden met “alle objecten en alle feiten over menselijke activiteit in iedere dimensie” omvatte omstreeks 1914 10.000 files met daarin ongeveer een miljoen items. Al dit materiaal was natuurlijk toegankelijk gemaakt met behulp van de UDC.
Daarover meer in een volgende bijdrage.
[1] Zie de omvangrijke
collecties fotonegatieven die in archieven en documentatiecentra te vinden
zijn.
[2] T.P.
Loosjes, Dokumentation wissenschaftlicher Literatur. (Münich 1962). 1-8,
geciteerd door Buckland, ‘What is a
document’ in: JASIS 48, nr. 9 (sept. 1997) 804-809. Na 1950 werd het woord
documentatie vervangen door informatiewetenschap, information storage and
retrieval, informatiemanagement en daaraan gerelateerde termen.
[3] In 2002 is een
bibliotheek opgegraven die kopieën van een deel van deze bibliotheek bevat, de
bibliotheek van Philodemus in het Herculaneum, Pompeï.
Bibliotheek betekent letterlijk: bewaarplaats van papyrusrollen en dat is deze
bibliotheek ook. Aan elkaar geplakte papyrusvellen werden, voorzien van een
opschriftschildje, het titulus, opgeborgen in stenen vazen, houten kisten,
nissen in de wand.
[4] Er zijn vier stadia te
onderkennen in de ontwikkeling: het schrift, de boekdrukkunst, de opkomst van
de schrijfmachine en de opkomst van de computer.
[5] Immanuel Kant, Kritik
der Reinen Vernunft.
[6] Vergelijk de manier
waarop heden wordt gedacht over de ontwikkelingstrits
data-informatie-kennis-wijsheid.
[7] Reproduceren maakte
daarvan geen deel uit.
[8] Dit is: de
bibliografische beschrijving, indexering, het refereren, de vervaardiging van
referaatbladen of “current contents”, attenderen, het opbouwen van
geautomatiseerde bestanden met bibliografische gegevens en het verschaffen van
gezochte documenten.
[9] Dewey heeft een grote
rol gespeeld in de wetenschappelijke fundering van het bibliotheekwezen. Hij
richtte de American Library Organisation op en The Library Journal en
propageerde de decimale classificatie. Verder was hij stichter van de Spelling
Reform Association en was hij oprichter van het American Metric Bureau, was
stichter van de Readers and Writers Economy Company, startte in 1887 de eerste
universitaire opleiding voor bibliothecarissen, was pionier op het gebied van
de verticale opberging van dossiers en kaartsystemen, bedacht het
gestandaardiseerde bibliotheekfiche en stichtte later (op zestigjarige
leeftijd) de Lake Placid Club, een omvangrijke coöperatieve onderneming tot
exploitatie van een vakantieoord aan Lake Placid. Hij hield zich bezig met de
bevordering van de stenografie, het feminisme en de drankbestrijding. Hij werd gedreven door economische principes:
door normalisatie kon tijdbesparing worden bereikt (in spelling, metriek,
bibliotheeksystematiek en standaardisatie van afmetingen). Zie de
artikelenserie van Dr. C. van den Berg, Overheidsdocumentatie, september 1962,
blz. 79-82, februari 1963, blz. 127 – 130; mei 1963, blz. 151 – 154; juni 1963
blz. 159 – 162. Een voorbeeld moge de volgende
“explanation” zijn: This Clasification divides knowlej into 9 main clases
numberd 1 to 9. Cyclopedias, periodicals, etc. so jeneral as to belong to no
one of these clases ar markt o (naught) and form a 10th clas. Uit:
Decimal Clasification and Relativ Index for libraries and personal use in
arranjing for immediate reference. Edition II, revized and enlarjd. Forest Pres, Lake Placid Club Adirondaks N Y,
1922.
[10] De DDC en LCC hebben de
grootste gebruikerskring. In Nederland en Vlaanderen wordt voor openbare
bibliotheken de SISO-code gebruikt, het Schema voor de Indeling van de
Systematische Catalogus in Openbare bibliotheken (Den Haag 1980).
Wetenschappelijke en speciale bibliotheken gebruiken eigen, particularistische
schema’s, maar ook wel de UDC.
[11] Onder registratuur wordt
verstaan: het ordenen en bewaren van archiefstukken gedurende de dynamische
fase, dit is de periode wanneer zij nog dagelijks in gebruik zijn en het
archief zich nog vormt.
[12] Un Internet de papier: le Mundaneum. (Mons, 1998).
[13] Otlet was
een ziener met een zeer inspirerende persoonlijkheid. Hij schrijft in 1912 al
over experimenten met microfilm "livre microphotographique. Le bibliophote ou livère à projection" Bulletin
Officiel de l’ Union de la Presse Périodique Belge 20 (September – October
1911) 197 – 205. In de jaren 30 speculeert hij hoe een breed aanbod aan nieuwe
technologie kan worden gecombineerd om nieuwe functionaliteit te bereiken: het
zoeken naar informatie, de analyse, het structureren van informatie en het
gebruik. Deze functies (die hij zag in de combinatie van radio, telefoon,
projectie, microfilm en televisie) zouden worden gecombineerd in nieuwe
informatiemachines, wat we vandaag de dag een werkstation zouden noemen.
[14] Documentation is een
neologisme, door Otlet bedacht, evenals het Mundaneum een niet-bestaand Latijns
woord was.
[15] De FID heeft bestaan
tot 2000 en werd daarna ontbonden.
[16]
W. Boyd Rayward, The Universe of Information. The work of
Paul Otlet for Documentation and International Organisation. (Moscow 1975).
[17] La Fontaine kreeg voor
zijn bijdrage op pacifistisch gebied in 1913 de Nobelprijs voor de vrede.
[18] Serge Brisy, ‘Paul Otlet, Un grand Belge’ in: Tribune 1945, cahier
51 (1945).
[19]
Edward Hallettt Carr, The Twenty Year’s Crisis: 1919 –
1939. An introduction to the Study of International Relations. (New York 1964).
[20] P. Schneiders,
‘Bibliotheek, bibliografie en documentatie: een historische benadering’ in: Bibliotheek
en documentatie, Handboek ten dienste van de opleidingen (Deventer 1984).
[21] Zie de bibliografie van
Otlet, opgesteld door zijn biograaf W. Boyd Rayward.
[22] Dit is bij voorbeeld
een verzameling cataloguskaarten, die verwijst naar de vindplaatsen van documenten.
[23] Traité de
Documentation, 1934.
[24] Vergelijk Wikipedia
[25] Vergelijk
Hypertextstructuren
[26] Citaat uit Traité de Documentation. (Bruxelles 1934). 83.
[27] Otlet vond schema’s,
diagrammen, kaarten en tabellen van uitzonderlijk belang uit onderwijskundig
opzicht en om het denken te verhelderen en te stimuleren. Hierdoor konden
concepten worden verduidelijkt en met elkaar in verband worden gebracht. Sir
Patrick Geddes, een Schots stedebouwkundige en socioloog noemde ze “Thinking
Machines”. Denk aan de infographics van nu.
[28] Die Brücke was een
genootschap voor de studie van de organisatie van kennis, opgericht in 1911
door de Duitse chemicus Wilhelm Oswald. Otlet was erevoorzitter.
[30] Visions of Xanadu: Paul Otlet (1868 – 1944) and Hypertext. W. Boyd Rayward, JASIS 45 (1994): 235 – 250.
[31] Ook bij Die Brücke van Wilhelm Oswald bestond het idee om een encyclopedie te ontwikkelen via een systeem van kaartindexen, gekoppeld aan de microfotografische bibliotheek van Robert Goldschmidt (zie hierover meer Das Gehirn der Welt (1912). Oswald streefde in Duitsland een gelijksoortig idee als dat van Otlet na.
[32] Dit is niet terecht: zo er al van het eerste softwarepakket gesproken kan worden, ligt de eer bij Melvil Dewey, die immers ook de catalogus gebruikt om het boekenbezit toegankelijk te maken.
[33]International Federation for Documentation, Index to UDC Editions, FID Publications: an 80 Year Bibliography, 1895-1975. (FID 1975). 87 - 90.
[34] Enkele cijfers: in 1895 bevatte het Universele Bibliografische Repertorium 400.000 fiches, in april 1934 waren dat er 15.646.346. Het Universal Iconographic Repertory (bestaande uit illustratief materiaal) omvatte in 1912 250.000 items, gebaseerd op materiaal van het Institut International de Photographie, waarin de collectie van de fotograaf Ernst Potter is opgenomen. Het Encyclopedic Repertory of Files (waarin samengestelde materialen die te maken hadden met “alle objecten en alle feiten over menselijke activiteit in iedere dimensie” omvatte omstreeks 1914 10.000 files met daarin ongeveer een miljoen items. Al dit materiaal was natuurlijk toegankelijk gemaakt met behulp van de UDC.
Geen opmerkingen:
Een reactie posten