banner

Elke bibliotheek een Alexandrijnse

Elektronische publicaties en digitalisering

Edward Vanhoutte

edward.vanhoutte@kantl.be

Digitalisering is de laatste jaren zowat het kernwoord geworden in de bibliotheek- en de archiefsector. Niet alleen is er heel veel aandacht voor digitaliseringsprojecten die opgezet worden als een essentieel onderdeel van een geïntegreerd preservatie- en conservatiebeleid, ook de modale bibliotheekcollectie bestaat al voor een groot stuk uit elektronische publicaties allerhande. En dat bezorgt menig bibliothecaris en catalograaf heel wat kopzorgen. De illusie dat een nieuwe Alexandrijnse Bibliotheek met de nieuwe technologieën en elektronische publicaties een haalbare kaart wordt, zou wel eens doorprikt kunnen worden door de dreiging van de moderne versie van de legendarische bibliotheekbrand.

De beroemde Alexandrijnse bibliotheek werd vermoedelijk in de vierde eeuw voor onze tijdrekening gesticht door Ptolemaeus I en zijn opvolgers. Op haar hoogtepunt wordt haar bezit geschat op een half miljoen boekrollen met teksten van over de hele wereld. Om de voortdurende uitbreiding van de bibliotheekcollectie te verzekeren, hadden de machthebbers in Alexandrië een elegant maar uitgekookt systeem uitgedokterd: elk schip dat de bloeiende haven van Alexandrië binnenvoer, was verplicht om een handschrift of een boekrol voor de bibliotheek mee te brengen. Die werd in het scriptorium van de Alexandrina minutieus gekopieerd, waarna niet het origineel, maar de kopie teruggegeven werd aan de eigenaars. Het eigenlijke handschrift werd beschouwd als een nieuwe aanwinst voor de bibliotheek. Op die manier slaagde de Biliotheca Alexandrina erin om een collectie uit te bouwen die een spiegel was van de hele tekstproductie van de oude wereld. We kunnen gerust aannemen dat een intelligent classificatiesysteem ervoor zorgde dat de geleerden die de Alexandrina frequenteerden — de bibliotheek was bij voorkeur een studieplaats — de juiste teksten in handen kregen. Daarenboven werden veel van die teksten in die tijd vertaald naar het Grieks, de heersende Lingua Franca, zodat ook geleerden die de uitheemse talen niet beheersten, al de kennis van de toenmalige wereld konden bestuderen.

De Bibliotheek van Alexandrië had de potentie om het grootste en het meest uitgebreide archief van de menselijke geschiedenis te worden, maar het noodlot sloeg toe. Samen met de bibliotheek die door een brand in de eerste eeuw vóór onze tijdrekening werd verwoest, ging ook de meeste literatuur en kennis van de klassieke wereld verloren. De omstandigheden waarin deze intellectuele ramp gebeurde, is nog steeds het voorwerp voor verschillende theorieën, maar één ding is zeker: boekrollen branden goed. En hoewel de fysieke vorm van een tekst voor het grootste gedeelte op toeval berust en slechts een materiële drager is van inhoud, kan de tekst samen met de desintegratie van die fysieke vorm voorgoed verdwijnen. Dit moet het geval geweest zijn met honderden scheppende literaire werken van Griekse auteurs uit de eerste 500 jaren van het Hellenisme.

Digitalisering

Dit klassieke en extreme voorbeeld uit de geschiedenis toont het onweerlegbare belang aan van een doordacht preservatie- en conservatiebeleid in onze bibliotheken. Een brand is nog altijd de grootste nachtmerrie van elke bibliothecaris, maar een brandvrije bib is vooralsnog geen garantie voor een eeuwige collectie. Verzuring, inktvraat, vocht, schimmels, allerlei bacteriën en ongedierte tot aan muizen toe zijn erop uit om ons papieren erfgoed te reduceren tot pulp. Ik kom al jaren in bibliotheken en archieven, en zie die 'trage vuren' hun verwoestende werk verrichten, ook in Vlaanderen. Naar aanleiding van de Europese visie van Terry Sanders' veelvuldig bekroonde film 'Slow Fires. On the preservation of the human record' die de crisis met betrekking tot het bewaren van bibliotheekmateriaal aan de kaak stelde, werd het probleem ook aan deze zijde van de oceaan door het beleid (veel te laat) erkend, en werden er grote reddingsoperaties opgestart. Het grootste probleem bij allerlei preservatie- en conservatieprogramma's is nu dat de optimale bescherming van elke fysieke eenheid van tekst tezelfdertijd ook gepaard moet gaan met die andere primaire taak van de bibliotheek: het toegankelijk maken en ter beschikking stellen van die teksten voor het publiek. Niemand is immers voorstander van een bibliotheek waar lezers geen boeken meer mogen inkijken, laat staan consulteren. De meest recente oplossing voor dit vraagstuk werd gezocht in de wereld van de nieuwste technologieën en de multimedia, en is ondertussen een buzzword geworden in de erfgoedsector: 'digitalisering'.

Digitalisering is in feite niets anders dan de creatie van een gecomputeriseerde representatie van een gedrukte analoog. Dit kan eenvoudigweg gebeuren door het verwerven van een beeld met een scanner of een gespecialiseerde digitale camera (imaging), door het omzetten van dat beeld in een tekstbestand dat door de computer kan gelezen en bewerkt worden (OCR – Optical Character Recognition), door het opnieuw laten intikken van de betreffende teksten (re-keying), of door een combinatie van dit alles. Van bij het begin van een dergelijk digitaliseringsproject moet ernstig nagedacht worden over de manier waarop dit zal gebeuren. Een verpulverende krantencollectie leg je nu eenmaal niet simpelweg op de eerste de beste flatbed-scanner om de beelden dan weg te schrijven op diskettes in gecomprimeerd Jpeg-formaat ('economisch want neemt niet veel plaats in'). Het is aan te raden om bij een digitaliseringsproject zoveel mogelijk aansluiting te zoeken bij internationale conventies, aanbevelingen en gangbare praktijken (vb. het opslaan van beeldbestanden in ongecomprimeerd TIFF-formaat) en ISO standaarden (vb. het gebruik van SGML voor het coderen en opslaan van teksten). Op die manier wordt een zo maximaal mogelijke levensduur van de bestanden gegarandeerd, zijn die bestanden maximaal toegankelijk door hun software- en platformonafhankelijkheid, en laten ze toe om wetenschappelijke informatie toe te voegen aan de bestanden.

Uiteraard hangt er aan de creatie van een digitaal archief een (stevig) kostenplaatje afhankelijk van de aankoop of huur van apparatuur, omvang van het project en inzetbaarheid van opgeleid personeel. Die kosten worden doorgaans voldoende gebudgetteerd en de mogelijke problemen voldoende ingeschat. De kosten en de problemen verbonden met het onderhoud en het updaten van dat archief daarentegen worden nogal eens onderschat. Of zoals Wilhelm Busch ooit schreef: "Vater werden ist nicht schwer, Vater sein dagegen sehr." Hetzelfde geldt in zekere mate met betrekking tot de digitale producten waar de bibliotheek mee te maken krijgt. Idealiter zijn die CD-Rom's, DVD's, databases, websites, etc. spin-offs van grotere digitaliseringsprojecten, en worden ze geproduceerd met een welbepaald doel voor ogen en voor een vooraf gedefinieerde doelgroep. Daarvoor wordt nogal eens een beroep gedaan op merk-eigen software die de informatie hypertekstueel, multimediaal, interactief, vernieuwend en gebruiksvriendelijk aanbiedt, maar bibliotheekvriendelijk zijn dergelijke producten geenszins.

CD-Roms

CD-Roms bijvoorbeeld bezorgen menig bibliothecaris heel wat kopzorgen. Een bibliotheek bezit algauw enkele tientallen, zoniet honderden of duizenden van die schijfjes. Ze werken allemaal met andere software, en om ze te kunnen consulteren, moeten er steeds weer bestanden op de lokale systemen geïnstalleerd worden (soms boven de 100Mb). Daarenboven draait het ene schijfje wel en het andere weer niet onder een bepaald besturingssysteem (Windows, MacOS, Linux, Unix, etc), of zijn ze niet geschikt om in een netwerk ingepast te worden. Bij het installeren van CD-Roms worden de eigen recente versies van multimedia plug-in software geregeld overschreven door oudere versies, of worden er – zonder dat de gebruiker er controle over heeft – connecties gemaakt met het Internet. De gebruiker mag dan al van geluk spreken als die hyperlink nog werkt op het moment dat ze gevolgd wordt.

CD-Roms zouden autonome producten moeten zijn die vanzelf opstarten zonder dat er extra software of enig ander bestand geïnstalleerd hoeft te worden op de harde schijf, en die geen hyperlinks bezitten naar sites op het Internet. Eigenlijk zou elke CD-Rom geleverd moeten worden als bootable disk, met zijn eigen besturingssoftware, maar dat is vooralsnog toekomstmuziek.

En zelfs al zouden al deze criteria vervuld zijn, dan nog zouden dergelijke CD-Roms snel verouderen, omdat de hardware aan een waanzinnig tempo evolueert. In het midden van de jaren '90, bijvoorbeeld, werden er heel wat CD-Roms aangemaakt met de populaire authoring software Director 4. Nu dik vijf jaar later hebben moderne machines al problemen om die CD-Roms correct af te spelen. Het plastieken schijfje overleeft duidelijk zijn inhoud, en dat is een nieuwe Alexandrijnse ramp. Dit kan echter vermeden worden door elk dergelijk product te concipiëren als een gecompileerd toon-moment van een digitaal archief dat door het gebruik van internationale normen en conventies een stabielere basis heeft. Elke zoveel jaar kan dan een nieuw, aan de realiteit aangepast product gepubliceerd worden dat op zijn beurt ook weer zijn beperkingen heeft in de tijd. Van bibliothecarissen kan nu eenmaal niet verlangd worden dat ze de technologische kennis in huis hebben om de onleesbare informatie 'te vertalen' naar de heersende Lingua Franca, zoals in Alexandrië het geval was.

Enkele jaren geleden hoorde ik op een internationale bijeenkomst een alternatieve oplossing voor deze kwestie: het idee om per land een depot van hard- en software in te richten, zodat elk digitaal product altijd op ten minste één plaats in het land zou kunnen geconsulteerd worden, wat ook de evolutie van de hard- en de software zou zijn. Nu is de realisatie van zo'n idee niet alleen een hele kostelijke zaak, het is nog maar de vraag of dat ook een nuttige investering zou zijn. Het is volgens mij veel nuttiger om te investeren in de architectuur en de software- en platformonafhankelijkheid van data, zodat een digitaal archief kan meegroeien met de evolutie van de technologie.

On-line publicaties

Ook de nieuwe Bibliotheca Alexandrina, het internet en dan meer bepaald het WWW biedt voor de hier geschetste problemen geen volledige oplossing. De taal waarmee doorgaans op het internet gepubliceerd wordt, de HyperText Markup Language (HTML), mag dan al software- en platformonafhankelijk zijn, het mist de grammatica om intellectuele interpretaties, semantische en structurele informatie toe te voegen aan tekst en beeld. HTML werd in 1990 oorspronkelijk ontworpen om teksten op te maken, beelden en formules in te voegen, verwijzingen naar andere plaatsen in de tekst in te bouwen (hyperlinks), en dit alles over een wereldwijd netwerk te versturen. Sinds de eerste versie van de taal zijn er al vier standaarden gepubliceerd, en zorgde HTML vanaf 1993 – met de komst van de grafische browser – voor het grote succes van het World Wide Web. Tegenwoordig wordt er op het web gegoocheld met termen als DHTML, XHTML, VRML, CSS, JavaScript, ASP, SMIL, WML – en meer en meer ook XML –, die verschillende 'talen' benoemen die volgens een heel eigen grammatica werken, en die geen noemenswaardige moeilijkheden opleveren voor wie de recentste browser gebruikt.

Tot zover zijn er weinig problemen te melden. Het succes van het internet en de relatieve eenvoud van HTML heeft er echter voor gezorgd dat iedereen zowat zijn of haar eigen uitgever kon worden. Die 'liberalisering' heeft er op korte termijn niet alleen voor gezorgd dat de filterfunctie die de uitgever normaliter vervult met betrekking tot de inhoud van een publicatie helemaal is weggevallen, het resultaat is ook dat er nog relatief weinig syntactisch correcte documenten worden gecreëerd. Men rommelt maar wat aan met de standaarden en creëert een universum van gebroken links, kleurboekachtige gedrochten die eeuwen vergen om te downloaden en sites die alleen correct worden weergegeven met een bepaalde browser of een bepaalde plug-in software. En temidden dit fantastische hobbyisme bevinden zich ook publicaties die voor de bibliotheek de moeite waard zijn. Alleen, hoe gaat een bibliotheek daarmee om?

Catalogus

Enkele jaren geleden pakte de voormalige Vlaams Minister van Cultuur uit met een plan waardoor alle openbare bibliotheken prioritair aangesloten werden op het Internet. Met die maatregel zagen de bibliotheken de omvang van hun collectie exponentieel toenemen. Elke bib 'bezit' nu bijvoorbeeld alle 50 delen van het gerenommeerde Studies in Bibliography <http://etext.lib.virginia.edu/bsuva/sb/>, of de complete Encyclopedia Britannica <http://www.britannica.com/> en kan haar lezers duizenden teksten aanbieden die door Electronic Text Centres van over de hele wereld verzameld worden. Alleen, die werken zal je als lezer niet in de catalogus terugvinden. Voor de bibliotheek maken de on-line leveranciers van dergelijke teksten geregeld spin-off productjes (zeg maar CD-Roms) die voor fikse prijzen te koop worden aangeboden en die wel tot de eigen collectie kunnen behoren, maar daarmee verzeilen we terug in de hierboven geschetste problematiek.

Om elegant met on-line publicaties om te gaan, hebben verschillende non-profit organisaties en individuen, vooral uit de academische sector, portaalsites ontwikkeld. Die portals bieden zoveel mogelijk relevante en kwaliteitsvolle publicaties rond een bepaald thema aan via een verzameling (gestructureerde en soms geannoteerde) hyperlinks. Het behoeft natuurlijk geen betoog dat de betrouwbaarheid, de kwaliteit en het sérieux van die nieuwe bloemlezingen recht evenredig zijn met de integriteit van de samensteller, maar dat is bij boekpublicaties niet anders.

De vraag is nu of de bibliotheek dergelijke portaalsites en/of interessante on-line publicaties ergens moet registreren zodat ze door de lezers kunnen geconsulteerd worden, en hoe dat dan wel moet gebeuren. Ten eerste is dit een vraag naar beschikbaar personeel, en ten tweede een vraag naar catalografie. Het zou niet mis zijn mocht er bijvoorbeeld per provincie of per bibliotheeknetwerk een full time verantwoordelijke zijn die (met assistentie van themaredacteurs) interessant on-line materiaal screent, groepeert en aanbeveelt op een eigen portal, en het aangebodene ook regelmatig controleert op beschikbaarheid. Die portaalsite kan in de bibliotheken met een eenvoudige interface-oplossing (vb. met een menu op de homepage) ter beschikking gesteld worden van de lezer.

Nu maakt Bibnet <http://www.bib.vlaanderen.be> wel een begin in die zin met hun Webwijzer waarop dik 3.000 sites op trefwoord en in categorieën geraadpleegd kunnen worden, maar een blik op wat onder de rubrieken 'Letterkunde' en 'Nederlandstalige letterkunde' staat, toont aan dat dit geenszins een sterk uitgebouwd en full-time project is. Nochtans ligt hier voor een stuk de toekomst van de bibliotheek als centraal informatiepunt. Ook het Taalunieversum van de Nederlandse Taalunie <http://www.taalunieversum.org> kan hierin een belangrijke rol spelen. Naar analogie met de manier waarop de bibliotheek van Alexandrië haar collectie uitbreidde, zouden onze bibliotheken theoretisch gezien alle interessante on-line publicaties kunnen downloaden en via de eigen server en catalogus aan het publiek aanbieden. Dat dit slechts een theoretische denkpiste blijft, bewijst o.a. de copyright-wetgeving ter zake en de buitensporige technologische investeringen die hiermee zouden gepaard gaan. Tezelfdertijd zou dit een ongelofelijke reductie van de kracht van het Internet als on-line publicatiemedium betekenen.

Neen, dan beter het idee van de catalogus op portaalsites en belangwekkende on-line publicaties. Een dergelijk digitaal document van de tweede generatie (een on-line catalogus van on-line bronnen, een portaalsite met links naar portaalsites, een database van databases) moet op zijn beurt ook weer in een catalogus terug te vinden zijn, zodat het oppassen wordt om van de nieuwe Biliotheca Alexandrina geen Borgesiaanse gedrocht te maken. Hoe dit het beste gebeurt; blijft alsnog een open vraag.

In een notendop

Informatie in de vorm van tastbare publicaties, digitaal of niet, moet geleverd worden in een autonome vorm een lange houdbaarheid en toegankelijkheid van de inhoud garandeert doordat ze geconcipieerd worden als spin-off producten van een op internationale standaarden en conventies gebaseerd digitaal archief. Daarenboven moeten de principes die aan de basis liggen van de publicatie expliciet duidelijk gemaakt worden voor de lezer. Het is de taak van de uitgever om ervoor te zorgen dat er geregeld nieuwe versies van de publicatie beschikbaar gesteld worden zodat de inhoud beschikbaar blijft op de markt. Het is de taak van de bibliotheek om via haar catalogussysteem de lezer toegang te verschaffen tot die publicaties. Voor de omgang met on-line publicaties in de bibliotheek komen er best afspraken op het internationale niveau. Alexandrina, herrijs uit je as.


© Edward Vanhoutte, 31 januari 2001.
Published as: Edward Vanhoutte. 'Elke Bibliotheek een Alexandrijnse. Elektronische publicaties en digitalisering.' In: Leesidee, 7/2 (maart 2001), p. 126-128.

XHTML auteur: Edward Vanhoutte
Last revision: 26/03/01

Valid XHTML 1.0!