banner

DALF: een model voor de multifunctionele verwerking van brievencollecties.

Ron Van den Branden en Edward Vanhoutte

edward.vanhoutte@kantl.be
ron.vandenbranden@kantl.be

1. Het epistolaire erfgoed en de Academie

De Koninklijke Academie voor Nederlandse Taal- en Letterkunde (KANTL) heeft een lange traditie van belangstelling voor het Vlaamse epistolaire erfgoed. In 1909 publiceerde de Academie de brieven aan Jan-Frans Willems in een editie van Jan Bols (Bols, 1909), en enkele jaren later het eerste deel van de helaas onvoltooid gebleven Briefwisseling van, met en over Hendrik Conscience uit de jaren 1837 tot 1851 (Jacob, 1913-1914). Van 1886 tot 2004 publiceerde de Academie twaalf brievenedities. Door het werk van het Centrum voor Teksteditie en Bronnenstudie (CTB), het onderzoekscentrum van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde, kwamen daar in de periode van 2000 tot 2004 nog eens vier edities bij. Momenteel zijn acht uitgaves van briefmateriaal in voorbereiding. Sinds zijn oprichting in augustus 2000 werden bij het CTB een tiental onderzoeksprojecten uitgevoerd waarin briefwisselingen van auteurs en componisten uit de 19de en de 20ste eeuw uit Vlaanderen een centrale rol spelen. Het gaat hierbij o.a. om de uitgave van brieven van en aan Stijn Streuvels, Karel van de Woestijne, Emmanuel de Bom, Maurice Gilliams, Raymond Herreman, Herman de Coninck, Louis de Meester, en Peter Benoit, en de inventarisatie en bestudering van brieven uit de archieven van het Nieuw Vlaams Tijdschrift (NVT), van de verspreide briefwisseling van de Vlaamse medewerkers van het tijdschrift 't Fonteintje (1921-1924), en van brieven van de componist Edgar Tinel.[1] Ook in editieprojecten die de ijking en uitgave van literaire teksten tot doel hebben, behoort de bestudering van relevante correspondentie tot de basistaken van de tekstediteur. Bijvoorbeeld bij het onderzoek ter voorbereiding van de edities van Stijn Streuvels' De teleurgang van den Waterhoek, Virginie Lovelings dagboek 1914-1918 In Oorlogsnood, Roger van de Veldes De knetterende schedels, Hendrik Consciences De Leeuw van Vlaenderen of de Slag der Gulden Sporen, Jos de Haes' Gedichten, of Johan Daisnes De trein der traagheid, edities die dankzij de Koninklijke Academie voor Nederlandse Taal- en Letterkunde werden gerealiseerd.

Met het Digital Archive of Letters in Flanders, of kortweg DALF, wil het CTB een formeel raamwerk en een methodologie aanbieden voor de elektronische beschrijving, transcriptie, codering, editie en annotatie van brievenmateriaal. DALF maakt hierbij gebruik van de laatste ontwikkelingen op het gebied van het gebruik van ICT en teksttechnologie in het onderzoek. De hierbij opgebouwde textbase biedt niet alleen flexibele mogelijkheden voor het genereren van output, zoals lees- of studie-edities in boekvorm, on-line of op elektronische drager, maar de textbase is een multifunctioneel corpus van ego-documenten dat bijvoorbeeld gebruikt kan worden voor o.a. historisch onderzoek, stilistisch en statistisch onderzoek, sociolinguïstiek, diachroon en synchroon lexicaal onderzoek. Alle brievenprojecten binnen het CTB worden sinds enige tijd volgens de DALF methodologie aangepakt en leveren input voor de steeds maar groeiende textbase.[é]

Eigenlijk gaat het DALF-model terug op een voorstel dat Ger Schmook (1898-1985), de toenmalige conservator van het huidige AMVC-Letterenhuis en toen pas een jaar lid van de Koninklijke Vlaamse Academie voor Taal- en Letterkunde, in de septembervergadering van 1948 uit de doeken deed. Voor de verzamelde leden van de Academie stelde Schmook een gedetailleerd plan op voor een cumulatieve uitgave van de correspondentie van Vlaamse literatoren die de "bouwstoffen voor wetenschappelijk onderzoek" zou leveren (Schmook, 1949, p. 24). In zijn "Pleidooi voor de uitgave van de brieven van negentiendeeuwse Vlaamse figuren" zoals zijn redevoering heette, onderstreepte hij het belang van een dergelijke uitgave voor zowel de wetenschap als het culturele bewustzijn. Ger Schmook wou niet alleen dat dit negentiende-eeuwse brievenmateriaal toegankelijk zou worden, hij was evenzeer bekommerd om de manier waarop dit zou gebeuren. Met veel aandacht voor uniformiteit, methodologie en detail legde hij de Academieleden een "lang niet utopisch werkplan" (p. 24) voor in zeven stappen die we gemakkelijk tot drie fasen kunnen terugbrengen die ook nu nog de chronologie van het werk aan een brieveneditie bepalen: inventariseren en verzamelen, geannoteerde transcripties maken, en verspreiden of publiceren.[3]

Het voorstel dat Schmook aan het eind van zijn betoog in handen van de leden van de Academie gaf, werd echter nooit gerealiseerd. Enerzijds omdat de eisen van de wetenschap en die van de privacy volgens de academieleden onverzoenbaar leken, een heikel punt dat ook nu meer dan ooit aan de orde is,[4] anderzijds wellicht omdat het alomvattende plan van Schmook veel te ambitieus was. Hij wilde immers dat er een inventaris kwam van "de opslag- en bergplaatsen van geschreven overleveringen waarin te begrijpen zijn de archieven van geestelijke en van wereldlijke, van allerlei aard en inzonderheid de archieven van persoonlijke nalatenschappen in België en Nederland aanwezig." Een Vlaams-Nederlandse archiefbank, zeg maar. Daarenboven zouden de briefwisselingen volgens een door de Academie op te stellen prioriteitenlijst diplomatisch getranscribeerd worden volgens een uniform systeem, en verspreid worden in druk. Bij de brieven zouden handige kaften geleverd worden waarmee de correspondenties zowel chronologisch als op auteur en geadresseerde gerangschikt zouden kunnen worden. Van elke auteur zou er een specimen van het handschrift en de handtekening bijgevoegd moeten worden om pro-actieve lokalisering en identificatie van niet geïnventariseerd materiaal mogelijk te maken.

Het lijkt misschien vreemd dit artikel te starten met een voorstel uit 1948 waarin de papieren uitgave van brievenmateriaal wordt beschreven, nu de elektronische editie onmiskenbaar opgang maakt, maar dat is het niet. Schmook concipieerde zijn plan vanuit de idee dat edities van brievenmateriaal sinds de twintigste eeuw niet meer gemaakt werden voor een lezerspubliek, maar voor een publiek van gebruikers die snel toegang wilden hebben tot een archief van brievenmateriaal en er veelvuldig wilden aan refereren - een omslag die duidelijk bevestigd werd door de ontwikkeling van gedetailleerde indexen in edities. De laatste jaren echter is er een kentering merkbaar en is er een toegenomen interesse ontstaan voor ego-documenten. Leesedities van dagboeken en briefwisselingen worden opgenomen in de fondscatalogi van commerciële uitgevers, en de bloei van de zogenaamde auteursgenootschappen in Vlaanderen en Nederland heeft de vraag naar edities van briefmateriaal doen stijgen. Naast de professionele gebruikers die een archief willen om aan te refereren of om onderzoek op te baseren, is er in de eenentwintigste eeuw opnieuw een publiek dat brievenedities wil lezen en misschien ook kopen. Beide vormen kunnen - mits doordacht opgezet - probleemloos aangeboden worden door een digitaal archief van brievenmateriaal dat veruit de meest handige en flexibele realisatie biedt van het concept 'brieveneditie'. De computer is immers bij uitstek goed in het behandelen en ordenen van informatie. Met een goed georganiseerd elektronisch archief van bibliografisch beschreven en getranscribeerd correspondentiemateriaal en geïncorporeerde instrumenten kan de gebruiker volgens zelf ingestelde parameters (chronologie, thema, geografie, afzender, bestemmeling,...) zijn of haar eigen gebruikersedities genereren.Tezelfdertijd kan het gebruik van het elektronisch archief de grenzen van de (historische) literatuurwetenschap ontstijgen en kan een dergelijk archief als corpus gebruikt worden door een brede waaier van onderzoeksdisciplines.

2. Elektronische edities van brieven

Met de termen 'elektronische uitgave' of 'elektronische editie' doelen we niet alleen op het publicatiemedium zoals de CD-ROM, de DVD of een site op het World Wide Web, maar op de essentieel elektronische aanpak van alle stappen in het onderzoek dat tot een dergelijke publicatie kan leiden, o.a. door het gebruik van text encoding m.b.v. internationaal ondersteunde markup talen zoals XML (eXtensible Markup Language) bij voorkeur volgens de TEI (Text Encoding Initiative) specificaties.[5] Strikt genomen kan een elektronische editie perfect resulteren in een gedrukt boek, terwijl het kan zijn dat een brieveneditie op het web zoals die van Boon en Burssens of Boon en Marchau door het Booncentrum om allerlei redenen niet kan kwalificeren als elektronische editie.[6]

Bij de oprichting van het Centrum voor Teksteditie en Bronnenstudie (CTB) als onderzoekscentrum van de Koninklijke Academie was het duidelijk dat de uitgave van brievenmateriaal een essentieel aandeel in het onderzoeksprogramma zou krijgen. Na de ervaringen met de elektronische editie van 71 brieven die werden opgenomen in de elektronisch-kritische editie van De teleurgang van den Waterhoek[7] (De Smedt en Vanhoutte, 2000), werd hierover in 2001 verslag uitgebracht op het internationale colloquium van de Amerikaanse Association for Computers and the Humanities (ACH) en de Europese Association for Literary and Linguistic Computing (ALLC) in New York (Vanhoutte, 2001). Daar bleek dat er, hoewel er internationaal heel wat belangstelling bestond voor de mogelijkheden van de elektronische editie van correspondentiemateriaal uit de 19de en 20ste eeuw, op dat vlak bitter weinig onderzoek was verricht.

Meteen presenteerde er zich een zesledig onderzoeksprogramma dat binnen het CTB werd opgestart:

  1. Het opstellen van definities voor de termen 'correspondentie' en 'brief' binnen DALF.
  2. Het opstellen van een ontologie van de tekst en een documentarchitectuur.
  3. Het uitwerken van een theoretisch model voor de beschrijving en transcriptie van modern correspondentiemateriaal.
  4. Het opstellen en documenteren van de DALF DTD en de DALF guidelines for the description and encoding of modern correspondence material.
  5. Het uitwerken van een applicatiemodel dat verschillende vormen van output kan genereren, waaronder edities, onderzoekscorpora etc. op basis van Open Source ontwikkelingsinstrumenten.
  6. De beschrijving en codering van briefmateriaal.

In een recent artikel in Literary and Linguistic Computing (Vanhoutte en Van den Branden, 2004) hebben wij 'correspondentie' gedefinieerd als 'the time-based interaction between two or more people by means of a physical channel.' In een artikel dat eerlang bij Toronto University Press wordt gepubliceerd in het boek Computing the Edition, hebben wij een brief gedefinieerd als 'a physical channel through which a communicative situation is established ' (Vanhoutte en Van den Branden, in druk). Deze definities lijken eenvoudig, en zijn het ook, maar worden duchtig theoretisch onderbouwd in de betreffende artikels. In alle geval zijn ze de basis geworden voor zowel de ontwikkeling van het theoretisch model als van het applicatiemodel (cf. infra).

Om de uitgave van briefwisseling op een zo uniform mogelijke manier te organiseren, werden er binnen het CTB richtlijnen opgesteld voor de uitgave van correspondentiemateriaal. Die richtlijnen gaan er inmiddels van uit dat dergelijke projecten elektronisch worden aangepakt, maar voorzien ook richtlijnen voor de visualisering van brievenedities, bijvoorbeeld op papier. In november 2004 waren reeds een 3.200-tal brieven beschreven, getranscribeerd, gecodeerd en geannoteerd uit de correspondenties tussen Stijn Streuvels en zijn Nederlandstalige uitgevers, Stijn Streuvels en zijn Duitstalige uitgevers, Karel van de Woestijne en Emmanuel de Bom, Julius Schrey, en tussen Lynne Bryer en Daphne Rooke.[8] Voor 2005 staat, naast de publicatie van de eerste elektronische edities van correspondenties volgens het DALF-systeem, de correspondentie tussen Richard Minne en Joris Vriamont op het programma.

Vanaf de start van de volgende fasen in het DALF onderzoek was duidelijk dat een goed applicatiemodel voor de ontsluiting van elektronische representaties van brieven een aantal formele en inhoudelijke eisen stelt aan het theoretische model voor de beschrijving en transcriptie van modern correspondentiemateriaal. Om daaraan te kunnen voldoen, werd aansluiting gezocht bij internationaal geldende standaarden voor tekstrepresentatie en -opmaak. Belangrijke formele vereisten zijn onafhankelijkheid van software en flexibiliteit en duurzaamheid van de gegevens. Inhoudelijk vereist het overkoepelende concept van een textbase waarin afzonderlijke geannoteerde brieftranscripties terecht komen bijzondere voorzieningen voor de beschrijving van de documenten en van die beschrijving zelf, naast die voor transcriptie van de documenten. Een goed uitgangspunt daarvoor wordt geboden door de richtlijnen voor tekstopmaak in XML die ontwikkeld zijn door het Text Encoding Initiative (TEI). Die bevatten een zeer omvattend en modulair geheel van regels voor de representatie van verschillende structurele kenmerken van diverse tekstgenres. Bovendien voorzien ze middelen om in de elektronische representatie van brondocumenten ook vrij gedetailleerde meta-informatie op te nemen over dat brondocument, de elektronische representatie ervan, en de relatie tussen beide. Het TEI model voor tekstopmaak is opgevat als een open standaard, met mogelijkheden om compatibele idiosyncratische modellen voor structurele tekstopmaak af te leiden, door selectie van bepaalde subcategorieën of de definitie van uitbreidingen op het model. Hiermee biedt TEI een zeer interessante basis voor de ontwikkeling van een formeel model voor een textbase van correspondentiemateriaal dat

  1. geschikt is voor de transcriptie van primair bronnenmateriaal, zodat er o.a. brievenedities van kunnen worden afgeleid.
  2. toelaat om gedetailleerde meta-informatie op te nemen over het getranscribeerde document.
  3. geschikt is om briefspecifieke kenmerken te beschrijven, zoals informatie op de enveloppe, postscripta en dergelijke.
  4. algemeen inzetbaar is voor de transcriptie van brievenmateriaal en zich niet beperkt tot een specifiek corpus.

Hierna worden enkele theoretische kenmerken van het DALF model toegelicht, om later te illustreren hoe ze bijdragen aan een ruime functionaliteit van de textbase.

3. Theoretisch model: belangrijke kenmerken van het DALF model

Bij de ontwikkeling van het DALF framework bleek snel dat er geen sprake is van brede internationale theorievorming over elektronische uitgave van primair brievenmateriaal. In de richtlijnen van TEI worden wel heel wat tekstgenres behandeld, maar ontbreken toch belangrijke elementen voor de representatie van briefspecifieke meta-informatie en structuurelementen. Zo vereist de elektronische representatie van briefmateriaal bijzondere voorzieningen voor de beschrijving van bibliografische gegevens, van de bewaarplaats en van fysieke kenmerken. Omdat brieven zeer directe ego-documenten zijn die een zeer uiteenlopend scala aan structuurelementen kunnen bevatten, moet een structuurmodel flexibel genoeg zijn om die variatie te kunnen representeren. Daarvoor werd een beroep gedaan op inzichten uit eigen onderzoek, andere internationale onderzoeksprojecten als MEP (Model Editions Partnership),[9] MASTER (Manuscript Access through Standards for Electronic Records)[10] en op bevindingen uit het ESP (Electronic Streuvels Project) dat startte met het onderzoek voor de publicatie van de elektronisch-kritische editie van De teleurgang van den Waterhoek (De Smedt en Vanhoutte, 2000).

In het DALF model is elk elektronisch document opgevat als een zelf-beschrijvende eenheid, die, uitgaande van de documentaire ontologie van de individuele brief, een verplicht minimum aan meta-informatie bevat in een header-gedeelte, en een transcriptie van het brondocument in een tekstgedeelte, verrijkt met structureel-semantische expliciteringen.

Het header-gedeelte is vrij gecontroleerd opgevat en bevat de vier grote onderverdelingen van de TEI header. De eerste is een bestandsbeschrijving met een volledige bibliografische beschrijving van het computerbestand zelf, en van bronmateriaal waarvan het een elektronische representatie is. De tweede bevat een beschrijving van de relatie tussen brontekst en elektronische representatie via een beschrijving van project-omstandigheden waarin die laatste tot stand kwam, de daarbij gevolgde codeerpraktijk en explicitering van editoriale beslissingen. De derde biedt de mogelijkheid om contextuele, niet-bibliografische gegevens van de brontekst aan te geven. De vierde is een gedetailleerde geschiedenis van het elektronische bestand, en biedt de mogelijkheid om alle wijzigingen op te tekenen. De standaard bestandsbeschrijving is in het DALF model uitgebreid met een verplichte beschrijving van een aantal briefspecifieke meta-gegevens, die sterk geïnspireerd zijn op de voorzieningen voor de beschrijving van middeleeuwse manuscripten in het MASTER model voor documentopmaak. Omdat brieven doorgaans ongepubliceerde primaire manuscripten zijn die bewaard worden in privé of publieke collecties, vereist een eerste verplicht veld een identificatie van de brief volgens een hiërarchisch locatiepad. Dat laat toe om de bewaarplaats van de brief te lokaliseren en identificeren (macro-niveau), en om de brief te situeren binnen die bewaarplaats (micro-niveau). Een tweede verplicht veld bevat een specifieke bibliografische beschrijving, met identificatie van de auteur, geadresseerde, en plaats en datum van schrijven. Gezien het directe karakter van een brief is abstractie van deze "contextuele primitieven"[11] immers een belangrijke manier om een brief te kunnen identificeren. Een derde vitaal onderdeel van de beschrijving van een brief heeft betrekking op de fysieke kenmerken. Die zijn per definitie veel meer bepaald door en bepalend voor de specifieke genese van een manuscript dan het geval is bij gedrukte uitgaven. Daarom is het noodzakelijk om bij de beschrijving van brieven op te nemen om wat voor fysiek documenttype het gaat, welke de afmetingen en het gebruikte materiaal zijn. Bovendien wordt de mogelijkheid geboden om bijzondere kenmerken van lay-out en de fysieke conditie van het materiaal te beschrijven, en om voorkomende illustraties, parafernalia en muzieknotaties te identificeren en te beschrijven. Een vierde verplicht veld is de aanduiding van aan- of afwezigheid van een enveloppe, omdat die belangrijke gegevens kan bevatten voor de contextualisering van een brief, of zelfs informatie die in onmiddellijk verband staat met de inhoud van de brief. Daarnaast wordt de mogelijkheid geboden om een inhoudelijke karakterisering van de brief op te nemen in een vijfde, optioneel onderdeel van het briefspecifieke header-gedeelte, met eventueel een communicatieve genre-aanduiding (liefdesbrief, ontslagbrief, .). Verder kan in een zesde onderdeel uitgebreide informatie worden opgenomen over de geschiedenis van de brief, van creatie tot verwerving door de huidige bewarende instelling. Er wordt ook ruimte voorzien voor bijkomende informatie, gaande van een gedetailleerde bewaringsgeschiedenis, beschrijving van andere representaties van het brondocument (zoals digitale facsimile's), nauw gerelateerde objecten en publicaties die gebruik maken van het brondocument. Tenslotte wordt de mogelijkheid voorzien om voor brieven die uit verschillende communicatieve onderdelen bestaan, de specifieke meta-informatie voor die onderdelen apart op te nemen.

<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE TEI.2 PUBLIC "-//CTB//DTD Dalf 1.0 (based on TEI)//NL" "..\DALF.dtd" [
<!ENTITY % entities SYSTEM "..\entities.ent"> %entities;
]>
  <TEI.2>
   <teiHeader creator="Joke Debusschere" date.created="2001-08-07" type="text" status="new">
      <fileDesc>
         <titleStmt>
            <title>160/ 03.02.1945 Stijn Streuvels aan Standaard Boekhandel.
             Ingooigem</title>
            <author>
               <name>Stijn Streuvels</name>
            </author>
            <editor role="editor">
               <name>Joke Debusschere</name>
            </editor>
            <principal>
               <name>Joke Debusschere</name>
            </principal>
            <funder>
               <name>Centrum voor Teksteditie en Bronnenstudie</name>
               <address>
                 <addrLine>Koninklijke Academie voor Nederlandse Taal- en
                  Letterkunde</addrLine>
                  <addrLine>Koningstraat 18</addrLine>
                  <addrLine>b-9000 Gent</addrLine>
                  <addrLine>(België)</addrLine>
                  <addrLine>tel: +32 9 265 93 40</addrLine>
                  <addrLine>fax: +32 9 265 93 49</addrLine>
                  <addrLine>email: ctb@kantl.be</addrLine>
               </address>
            </funder>
         </titleStmt>
         <publicationStmt>
            <publisher>Centrum voor Teksteditie en Bronnenstudie.</publisher>
            <pubPlace>Gent</pubPlace>
            <date value="2002">2002</date>
            <availability status="restricted">
               <p>© Copyright 2002, Centrum voor Teksteditie en Bronnenstudie van de
                  Koninklijke Academie voor Nederlandse Taal- en Letterkunde</p>
            </availability>
         </publicationStmt>
         <sourceDesc default="NO">
            <letDesc>
               <letIdentifier>
                  <country>België</country>
                  <settlement>Antwerpen</settlement>
                  <repository>AMVC Letterenhuis</repository>
                  <collection>S 935/B</collection>
                  <idno>171373/35</idno>
               </letIdentifier>
               <letHeading>
                  <author>Stijn Streuvels</author>
                  <addressee>Maurits De Meyer</addressee>
                  <placeLet>Ingooigem</placeLet>
                  <dateLet>1945-02-03</dateLet>
               </letHeading>
               <physDesc>
                  <type>brief</type>
                  <support>
                     <p>voorgedrukte kartonnen briefkaart</p>
                  </support>
                  <extent>
                     <dimensions>90 x 140 mm</dimensions>
                  </extent>
                  <layout>
                     <p>enkelzijdig beschreven met inkt</p>
                  </layout>
               </physDesc>
               <envOcc occ="yes"/>
            </letDesc>
         </sourceDesc>
      </fileDesc>
      <revisionDesc>
         <change>
            <date value="2001-08-07">2001-08-07</date>
            <respStmt>
               <resp>markup</resp>
               <name>Joke Debusschere (JD)</name>
            </respStmt>
            <item>parsing en validating</item>
         </change>
         <change>
            <date value="2001-08-07">07-08-2001</date>
            <respStmt>
               <resp>markup</resp>
               <name>Joke Debusschere (JD)</name>
            </respStmt>
            <item>creatie header & update markup</item>
         </change>
         <change>
            <date value="2001-08-07">07-08-2001</date>
            <respStmt>
               <resp>markup</resp>
               <name>Joke Debusschere (JD)</name>
            </respStmt>
            <item>markup</item>
         </change>
      </revisionDesc>
   </teiHeader>
Listing 1: DALF-codering van de header voor de brief van Stijn Streuvels aan Standaard Boekhandel, 03.02.1945. (AMVC-Letterenhuis S 935/B, 171373/35).

Het tekstgedeelte van het DALF model laat toe om het bronmateriaal te transcriberen en te verrijken met structureel-semantische expliciteringen. Zo zijn er de standaard TEI elementen om verschillende tekstonderdelen (zoals tekstdivisies, paragrafen, namen, titels,.), en editoriale annotaties (noten, toevoegingen, regularisering van namen,.) te identificeren. Waar nodig werden versoepelingen van het tekstmodel doorgevoerd om te verzekeren dat het theoretische model de complexiteit van handgeschreven bronnen voldoende kan anticiperen. Ook bleek het nodig om daarin enkele briefspecifieke structuurelementen op te nemen. Twee opvallende briefspecifieke elementen zijn enveloppen en postscripta.

Enveloppen zijn functioneel verschillend van de inhoud van de brief en bevatten zelf typische structuren als adresgegevens, poststempel, willekeurige tekst,. Ze bevatten gegevens voor eventuele communicatieve contextualisering en kunnen verdere inhoud bevatten die gerelateerd is aan die van de brief, of autonoom is. Postscripta zijn structureel gemarkeerd doordat ze temporeel onderscheiden zijn van de hoofdschrijfact van de brief. Vaak markeert de auteur deze aanvullende status zelf met een label als 'P.S.'. Ook berekeningen, hoewel ze niet specifiek briefgebonden zijn, komen frequent voor in zakelijke communicatie. Ze zijn vaak structureel onderscheiden van doorlopende tekst en bevatten bovendien een eigen interne semantische structuur van argumenten, operatoren en resultaat. Andere frequente fenomenen in brieven zijn voor- of nagedrukte tekst, en toegevoegde afbeeldingen of illustraties. Die kunnen een eigen dynamiek toevoegen aan de tekstuele inhoud van de brief; het is wenselijk om ze als structuurelement te onderscheiden. Een laatste voorziening werd getroffen om de overlapping van fysieke inhoudsdragers te kunnen aanduiden, zodat kan worden aangegeven waar er grenzen optreden van verschillende fysieke structuren waarop geschreven is. Voor al deze structuurelementen zijn in het DALF model corresponderende opmaakstructuren voorzien, zodat ze kunnen worden aangeduid waar ze voorkomen.

   <text id="ssb450203" n="160">
      <body>
         <print type="letterhead">FRANK LATEUR</print>
         <seg part="N">
            <hi rend="underlined">Vlaamsch</hi>
         </seg>
         <opener>
            <dateline>
               <date value="1945-02-03">3 februari '45</date>
            </dateline>
         </opener>
         <salute>
            <abbr expan="Waarde heer">W.h.</abbr> Demeyer,
         </salute>
         <p>Heden heb ik het bedrag (750 <abbr expan="frank">fr.</abbr>) overgeschreven op
            het aangeduide adres: <abbr expan="Nationale">Nat.</abbr> Instelling
           <abbr expan="voor">v.</abbr> Sociaal Dienstbetoon en gevraagd het bedoelde
           <abbr expan="exemplaar">expl.</abbr> op naam bij U op <name type="publisher">De
           Standaard</name> te Brussel te doen neerleggen.<ptr target="n1" targOrder="U"/>
         </p>
         <p>Goed maar dat de <title>Vlaschaard</title> heelhuids uit Antwerpen kan
            weggeraken!<ptr target="n2" targOrder="U"/>
         </p>
         <closer>
            <salute>
               <abbr expan="Vriendelijke">Vriendel.</abbr> groet
            </salute>
            <signed>(paraaf)</signed>
            <print>FRANK LATEUR<lb/>
                   INGOYGHEM</print>
         </closer>
      </body>
      <envelope>
         <envPart side="front">
            <address>
               <addrLine>Den Heer J. <abbr expan="Maurits">Maur.</abbr><lb/>
                         De Meyer</addrLine>
               <addrLine><abbr expan="Directeur">Dir.</abbr> <abbr expan="Naamloze
                         Vennootschap">N.V.</abbr> Standaard Boekhandel</addrLine>
               <addrLine><abbr expan="Emiel">Em.</abbr> Jacqmainlaan, 125</addrLine>
               <addrLine><hi rend="underlined">Brussel</hi></addrLine>
            </address>
            <postmark>
               <placeName/>
               <date value="1945-03-02">3/2/45</date>
            </postmark>
         </envPart>
      </envelope>
   <back>
      <div type="notes">
       <list>
        <item><note id="n1" anchored="yes" place="unspecified">
         <p>Cf. brief van De Meyer aan Streuvels van <xref doc="sbs450131" from="id(xr3)"
            to="DITTO" targOrder="U">31 januari 1945</xref>.</p></note></item>
        <item><note id="n2" anchored="yes" place="unspecified">
         <p>Cf. brief van De Meyer aan Streuvels van <xref doc="sbs450131" from="id(xr2)"
            to="DITTO" targOrder="U">31 januari 1945</xref>.</p></note></item>
       </list>
      </div>
   </back>
   </text>
  </TEI.2>

Listing 2: DALF-codering van de tekst van de brief van Stijn Streuvels aan Standaard Boekhandel, 03.02.1945. (AMVC-Letterenhuis S 935/B, 171373/35).

4. Applicatiemodel: functionaliteit van DALF

Met de theoretische uitgangspunten voor het opzet van DALF wordt expliciet een zo ruim mogelijke toepasbaarheid van het uiteindelijke product (de textbase) beoogd. Die zal hoofdzakelijk projectmatig worden uitgebreid met nieuwe elektronische getranscribeerde en geannoteerde brievencollecties. De aansluiting bij formele en inhoudelijke standaarden, en de beschikbaarheid van gedetailleerd documentatiemateriaal moeten daarbij transparantie, uniforme toepassing van principes en dus flexibiliteit en duurzaamheid van die onderzoeksinspanningen maximaal kunnen garanderen.

In eerste instantie is de textbase gericht op de mogelijkheid om (geannoteerde) edities van de opgenomen correspondenties te genereren. Van de elektronisch ingevoerde brieftranscripties kunnen verschillende uitvoerformaten worden afgeleid, gaande van traditionele gedrukte vorm tot een elektronisch presentatieformaat als (X)HTML, of XML of een ander elektronisch representatieformaat dat kan worden gebruikt voor verdere verwerking. Omdat de focus van de transcriptie ligt op een getrouwe representatie van de documentaire bron, kunnen in een latere fase, onafhankelijk van de codeerfase verschillende visualiseringen worden bepaald. Zo kan van eenzelfde brief een weergave van de transcriptie gegeven worden, al dan niet vergezeld van annotaties door de editeur, of van de onderliggende XML opmaak of een digitale facsimile. Ook kunnen op basis van contextuele parameters deelcorrespondenties worden gereconstrueerd rond bepaalde correspondenten of onderwerpen (Vanhoutte en Van den Branden, 2004). De manipuleerbaarheid laat toe om verschillende producten te genereren, zoals de ontsluiting van de volledige textbase in een netwerkomgeving, of afgeronde edities die gepubliceerd worden op CD-ROM.

Omdat de transcripties verrijkt zijn met zeer uitgebreide meta-informatie, laat het model ook toe om andere dan editiewetenschappelijke criteria te gebruiken voor de selectie van brieven. De textbase kan zo een hulpmiddel bieden voor literair-historisch onderzoek, bijvoorbeeld door de mogelijkheid om brieven te selecteren volgens thematische criteria, het voorkomen (of niet-voorkomen) van bepaalde titels van werken of persoonsnamen. Het gebruik van de chronologische, geografische en demografische metadata voor de selectie van brievenmateriaal kan een corpus opleveren dat bruikbaar is voor historisch, sociologisch of socio-linguïstisch onderzoek. Uiteraard biedt de verzameling transcripties mogelijkheden voor de creatie van corpora voor taalkundig onderzoek, al dan niet na toevoeging van bijkomende informatie. Hiervoor zal de gebruiker van de DALF textbase de mogelijkheid krijgen om een eigen afgebakend deelcorpus weg te schrijven als een TEI corpus. Ook wanneer de opmaak van brieven in de DALF textbase ontoereikend is voor bepaalde onderzoeksvragen, kan de loutere elektronische beschikbaarheid ervan de toevoeging van specifieke opmaak voor ander onderzoek faciliteren.

Hoewel de nadruk ligt op de ontsluiting van het getranscribeerde en geannoteerde bronnenmateriaal, kan de rijke meta-informatie in de brieven eveneens gebruikt worden om geavanceerde selecties van het materiaal te maken. Zo kan een overzicht gegenereerd worden van de brieftranscripties in de textbase die zich op een bepaalde bewaarplaats bevinden, tot bepaalde collecties behoren, of aangemaakt zijn door een bepaalde editeur. Uiteraard kan die meta-informatie niet alleen gebruikt worden voor de formulering van selectiecriteria, maar ook voor het genereren van gedetailleerde stukbeschrijvingen van de brieven in de textbase. Die beschrijvingen blijken bovendien vrij compatibel met de velden die in de ISAD standaard voor archiefbeschrijving worden gespecificeerd (International Council on Archives, 1999). Zo benadert de DALF textbase het model dat ondertussen werd ontwikkeld in het LEADERS (Linking EAD to Electronically Retrievable Resources) project, om transcripties van bronnen te presenteren met beschrijvingen van hun archivalische context.

visualisering van de geannoteerde editie van de brief van Stijn Streuvels aan Standaard Boekhandel, 03.02.1945.

Fig. 1: De visualisering van de geannoteerde editie van de brief van Stijn Streuvels aan Standaard Boekhandel, 03.02.1945. (AMVC Letterenhuis S 935/B, 171373/35).

5. Conclusie

Het DALF-project biedt een open formaat aan voor de multifunctionele verwerking van modern correspondentiemateriaal. Door het uitwerken van een goed doordacht onderzoeksprogramma wordt een textbase uitgebouwd dat door middel van structurele en semantische coderingen een rijk corpus biedt dat voor velerlei vormen van wetenschappelijk onderzoek kan worden gebruikt en waaruit verschillende visies op het materiaal kunnen worden gegenereerd. Zonder aansluiting bij internationale standaarden en praktijken op het gebied van de tekstcodering en de laatste evoluties in het veld van de teksttechnologie is zulks echter niet mogelijk. Op die manier draagt een in wezen editiewetenschappelijk project bij tot de bevordering van het interdisciplinair onderzoek in de humane wetenschappen.

6. Lijst van brievenuitgaven mogelijk gemaakt door de Koninklijke Academie voor Nederlandse Taal- en Letterkunde 1886-2004 inclusief publicaties van het CTB

7. Publicaties in voorbereiding bij het Centrum voor Teksteditie en Bronnenstudie van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde

8. Literatuurlijst

Noten



© 2006 Ron Van den Branden en Edward Vanhoutte

Deze tekst verscheen als Ron Van den Branden en Edward Vanhoutte. 'DALF: een model voor de multifunctionele verwerking van brievencollecties.' in: Isabel Rotthier (red.). Bron van inspiratie. Het archief van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde. Themanummer van Verslagen & Mededelingen van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde, 114/3 (2004): 383-400.


XHTML auteur: Edward Vanhoutte
Last revision: 29/06/2006


Valid XHTML 1.0!