Literaire Tekstedities, Talig Erfgoedonderzoek en Humanities Computing in Vlaanderen

Edward Vanhoutte

1. Literaire tekstedities

Een literaire teksteditie is een uitgave van ongepubliceerd of eerder gepubliceerd werk, verzorgd door een editeur die de tekstkeuze beredeneerd en expliciet verantwoord heeft en de tekstvorm aanbiedt als resultaat van wetenschappelijk onderzoek.[1] Daartoe maakt de editeur gebruik van de tekstkritiek. Op basis van de studie van de genese en de transmissie van de beschikbare primaire bronnen en kennis van secundaire bronnen wordt geen letterlijke weergave gegeven van een versie uit één bepaald handschrift of uit één bepaalde druk, maar kiest de editeur een basistekst waarin zij – waar nodig – ingrijpt om een wetenschappelijk verantwoorde en betrouwbare tekst aan te bieden. Dat de editeur heel omzichtig met haar ingrepen moet omspringen, wordt gesuggereerd door de definitie die Peter Shillingsburg geeft van een wetenschappelijke teksteditie: "I should like to use the name scholarly edition for editions that preserve or rescue a work of artistic, social, intellectual, or historical importance as an artifact."[2] De verantwoording van de emendaties in de basistekst en een documentatie van interversionele varianten wordt traditioneel in een kritisch apparaat afgedrukt.[3] Op basis van de studie van dat apparaat zou het voor de geïnteresseerde lezer mogelijk moeten zijn om de documentaire stadia van de tekst te reconstrueren. Maar de praktijk verschilt hier grondig van de theorie. Niet alleen is het documenteren van alle daarvoor benodigde karakteristieken van de documentaire bronnen – zoals bibliografische en typografische gegevens – en het registreren van alle varianten – ook de interpunctie-varianten – een ontzachelijk werk, de weergave hiervan in een voor de uitgever economisch en voor de lezer duidelijk en hanteerbaar systeem is quasi onmogelijk zonder verlies aan informatie. Daarom ook dat Shillingsburg vijf formal orientations[4] onderscheidt waardoor de editeur zich laat leiden bij het maken van een bepaald soort editie met een bepaald doel en voor een bepaald publiek. De vijf orientations die Shillingsburg onderscheidt zijn de documentary, aesthetic, authorial, sociological en bibliographical orientation.[5]

Dit is in een notendop de beschrijving van de moderne literaire editiepraktijk. De praktijk en de theorie van de uitgave van oudere teksten of historische documenten[6] verschilt hiervan enigszins. Thomas Tanselle vat het verschil tussen historische edities en literaire edities bondig samen: "the historical editions in general give more attention to explanatory annotation than to the detailed recording of textual data, whereas the literary editions reverse this emphasis."[7] Deze observatie blijkt te kloppen als we de Richtlijnen voor het uitgeven van historische bescheiden[8] bekijken waarin bijvoorbeeld modernisering van interpunctie, aliniëring en accentuering wordt toegelaten. Mathijsen waarschuwt hierbij voor het gevaar dat er bij het opvolgen van de Richtlijnen bij het uitgeven van historische documenten "een tekst wordt aangeboden die noch historisch, noch modern is en die verkeerde suggesties kan geven."[9] Dergelijke teksten zijn m.i. ook voor het talig erfgoedonderzoek niet bruikbaar omdat ze een vertekende representatie geven van de betreffende documenten en een transmissiemoment toevoegen aan de overleveringsgeschiedenis van de talige expressie.

2. Edities voor linguïstisch onderzoek

Diplomatische edities daarentegen kunnen wel als bron voor linguïstisch onderzoek gebruikt worden, wat het Corpus Gysseling ten overvloede aantoont.[10] Hierbij bekent de editeur zich meer tot Shillingsburgs documentary en bibliographical orientation dan algemeen de gewoonte is in de moderne editiewetenschap. Diplomatische edities van moderne teksten, of zogenaamde archiefedities, worden trouwens vooral door de Duitse school van de Editionswissenschaft smalend bekeken, en een editeur die zich met dergelijke edities bezig houdt, wordt dan ook niet echt voor vol aangezien. Dergelijke opmerkingen zijn dom. Bij de voorbereiding van een diplomatische editie komt de editeur ook voor momenten te staan waarop hij of zij beredeneerde en wetenschappelijk beargumenteerde beslissingen moet nemen. Vanuit linguïstisch oogpunt zijn diplomatische edities van teksten uit om het even welke periode even belangrijk. De hiërarchie die de editietheorie van moderne teksten aanbrengt in de editietypes – het paradepaardje is de historisch-kritische editie die tegenwoordig nog alleen maar in Duitsland van enige betekenis is – is natuurlijk ingegeven door de aard van het tekstmateriaal zelf. De editie van moderne teksten concentreert zich door het voorhanden zijn van autograaf materiaal op de genese van het werk en het constitueren van een betrouwbare leestekst, terwijl er van vele oudere teksten slechts 1 versie is overgeleverd (vooral in het geval van ego-documenten). En waar meer dan 1 versie van bestaat, kan de nadruk gelegd worden op de bestudering van de overleveringsgeschiedenis (met de bestudering van zogenaamde transmissievarianten).

Een project dat wil resulteren in een corpus van het talig erfgoed uit de 14de eeuw, en de opgenomen teksten elektronisch ontsluit, bijvoorbeeld d.m.v. diplomatische edities waarbij de transcriptie is gebeurd m.b.v. text encoding technieken volgens een internationale standaard, kan een flexibel werkinstrument worden voor de verschillende tekstgebaseerde disciplines in de humane wetenschappen. Een voorbeeld van die beoogde polyfunctionaliteit is, bijvoorbeeld, dat op basis van een opgebouwd corpus van teksten uit de 14de eeuw, gemakkelijk een spellingdatabase kan gebouwd worden, dat – zoals wordt aangehaald bij het voorstel voor een dergelijke database van Middle English Spelling[11] – van instrumenteel belang kan zijn voor een breed gamma aan taalkundig onderzoek. Horobin en Smith geven in hun voorstel prioriteit aan twee soorten onderzoek:

Een diachronisch en diatopicaal onderzoek van de 14de-eeuwse orthografie en fonologie, gebaseerd op gepubliceerd en ongepubliceerd materiaal.
Een onderzoek naar de 14de-eeuwse woord geografie.

In Vlaanderen en Nederland kan die priorisering natuurlijk op andere gebieden van de wetenschap liggen. Als er van bij het begin van een dergelijk project – d.w.z. reeds van bij de inventarisatie-fase – gestreefd wordt naar aansluiting bij internationale standaarden voor text-encoding en uitwisseling van tekstuele informatie, dan kan de diplomatische en elektronische uitgave van de geïnventariseerde teksten op basis van een prioriteitenlijst die bijvoorbeeld de gelijkmatige spreiding over zoveel mogelijk vormen van talige uiting garandeert, projectgewijs nagestreefd worden. Het noodgedwongen sample karakter van elk corpus van talig materiaal kan daarbij stap voor stap verkleind worden om idealiter, bij het beëindigen van dit grote uitgeefproject, volledig weg te vallen.[12]

3. Drie basisvragen

Hierbij kunnen onmiddellijk drie basisvragen worden gesteld:

Hoe moet een prioriteitenlijst opgesteld worden?
Welke internationale standaarden voor text-encoding garanderen de grootst mogelijke toegankelijkheid, levensduur en wetenschappelijke integriteit?
Hoe kan de elektronisch-diplomatische uitgave van teksten uit de 14de eeuw projectgewijs georganiseerd worden?

Ik behandel deze vragen in omgekeerde volgorde.

3.1. Projectgewijze uitgave van teksten uit de 14de eeuw.

Aan het eind van zijn inventaris van edities van oudere teksten uit de zuidelijke Nederlanden,[13] komt Werner Waterschoot tot de weinig verrassende conclusie dat er al veel werk verricht is op het gebied van de Middeleeuwen, "maar veel meer in het Noorden dan het Zuiden."[14] Waterschoot heeft het in zijn overzicht van voorhanden zijnde tekstedities vooral over officiële publicaties, en maakt geen vermelding van het editiewetenschappelijk werk dat bij wijze van eindverhandelingen aan onze universiteiten wordt gedaan. In een stand van zaken van de editiewetenschap in Vlaanderen erkent Marcel De Smedt daarentegen expliciet het belang van dit soort afstudeerprojecten:

Een niet te onderschatten pijler die de editiewetenschap in het algemeen en de editiepraktijk in het bijzonder moet schragen zijn de licentieverhandelingen. Dat is als het ware de broed- en kweekvijver voor de toekomst. Jonge mensen leren er de editieproblematiek kennen in confrontatie met de praktijk en kunnen er enthousiast raken voor het vak.[15]

In het vervolg van zijn tekst geeft De Smedt enkele voorbeelden van tekstedities van 19^de en 20^ste eeuwse teksten en briefwisselingen die hij als promotor heeft begeleid en die als eindverhandeling aan de universiteit van Leuven werden ingediend. De database van alle tekstedities met betrekking tot de neerlandistiek die ooit als eindverhandeling aan de Belgische universiteiten werden ingediend, die ik op basis van de dissertatielijsten van 39 jaargangen van Spiegel der letteren samenstelde telt 658 teksteditorische en editiewetenschappelijke licentiaatsverhandelingen en doctorale proefschriften,[16] of een ruw gemiddelde van bijna 17 tekstedities per jaar. De initiële bedoeling van die database was om te beschikken over bruikbaar statistisch materiaal dat als kwantificeerbaar argument kon gebruikt worden bij de klaagzang die wij destijds op alle niveaus lieten horen omtrent de schandelijke desinteresse die er bestond ten aanzien van ons literair erfgoed.[17] De periode van de inventarisatie liep van het academiejaar 1956-1957 tot en met het academiejaar 1995-1996. Gezien de ongecorrigeerde staat van de database kunnen hier slechts enkele voorlopige resultaten gepresenteerd worden.

	Oudere teksten	Moderne teksten	Totaal
Totaal	584	74	658
U Gent	377	33	410
KuLeuven	192	35	227
UCLouvain	10	0	10
Rijksuniversiteit Luik	0	4	4
Universiteit Antwerpen (UIA)	3	2	5
ULB	1	0	1
Centrale Examencommissie	1	0	1

Figuur 1: Het aantal editiewetenschappelijke licentiaatsverhandelingen en doctorale proefschriften in de neerlandistiek, voorgelegd aan de Belgische Universiteiten in de periode 1956/1957-1995/1996. Totalen per periode en per universiteit

Het gaat dus beter dan we dachten met de uitgave van onze oudere teksten. Minstens 584 jonge mensen hebben zich in die 39 jaren toegelegd op de uitgave van oudere teksten uit de Nederlandse literatuurgeschiedenis van in totaal een 130-tal auteurs en 240 uitgaven van anonieme teksten. En niets wijst erop dat er vandaag een kentering komt in die tendens. Hoewel het wel eens zo zal zijn geweest dat de thesisonderwerpen alfabetisch en in looppas werden uitgedeeld of opgelegd, ben ik ervan overtuigd dat heel wat studenten voor een teksteditie kiezen omdat ze met noeste filologische arbeid een tastbare bijdrage kunnen leveren aan het lopende onderzoek, m.a.w. de student weet wat hem/haar te doen staat, ziet een begin en hopelijk ook een eind aan zijn/haar (eind)werk.

En we kunnen tegenwoordig niet ontkennen dat de middeleeuwen ook vandaag een ongelofelijke aantrekkingskracht uitoefenen op de jongerencultuur. Deze zomer weer zal Dranouter overspoeld worden met meer dan 60.000 veelal jonge mensen die komen voor de muziek van moderne folkgroepen zoals Laïs en Kadril die hun teksten sprokkelen uit verzamelbundels als Oude Vlaemsche liederen van J.F. Willems (1848), Chants populaires des Flamands de France (1856) van De Coussemaker, het Iepersch Oud-Liedboeck van Blyau en Tasseel (1900), het Antwerpsch Liedboeck of het Gruuthuuse handschrift. Er wordt gedanst op het kloppen van 't Smidje, pinten gedronken op de Weverdans, geld verbrast tijdens Het Heerke van Maldegem, geslapen met het Luiaardsgild, onmogelijke liefdes verklaard tijdens het bezingen van de Nachtvrijage en gevreeën met de wijze les: "houd uw kanneke proper Dianneke, houd uw kanneke vaste." De middeleeuwen zijn sexy, zoveel is duidelijk.

Een dergelijke analyse van het beschikbare materiaal dat de vermelde inventaris opleverde was natuurlijk nauwelijks bruikbaar in ons discours dat er op gericht was de subsidiërende culturele overheid te wijzen op de alarmerende situatie in verband met de beschikbaarheid van onze middeleeuwse teksten. Eén conclusie van het onderzoek is alvast dat we de hand in eigen boezem moeten durven steken. We laten onze studenten tekstedities maken, maar doen er verder weinig mee. Met een minimum aan werk en een gecoördineerd beleid ter zake kan heel wat van het afstudeerwerk resulteren in betrouwbare tekstedities die op de markt kunnen worden gebracht, en die probleemloos ingepast kunnen worden in het grotere project over het 14de-eeuwse talig erfgoed. Enerzijds is een groot stuk van het werk al gedaan, en het is blijkbaar van goede kwaliteit: de studenten in kwestie hebben er immers een academische graad mee verdiend. Anderzijds kan, wat nog op de prioriteitenlijst staat bijvoorbeeld, gerust – onder begeleiding weliswaar – door studenten aangepakt worden. Als straks de Bologna-verklaring haar toepassing krijgt op het academische curriculum, zullen we, zoals onze collega's in het buitenland, zelfs een beroep kunnen doen op graduate students, die als een soort student-assistenten kunnen worden ingeschakeld in onderzoeksprojecten. Minimale kost met een maximale opbrengst. Als dat geen goed beheer van het erfgoed is.

3.2. TEI: een internationale standaard voor text-encoding en markup

Bij een dergelijke optie moet er natuurlijk wel overeenstemming bestaan over de editieprincipes en de principes van de text-encoding en markup die hierbij gebruikt wordt. Alleen als alle teksten op een uniforme manier elektronisch worden bewerkt kunnen die probleemloos de input vormen voor een polyfunctionele en een zich steeds uitbreidende tekstbank. Dit brengt ons bij de vraag welke internationale standaarden voor text-encoding de grootst mogelijke toegankelijkheid, levensduur en wetenschappelijke integriteit garanderen?

Momenteel is de theorie en de praktijk van de teksteditie in een overgangsfase. Sinds de jaren '60 worden bij de voorbereiding van gedrukte tekstedities computers gebruikt voor het opstellen van concordanties, het maken van statistische analyses, automatisch collationeren en het genereren van stemmata (de laatste jaren trouwens met spitstechnologie uit de biogenetica). Met de komst van de Standard Generalized Markup Language (SGML) als ISO-standaard voor de structurering en uitwisseling van tekstmateriaal (ISO 8879:1986)[18] en de toepassing van die standaard in de humane wetenschappen door de creatie van het Text Encoding Initiative (TEI),[19] kreeg de humane wetenschapper in het algemeen de beschikking over een syntaxis en een methodologie voor de presentatie en documentatie van tekstuele kenmerken en eigenschappen, en de tekstediteur in het bijzonder werd bedacht met een consistent voorstel voor de transcriptie van primair bronnenmateriaal[20] en de documentatie van tekstvariatie.[21] De hernieuwde interesse voor hypertext, de spectaculaire mogelijkheden van de imaging technologie, het succes van het internet, het wereldwijde gebruik van grafische browser software, en de exponentiële toename van zowel de processorsnelheid als de digitale opslagcapaciteit, hebben voor een volgende logische stap gezorgd in de recente geschiedenis van de editiewetenschap in het computertijdperk: het elektronisch publiceren van wetenschappelijke tekstedities. In het midden van de jaren '90 resulteerde dat in het Engelstalige taalgebied in een reeks principles for en rationales of electronic scholarly editing[22] en een nieuw debat over de functie en de rol van zowel de teksteditie als de tekstediteur werd geopend. Tegelijkertijd werden ook nieuwe oplossingen gesuggereerd voor het probleem van de visualisering van een volledige overleveringsgeschiedenis, of zoals de Chaucer-editeur Peter Robinson schrijft: "How does one read a text in 58 different versions?"[23] Het mag duidelijk zijn dat het linken van een elektronische tekst aan een traditioneel apparaat geen antwoord kan zijn op die vraag. Een dergelijke editie zou slechts een klikbare analoog zijn van zijn gedrukte kozijn. Edities die in het elektronische paradigma traditionele editiemethodes en -conventies nabootsen, zijn typische producten van de overgangsperiode van de wetenschappelijke codex-editie naar de echte mogelijkheden van het computertijdperk.[24] De combinatie van het gebruik van geavanceerde text encoding voor de transcriptie, editie, genetische, literatuurwetenschappelijke, bibliografische en linguïstische analyse, gebaseerd op internationaal aanvaarde standaarden (TEI compliant SGML/XML), relationele database-technologie en interface-gestuurde interactiviteit moet het mogelijk maken het logische verband tussen de editiewetenschap enerzijds en de linguïstiek en literatuurwetenschap anderzijds te articuleren in een hoogtechnologisch wetenschappelijk onderzoeksinstrument.

In 1949 startte Roberto Busa een onderzoek dat moest resulteren in de Index Thomisticus, een gelemmatiseerde concordantie op het volledige werk van Thomas van Aquino (het eerste volume van de Index verscheen pas in 1973).[25] Daarmee was Busa de eerste humane wetenschapper die de computer gebruikte in het wetenschappelijk werk. Sindsdien zijn er verschillende theoriën, instrumenten en technieken ontwikkeld voor het gebruik van de computer in drie grote gebieden:

Het gebruik van de computer voor het capteren en inputten van data: digitalisering, imaging en OCR (Optical Character Recognition).
Het gebruik van de computer voor de analyse van tekst: concordanties, sorteren, text retrieval, lemmatiseren, collatie, statistische analyse, stylometry en stemma (re)constructie.
Het gebruik van de computer als publicatiemedium: typesetting, visualisering, hypertext en distributie/uitwisseling van data.

Een exhaustieve behandeling van de functionaliteit en de geschiedenis van de computertechnieken uit de aangehaalde gebieden, valt buiten het bestek van dit artikel,[26] maar toch wil ik in de hierna volgende paragrafen de logische culminatie beschrijven van de evoluties in de drie aangehaalde gebieden in de creatie van een uniform systeem voor text encoding en interchange.

Geen enkele computer begrijpt tekst, of kan met tekst overweg. Computers werken altijd met representaties van teksten die omgezet worden in binaire code:

Computers can contain and operate on patterns of electronic charges, but they cannot contain numbers, which are abstract mathematical objects not electronic charges, nor texts, which are complex, abstract cultural and linguistic objects.[27]

Tot ver in de tachtiger jaren van de vorige eeuw gebruikte elke wetenschapper, elk project, softwarepakket of onderzoeksgroep zijn of haar eigen systeem voor de structurele en/of typografische representatie van tekstmateriaal.[28] Deze praktijk resulteerde in corpora aan tekstmateriaal die onderling niet konden worden uitgewisseld, waarvoor geen garanties bestonden qua levensduur, en die niet software- en platformonafhankelijke waren. Kortom, corpora die qua functionaliteit de grenzen van het eigen project niet overstegen. Zoals reeds vermeld kregen de humane wetenschappen met de ontwikkeling van de Standard Generalized Markup Language (SGML) – een ISO standaard sinds 1986: ISO 8879 – alle elementen aangereikt voor de bouw van een eigen gestandaardiseerde markup-taal die voldeed aan:[29]

De eis van uitvoerigheid;
De eis van eenvoud;
De eis dat documenten door software van gematigde complexiteit kunnen worden verwerkt;
De eis van platform en hardware onafhankelijkheid;
De eis van software-onafhankelijkheid;
De eis dat de standaard tekst zou beschrijven in een bewerkbare vorm;
De eis van uitwisselbaarheid van documenten.

Kort nadat de SGML standaard gepubliceerd werd, kwam een groep computerspecialisten uit de humane wetenschappen samen in Vassar College in Poughkeepsie (november 1987) en ze werden het eens over een set van methodologische principes – de zogenaamde Poughkeepsie Principles – die de basis vormden voor het Text Encoding Initiative (TEI).[30] Op basis van SGML, die zelf geen markup-taal is, maar een meta-taal, werd – bij consensus – een set van Document Type Definitions (DTD's) opgesteld voor de beschrijving van alle teksten in alle talen en schriften en uit alle periodes, voor alle types van onderzoek[31] in de humane wetenschappen.[32]

De hieruit voortkomende aanbevelingen werden in 1994 gepubliceerd als de monumentale P3 Guidelines for Electronic Text Encoding and Interchange,[33] een 1.292 pagina dik handboek met daarin de definitieve guidelines. De P4[34] revisie van die guidelines die midden 2001 werd aangekondigd, ondersteunt daarenboven niet alleen SGML, maar nu ook XML (eXtensible Markup Language),[35] de krachtige SGML-applicatie voor gebruik op het internet.

Het TEI encoding scheme is geen de jure standaard, zoals een ISO document, maar is vanwege zijn massale toepassing in allerlei disciplines van de humane wetenschappen en een hele actieve gemeenschap van humanities computing wetenschappers een de facto standaard geworden. De conclusies van het TEI worden daarom eerder als adviserende guidelines, rules, en recommendations gepubliceerd dan als dwingende standards. Daarenboven erkent het TEI hierbij dat elke wetenschapper de vrijheid moet hebben om zijn of haar eigen theorie van de tekst te ontwikkelen en volgens eigen inzichten aan de hand van encoding toe te passen op de tekst.[36]

De elektronische editie van De teleurgang van den Waterhoek van Stijn Streuvels[37] – een project van de KANTL – was de eerste wetenschappelijke editie in de Nederlandstalige wereld die gebruik maakte van TEI, en de eerste elektronische editie van een Nederlandstalig werk tout court. Ik geloof graag dat het Centrum voor Teksteditie en Bronnenstudie gedeeltelijk op basis van de verdienste van dit project werd opgericht aan de Academie. Ondertussen heeft het CTB in haar korte bestaan heel wat theoretisch werk verricht op het gebied van de text encoding, en werkt ze samen met internationale partners aan de verbetering van de guidelines. Daarom ook is het CTB mede-indiener en één van de lead contractors van het Europese project ESTATE (European Support for Techniques of Advanced Text Encoding), dat als opvolger fungeert van het MASTER-project (Manuscript Access through Standards for Electronic Records). MASTER is erop gericht een internationale standaard te ontwikkelen (als uitbreiding van en compatibel met TEI) voor de beschrijving en de catalogisering van manuscriptcollecties van Europese bibliotheken en archieven en zodoende een hoge kwaliteit van toegankelijkheid te verzekeren (geen enkele Belgische instelling was bij dit project betrokken). Met de logische opvolger ESTATE, willen we geavanceerde technieken ontwikkelen om het Europese culturele erfgoed niet alleen op catalogus toegankelijk te maken, maar de manuscripten zelf op een geavanceerde manier te digitaliseren zodat niet alleen de catalografische gegevens, maar ook de linguïstische en de bibliografische tekst voor allerhande onderzoek beschikbaar is. Ik denk dat de elektronisch-diplomatische editie van teksten uit de 14de eeuw in het kader van het talig erfgoedproject van de Academie een interessante test-case kan zijn voor ESTATE.

3.3. Hoe moet een prioriteitenlijst opgesteld worden?

Het antwoord hierop is even simpel als gecompliceerd: ik laat het over aan de specialisten ter zake om, rekening houdend met het werk dat al voor een stuk verricht is in de vorm van eindverhandelingen, een prioriteitenlijst op te stellen van teksten die elektronisch uitgegeven kunnen worden.

4. Conclusie

Met een resolute keuze voor de hier geschetste methodes bij de samenstelling en de realisatie van een corpus van 14de-eeuwse zuidnederlandse teksten, kan Vlaanderen haar leiderspositie die het nu al bezit met betrekking tot de elektronische editie van moderne teksten uitbreiden naar de editie van ouder tekstmateriaal. Het Centrum voor Teksteditie en Bronnenstudie kan hierin een instrumentale rol spelen. Niet alleen heeft ze de expertise in huis om elektronisch aan de slag te gaan, het ontsluiten van het geschreven (talig) erfgoed behoort ook tot haar kerntaak.

Noten

1. Marita Mathijsen, Naar de letter. Handboek editiewetenschap. Den Haag: CHI, 1997, 33-34. [terug]
2. Peter L. Shillingsburg, Scholarly Editing in the Computer Age. Theory and Practice. Third Edition. Ann Arbor: The University of Michigan Press, 1996, 3. [terug]
3. Grosso modo bestaan er drie soorten tekstedities: de historisch-kritische editie, de studie-editie en de leeseditie. Zie voor definities van deze editietypes Klaus Kanzog, Prolegomena zu einer historisch-kritischen Ausgabe der Werke Heinrich von Kleists. Theorie und Praxis einer modernen Klassiker-Edition. München, 1970, 15-44; Marita Mathijsen, o.c., 57-81, en Marcel De Smedt, Editiewetenschap. Deel I: Syllabus, Leuven: Acco, 1999, 1-2. [terug]
4. "By formal orientation I mean a perspective on forms that leads to the selection of one set of formal requirements over another." Shillingsburg, o.c., 16. [terug]
5. Shillingsburg, o.c., 17-27. [terug]
6. Met historische documenten bedoel ik oorkonden, politieke verslagen, handelingen, testamenten, dossiers, akten, rapporten, en ego-documenten die uitgegeven worden omwille van hun historisch eerder dan hun literair of esthetisch belang. De hier gepresenteerde lijst is natuurlijk niet exhaustief. [terug]
7. G. Thomas Tanselle, "The Editing of Historical Documents." in: Studies in Bibliography, XXXI (1978), 1-56 (2). [terug]
8. Richtlijnen voor het uitgeven van historische bescheiden. Samengesteld in opdracht van het Nederlands historisch genootschap en van de Rijkscommissie voor Vaderlandse Geschiedenis (6de herziene druk). 's-Gravenhage, 1988. [terug]
9. Mathijsen, o.c., 389. [terug]
10. Maurits Gysseling, Corpus van Middelnederlandse teksten tot en met het jaar 1300. Reeks I: Ambtelijke bescheiden (9 delen). Den Haag, 1977; Reeks II: Literaire handschriften (6 delen). Den Haag, 1980-1987. [terug]
11. Simon Horobin en Jeremy Smith, "A Database of Middle English Spelling." in: Literary & Linguistic Computing, 14/3 (september 1999), 359-373. [terug]
12. Een exhaustief uitgeefproject, zoals hier voorgesteld, is weliswaar na te streven, maar wegens de omvang van het materiaal zeer onwaarschijnlijk volledig te realiseren. [terug]
13. Werner Waterschoot, "De editie van oudere teksten uit de zuidelijke Nederlanden. Een status quaestionis." in: G. De Schutter (red.). De toekomst van ons literaire verleden. Toespraken gehouden tijdens het colloquium georganiseerd door de Koninklijke Academie voor Nederlandse Taal- en Letterkunde, i.s.m. de Interuniversitaire Werkgroep Genese. 17 februari 1998. (Overdruk uit Verslagen en Mededelingen van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde, jrg. 108 (1998), afl. 1), 55-73. [terug]
14. Idem, 64. Voor een overzicht van de beschikbare tekstedities en bloemlezingen voor het onderwijs in Nederland, alsook de gebruikte Nederlandse Literatuurgeschiedenissen, zie: Hubert Slings, Toekomst voor de Middeleeuwen. Middelnederlandse literatuur in het voortgezet onderwijs. (NLCM 21). Amsterdam: Prometheus, 2000. [terug]
15. Marcel De Smedt, "Editiewetenschap in Vlaanderen. Stand van zaken." in: Edward Vanhoutte & Dirk Van Hulle (red.), Editiewetenschap . Gent: Genese, 1998, 15-35 (30). [terug]
16. De aangelegde database werd, wat de oudere periode betreft, nagelezen door Hubert Meeus, waarvoor dank. De volledige database werd (nog) niet gecontroleerd, bijvoorbeeld aan de hand van de titelpagina's van de geïnventariseerde verhandelingen, zodat een geschatte foutenmarge van 10% in de opgenomen data mogelijk is. [terug]
17. Cf. de congresbundels G. De Schutter (red.), o.c.; en M. Janssens (red.), Studiedag "Klassieken op de Markt" (24/3/99), Overdruk uit Verslagen en Mededelingen van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde, 109/1 (1999), 1-68. [terug]
18. Cf. C.E. Goldfarb, The SGML Handbook. Oxford: OUP, 1990. [terug]
19. C. M. Sperberg-McQueen & Lou Burnard (eds.), Guidelines for Electronic Text Encoding and Interchange (TEI P3). Chicago/Oxford: The Association for Computers and the Humanities (ACH), The Association for Computational Linguistics (ACL), The Association for Literary and Linguistic Computing (ALLC), The Association for Computers and the Humanities (ACH), 1994. De website van het TEI-consortium: <http://www.tei-c.org/>. [terug]
20. Zie Peter Robinson, The Transcription of Primary Textual Sources Using SGML. Oxford: OHC, 1994. (Office for Humanities Communication Publications 6). [terug]
21. Zie respectievelijk hoofdstukken 18 en 19 van de TEI P3 Guidelines. (Sperberg-McQueen & Burnard, o.c.). [terug]
22. Respectievelijk David L. Gants, "Toward a Rationale of Electronic Textual Criticism." Paper. ALLC/ACH Conference, Paris, 19 april 1994, <http://parallel.park.uga.edu/dgants/ach94.html>; Jerome McGann, "The Rationale of HyperText." in: TEXT 9 (1996), 11-32,; Peter Shillingsburg, "General Principles for Electronic Scholarly Editions." MLA, 1993. <http://sunsite.berkeley.edu/MLA/principles.html>; en Peter Shillingsburg, "Principles for Electronic Archives, Scholarly Editions, and Tutorials." in: Richard J. Finneran (ed.), The Literary Text in the Digital Age. Ann Arbor: The U of Michigan Press, 1996 23-35. [terug]
23. Peter M.W. Robinson, "New directions in Critical Editing." in: Kathryn Sutherland (ed.), Electronic Text. Investigations in Method and Theory. Oxford: Clarendon Press, 1997, 145-171 (159). [terug]
24. Elders ben ik dieper ingegaan op de mogelijkheden, de problematiek, en methodologie voor elektronische edities, en stel ik modellen en classificaties voor. Zie o.a. Edward Vanhoutte, "Where is the editor? Resistance in the creation of an electronic critical edition." in: Marilyn Deegan, Jean Anderson, & Harold Short (eds.), DRH 98. Selected papers from Digital resources for the Humanities 1998. University of Glasgow, September 1998. (OHC Publication 12). London: Office for Humanities Communication, 2000, 171-183; en Edward Vanhoutte, "'Display or Argument: Markup and Visualisation for Electronic Scholarly Editions." in: Thomas Burch, Johannes Fournier, Kurt Gaertner & Andrea Rapp (Hrsg.), Standards und Methoden der Volltextdigitalisierung. Beitraege des Internationalen Kolloquiums an der Universitaet Trier, 8./9. Oktober 2001. Stuttgart: Franz Steiner Verlag, 2003 (Abhandlungen der Geistes- und Sozialwissenschaftlichen Klasse. Einzelveröffentlichung. Nr. 9; Akademie der Wissenschaften und der Literatur Mainz), 71-96. [terug]
25. Cf. drie artikels door Roberto Busa: "An Inventory of Fifteen Million Words." in: J.B. Bessinger and S.M. Parrish (eds.), Literary Data Processing Conference Proceedings. White Plains, [1965], 64-78; "Computer Processing of over Ten Million Words: Retrospective Criticism." in: Alan Jones and R.F. Churchhouse (eds.), The Computer in Literary and Linguistic Studies. (Proceedings of the Third International Symposium). Cardiff, 1976, 114-117; en "Concluding a Life's Safari from Punched Cards to World Wide Web." in: L. Burnard, M. Deegan en H. Short (eds.), The Digital Demotic: Selected Papers from DRH97, Digital Resources for the Humanities Conference, St. Anne's College, Oxford, September 1997. (Office for Humanities Communication Publications 10). London, 1998, 3-11. [terug]
26. Een goede inleiding in Humanities Computing biedt Susan Hockey, Electronic Texts in the Humanities. Principles and Practice. Oxford: OUP, 2000. [terug]
27. C.M. Sperberg-McQueen, "Text in the Electronic Age: Textual Study and Text Encoding with examples from Medieval Texts." in: Literary & Linguistic Computing, 6/1 (1991), 34-46 (34). [terug]
28. De bekendste vroege encoding systemen zijn COCOA en TACT. Cf. Susan Hockey, o.c., 24-48. Zie ook D.B Russel, COCOA: A Word Count and Concordance Generator for Atlas. Chilton, 1967; en I. Lancashire et. al., Using TACT with Electronic Texts. New York, 1996. [terug]
29. Eisen geciteerd in en vertaald uit David T. Barnard, Cheryl A. Fraser en George M. Logan, "Generalized Markup for Literary Texts." in: Literary & Linguistic Computing, 3/1 (1988), 26-31 (28-29). [terug]
30. Zie voor een geschiedenis van het TEI: Nancy M. Ide & C.M. Sperberg-McQueen, "The TEI: History, Goals, and Future." in: Computers and the Humanities, 29 (1995), 5-15 (6-7); en het hoofdstuk "1. About These Guidelines" in zowel de TEI P3 en de P4 Guidelines. Cf. C. M. Sperberg-McQueen & Lou Burnard (eds.), o.c.. De herziene versie van 1999 kan geconsulteerd worden op <http://www.tei-c.org/Guidelines/index.htm>; de P4 Guidelines op <http://www.tei-c.org/P4X/>. [terug]
31. Zeventien aparte commissies met vakspecialisten maakten de encoding sets voor de verschillende soorten teksten en types van onderzoek. Zo waren o.a. de volgende werkgroepen actief van 1990 tot 1993: character sets, text criticism, language corpora, manuscripts and codicology, verse, drama & performance texts, literary prose, linguistic description, spoken text, literary studies, historical studies, print dictionaries, machine lexica, en terminological data. De Guidelines definiëren een 600-tal elementen die gebruikt kunnen worden voor de encoding van "texts in any natural language, of any date, in any literary genre or text type, without restriction on form or content. They treat both continuous materials ("running text") and discontinuous materials such as dictionaries and linguistic corpora." (TEI P3, Chapter 1). [terug]
32. Zie ook Edward Vanhoutte, "...en doende denkt dan nog. SGML, TEI en editiewetenschap." in: Edward Vanhoutte & Dirk Van Hulle (red.), o.c., 107-133. [terug]
33. Sperberg-McQueen & Lou Burnard, o.c.. De partners in het werk van het TEI waren The Association for Computers and the Humanities (ACH), The Association for Computational Linguistics (ACL), en The Association for Literary and Linguistic Computing (ALLC). [terug]
34. The XML compatibele P4 Guidelines kan men consulteren op <http://www.tei-c.org/P4X/>. [terug]
35. "The revisions needed to make TEI P4 have been deliberately restricted to error correction only, with a view to ensuring that documents conforming to TEI P3 will not become illegal when processed with TEI P4. During this process however many possibilities for other, more fundamental, changes have been identified. With the establishment of the new TEI Council, it becomes possible to agree on a programme of work to enhance and modify the Guidelines more fundamentally over the coming years. TEI P5 will be the next full revision of the Guidelines. No date has yet been fixed for its appearance, but work on it will commence early in 2002." <http://www.tei-c.org/Guidelines2/index.html>. [terug]
36. De TEI Guidelines demonstreren een breed gamma aan toepassingsmogelijkheden en suggesties voor het coderen van teksten. Het document moet daarom eerder als referentiewerk dan als een werkboek gezien worden. De beheersing van het volledige TEI schema vergt een lange studietijd, maar weinig projecten vereisen een volledige kennis van TEI. Een overzichtelijke en handige subset van slechts 131 elementen werd daarom ontwikkeld onder de naam TEI Lite. Oorspronkelijk was dit bedoeld als een didactisch opstapje naar de volledige documentatie, maar sinds de publicatie van TEI Lite in 1995 is het de meest populaire TEI DTD geworden. Het lijkt voor 90% van de tijd te voldoen aan de behoeften van 90% van de TEI gemeenschap (met ongeveer 20% van de elementen). Zie Lou Burnard & C.M. Sperberg-McQueen: TEI Lite: An Introduction to Text Encoding for Interchange (TEI U5), 1995. <http://www.tei-c.org/Lite/index.html>. [terug]
37. Marcel De Smedt & Edward Vanhoutte, Stijn Streuvels, De Teleurgang van den Waterhoek. Elektronisch-kritische editie/electronic-critical edition. Amsterdam: Amsterdam University Press/KANTL, 2000. (CD-Rom). [terug]

© Edward Vanhoutte, 1 September 2002.
This text was published as Edward Vanhoutte, 'Literaire Tekstedities, Talig Erfgoedonderzoek en Humanities Computing in Vlaanderen'. in: Edward Vanhoutte (ed.). Talig erfgoed. De zuidelijke Nederlanden in de 14de eeuw. Gent: KANTL/CTB, 2002, p. 105-119.

XHTML auteur: Edward Vanhoutte
Last revision: 25/11/2003