Den danske Nationallitteratur før 1700 digitaliseres
igennem et banebrydende internationalt samarbejde !
Af Erland Kolding Nielsen,
Direktør, Det Kongelige Bibliotek.
Det første massedigitaliseringsprojekt i kultursektoren i Danmark er nu i gang. D. 13. maj 2009 indgik Det Kongelige Bibliotek en aftale med den store britiske forlagskoncern ProQuest om at kvalitetsdigitalisere alle danske, norske, islandske og slesvigske trykte bøger og småskrifter, fra den første danske bog, der tryktes i 1482, og indtil 1700, herunder også alle bøger trykt i udlandet med tilknytning til Danmark.. Det er det første massedigitaliseringsprojekt i kultursektoren i Danmark, defineret som en total digitalisering af alt fra første til sidste hylde. Projektet omfatter anslået 16.200 enheder og knap 2.8 millioner sider.
Projektet er første del af et langt større projekt, benævnt Early European Books until 1700, en parallel til de næsten afsluttede Early English Books Online (1474-1700, kaldet EEBO) og Eighteenth Century Collection Online (1701-1800, kaldet ECCO), d.v.s. hele den engelsksprogede litteratur over alt i verden omfattende næsten 300.000 værker, som Det Kongelige Bibliotek erhvervede i 2008 og Statsbiblioteket her i 2009. Digitaliseringen af den danske nationallitteratur – d.v.s. beholdningerne i Det Kongelige Bibliotek samt unika i det tidligere Universitetsbibliotek og Karen Brahes Bibliotek i Odense – er pilotprojektet for den europæiske base over ældre litteratur, og i løbet af kort tid fortsætter digitaliseringen af beholdningerne fra Det Italienske Nationalbibliotek i Firenze, ligesom der forventes indgået aftaler i nær fremtid med foreløbig tilsvarende biblioteker i Belgien, Holland, Sverige og Finland.
Projektet er opdelt i to faser omfattende hhv. litteraturen indtil 1600 og 1601-1700. Første fase afsluttes først i 2010, og senere på året åbnes for adgangen til basen efter en ny banebrydende forretningsmodel, hvor Det Kongelige Bibliotek giver gratis adgang fra danske IP-adresser til basen, mens ProQuest sælger licensadgang for biblioteker, institutioner og andre brugere i udlandet med en varighed på10 år fra offentliggørelsestidspunktet, hvorefter den danske litteratur overgår til public domain med open access. Dette betyder omvendt, at hvis man i Danmark vil have adgang til de øvrige landes ældre nationallitteratur i fremtiden, må man naturligvis købe sig en licens.
De digitaliserede versioner af de trykte bøger bliver på enhver måde af høj kvalitet. Digitaliseringen
sker i 400dpi/farve og omfatter ikke alene billedskanning af indholdet i form af tekster, illustrationer, kort og håndskrevne noter og tilføjelser [sic!], men også billeder af alle tryk som genstande, der omfatter bind, omslag og snit, således at det bliver den mest omfattende gengivelse af disse værker ud fra alle synsvinkler, der nogensinde er foretaget. Alle tekster, der er OCR-genkendelige med den nuværende OCR-teknologi, får en tegngenkendt paralleludgave til faksimile-versionen med henblik på fuldtekstsøgning. Opmærkningen, d.v.s. i form koder, der gør det muligt at søge i bestemte dele af tekst eller værk, kommer ikke alene til at omfatter kapitler, afsnit og sider, men også en specialopmærkning af alle illustrationer, kort, håndskrevne noter, bemærkninger og tilføjelser, på et niveau, Det Kongelige Bibliotek ikke selv ville have råd til at investere i.
Metadata – hvad man tidligere benævnte de bibliografiske indførsler – bliver et kapitel for sig i kvalitativ henseende. Ud over de forholdsvis kortfattede indførsler, man har igennem Bibliotheca Danica 1482-1830 (tr. 1877-1902) og Katalogen over Den Kongelige Biblioteks Danske Afdelings 1. og 2. samling indtil 1959, har man Lauritz Nielsens storværk i 2 bind Dansk Bibliografi 1482-1559 og 1551-1600 med særligt Hensyn til dansk Bogtrykkerkunsts Historie (tr. 1919-33), der med registerbind kom i en ny udgave med tilføjelser ved Erik Dal, udgivet af Det Kongelige Bibliotek og Det Danske Sprog- og Litteraturselskab i 1996, bekostet både nu som tilforn af Carlsbergfondet.
Det var om dette værk, min forforgænger, rigsbibliotekar Palle Birkelund, skrev i Dansk Biografisk Leksikon, 3. udg.: ”Værket er et monument i dansk bibliografi og boghistorie, og det vil, selv om det vil kunne suppleres med nye titler, næppe nogensinde blive overgået”. Dette værk bliver retrokon¬verteret gennem genindtastning i et udførligt feltformat, der knyttes til de digitaliserede e-bøger. På den måde udnytter vi fortidens investeringer!
Den fysiske digitalisering begyndte 1. juli og vil være afsluttet i november i år. Arbejdet foregår in house på Det Kongelige Bibliotek gennem en underleverandør for ProQuest, firmaet CCS Hamburg, der har leveret 2 teknisk forskellige højkvalitetsskannere og udstationeret specialuddannet personale, mens KB står for lokal infrastruktur, logistik, sikkerhed, bevaringskontrol og forberedelse af metadata¬poster og stregkodning. OCR-genkendelse, opmærkning og tagging, kvalitetskontrol samt databaseopbygning og retrokonvertering af Lauritz Nielsen står ProQuest for. Der produceres 6.500 sider dagligt.
Hvorfor nu begynde med den ældre danske litteratur har mange spurgt? Svaret er ganske enkelt, at her er der et marked, hvis den danske litteratur indgår i større sammenhæng, der giver et forrentningsgrundlag for investeringen i en europæisk eller global sammenhæng. Det Kongelige Bibliotek ville aldrig få råd til selv at foretage denne investering gennem sine ordinære driftsmidler. Og digitalisering af den danske nationallitteratur indgik af rent økonomiske grunde ikke i (prioriteringen i) den digitaliseringspolitik, som Kulturministeriet har ladet udarbejde, og som offentliggjordes d. 30. april i år. Derfor har Det Kongelige Bibliotek besluttet at gå andre veje for at få digitaliseret sine samlinger, herunder veje, der kan betyde, at der ikke bliver gratis adgang for alle til alt digitaliseret dansk materiale i fremtiden. Aftalen med ProQuest er første skridt ad denne vej.
