LOAR
Find vores åbne datasæt indeholdende råtekst fra monografier og aviser samt rå lydoptagelser i vores Library Open Access research data Repository (LOAR).
Det Kgl. Bibliotek tager løbende nye initiativer for at understøtte datascience.
I vores Library Open Access research data Repository (LOAR) har vi blandt andet lagt følgende materiale:
- datasæt baseret på bøger trykt op til 1881 (p.g.a. 140 års ophavsretsreglen).
- datasæt med Trykkefrihedens skrifter
- en stor samling af OCR (optisk tegngenkendt) tekst baseret på digitaliserede aviser fra 1660 til 1877
- Ruben-samlingen som indeholder Danmarks første lydoptagelser (1889-1895)
Datasættene kan anvendes til natural language processing, tekst og datamining til forskningsbrug og undervisningsbrug.
Kontakt os via kb@kb.dk hvis du har spørgsmål vedr. datasættenes metadata og anvendelsesmuligheder.
Søg direkte i LOAR