Netarkivet

Vi har ansvaret for at indsamle og bevare den danske del af internettet som en del af pligtafleveringsloven. Målet er blandt andet at sikre, at man i fremtiden kan bruge materialet i forskningsøjemed.

Server. Indre med lysende dioder

Foto: Thomas Søndergaard

Siden 2005 har vi indsamlet materiale fra den danske del af internettet og bevaret det i vores webarkiv. Mere præcist vil det sige materiale udgivet på internettet på dansk, af danskere eller henvendt til danskere. Dette er en del af den danske kulturarv, som biblioteket ifølge pligtafleveringsloven skal bevare for eftertiden.

Indsamlingen sker automatisk med såkaldte webcrawlere, som er software udviklet til at kunne indsamle internetmateriale.

Vi indsamler kun offentligt tilgængeligt materiale fra internettet. Privat indhold (med begrænset adgang) som for eksempel interne familiehjemmesider eller firmaers intranet er ikke offentlige, og vi indsamler det derfor ikke.

Vi anvender forskellige strategier for indsamling:

  • Tværsnitsindsamling som tager et øjebliksbillede af alle danske domæner op til fire gange årligt
  • Selektiv indsamling fra følgende typer hjemmesider: alle danske nyhedsmedier (fra 12 gange dagligt til ugentligt), politiske partier, organisationer og foreninger, ministerier og styrelser, udvalgte profiler fra sociale medier, YouTube videoer (for eksempel ugentlig)
  • Begivenhedsindsamling af to-tre begivenheder årligt (for eksempel folketingsvalg eller Coronapandemien)
  • Specialindsamlinger (for eksempel ud fra forskerønsker)

Hensigten med de forskellige strategier er, at de kombineret med hinanden giver den bedst mulige dækning af, hvad der offentliggøres på den danske del af internettet. 

Mængden af materiale i arkivet vokser løbende. I starten af 2022 indeholdt det ca. 850 TB og over 34 mia. objekter.

Det indsamlede materiale kan kun benyttes til videnskabelige formål, fordi det indeholder følsomme personoplysninger. Læs mere under forskningsadgang.

Der findes en række andre frit tilgængelige webarkiver, som man kan benytte sig af, hvis man ikke kan få forskningsadgang til arkivet. Det er for eksempel muligt at finde indhold fra mange danske hjemmesider her:

I regi af arbejdet med at indsamle materiale fra internettet deltager vi desuden i internationale tematiske indsamlinger, som er frit tilgængeligt for alle.