Digitalt kulturarv för framtida generationer

Bakgrund och sammanhang

Ingenting varar för evigt, utan allting förgås förr eller senare. Detta är ett faktum som i skrivande stund förefaller smärtsamt påtagligt, givet den aktuella säkerhetspolitiska situationen. Historien påminner oss också om hur utsatt kulturarv är i tider av oroligheter, i yttersta synnerhet andra världskriget. Alldeles särskilt bekymrande är det när kulturarv utgör själva måltavlan, som i fallet med de antika tempel, gravkammare och statyer i Palmyra i Syrien som förstördes så sent som 2015-2017. Kulturarvet spelar en betydande roll för historieskrivningen och kan därmed generera en hotbild mot sig själv, exempelvis av ideologiska eller religiösa skäl, som i fallet Palmyra.

Källa: Wikimedia Commons, (licens CC0)

En av arkivens och andra minnesinstitutioners mest centrala uppgifter är att skjuta fram tidpunkten för att informationens ska upphöra så långt det är möjligt. Helst ännu längre. Lika viktigt som bevarandet av arkivhandlingarna i sig är att bevara den kontextuella information som exempelvis beskriver hur och varför de tillkommit, vem som upprättat dem, handlingarnas inbördes ordning med mera. Ett sammanfattande begrepp för denna typ av information är proveniens, vilket för många säkert är bekant genom Antikrundan. För att arkivinstitutionerna ska kunna fullgöra sina bevarandeuppdrag på bästa möjliga vis finns omfattande riktlinjer, standarder och föreskrifter, i typfallet framtagna av eller i nära samverkan med Riksarkivet och andra nationella och internationella institutioner.

Bild på ett ljudband där skiktet som håller den magnetiska ljudinformationen helt har släppt från polyesterbasen. källa: Wikimedia commons, Public Domain

I somliga fall är arkivhandlingar rent materiellt mycket beständiga, som exempelvis tjockt papper tillverkat av linnefibrer. Särskilt så om bläcket som använts för påskrift inte är av den typ som orsakar frätning över tid. Bloggförfattaren har själv erfarenhet av att hantera handskrifter från 1600-talet som är i så gott skick att de faktiskt ser ut att vara helt nyskrivna, nästan som om bläcket nyss torkat, vilket är en säregen upplevelse i sig. För denna typ av handling vore förmodligen en yttre katastrof, såsom brand, vattenskada eller stöld, det största hotet. I andra fall är den återstående livslängden begränsad av andra skäl, som till exempel egenskaper i själva materialet. Så till exempel i vissa exemplar av ljudband där det bindemedel som håller den faktiska magnetiska informationen till basen (plastremsan) kan påverkas negativt av inträngande fukt. I detta fall räcker sannolikt inte ens optimala förutsättningar för klimat och temperatur i den omgivande arkivlokalen. En samtida lösning på detta är att överföra informationen från analogt till digitalt format, så kallad digitisering. För en fullständig definition av digitisering samt det mer vanligt förkommande digitalisering och andra för diskussionen relevanta termer och begrepp, se Digisams termlista. För mer information om problem med digitisering av analoga ljudsamlingar, läs gärna en tidigare bloggtext från Svenskt visarkiv på detta tema.

Digitala filer har många fördelar, framför allt att de är så lätta att mångfaldiga och sprida vidare. Som nämnts kan de utgöra utmärkta säkerhetskopior, om det som inte får hända ändå skulle inträffa, eller om den analoga förlagan av olika skäl inte är tillförlitlig som lagringsmedium på längre sikt. För vidare användning blir det avsevärt lättare att bygga tjänster med informationen i digital form, till exempel för en extern app-utvecklare, i enlighet med den så kallade PSI-lagen. Dessutom öppnar digitiserat kulturarv möjligheter till storskalig analys av data och sammanlänkning materialet över hela världen. Förutsättningar för ovanstående är att informationen kan läsas av maskiner/datorer och dessutom tydligt rättighetsmärkt, det vill säga vad användaren får göra med informationen.

Men myntet har åtminstone två sidor och de problem som kulturarvssektorn har att hantera i en alltmer digital värld är omfattande. Faktum är att det digitala långsiktiga bevarandet är en av de absolut största utmaningarna vi står inför. Det finns dessvärre inte någon patenterad helhetslösning på problemen, men väl en aktiv samverkan i kulturarvssektorn. Konsekvensen av en ökande digitisering är också att man står med två arkiv att förvalta: ett analogt och ett digitalt. Musikverket har under de senaste 10 åren deltagit mycket aktivt i denna samverkan, främst genom den nationella samverkansplattformen Digisam, där experter från Kungliga biblioteket, Riksarkivet, Riksantikvarieämbetet och alla statliga museer tillsammans hjälps åt att göra kulturarvet digitalt tillgängligt. Att Musikverket ingår i detta sammanhang beror på vi räknas som museimyndighet.

Under de senaste åren har fokus inom Digisams samverkan varit på att ringa in de områden som är särskilt viktiga att prioritera. Rent praktiskt har det bildats arbetsgrupper med uppgift att formulera användbara vägledningar gällande dessa områden. Musikverket har deltagit arbetsgrupperna för digitalt långsiktigt bevarande respektive för termlistan. De områden som givits prioritet är:

Termlistan och vägledningarna beslutades och publicerades under 2021 och implementeringen av dessa pågår för närvarande vid Musikverket, däribland vid Svenskt visarkiv.

Problem och centrala begrepp

Problemen med långsiktigt bevarande av digital information är som nämnts många. Till att börja med är en grundförutsättning för att kunna lagra informationen att det finns en hårdvara i botten (till exempel hårddiskar, USB-stickor och servrar), vilken faktiskt slits ut, går sönder eller blir tekniskt föråldrad och obsolet över tid. Detta faktiska förhållande kräver en medveten och långsiktig strategi. Organisationen för lagring kan vara att man huserar, underhåller och successivt byter ut lagringen själv, att man lägger ut den på en extern leverantör som en tjänst (ofta som molntjänst) eller en kombination av båda. Några parametrar att särskilt beakta är kostnader (säker lagring är fortfarande dyrt!), hur snabb tillgång man behöver till informationen i sin arbetsvardag, vem som ska kunna leverera data till systemet, hur mycket datamängden kommer att öka per år, om det finns känslig eller sekretessbelagd information som ska lagras samt var informationen faktiskt lagras rent geografiskt.

Eftersom digitala filer i dagsläget är så lätta att redigera och retuschera är autenticitet ett centralt begrepp inom digitalt bevarande, vilket i Digisams termlista definieras som ”egenskap som styrker vad informationen är, dess skapare och tidpunkt”. Den som läser den bevarade informationen om, säg 200 år från nu (människa eller maskin) måste då kunna vara säker på och se belägg för att informationen är vad den utger sig för att vara, vem som skapat den, när den tillkommit och när/hur den eventuellt kompletterats. Även information som medvetet raderats av ansvarig personal ska detta kunna spåras, varför och av vem det gjordes och vid vilken tidpunkt

Viktigt att notera här är att autentisk information i denna mening inte nödvändigtvis behöver vara sann i sig, i innehållslig mening. Därmed kan digitalt bevarade ”fake news” alltså, om kriterierna för autenticitet är uppfyllda vill säga, också betraktas som helt autentiska.

Ett annat centralt begrepp i sammanhanget är dataintegritet, vilket Digisams termlista definierar som ”egenskap att informationsinnehållet är fullständigt och inte har ändrats”. Exempel på hot mot dataintegriteten är yttre intrång, att data förändras av misstag när man kopierar från en lagringsyta till en annan och när man av olika skäl behöver konvertera från ett filformat till ett annat. Om filformat ändras bör detta alltid dokumenteras. Ett sätt att hålla koll på dataintegriteten hos en fil är att använda sig av kontrollsummor, vilket fungerar bra mot fel som uppstår vid kopiering, konvertering och lagring under lång tid (jfr bitröta).

Metadata, ofta lite slarvigt kallat ”data om data” är också en absolut förutsättning för att information (se termlistan för definition) ska vara användbar och förståelig på såväl kort som lång sikt. Metadata definieras av Digisam som ”strukturerad information som beskriver och identifierar annan information eller data för att underlätta förståelse, sökning och användning”. Metadata kan också finnas i en helt analog form, som till exempel en gammeldags manuell kortkatalog eller register, vilka många arkiv- och biblioteks- och museianvändare i vissa fall fortfarande är hänvisade till.

I den digitala världen kan metadata representera olika aspekter av den information som ska bevaras långsiktigt. Lite grovt kan man dela upp dessa i tre typer – beskrivande, administrativa och strukturella metadata. Beskrivande metadata kan vara datering, namn på författare eller förlag, det vill säga sådant som typiskt anges i en katalog- eller arkivpost i en databas (jfr även med proveniens ovan). Administrativa metadata kan vara av teknisk art som filtyp, eller information om upphovsrättslig status. Strukturella metadatabeskriver hur olika element i en digital fil förhåller sig till varandra som till exempel sidornas ordning i en bok, eller hur den förhåller sig till andra digitala representationer av samma bok, se exempelillustration ur Digisams termlista nedan.

Det finns en uppsjö av olika filformat för bilder, ljud, rörlig bild och annat. Rekommenderat är att alltid använda så kallade öppna format (dvs inte exempelvis Word-filer), format utan komprimering, format som har en bred användning världen över och även de format som Riksarkivet eller andra institutioner med nationellt ansvar föreskriver.

För att förbättra det långsiktiga bevarandet av digital information på Musikverket pågår för närvarande en utredning av ett nytt och ändamålsenligt arkivlagringssystem. Sammanfattningsvis måste detta system, nu samt över tid

  • möta aktuella krav från Riksarkivet och andra nationella ansvarsinstitutioner
  • följa riktlinjerna i Digisams vägledning till digitalt långsiktigt bevarande
  • följa Musikverkets egna styrdokument
  • möta aktuella lagkrav gällande sekretess och personuppgifter
  • vara lätt att förstå och använda

För den verkligt nyfikne rekommenderas att läsa Digisams vägledning till digitalt bevarande, som länkats ovan.

Avslutningsvis kan konstateras att de digitala utmaningar som arkivinstitutionerna står inför är något som också i allt högre grad präglar de flesta sfärerna i samhället, inte minst privatlivet och våra personliga minnen. Det kan vara fråga om semesterbilder och barnens dokumenterade uppväxt i telefonen. Det sistnämnda är något som även bloggförfattaren brottas med i vardagen.