Var ska jag börja?
Redan innan du börjar samla in eller producera data är det bra att planera hur du ska hantera dessa data. Några bra saker att tänka på redan inledningsvis i forskningsprocessen är:
- att bedöma vilka etiska etiska frågor/aspekter (exempelvis personuppgifter) som är relevanta för datahanteringen
- att bedöma om immateriella rättigheter behöver hanteras
- att informationsklassificera (se nedan)
- att uppskatta datavolymer
- att uppskatta beräkningsbehov samt
- arkivering
Utifrån ovanstående kan du bedöma vilken typ av lösning som är lämplig för dina behov. Forskningsdata har en ”levnad” som innefattar såväl en aktiv projektfas, publicering och långsiktig delning och så småningom arkivering. Beslut som tas tidigt i processen kan ha stor inverkan på datahanteringen senare i projektet. Därför är det klokt att göra en genomtänkt datahanteringsplan redan när du planerar ett projekt. En sådan plan kan vara ett formellt krav från forskningsfinansiärer vid bidragsansökningar. En datahanteringsplan som regelbundet följs upp och uppdateras blir ett stöd i genomförandet av ett projekt.
Informationsklassificering
För att hitta rätt typ av lösningar för lagring och annan hantering av data så är det naturligtvis viktigt att veta sina behov, och vilka legala och andra krav den typ av data du arbetar med ställer. Höga krav innebär vanligtvis högre kostnader för teknisk lösning, så det är viktigt att hitta rätt nivå för sina behov. Ett sätt att hitta rätt nivå är att ”informationsklassificera” sina data. Man gör klassificeringen genom att bedöma sina behov och data med avseende på tre faktorer: Konfidentialitet, Riktighet och Tillgänglighet.
- Med Konfidentialitet syftar man på om data innehåller information, såsom personuppgifter, som måste hanteras konfidentiellt.
- Med Riktighet menar man hur viktigt det är att det inte uppstår något fel (i någon datapunkt t.ex.).
- Med Tillgänglighet avses här hur kritiskt det är att man hela tiden har sina data tillgängliga. Är det tillräckligt att det tar 24 timmar innan data blir tillgängligt? Eller måste det vara uppkopplat vid alla tidpunkter?
Klassificeringen görs en med en skala 0-3 för varje faktor och du kan göra den själv med hjälp av i Uppsala universitets instruktion för informationsklassificering. Är man ovan kan det vara effektivt att ta hjälp av datakontoret (datkontoret@uu.se) som arbetar tillsammans med Säkerhetsavdelningen.
Läs mer om informationsklassificering och informationssäkerhet vid Uppsala universitet. Du kan också kontakta säkerhetsavdelningen direkt, security@uu.se
Organisera dina data
Några saker att tänka på när du ska organisera insamlad data:
- Kom överens med dina kollegor om hur ni namnger, organiserar och lägger till metadata till er forskningsdata. Med tydlig metadata är det enklare för andra att hitta och förstå dina data.
- Skapa en genomtänkt mappstruktur.
- Mappstrukturen bör vara anpassad till de krav på arkivering och offentlighet som ställs på universitet som myndighet. (Forskningens datalagringsbehov, Dnr Ufv 2012/1735). Ni bör göra mappstrukturen så att data som så småningom ska arkiveras redan från början läggs i andra mappar än data som kommer att gallras.
- Om det finns etablerade sätt att strukturera mappar på din arbetsplats, använd samma metod.
- Namnge mapparna konsekvent enligt ett och samma system.
- Namnge mapparna så att även utomstående personer också efter lång tid kan hitta och förstå innehållet. Undvik att namnge mappar med personnamn.
- Använd en hierarkisk struktur
- Separera pågående arbete och avslutat arbete.
- Säkerhetskopiera – se till att spara en säkerhetskopia av dina originaldata. Säkerhetskopian ska läggas på en annan disk, på en åtskild plats.
- Gå igenom data regelbundet och ta bort filer som inte behövs och inte ska arkiveras.
Gör filnamnen begripliga
Din forskargrupp eller institution behöver komma överens om en standardmetod för att namnge filer. Tänk på följande:
- Ordval – använd samma ord för filnamn
- Skiljetecken – använd stora och små bokstäver liksom punkt, komma, mellanslag och bindestreck på ett enhetligt sätt.
- Datum – skriv på ett enhetligt sätt, t.ex. ÅÅÅÅMMDD
- Vilken ordning olika beståndsdelar av namnet anges så att man kan sortera efter filnamn. Exempelvis: 20181231,kost,001
- Nummer – ange antal siffror för filer som listas numeriskt, till exempel: 0001, 0002