Lagra och samarbeta
Lagringsytor – interna och externa
Forskningsdatas ”levnad” sträcker sig totalt över många år och kan delas in i faser som ställer olika krav på hanteringen av data. Forskningsdata är formellt en allmän handling och universitetet har som myndighet ett ansvar för att data hanteras och lagras på ett korrekt sätt. Generellt gäller att forskningsdata ska lagras på plattformar/lösningar som är långsiktigt förvaltade, tillhandahåller goda backuprutiner och har adekvat säkerhetsnivå. Om data har ett högt skyddsvärd och kanske innehåller konfidentiell information ställs särskilda krav, se Planera hanteringen av data.
Tänk på att överföring av personuppgifter till tredjeland (utanför EU/EES-området) endast får göras om mottagarlandet säkerställer en tillräcklig skyddsnivå för uppgifterna.
Kontakta gärna forskningsdatakontoret (dataoffice@uu.se) om du har frågor.
Plattformar för aktiva data/projekt
Plattformar för aktiva data används främst under pågående projekt, då man behöver spara, dela och arbeta med data och dokument. Vissa plattformar har även stöd för krävande beräkningar av data.
Vid val av plattform är det lämpligt att fundera på projektets behov när det exempelvis gäller vilka operativsystem som är kompatibla, om plattformen har versionshantering av filer/dokument, vem som kan få åtkomst till data, hur autentisering av användare sker, om det finns möjlighet till redigering via webbläsare osv.
Uppsala universitet erbjuder själv och via det nationella SNIC-konsortiet ett antal tjänster för aktiva data. Observera att förändring av tjänsterna kan införas snabbare än denna text hinner uppdateras.
För samtliga tjänster i listan nedan gäller att:
- De har en långsiktig förvaltning.
- Det finns lösningar för backup/säkerhetskopiering.
- Nyttjande sker i regel mot en avgift som styrs av säkerhetsnivå, tillgänglighet, backupfrekvens m.m.. En och samma plattform kan erbjuda olika servicenivåer och därmed olika kostnadsnivåer. En del resurser är dock avgiftsfria, Allvis (upp till 200 Gb lagringsutrymme) och flera av SNICS tjänster.
- Filer kan delas även med forskare utanför UU, med hjälp av olika lösningar.
Plattformar som drivs eller förvaltas av Uppsala Universitet
- Dataportal Allvis En plattform för att spara och dela data och projektdokumentation under aktiv projektfas. Den tekniska lösningen bygger på SharePoint och lämpar sig för dokument och mindre dataset. Upp till 200 Gb lagringsutrymme kan användas kostnadsfritt. Den maximala storleken på enskild fil som kan laddas upp är 10 GB. Om man vill samarbeta med externa användare, d.v.s. personer som inte har ett UU-konto behöver man beställa konton till dem. Allvis uppfyller KRT-värde 233 utan kryptering och 333 med kryptering. Allvis drivs av Avdelningen för universitetsgemensam IT (UIT).
- UIT Datalagring (Argos) En plattform för aktiv projektfas. Alla gruppkataloger lagras på Argos, som är en central och driftsäker, skalbar lagringslösning. Valbar nivå av service och säkerhet. Kostnaden beror på vald nivå. Alla heltidsanställda universitetsmedarbetare har möjlighet att beställa gruppkataloger efter godkännande av prefekt (eller motsvarande chef). Data som lagras på lagringsytan inklusive åtkomsträttigheter till denna hanteras av beställaren. KRT-värde 232 till 211 utan kryptering och 333 med kryptering.
UIT erbjuder också andra kompletterande tjänster och flexibla lösningar som skräddarsys för dina behov. Kontakta gärna IT-support om du vill diskutera dina behov.
- Vesta En plattform för säker lagring och bearbetning av känsliga data. Bygger på samma teknik som Datalagring men med kryptering på disk och med hårdare begränsning av hur datan går att nå. Du får tillgång till en virtuell Windows 10 miljö inklusive ett antal förinstallerade programvaror för bearbetning och analys av data utan att de lämnar den säkra lagringsmiljön. Inloggning i systemet sker med tvåfaktorsautentisering och hårdvarunyckel (Yubikey som behöver kvitteras ut). Kan delas med andra Vesta-användare. Tjänsten uppfyller KRT-värde 332. Kontakta IT-support om du vill få tillgång till Vesta eller har fler frågor.
- Electronic Lab Notebook - ELN En digital labbok/loggbok och en plattform för dokumentation av forskningsplanering, forskningsdata och resultat. Systemet är webbaserat och främst avsett för att lagra/dela/samarbeta och arkivera labbanteckningar. Systemet är inte anpassat för att lagra större mängder rådata och filstorleken är begränsad till 50 MB. Systemet är integrerat med Microsoft Office samt ritningsprogram för kemiska strukturer. Läs här om kostnad för att använda ELN. Har du frågor -- kontakta din lokala ELN-administratör eller ELN-supporten.
Plattformar vid institutionen för informationsteknologi
- UPPMAX (Uppsala Multidisciplinary Center for Advanced Computational Science) är Uppsala universitets resurs för högprestandadatorer, storskalig datalagring och kunskap inom högprestandaberäkning. UPPMAX har ett nationellt uppdrag för SNIC och bidrar även med resurser för undervisning inom Uppsala universitet. Kontakta UPPMAX support vid frågor.
Nationella resurser som kan användas av UU-forskare
- SNIC En nationell resurs, i första hand för krävande beräkningar och den lagring som behövs för beräkningarna. För tillgång krävs en ansökan som vanligen beviljas. För projekt med mycket stora datavolymer råder en större konkurrens. Plattformen är kompatibel med alla vanliga operativsystem (Windows, MacOS med hjälp av ett hjälpprogram). Lagring och beräkningsresurser bekostas av SNIC. Användare kan också betala för extra lagring med fast löptid på 4 år.
- SNIC SENS En nationell resurs som tillhandahåller lagring och beräkningskapacitet för krävande beräkningar, med hög säkerhet, för känsliga data. För tillgång till resurserna behövs en godkänd ansökan. Vanligtvis beviljas ansökan för datamängder upp till 1 Tb. För mycket större behov är konkurrensen större. Kompatibel med alla vanliga operativsystem (via en SSH-klient). Lagring och beräkningsresurser bekostas av SNIC.
- Swestore En nationell resurs (del av SNIC), i första hand för lagring (ej för backup eller arkivering). Kompatibel med alla vanliga operativsystem (via en SSH-klient). Kostnadsfri tillgång efter beviljad ansökan. Man kan också köpa tillgång till lagring, en service som främst används av infrastrukturer.
Tjänster med lagring utanför UU
- Forskarsamfundets repositorier. Forskningsdata hanteras ofta i externa tjänster och repositorier som forskarsamfundet ansvar för. Dessa har generellt en hög kvalitet när det gäller hantering av data och långsiktighet.
- Sunet Box. En upphandlad tjänst för fillagring med möjligheter att dela filer med andra inom universitets- och högskolesektorn i Sverige samt med andra användare på internet. OBS! På grund av ett oklart juridiskt läge (Schrems II-domen 2020-07-16) avråder vi just nu från att använda SUNET Box för hantering av personuppgifter. Kontakta säkerhetsavdelningen om du har frågor om detta.
- Tjänster på öppna marknaden. Det finns en mängd tjänster på den öppna marknaden som erbjuder lagring och annan funktionalitet, ofta med en attraktiv prisnivå. Men att använda sig av en extern leverantörs tjänster för lagring, funktioner, datorkapacitet ställer särskilda krav i samband med anskaffning och användning, i synnerhet om det gäller personuppgifter och annan skyddsvärd information. Tänk på att molntjänster ofta tillhandahålls av internationella företag som lyder under andra länders lagstiftning, och information som lagras i molnet kan i praktiken hanteras i många olika länder. Vidare saknas oftast åtaganden vad gäller långsiktighet som är i överensstämmelse med de krav som ställs på ett svenskt universitet. Se vidare information från UU om molntjänster och Rutiner för säker informationshantering.
Samarbeta
Oavsett hur många personer det är i ditt forskningsprojekt är det viktigt att på ett enkelt sätt kunna komma åt och arbeta med projektets forskningsdata. Samtidigt är det data förvaras säkert så att arbetsinsatser inte går förlorade och att obehöriga inte kommer åt data.
Frågor kring datasäkerhet är centrala i alla projekt som inkluderar stora eller känsliga datamaterial. Det är viktigt att känna till vilka riktlinjer och tekniska lösningar som finns på universitet: hur kan ni till exempel arbeta tillsammans med samma data i ett projekt med deltagare från olika lärosäten eller organisationer? Finns det tekniska lösningar som erbjuder möjligheter att komma åt samma lagringsyta med datafiler?
Utöver den tekniska lösningen är det också viktigt att ha effektiva rutiner på plats som utnyttjar de lösningar ni väljer inom projektet. Är rutiner och arbetsflöden för komplicerade eller tidskrävande är risken att de ignoreras av projektdeltagarna, vilket kan innebära risk för dataförlust och felaktiga analyser. En datahanteringsplan kan vara ett bra stöd, men den kommer inte att förhindra att steg hoppas över eller skjuts upp i ett för besvärligt arbetsflöde.
Om din Hemkatalog är centralt administrerad kan du använda tjänsten myfiles/Filr för att dela filer och kataloger med andra. Observera att det inte är lämpligt att använda myfiles/Filr som en kontinuerlig samarbetsyta med externa parter. Sådana samarbetsytor behöver hanteras i tjänster som nås via ett regelrätt autentiseringsförfarande. När du delar filer/kataloger med externa parter tänk på att:
- Begränsa tiden för åtkomst.
- Endast dela filer/kataloger som är nödvändiga i det aktuella sammanhanget.
- Var noggrann med hur du delar ut rättigheter till filer/kataloger.
Ordning och reda vid samarbete
När flera personer inom ett forskningsprojekt arbetar med samma datamaterial är det extra viktigt att ha ordning på datamaterialet genom de regler för katalognamn, filnamn och versionering av filer, samt god dokumentation som beskrivits i föregående kapitel. Variabler kan ändras, läggas till och tas bort i datamaterialet. Detsamma gäller för koder och uppmärkning i material som behandlas med kvalitativa analysmetoder.
För att undvika oordning och eventuella felanalyser är det lämpligt att utgå från en gemensam version av data, som lagras skrivskyddad med åtkomst för bara en eller ett fåtal personer i forskargruppen. Den eller dessa förvaltar de data ni arbetar med och har ansvar för att rätta till fel, lägga till nya variabler, ändra koder med mera. Ansvaret inkluderar också att dokumentera de versioner som skapas. Det ger gruppen bättre kontroll över vilken version av data som ska analyseras och det blir enklare att i efterhand återskapa de analyser som har gjorts. Med en gemensam version av data blir det smidigare att i ett senare skede förbereda data för arkivering och göra data tillgängliga för ny forskning. Datahanteringsplanen behöver uppdateras löpande i takt med att förändringar görs i datamaterialet.
I projekt där flera personer arbetar med samma datamaterial är det bra att ha:
- en klar och tydlig ansvarsfördelning
- regler för dokumentation, katalogstruktur, filnamn och versionering
- en fillagring som alla behöriga kan komma åt
Skydd mot obehörig åtkomst
Lika viktigt som det är att se till att rätt personer har åtkomst till data är det att se till att obehöriga inte kan komma åt dem. En lösning som ger alla som behöver åtkomst till data kanske inte är säker nog för att skydda materialet från obehöriga personer. Du behöver veta vilken informationsklass data har och vilka riktlinjer som lärosätet har för hantering av material med den informationsklassen. Data som innehåller känslig information (exempelvis personuppgifter, militära hemligheter eller information om biologiskt känsliga lokaler) ställer högre säkerhetskrav än data av mindre känslig karaktär. Oavsett innehållets känslighet har du ansvar för att data har det skydd som behövs för att förhindra oavsiktlig eller obehörig åtkomst.
Molntjänster som drivs av en kommersiell aktör bör du vara extra försiktig med. Tjänster som Dropbox, iCloud, OneDrive eller Google Drive kan vara både praktiska och billiga, men du saknar kontroll över vem som har tillgång till data och du har ofta ingen garanti för att data säkerhetskopieras eller kan återbördas till dig om företaget skulle besluta sig för att lägga ned tjänsten eller gå i konkurs. Undersök om användning av kommersiella molntjänster är förenliga med ditt lärosätes riktlinjer. Läs också igenom användaravtalet så att du inte utsätter datamaterialet för någon risk. Observera att detsamma gäller för programvara som lagrar data på egna servrar. Även e-post och USB-stickor kan vara osäkra sätt att ge åtkomst på beroende på typ av data då risken finns att data hamnar i orätta händer.
Att välja IT-lösning för forskningsdata
En säker lösning är inte nödvändigtvis den enklaste lösningen. Konsultera gärna dina kollegor när du planerar för hur du ska uppnå en lösning med den bästa kombinationen av åtkomst och skydd. Idag saknas för många typer av data standardlösningar och praxis för att skydda data och samtidigt ge alla relevanta personer i ett projekt åtkomst. Då behöver projektet hitta rimliga kompromisser i samarbete med IT-avdelningen, säkerhetsavdelningen och juridiskt stöd.
Lagringslösningar
För att du inte av misstag ska bli av med eller förstöra data är det viktigt att du har en säker lagringslösning där det görs regelbundna säkerhetskopior av materialet. Originalfiler bör inte sparas på den egna datorns hårddisk, framför allt inte om den är bärbar. Forskningsdata bör inte heller lagras på USB-minnen, CD- eller DVD-skivor, externa hårddiskar eller liknande (om det inte finns en säkerhetskopia på en säker lagringsyta), eftersom det finns risk att lagringsmediet går sönder, tappas bort eller stjäls.