Filer, mappar och versionering
Filnamn
Välj principer för att namnge filer tidigt i ett projekt. Det bör framgå vilken version som är den senaste och det ska vara möjligt att hämta tidigare versioner vid behov.
Filnamn bör:
- ha ett transparent namn beskriver det viktigaste aspekterna av innehållet i filen
- visa hur den specifika filen relaterar till andra filer
- vara unika och följa ett enhetligt och konsekvent mönster
- informera om innehåll, status och version
Använd bindestreck eller understreck för att skilja olika delar i ett filnamn. Undvik blanksteg och specialtecken. Använd standarder som exempelvis ISO 8601 för datum, tid och tidsintervall. Var konsekvent vid användning av versaler och gemener och ange antal siffror för filer som behöver listas numeriskt, till exempel: 0001, 0002. Det underlättar vid sortering och ger bättre maskinläsbarhet.
Utgå från vilka behov du har att sortera filer vid val av beståndsdelar i filnamn. Ofta är det bättre att gå från generellt till mer specifikt, ex, ProjectAbbr_ExperimentNr_Location_Time_TypeOfData_VersionNr
Filformat
Sträva efter att använda filformat som bygger på öppna standarder, är vanligt förekommande, lämpade för långsiktig hållbarhet, leverantörsoberoende och inte kontrollerade av en enskild person/organisation. Det underlättar när data sedan ska delas, återanvändas och bevaras. Vid behov kan de ursprungliga filformaten behöva föras över till arkivbeständiga format inför långtidslagring och arkivering. Men som forskare ska man naturligtvis välja de filformat som passar bäst för datainsamling och vald analysmetod. På grund av praxis inom vissa discipliner och behov av att använda specifika instrument och analysredskap måste man ibland använda proprietära leverantörsberoende filformat.
Tänk på följande vid val av filformat:
- Finns det några områdesspecifika rekommendationer?
- Är mjukvaran kompatibel med de system som tillhandahålls av universitetet?
- Hur ska data genereras och analyseras?
- Kan du lägga till metadata?
- Är formatet lämpligt vid delning av data?
- Är formatet lämpligt vad gäller långsiktighet?
- Fungerar det i alla delar av processen, med så litet behov av konvertering till andra format som möjligt?
För förbättrad återanvändbarhet (reproducerbarhet) bör filformat och programvara som används beskrivas. Det är särskilt viktigt när objektet innehåller .zip eller .tar-kataloger som kan omfatta flera olika filformat.
Versionering
I projekt där data och filer förekommer i olika versioner är det viktigt att du och dina medarbetare kan hålla isär olika versioner, att det är tydligt vad en version innehåller och hur den skiljer sig från andra versioner. Regler för versionering bör dokumenteras och tas med i en datahanteringsplan. I större projekt med många medarbetare kan det vara lämpligt att ge en medarbetare ansvar för att riktlinjer för namngivning och versionering följs och uppdateras.
Varje ny sparad version av data bör anges med ett nytt versionsnummer (t.ex. v01, v02, v03 o.s.v.) och gärna datum när filen skapades. Större ändringar i en fil kan indikeras med hela siffror, till exempel v01 för den första versionen och v02 för andra versionen. Mindre ändringar kan indikeras lägga till fler led i filnamnet, till exempel, v01_01, v01_02 och så vidare.
Viktiga ändringar kan dokumenteras i en separat versionskontrolltabell. Där kan man ange vad som ändrades, varför och när, vilket skapar bättre spårbarhet för data och resultat. Tänk även på att dokumentera eventuell kod som används.
Läs mer:
Svensk nationellt datatjänst (SND): Mappstruktur, filnamn och versionering