Publicera data
Öppna data
Att publicera och göra forskningsdata öppet tillgängliga ger ökad transparens och tillförlitlighet för presenterade resultat och publikationer. Det ger även andra möjlighet att hitta och återanvända befintliga data i ny forskning. Forskningsdata som tillgängliggörs via repositorier blir sökbara, citerbara och ger upphovsmännen fler möjligheter till genomslag, meritering och framtida samarbeten.
Vetenskapsrådet samordnar arbetet med öppen tillgång till forskningsdata i Sverige och Kungliga biblioteket har ett uppdrag att ta fram nationella riktlinjer för öppen vetenskap. Den nationella målbilden är att forskningsdata som finansierats med offentliga medel ska vara öppet tillgängliga senast 2026. Läs mer om öppen vetenskap.
Vissa data bör inte publiceras
Det kan finnas juridiska och/eller etiska skäl att inte dela eller publicera forskningsdata. Det gäller exempelvis data som innehåller personuppgifter och som då omfattas av dataskyddsförordningen (GDPR) eller annan lagstiftning. Det kan även gälla information som är sekretessbelagt enligt OSL (SFS 2009:400), som innehåller företagshemligheter, är upphovsrättsskyddat av någon annan eller som innehåller annan information som av juridiska eller etiska skäl inte bör spridas. Även om vissa data inte direkt kan delas, publiceras eller göras öppet tillgängligt kan de ändå registreras så utförligt som möjligt och bli sökbara i kataloger över forskningsdata. Då kan du även ange kontaktpersoner och de förutsättningar och villkor som finns för att få tillgång till data.
Repositorier och identifierare
Det finns många repositorier för att dela och publicera forskningsdata. Välj gärna etablerade ämnesspecifika datarepositorier i första hand. I re3data.org - Registry of research data repositories - kan du söka efter repositorier inom olika ämnesområden och länder. Du hittar också en lista över ämnesspecifika repositorier hos The Open Access Directory (OAD). I ditt val av ämnesrepositorium kan du också ta del av rekommendationer och guider som många förlag erbjuder, t ex Nature. Några exempel på ämnesspecifika repositorier är:
- CESSDA – samhällsvetenskap
- DARIAH - humaniora
- ELIXIR - livsvetenskap life science. Här hittar du Elixirs lista över rekommenderade databaser, t ex BioStudies
- HEPData – högenergifysik
- NOMAD – materialvetenskap
- SBDI - biologisk mångfald
- SICAS Medical Image Repository - medicin
När du ska välja repositorium, undersök vilka riktlinjer din tidskrift, ditt förlag eller din finansiär har för delning och publicering av data. Europeiska kommissionen rekommenderar att forskare använder sig av certifierade repositorier som stödjer öppna data.
En fördel med ämnesspecifika repositorier kan vara att metadatafälten är mer detaljerade och att ämnesspecifika vokabulärer kan användas, vilket gör beskrivningen av materialet bättre. Generella datarepositorier kan ha fördelen att data får större tvärvetenskaplig räckvidd.
Att repositorier har maskinläsbara metadata och vedertagna metadatastandarder ökar också möjligheten till återanvändning och spridning.
Välj helst ett repositorium som tilldelar data persistenta identifierare, t ex DOI. Läs mer om identifierare nedan.
Nedan finns exempel på ämnesövergripande repositorier där forskare vid Uppsala universitet kan göra forskningsdata öppet tillgängliga utan kostnad:
- SND - Svensk nationell datatjänst är en svensk forskningsinfrastruktur som drivs av ett konsortium av nio lärosäten. I SND:s repositorium, som är certifierat enligt CoreTrustSeal, kan du som forskare publicera dataset och metadata. I SND:s registreringsformulär för dataset är det möjligt att söka fram och länka till publikationer registrerade i DiVA eller i SwePub. När du publicerar dataset i SNDs repositorium tilldelas det en persistent identifierare, DOI, och blir sökbart i SNDs katalog, Web of Science och DataCite. Dataset som deponeras hos SND beskrivs enligt metadatastandarden DDI (Data Documentation Initiative). Data som registreras i SNDs repositorium kureras av datakontoret vid Uppsala universitet i dialog med dig som forskare, i syfte att göra data så FAIR som möjligt.
- DiVA Uppsala universitets publikationsdatabas och publiceringsplattform. I DiVA kan du registrera forskningsdata under publikationstypen dataset och koppla dataseten till dina registrerade publikationer. Datakontoret kurerar också de dataset som registreras i DiVA. Dataset registrerade i DiVA kan du visa upp i publikationslistor på Medarbetarportalen och på https://katalog.uu.se/. Här hittar du en lathund för registrering av dataset i DiVA. Datakontoret kurerar också de dataset som registreras i DiVA.
- B2SHARE-EUDAT The EUDAT Collaborative Data Infrastructure är en EU-gemensam plattform för lagring och tillgängliggörande av data via European Open Science Cloud.
- Zenodo Ett repositorium som drivs av OpenAIRE och CERN med finansiering från EU-kommissionen. Kan användas för lagring och delning av dataset, programkod och annan forskningsdata. Via Zenodo kan man även lagra en kopia och generera DOI-nummer för programkod i Github.
- Figshare Ett öppet datarepositorium som Digital Science står bakom.
- Dryad Skapad av National Evolutionary Synthesis Center, UNC-CH Metadata Reserach Center, Oxford University, The British Library och California Digital Library.
- GitHub Microsoft.
- Dataverse Harvard University står bakom.
Det är också möjligt att tillgängliggöra dataset som supplementmaterial i samband med artikelpublicering eller via datatidskrifter. SND har en lista över datatidskrifter inom olika områden.
Vid publicering i ett repositorium får ett dataset en beständig identifierare, en PID (persistent identifier), ofta i form av ett DOI-nummer (Digital Object Identifier). PID:en är maskinläsbar och hållbar över tid till skillnad från url-länkar. En PID är ett unikt id-nummer eller en kodsträng. Det finns olika typer av PID:ar beroende på vad som ska identifieras och vilken organisation som står bakom dem. En PID kan leda till en landningssida där data är beskrivet, till filer eller dokument eller användas för att identifiera personer och organisationer. Några exempel är DOI (för data och publikationer), ORCID (för forskare och akademiker),ISBN (för böcker) och ISSN (för tidskrifter) och ROR (för forskningsorganisationer).
Tänk på att vid publicering av ett dataset kan angivna upphovsmän och roller vara andra än de som anges i publikationer vars analys och resultat bygger på dessa data. För exempel på roller se CRediT – Contributor Roles Taxonomy. FORCE11 Research Data Publishing Ethics Working Group har i samarbete med Committee on Publication Ethics (COPE) utarbetat en rekommendation kring frågor om upphovsmannaskap för dataset.
Licenser
För att underlätta för andra att återanvända publicerade data kan man ange eventuella villkor för användning, exempelvis med hjälp av Creative Commons licenser eller Open Data Commons. Villkoren kan beskriva sådant som korrekt citering, om bearbetningar och kommersiell användning är tillåtet och om data kan delas vidare. Licensiering av data är ett viktigt steg i att göra data FAIR. Läs mer om FAIR data här. Vissa tidskrifter har också krav på licensiering av data.
DIGG, Myndighet för digital förvaltning, har utarbetat riktlinjer för licensiering med öppna licenser. De rekommenderar att data som inte är föremål för upphovsrättsligt eller annat immaterialrättsligt skydd har märkningen PDM (Public Domain Mark) eller CC0. Data som omfattas av upphovsrätt bör, enligt DiGG, tilldelas licensen CC-BY 4.0. Digisam tydliggör här när och hur CC0 och PDM kan användas.
Du kan du läsa mer om licensiering av data i en nationell kontext hos SND.
Vi har samlat några användbara länkar om licenser för kod, datorprogram och databaser:
- För att välja licens till programvara med öppen källkod har GitHub skapat verktyget Choose a licence.
- Ett verktyg, tillhandahållet av Europeiska kommissionens Joinup, för att hitta och jämföra licenser för mjukvara: https://joinup.ec.europa.eu/collection/eupl/solution/joinup-licensing-assistant/jla-find-and-compare-software-licenses
- Open Source Initiative listar licenser för mjukvara https://opensource.org/licenses och har en läsvärd FAQ om ämnet https://opensource.org/faq
- Europeiska unionens licens till öppen källkod https://www.eupl.eu/1.2/sv/
- Information om ODbL, en öppen licens för databaser, från Open Knowledge Foundation: https://opendatacommons.org/licenses/odbl/