Tutkimusaineistojen hallinnassa on suositeltavaa noudattaa FAIR -periaatteita (Findable, Accessible, Interoperable, and Re-usable) eli aineiston tulisi olla löydettävissä, saavutettavissa, yhteentoimivaa ja uudelleen käytettävää.
Tutkimuksen rahoittajat ja kustantajat edellyttävät yhä useammin tutkimuksen tausta-aineistojen saattamista avoimiksi. Itä-Suomen yliopiston datapolitiikan mukaisesti julkisella rahoituksella tehdyn, julkaistuihin tutkimustuloksiin liittyvän tutkimusaineiston tulee lähtökohtaisesti olla avointa aina, kun se on tehtyjen sopimusten (omistajuus, käyttöoikeudet, immateriaalioikeudet ja salassapito), lainsäädännön ja tutkimuseettisten periaatteiden puitteissa mahdollista eikä vaaranna yliopiston etua.
Tutkimusaineistojen avaaminen muiden käyttöön:
- parantaa tutkimustulosten laajamittaista hyödynnettävyyttä ja jatkokäyttöä
- edistää tutkimusta ja mahdollistaa uusien havaintojen ja ilmiöiden löytämistä
- edistää tutkimusyhteistyötä
- tarjoaa tutkijoille tasavertaiset mahdollisuudet tutkimusdatan käyttöön
Aineistojen avaamisessa suositellaan lisenssejä, joiden avulla tutkija voi itse määritellä datansa käyttöoikeuksia: mitä, miten ja kenelle aineistoja luovutetaan. On tärkeää huomioida rahoittajien ja tutkimusorganisaation ohjeistukset ja vaatimukset, lain ja tutkimusetiikan lisäksi.
Aineiston käyttöehdoista määrää tutkimusaineiston tekijä tai se, kenelle tekijä on siirtänyt oikeudet, lukuun ottamatta tilanteita, joissa lainsäädäntö (tietosuoja, laki viranomaisen toiminnan julkisuudesta) tai liikesalaisuus rajoittaa datan käyttöä ja julkaisemista. Lisäksi tekijänoikeuslaki ja hyvä tieteellinen käytäntö edellyttävät, että tekijä mainitaan hyvän tavan mukaisesti. Lisensointi (esim. Creative Commons) määrittää aineiston tuottajan ja käyttäjän oikeudet, ja näin ollen parantaa datan uudelleenkäyttömahdollisuuksia.
Tutkijalle aineiston avaaminen on tieteellinen meriitti, sillä tutkimustyön tieteelliseen ja yhteiskunnalliseen vaikuttavuuteen luetaan ansiot tutkimus- ja tietoaineistojen tuottamisessa ja jakamisessa. Tutkimusaineistojen avaaminen kannattaa siis lisätä ansioluetteloon. Avaaminen meritoi tutkijaa viittauksina avattuun tutkimusaineistoon sekä tutkimusaineistosta tuotettuihin julkaisuihin. Myös käyttämättä jääneiden aineistojen julkaisua suositellaan. Jotta tutkimusaineisto olisi löydettävissä ja hyödynnettävissä, aineistoon täytyy liittyä riittävän tarkkoja kuvailutietoja eli metadataa. Aineiston löytämiseksi sille tulee hankkia pysyvä tunniste (URN, DOI), jonka avulla digitaalinen aineisto voidaan tunnistaa ja löytää, vaikka aineiston sijaintipaikka olisi muuttunut.
UEF-eRepository (eRepo) on Itä-Suomen yliopiston avoimien tutkimusaineistojen palvelu, joka sisältää rinnakkaistallennettuja tieteellisiä artikkeleita ja tutkimusaineistojen metatietoja. eRepo kokoaa yhteen tietoja Itä-Suomen yliopiston tutkijoiden tuottamasta tutkimusdatasta useista eri palvelusta.
Tutkimusaineistot on suositeltavaa kuvata tutkimusaineistojen Etsin-hakupalveluun. Palveluun voi tallentaa metatietoja myös aineistoista, joita ei voida suoraan avata jatkokäyttöön. Aineiston julkiset kuvailutiedot lisäävät tietoa olemassa olevista aineistoista ja voivat poikia esimerkiksi yhteistyömahdollisuuksia, vaikka itse aineistoa ei voida avata. Tutkimusdatan avaamiseen soveltuvia palveluja on esitelty alla olevissa kokonaisuudessa.
Tutkimusdatan tallentamiseen on käytettävissä useita kansallisia ja kansainvälisiä tutkijoille maksuttomia palveluita. Mikäli valitset ulkomaisen säilytys- tai julkaisupaikan muista varsinkin silloin erikseen huolehtia siitä, että aineisto tulee näkyviin tutkimusaineistojen Etsin-hakupalveluun.
UEF eRepository on Itä-Suomen yliopiston avoimien tutkimusaineistojen palvelu, joka sisältää rinnakkaistallennettuja tieteellisiä artikkeleita ja tutkimusaineistojen metatietoja. eRepo kokoaa yhteen tietoja UEFin tutkijoiden tuottamasta tutkimusdatasta useista eri palvelusta. Haravoitavia datapalveluita, joista metatiedot siirtyvät automaattisesti UEF eRepoon ovat Etsin, Zenodo ja EUDAT. Tutkimusdata-arkistoon aineistoa tallentaessa kannattaa huomioida, että Itä-Suomen yliopisto tulee mainituksi. Affiliaation kirjaamiseen suosittelemme käytettävän ”University of Eastern Finland".
Tutkimusaineistoa avattaessa aineiston tulee olla sellaisessa muodossa, jonka ulkopuolinen pystyy ymmärtämään ja hyödyntämään. Huolella laadittu aineistonhallintasuunnitelma ohjaa jo aineistonkeruuvaiheessa ja helpottaa tutkimusaineiston avaamista. Avattava aineisto on pidettävä yksinkertaisena, selkeänä kokonaisuutena. Tutkimusaineisto kannattaa julkaista sellaisessa datarepositoriossa tai -arkistossa, josta aineiston mahdolliset hyödyntäjät löytävät sen helposti.
Aineiston avaamisen askelmerkit:
- Valitse aineisto tai aineiston osa, jota suunnittelet avaavasi.
- Selvitä, onko aineistojen avaamiselle eettisiä, laillisia tai sopimusoikeudellisia rajoituksia.
- Kuvaa aineiston avaaminen aineistonhallintasuunnitelmassa, jolloin osaat huomioida avaamisen vaatimukset jo aineistoa muodostaessasi. Määrittele, missä vaiheessa tutkimusprojektia aineisto avataan.
- Suorita aineistolle tarvittaessa anonymisointi.
- Aineistolle suositellaan avointa tiedostoformaattia, jonka käyttämiseen ei tarvita mitään kaupallista ohjelmaa, ja joka toimii mahdollisimman monilla käyttöjärjestelmillä (lisätietoja).
- Huolehdi metadatan saatavuudesta tutkimusaineiston löytämiseksi. Kuvaile syntyvät aineistot ja hanki aineistoille pysyvät tunnisteet (URN, DOI). Pysyvän tunnisteen saa Etsin-palvelun, datarepositorioiden tai -arkistojen kautta.
- Määrittele aineiston käyttöoikeudet lisensoimalla tutkimusaineistosi. UEF ohjeet Creative Commons lisenssien käyttöön löytyvät seuraavasta osiosta. Avoimille aineistoille suositellaan standardimuotoista koneluettavaa lisenssiä CC BY 4.0. Tutkimusaineistoja kuvailevat metatiedot suositellaan lisensoimaan käyttöluvalla CC0. Tietokoneohjelmille suositellaan MIT-lisenssiä.
-
Saata aineisto avoimeksi tallentamalla aineisto datarepositorioon tai -arkistoon (yliopistojen, tutkimuslaitosten, kansalliset tai kansainväliset tieteenalakohtaiset tai yleiset tietoarkistot, lisätietoja löytyy sitä seuraavasta osiosta) tai julkaisemalla aineisto esimerkiksi data lehdessä.
- Mainosta julkaisemaasi aineistoa sosiaalisessa mediassa (esim. ResearchGate, Academia.edu, Mendeley) ja lisää tiedot ansio-/julkaisuluetteloosi sekä kotisivuillesi.
Eettiset ja juridiset kysymykset voivat rajoittaa aineistojen täysimittaista avaamista:
- Tietosuoja ja henkilötietojen käsittely Itä-Suomen yliopistossa
- EU:n yleinen tietosuoja-asetus (2016/679, GDPR=General Data Protection Regulation)
- julkisuuslaki (21.5.1999/621)
- tekijänoikeuslaki (8.7.1961/404)
- hyvä tieteellinen käytäntö / Tutkimuseettinen neuvottelukunta
- Itä-Suomen yliopiston tutkimusetiikkaa koskeva sivusto
- tietosuojaperiaatteet / Tietosuojavaltuutetun toimisto
Lisätietoa
- UEF ohjeita aineistonhallinnan suunnitteluun
- Aineistonhallinnan käsikirja / Tietoarkisto
- Dataan viittaaminen, Datan jäljillä : kansallinen dataviittauksen tiekartta / Finnish Committee for Research Data (Data-asiain kansalliskomitea)
- Itä-Suomen yliopiston tietoturvaa käsittelevä sivusto / Tietotekniikkapalvelut
- CSC:n palvelut tutkimukselle / Tieteen tietotekniikan keskus, CSC
- Open Data Handbook / Open Knowledge International
- Managing and Sharing Data: Best Practice For Researcher / UK Data Archive
Aineistojen avaamisessa suositellaan lisenssejä, joiden avulla tutkija voi itse määritellä datansa käyttöoikeuksia: mitä, miten ja kenelle aineistoja luovutetaan. On tärkeää huomioida rahoittajien ja tutkimusorganisaation ohjeistukset ja vaatimukset, lain ja tutkimusetiikan lisäksi.
Aineiston käyttöehdoista määrää tutkimusaineiston tekijä tai se, kenelle tekijä on siirtänyt oikeudet, lukuun ottamatta tilanteita, joissa juridiset tai eettiset esteet, (kuten tietosuoja, liikesalaisuus tai muu salassa pidettävä tieto) rajoittavat datan käyttöä ja julkaisemista. Lisäksi tekijänoikeuslaki ja hyvä tieteellinen käytäntö edellyttävät, että tekijä mainitaan hyvän tavan mukaisesti. Lisensointi (esim. Creative Commons) määrittää aineiston tuottajan ja käyttäjän oikeudet, ja näin ollen parantaa datan uudelleenkäyttömahdollisuuksia.
- Avoimelle tutkimusdatalle suositellaan standardimuotoista koneluettavaa lisenssiä CC BY 4.0 tai CC0.
- Tutkimusaineistoja kuvailevat metatiedot suositellaan lisensoimaan käyttöluvalla CC0.
- Tietokoneohjelmille suositellaan MIT-lisenssiä.
Lisätietoa
- CreativeCommons.fi / tietoa CC-lisensseistä
- How to License Research Data / DCC
Tutkimusdatan tallentamiseen on käytettävissä useita kansallisia ja kansainvälisiä tutkijoille maksuttomia palveluja. Tutkija voi valita omalle tutkimusdatalle ja tieteenalalle sopivan datapalvelun, jonne tallentaa tutkimusdatan avoimesti saataville. Tutkimusdatalle kannattaa valita tallennuspaikka, joka on säilytyksen suhteen luotettava ja stabiili sekä avoimen saatavuuden mahdollistava.
Kustantajilla on erilaisia käytäntöjä tutkimusdatan avaamiseen liittyen. Osa kustantajista edellyttää, että julkaisun yhteydessä kerrotaan miten tutkimusdata on saatavissa tai perustellaan miksi dataa ei voida avata. Tutkimusdataa voi avata myös julkaisemalla sen esimerkiksi dataan erikoistuneessa lehdessä. Data journals eli datalehdet ovat uusi julkaisemisen muoto, joka keskittyy artikkelien sijaan julkaisemaan tutkimusdataa ja tietoja siitä.
Suomalaisia datapalveluja
- Etsin / tutkimusaineistojen hakupalvelu, CSC
- AVAA / avointen tutkimusaineistojen julkaisualusta, CSC
- IDA / tietoaineistojen säilytyspalvelu tutkijoille, CSC
- Aila / tutkimusaineistojen palveluportaali, Tietoarkisto
- Kielipankki / teksti- ja puheaineistoja, FIN-CLARIN
Kansainvälisiä datapalveluja
- Zenodo / eurooppalainen eri tieteenalojen tutkimusdatarepositorio, CERN
- EUDAT / eurooppalainen tutkimusdatainfrastruktuuri ja -palvelukokonaisuus
- Dryad / yleisdatarepositorio tieteellisiin julkaisuihin liittyvälle tutkimusdatalle
- Pangaea / geo- ja biotieteiden datarepositorio
- The European Bioinformatics Institute (EMBL-EBI) molekyylidata resursseja ja bioinformatiikka palveluita. Useita data repositorioita ja valintatyökalu helpottamaan datan tallennuspaikan valintaa.
- Figshare / eri tieteenalojen tutkimusdatarepositorio
Muita datapalveluja
- re3data.org / kansainvälinen tieteenalakohtaisten tutkimusdata repositorioiden hakemisto
- Data repositories / lista eri tieteenalojen datarepositorioista
- OpenDOAR / data-arkistojen hakemistopalvelu
- CESSDA / eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri, sisältää maakohtaiset arkistot
- OpenAIRE / eurooppalainen open access -infrastruktuuri
Olemassa olevien tutkimusaineistojen jatkokäyttö on taloudellista ja säästää rajallisia resursseja. Tutkijan kannattaa hyödyntää tutkimuksessaan jo olemassa olevia tutkimusaineistoja, koska
- tutkimuksen tekeminen nopeutuu
- valmiit aineistot voivat toimia oman aineiston vertailuaineistona tai oman aineiston voi yhdistää olemassa oleviin aineistoihin
- tutkimusresursseja säästyy, kun kaikkea ei tarvitse tehdä itse.
Toisten tuottamien materiaalien käytössä on huomioitava niiden käyttöehdot. Käyttöehdot määritetään tavallisesti lisenssillä. Aineistot voivat olla täysin vapaasti hyödynnettäviä tai niiden käyttöön voi olla määritetty käyttörajoitteita.
Tutkimusaineistoja voit etsiä hakupalvelujen, datarepositorioiden tai -arkistojen ja portaalien kautta. Haussa kannattaa hyödyntää yleisiä asiasanoja (eri tieteenalojen asiasanoja Finto-palvelusta), joilla aineistoa on mahdollisesti kuvailtu. Tutkimusdatapalveluja on listattu edellisessä osiossa.
Avoimen datan portaaleja
- Avoindata.fi / julkisen hallinnon avoimia tietoaineistoja
- Ilmatieteen laitos – Avoin data / Ilmatieteen laitoksen avoin data ja lähdekoodi
- Väylävirasto – Avoin data / avointa dataa liikenteestä ja liikenneverkoista
- Maanmittauslaitos - Avoimien aineistojen tiedostopalvelu / karttojen laatimisen itsepalvelu
- THL – Avoin data / Terveyden ja hyvinvoinnin laitoksen avointa dataa
- Tilastokeskus – Avoin data ja rajapinnat / avoimia aineistoja ja niiden rajapintoja
- Traficom – Avoin data / Liikenne- ja viestintäviraston avointa dataa
- Verohallinto – Avoin data / Verohallinnon tarjoamaa avointa dataa
- Euroopan unionin avoimen datan portaali
Dataan viittaaminen
Tutkimusdataan on viitattava aivan kuten muihinkin tutkimuksessa käytettyihin lähteisiin. Kansallisen dataviittaussuosituksen mukaan viittauksen tulee sisältää seuraavat tiedot: tekijä, aineiston nimi, tekijän taustaorganisaatio, julkaisun ajankohta, pysyvä tunniste. Hyödyllisiä lisätietoja viittauksessa ovat: versiotiedot, aineistotyyppi, lisenssi, ORCID, tieto mahdollisesta embargo ajasta.
Datarepositorioissa ja –arkistoissa on usein ohjeita dataviittaukseen. Myös kustantajilla voi olla oma ohjeistus julkaisussa käytettävään viittaustapaan.
- Kansallinen dataviittaus tiekartta Tracing data: Data citation roadmap for Finland / FCRD
- Tietoarkiston ohje aineistoon viittaamisesta
- How to Cite Datasets and Link to Publications / DCC