Tälle sivulle olemme koonneet ohjeita tutkimusaineistojen hallintaan tutkimuksen jälkeen. Usein tällöin puhutaan myös tutkimusaineiston arkistoinnista. Ohjeet ovat osin vain suuntaa antavia, mikä heijastelee tutkimuksenjälkeisen aineistonhallinnan monia ratkaisumahdollisuuksia ja vaatimuksia. Päivitämme ja täydennämme ohjeita jatkuvasti.
Alla olevissa osioissa on ohjeita esim. tutkimusdatan
- säilytysaikojen määrittelyyn,
- säilyttämisen ratkaisuihin,
- avaamiseen ja julkaisemiseen eli uudelleenkäytön mahdollistamiseen,
- arvonmääritykseen eli seulontaan ja
- turvalliseen hävittämiseen.
”Tutkimuksenjälkeisellä säilyttämisellä tai arkistoimisella tarkoitetaan sitä, että aineistoon ei enää säilytyksen/arkistoinnin alettua tehdä muutoksia, vaan aineisto säilyy sellaisena kuin se tietyllä hetkellä on.” (Tutkimusaineistojen säilytys tutkimuksen jälkeen Itä-Suomen yliopistossa. 2019, 1.)
Tutkimuksen jälkeen toteutettavaa tutkimusaineiston säilyttämistä kutsutaan säilyttämiseksi tai arkistoinniksi, jotka arkipuheessa saattavat viitata samaan asiaan. Näille käsitteille on myös tarkemmat, lainsäädännöstä ja viranomaiskäytöstä kumpuavat määritelmät, jotka on hyvä tietää.
Säilyttäminen
- on tiedonhallintalain (906/2019 § 21) mukaan aineiston säilyttämistä määräajan ja vain niin kauan kuin sitä tarvitaan tiettyyn tarkoitukseen (tutkimusaineistojen kohdalla esim. sopimus, rahoittajan tai julkaisijan vaatimus, laki tms.).
Arkistointi
- tapahtuu tiedonhallintalain (906/2019 § 21) mukaan säilytysajan päättymisen jälkeen, silloin kun aineistoa ei hävitetä.
- tarkoittaa arkistolain (831/1994 § 8,3) mukaan pysyvää säilyttämistä.
Pitkäaikaissäilyttäminen (PAS)
- viittaa digitaalisen aineiston pysyvään säilyttämiseen (arkistolaki) eli arkistointiin (tiedonhallintalaki).
Avaaminen
- viittaa tutkimusdatan saattamiseen sellaiseen muotoon, että muut voivat käyttää sitä mahdollisimman vapaasti esimerkiksi uudessa tutkimuksessa tai muussa tarkoituksessa.
- on tehtävä lainsäädäntöä, sopimuksia, lisenssejä ja eettisiä periaatteita noudattaen: Johtoajatuksena on “niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä”.
Julkaiseminen
- pitää sisällään datan avaamista tarkemmin määriteltyjen käytänteiden noudattamisen (vrt. tutkimustulosten julkaiseminen).
- voi käytännössä olla myös samaa kuin tutkimusdatan avaaminen.
- toteutetaan datarepositorioita tai tutkimusdatan julkaisemiseen erikoistuneita datajulkaisuja hyödyntäen.
Lisätietoa, lähteet ja linkit
Arvonmäärityksen ja seulonnan keskeiset käsitteet | Kansallisarkisto <https://kansallisarkisto.fi/fi/viranomaisille/arvonmaaritys-ja-seulonta/kasitteet> (käyty 2022-05).
Kuusniemi, M. E., & Nykyri, S. 2021. Tutkimusdata tieteellisenä julkaisuna. Informaatiotutkimus, 40(2), 57–71. <https://doi.org/10.23978/inf.109094>
Larmo, Katri; Kuusniemi, Mari Elisa & Fuchs, Siiri 2018. Tutkijan muistilista tutkimusdatan julkaisemiseen. Vastuullinen tiede -sivuston artikkeli 12.6.2018. <https://vastuullinentiede.fi/fi/jatkokaytto/tutkijan-muistilista-tutkimusdatan-julkaisemiseen> (käyty 2022-05).
Mitä on avoin tiede?| Avoin tiede – Avoimen tieteen ja tutkimuksen koordinaatio <https://avointiede.fi/fi/mita-avoin-tiede> (käyty 2022-05).
Tietoa avoimesta datasta | Digi- ja väestötietovirasto <https://www.avoindata.fi/fi/tietoa-avoimesta-datasta> (käyty 2022-05).
Tutkimusaineistojen säilytys tutkimuksen jälkeen Itä-Suomen yliopistossa. Itä-Suomen yliopiston avoimen tieteen työryhmän 29.5.2019 hyväksymä ohje |UEF Heimo, sisäinen verkko (edellyttää UEFin tunnuksia).
Säädökset
Arkistolaki (831/1994) |Finlex <https://www.finlex.fi/fi/laki/alkup/1994/19940831?search%5Btype%5D=pika&search%5Bpika%5D=arkistolaki#Lidm45237816660256> (käyty 2022-05).
Tiedonhallintalaki (906/2019) | Finlex <https://www.finlex.fi/fi/laki/alkup/2019/20190906#Pidm45237817325376> (käyty 2022-05).
Tutkimusaineistoa pitää säilyttää tutkimuksen jälkeenkin, mikä mahdollistaa tutkimustulosten arvioinnin ja luotettavuuden varmistamisen. Tutkimusaineistojen säilytystä tutkimuksen jälkeen suunnitellaan jo tutkimuksen alkuvaiheessa aineistonhallintasuunnitelmassa, mihin löydät ohjeita tämän UEF Datatuen verkkosivun ensimmäisessä osiossa Aineistonhallinnan suunnittelu ja tutkimuksen alku.
Suunnitteluvaiheessa ei välttämättä pysty vielä määrittelemään kovin tarkasti useamman vuoden päähän ajoittuvia ratkaisuja, sillä uusia tallennusratkaisuja, teknisiä vaatimuksia tai aineistoon itseensä kohdistuvia uusia asioita voi tulla eteen. Tämä ei kuitenkaan sulje pois aineiston tutkimuksenjälkeisten toimenpiteiden suunnittelun tärkeyttä, pikemminkin päinvastoin. Hyvällä suunnittelulla on helpompi kohdata mahdollisesti eteen tulevia ongelmia ja pitää tutkimusaineisto koko tutkimuksen ajan sellaisessa kunnossa, että se on mahdollisimman helppo siirtää vaikkapa datarepositorioon tai avata muille tutkijoille uudelleenkäytettäväksi.
Suunnittelun pohjalle on hyvä ottaa avuksi oman organisaation linjaukset. Itä-Suomen yliopiston datapolitiikassa (2015) tutkimuksenjälkeisiin aineistonhallinnan ratkaisuihin liittyvät erityisesti seuraavat toteamukset:
- tutkimusaineistot on tallennettava ja raportoitava siinä muodossa, että aineisto on tarvittaessa verifioitavissa.
- tutkimusaineistojen säilytysaika ja hävittäminen määritellään yliopiston arkistonmuodostussuunnitelmassa.
Käytännön toimenpiteisiin ohjeistaa puolestaan Itä-Suomen yliopiston ohje tutkimusaineistojen säilytykseen (2019), jossa todetaan, että tutkimuksen jälkeen tutkimusaineiston säilytykseen vaikuttavat esimerkiksi
- aineiston sisältö,
- tutkimussuostumukset tai -luvat,
- tutkittavien informointi,
- aineiston omistajuus,
- aineistoon liittyvät sopimukset,
- tutkimuksen todennettavuus ja toistettavuus,
- rahoittajien vaatimukset tai
- aineistoon liittyvän julkaisun kustantajan mahdolliset vaatimukset.
Muitakin säilytykseen vaikuttavia tekijöitä on, kuten kulttuuriperintöaineistoon liittyvät vaatimukset.
Perusaskeleet tutkimuksenjälkeiseen säilyttämiseen
- Ennen tutkimusta: Suunnittele tutkimusdatan lopputilannetta vähintään hahmotelma-asteella jo tutkimuksen alussa. Huomioi tekijöitä, jotka ohjaavat ratkaisuja ja joiden avulla perustelet säilytykseen liittyviä päätöksiä: lainsäädäntö, yleiset sekä yliopistosi linjaukset ja ohjeet, oman alasi käytännöt.
- Tutkimuksen aikana: Pidä tutkimusdatasi järjestyksessä ja dokumentoituna tutkimuksen ajan. Seuraile, mitä omalla tutkimusalallasi tapahtuu datan säilytysratkaisujen rintamalla.
- Tutkimuksen loppuessa: Päätä lopullisesti, mitä tuhoat ja mitä säilytät, miten kauan ja missä. Pidä mielessä päätöstä ohjaavat perustelut (ks. kohta 1). Tee tutkimusdatalle loppusiivous ja säilytä suunnitellusti. Muista antaa tutkimusdatallesi sille kuuluva arvo, eli ota talteen sille tai sen metadatalle kuuluva pysyvä tunniste ja käytä sitä ahkerasti. Pysyvistä tunnisteista voit lukea lisää UEFin Avoin julkaiseminen -sivustolta kohdasta Pysyvät tunnisteet (mm. DOI, ORCID).
Lisätietoa, lähteet ja linkit
Itä-Suomen yliopiston julkaisu- ja datapolitiikka (2015). Heimo-palvelut, vaatii kirjautumisen UEF-tunnuksilla.
Tutkimusaineistojen säilytys tutkimuksen jälkeen Itä-Suomen yliopistossa. Itä-Suomen yliopiston avoimen tieteen työryhmän 29.5.2019 hyväksymä ohje. Heimo-palvelut, vaatii kirjautumisen UEF-tunnuksilla.
Linkit tarkistettu 2023-05-24.
Tutkimuksen päätyttyä tutkimusdataa voidaan säilyttää suljetuissa ympäristöissä tai avata eriasteisesti muiden hyödynnettäviksi esimerkiksi avoimien datajulkaisuiden, datarepositorioiden tai -arkistojen kautta. Tutkimusdata suositellaan avaamaan tutkimuksen jälkeen jatkokäyttöön aina, kun se on mahdollista. Mikäli dataa ei voi avata, tulee tämä perustella aineistonhallintasuunnitelmassa. Tässäkin yhteydessä on hyvä pitää mielessä metadatan avaamisen mahdollisuus, vaikka itse tutkimusdataan kohdistuisikin avoimuutta rajoittavia juridisia tai eettisiä tekijöitä.
Miksi avata tai julkaista tutkimusdataa?
Tutkimusdatan avoin saatavuus mahdollistaa tutkimuksen todentamisen ja tutkimusdatan jatkohyödyntämisen. Tutkimusdatan jakaminen ja sen avoimen saatavuuden edistäminen voidaan lukea tutkijalle meriitiksi, mikä näkyy vaikkapa kansallisessa tutkijanarvioinnin hyvien käytäntöjen suosituksessa. Myös tutkimuksen rahoittajat (esim. Suomen Akatemia, EU-tutkimusrahoitus) ja tiedekustantajat edellyttävät yhä useammin tutkimusdatan saattamista avoimeksi. Kaiken taustalla on tutkimustuotosten uudelleenkäytön mahdollistaminen. Myös käyttämättä jääneiden tutkimusdatojen julkaisua suositellaan.
Tutkimusdatan avaaminen muiden käyttöön
- parantaa tutkimustuotosten laajamittaista hyödynnettävyyttä ja jatkokäyttöä,
- edistää tutkimusta ja mahdollistaa uusien havaintojen ja ilmiöiden löytämistä,
- edistää tutkimusyhteistyötä sekä
- tarjoaa tutkijoille tasavertaiset mahdollisuudet tutkimusdatan käyttöön.
Tutkimusdatan avoimuuden tavoitteita on kirjattu kansainvälisesti esimerkiksi UNESCOn avoimen tieteen suosituksissa ja EUn linjauksissa. Kansallinen tutkimusdatan avoimen saatavuuden linjaus 2021 tarjoaa tutkimusyhteisölle raamit datan avoimuuden toteuttamiseen, missä ilmaistuja tavoitteita on linjattu jo vuonna 2015 hyväksyttyyn Itä-Suomen yliopiston datapolitiikkaan. Sen mukaan julkisella rahoituksella tehdyn, julkaistuihin tutkimustuloksiin liittyvän tutkimusaineiston tulee lähtökohtaisesti olla avointa aina, kun se on tehtyjen sopimusten (omistajuus, käyttöoikeudet, immateriaalioikeudet ja salassapito), lainsäädännön ja tutkimuseettisten periaatteiden puitteissa mahdollista eikä vaaranna yliopiston etua.
Julkaiseminen ja avaaminen
Tutkimusdataa voidaan julkaista tutkimusjulkaisun yhteydessä, mitä monet julkaisijat jo edellyttävätkin. Tieteelliset lehdet saattavat pyytää selostusta tutkimusdatan saatavuudesta (ns. data availability/access statement). Selostuksessa kerrotaan tiiviisti mm. julkaisussa käytetyt datatyypit, mistä data löytyy (pysyvä tunniste, verkko-osoite), käyttöehdot tai rajoitukset. Lehdillä on tähän usein esimerkkejä tai ohjeita.
Tutkimusdataa voidaan julkaista myös kokonaan itsenäisenä julkaisuna. Tutkimusdataan erikoistuneita lehtiä kutsutaan datajournaleiksi (data journal) tai datalehdiksi. Datasettejä julkaistaan myös datarepositorioissa.
Jotta tutkimusdata olisi löydettävissä, viitattavissa ja hyödynnettävissä, siihen täytyy liittyä riittävän tarkkoja kuvailutietoja eli metadataa. Löydettävyyden mahdollistaa pysyvä tunniste eli PID (Persistent IDentifier), jonka avulla digitaalinen aineisto voidaan tunnistaa ja löytää, vaikka sen sijaintipaikka olisi muuttunut. Tällaisia tunnisteita ovat esimerkiksi DOI tai URN. Pysyvän tunnisteen saa esimerkiksi tutkimusdatan avaamiseen ja julkaisemiseen soveltuvista palveluista, joita on esitelty tällä sivulla (Datarepositorioita ja repositoriohakemistoja)..
Tutkimusdatan vertaisarviointi ei ole ainakaan vielä toistaiseksi yhtä jäsentynyttä kuin ns. perinteisen tutkimusjulkaisun vertaisarviointi. Vertaisarviointi pitää sisällään ajatuksen laadusta, ja sitä kautta datan arviointia voidaan jossain määrin toteuttaa datan kuratoinnin avulla. Kuratoinnilla eli hoivalla varmistetaan datan käytettävyys ja datan dokumentoinnin laatu. Kun valitsee tutkimusdatalle repositoriota, kannattaa kiinnittää siten huomiota myös siihen, lupaako kyseinen datarepositorio huolehtia datan kuratoinnista. Datan kuratointia voi pitää myös yhtenä datan laadun mittarina silloin, kun etsii jo olemassaolevaa dataa käytettäväksi omassa tutkimuksessa eli kuratoinnista huolehtiva datarepositorio on tehnyt jo ainakin jonkinlaisen laadunvarmennuksen datalle.
Tutkimusdatan avaaminen ei välttämättä tarkoita samaa kuin sen julkaiseminen. Julkaiseminen pitää sisällään ennen kaikkea viitattavuuden, mikä asettaa datan laadulle erityisiä vaatimuksia. Sen sijaan dataa voidaan periaatteessa avata vaikkapa tutkijan omalla kotisivulla, jolloin pysyvyys, löydettävyys ja käytettävyys eivät välttämättä toteudu.
Lisenssit ja avoin data
Tutkimusdatan tai lähdekoodin avaamisessa suositellaan lisenssejä, joiden avulla tutkija voi itse määritellä datansa tai lähdekoodinsa käyttöoikeuksia: mitä, miten ja kenelle niitä luovutetaan. Lisensointi määrittää teoksen tekijän ja käyttäjän oikeuksia ja parantaa osaltaan tutkimustuotosten uudelleenkäytön mahdollisuuksia. Lisensointi kertoo siten tutkimustuotoksen käyttäjälle, onko hänellä lupa esimerkiksi kopioida tai käyttää tuotosta uudelleen ja millä ehdoin.
Käyttöehdoista määrää tekijä tai se, kenelle hän on oikeudet siirtänyt. Juridiset tai eettiset esteet saattavat rajoittaa tutkimusdatan käyttöä ja julkaisemista siten, että tekijä ei voi omavaltaisesti määrätä sen käyttöehdoista. Tällaisia esteitä ovat mm. tietosuoja, liikesalaisuus tai muu salassa pidettävä tieto. Lisäksi on muistettava tekijänoikeuslaki ja hyvä tieteellinen käytäntö, jotka edellyttävät, että tekijä mainitaan hyvän tavan mukaisesti ja alkuperäistä lisensointia kunnioittaen. Jos siis omassa tutkimuksessa on hyödyntänyt jonkun muun julkaisemaa ja avaamaa tutkimusdataa, on huomioitava alkuperäisen tekijän lisenssiehdot. Lain ja tutkimusetiikan lisäksi on tärkeää huomioida rahoittajien ja tutkimusorganisaation ohjeistukset ja vaatimukset.
Jos tekijä lisensoi tutkimustuotoksiaan tietyille, nimetyille henkilöille, puhutaan käyttöoikeussopimuksista. Avoimen tieteen kontekstissa lisensoinnin tulisi kuitenkin koskea ketä tahansa, ja tällöin suositellaan yleistä lisenssiä. Tutkimusdatan ja sen metadatan kohdalla lisenssin voi määritellä esimerkiksi CC- eli Creative Commons -lisenssin avulla.
Creative Commons on suunniteltu suoraan tekijöille ja käyttöoikeuksien antaminen on tehty varsin helpoksi. CC-lisenssin käyttö on ilmaista, eikä siihen tarvita erillistä lupaa tai rekisteröitymistä. Creative Commonsin sivustolla on CC-lisenssivalitsin, joka ohjaa sopivan lisenssin valintaa. Lisenssin voi merkitä tekstinä, kuvakkeena, ääneen luettuna tai koneluettavassa muodossa. Avoimelle tutkimusdatalle suositellaan CC0-lisenssiä (tekijä luopuu kaikista oikeuksista) tai CC BY 4.0 -lisenssiä (tekijä on aina mainittava) ja metatiedoille CC0-lisenssiä. Vaikka CC0-lisenssi ei edellytä tekijän mainitsemista, tekijän ilmaiseminen kuuluu hyvään tieteelliseen käytäntöön. CC-lisenssi ei välttämättä sovellu kaikkiin tutkimustuotoksiin. Tietokoneohjelmille ja lähdekoodeille suositellaan usein esimerkiksi MIT-lisenssiä tai GPL-lisenssiä.
Lisätietoa, lähteet ja linkit
Euroopan parlamentin ja neuvoston direktiivi 2019/1024 avoimesta datasta ja julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä <https://eur-lex.europa.eu/legal-content/FI/TXT/?uri=celex%3A32019L1024> (käyty 2022-06).
Kuusniemi, M. E., & Nykyri, S. 2021. Tutkimusdata tieteellisenä julkaisuna. Informaatiotutkimus, 40(2), 57–71. <https://doi.org/10.23978/inf.109094>
Tutkijanarvioinnin hyvät käytännöt. Vastuullisen tutkijanarvioinnin kansallinen suositus 2020: Vastuullisen tutkijanarvioinnin työryhmä 2020. Tutkijanarvioinnin hyvät käytännöt. Vastuullisen tutkijanarvioinnin kansallinen suositus. Vastuullisen tieteen julkaisusarja 5:2020, Tiedonjulkistamisen neuvottelukunta ja Tieteellisten seurain valtuuskunta. <https://doi.org/10.2384/isbn.9789525995268>
Tutkimusdatan avoimen saatavuuden linjaus 2021: Avoimen tieteen koordinaatio, Tieteellisten seurain valtuuskunta 2021. (Toim. Nykyri, S., Päällysaho, S., Rosti, T. (pj.), Sunikka, A., Neuvonen, A., Kuusniemi, M E.) Tutkimusaineistojen ja -menetelmien avoimuus. Korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021–2025. Osalinjaus 1: Tutkimusdatan avoin saatavuus. Vastuullisen tieteen julkaisusarja 5:2021, Tiedonjulkistamisen neuvottelukunta ja Tieteellisten seurain valtuuskunta. <https://doi.org/10.23847/isbn.9789525995466>
UNESCO 2020. Preliminary report on the first draft of the Recommendation on Open Science. <https://unesdoc.unesco.org/ark:/48223/pf0000374409.locale=en.page=10> (käyty 2022-06).
Lisenssit
Creative Commons | Creative Commons Suomi (tietoa ja ohjeita CC-lisenssien valintaan, käyttöön ja merkitsemiseen). <https://creativecommons.fi/> (käyty 2022-06).
Creative Commons –lisenssivalitsin <https://creativecommons.org/choose/?lang=fi> (käyty 2022-06).
GPL – GNU General Public License | Open Source Initiative <https://opensource.org/licenses/gpl-license> (käyty 2022-06).
How to License Research Data | Digital Curation Centre - DCC (lisäohjeita tutkimusdata lisensointiin). <https://www.dcc.ac.uk/guidance/how-guides/license-research-data> (käyty 2022-06).
The MIT license | Open Source Initiative (tietoa tietokoneohjelmien ja koodin lisensointiin). <https://opensource.org/licenses/MIT> (käyty 2022-06).
Säilytysaika
Tutkimusaineistoa on säilytettävä jonkin aikaa tutkimuksen jälkeen, jotta tutkimustuloksia voidaan arvioida. Osa tutkimusaineistosta saattaa olla pysyvän säilyttämisen arvoisia joko lakisääteisesti tai muutoin.
Itä-Suomen yliopistolla yleisen ohjeen tarjoaa UEFin ohje tutkimusaineistojen säilytykseen (2019), jossa suositellaan tutkimusaineistoja säilytettävän ”vähintään viisi vuotta tutkimuksen päättymisen jälkeen” ellei esimerkiksi lainsäädäntö velvoita tätä pidempää säilytysaikaa. Lääketieteellisen ja terveystieteellisen tutkimusaineiston kohdalla tutkimusaineistojen säilytysaika on yleisimmin 15 vuotta tutkimuksen päättymisestä. Korvaamattoman arvokas, kansallinen kulttuuriperintöaineisto on säilytettävä pysyvästi. Kulttuuriperintöaineistoja ovat esimerkiksi historialliset valokuvat, kartat tai piirustukset myös digitoituina.
Säilytyspaikka
Tutkimuksen päätyttyä tutkimusdataa voidaan säilyttää suljetuissa ympäristöissä tai avata eriasteisesti muiden hyödynnettäviksi avoimien datarepositorioiden tai -arkistojen kautta. Mikä tahansa säilytysratkaisu onkin, tietoturvasta on huolehdittava.
Jos tutkimuksen jälkeen jatkat työtäsi Itä-Suomen yliopistolla, voit hyödyntää yliopiston tarjoamia tietoturvallisia säilytysratkaisuja, joista löytyy tietoa UEFin sisäisestä Heimo-verkosta ("Tiedostojen tallentaminen ja jakaminen"). Muussa tapauksessa on turvauduttava yksityisiin laitteisiin.
Määräajan säilytettävälle aineistolle voit myös valita jonkin koti- tai ulkomaisen datarepositorion, joissa on runsaasti valinnan varaa. Toisinaan datarepositorion valinta on helppoa, jos esimerkiksi tieteenalallasi on vakiintuneita käytäntöjä tai jos lehti, jossa julkaiset tutkimustuloksesi, suosittelee tietyn repositorion käyttöä. Kotimaisia datarepositorioita ovat esimerkiksi yhteiskuntatieteelliseen tutkimukseen erikoistunut Tietoarkisto, joka ottaa vastaan muidenkin tieteenalojen aineistoja, ja kieliaineistoihin erikoistunut Kielipankki.
Toisinaan sopivan repositorion valinta saattaa kuitenkin osoittautua työlääksi etenkin, jos omalla tieteenalallasi ei ole luontevia ja luotettavia datarepositoriosuosituksia. Tällöin voit hyödyntää ns. yleisiä repositorioita. Tällaisia ovat esimerkiksi Zenodo tai Dryad. Sopivaa repositoriota voit etsiä hakemistopalveluista (esim. re3data.org-portaali). Esittelemme lyhyesti tässä mainittuja ja muutamia muita repositorioita ja hakemistopalveluita alla kohdassa Datarepositorioita ja repositoriohakemistoja. Sieltä löytyvät myös linkit kyseisiin palveluihin.
Repositorion valintaan vaikuttavia seikkoja
- Repositorio tuottaa kansainvälisesti tunnustetun pysyvän tunnisteen (esim. DOI, URN).
- Tieteenalakohtaisuus (esim. osaaminen tieteenalalle tyypillisten dataformaattien osalta).
- Luotettavuus (esim. tietoturva, datan sijainti, kansainvälisesti tunnustetut sertifikaatit kuten CoreTrustSeal).
- Ylläpitävä taustaorganisaatio (kaupallisten toimijoiden ehtoihin on syytä kiinnittää huomiota).
- Pitkäaikaissäilytyksen tarve (kaikki datareposiotoriot eivät sovellu PAS-tarpeeseen).
- Datan hoivaaminen eli kuratointi (datarepositorio huolehtii sisällön ylläpitoon ja päivityksiin liittyvistä toimenpiteistä, joilla turvataan aineistojen eheys ja käytettävyys).
- Kustannukset.
Lisätietoa, lähteet ja linkit
Tiedostojen tallentaminen ja jakaminen. Heimo-palvelut, vaatii kirjautumisen UEF-tunnuksilla.
Linkit tarkistettu 2023-04-05.
UEF eRepo – UEF eRepositorio - on Itä-Suomen yliopiston avoimien aineistojen palvelu. Se sisältää yliopiston opinnäytetyöt, sarjajulkaisut ja rinnakkaistallennetut artikkelit sekä kokoaa yhteen tietoja Itä-Suomen yliopiston tutkijoiden tuottamasta tutkimusdatasta.
UEF eRepo ei ole data-arkisto tai datarepositorio eli UEF eRepossa ei ole tutkimusdataa vaan ainoastaan Itä-Suomen yliopiston tutkijoiden tutkimusdatojen metatietoa. Tutkija ei siis voi tallentaa omaa tutkimusdataansa UEF eRepoon. Tutkija ei myöskään syötä itse tutkimusdatansa metadataa UEF eRepoon. Sen sijaan tutkija valitsee oman tutkimusdatansa tallennukseen soveltuvan kansallisen tai kansainvälisen datapalvelun. Tiedot avatusta tutkimusdatasta siirtyvät automaattisesti eRepoon ns. haravannoin avulla.
Haravointi tarkoittaa metatiedon automaattista poimintaa sovelluksesta toiseen. Tällä hetkellä (2023) UEF eRepoon haravoidaan tutkimusaineistoja ja niiden metatietoja Etsin-hakupalvelusta sekä EUDATin palveluista, joiden kautta tavoitetaan lukuisia kansallisia ja kansainvälisiä datarepositorioita. Kansallisista mainittakoon Tietoarkisto, Kielipankki, Syke, IDA ja Fairdata PAS. Suoraan haravoitavia datarepositorioita ovat Zenodo ja Dryad.
Kansallisia palveluita
Tietoarkisto ja Aila-palveluportaali
- erityisesti yhteiskuntatieteellinen tutkimus, anonyymi data,
- kuratoitu, sertifioitu (CoreTrustSeal),
- DOI-tunniste,
- maksuton,
- data Suomessa,
- toimii Tampereen yliopiston yhteydessä ja on CESSDAn (Consortium of European Social Science Data Archives) suomalainen palveluntuottaja.
Kielipankki-palvelukokonaisuus
- teksti- ja puheaineistot,
- kuratoitu, sertifioitu (CoreTrustSeal),
- DOI-tunniste,
- maksuton peruskäyttö,
- data Suomessa,
- palvelusta vastaa kansallinen FIN-CLARIN-konsortio (taustalla suomalaiset yliopistot ja tutkimusorganisaatiot).
- tutkimusdatan säilytyspalvelu erityisesti tutkimuksen aikana (palvelua käyttävän projektin on oltava aktiivinen), mutta on käytettävissä myös datan julkaisemiseen,
- suomalaiset korkeakoulut ja valtion tutkimuslaitokset (hankkeissa voi olla mukana näiden ulkopuolisia tutkijoita),
- DOI-tunniste, jos IDAssa säilytettävä aineisto kuvaillaan Qvain-työkalulla,
- maksuton käyttäjille,
- data Suomessa,
- palvelun toimittaa CSC ja järjestää opetus- ja kulttuuriministeriö.
Fairdata.fi: Fairdata PAS-palvelu
- tutkimusdatan säilytyspalvelu pitkäaikaissäilytykseen,
- hyödyntämisestä kiinnostunut tutkija ottaa yhteyttä oman organisaation datatukeen (ks. alla Pitkäaikaissäilytys (PAS)-osio),
- palvelua voivat hyödyntää suomalaiset korkeakoulut ja valtion tutkimuslaitokset,
- palvelun toimittaa CSC ja järjestää opetus- ja kulttuuriministeriö.
Kansainvälisiä palveluita
- yleisrepositorio,
- ei kuratoitu,
- DOI-tunniste,
- maksuton,
- data Euroopassa,
- ylläpitäjä CERN, päärahoittaja mm. Euroopan komissio (OpenAIRE).
- palvelukokonaisuus mm. datan jakamiseen, tutkimuksenaikaiseen, säilyttämiseen ja arkistointiin,
- palveluita mm. B2SHARE, B2DROP, B2SAFE,
- yleisrepositorio (ei sovellu sensitiiviselle datalle),
- ei kuratoitu,
- DOI-tunniste,
- maksuton (säilytystilaraja),
- data Suomessa/Euroopassa,
- ylläpitäjä EUDAT CDI (eurooppalainen tutkimusorganisaatioiden verkosto, jota koordinoi suomalainen CSC), päärahoittaja mm. Euroopan komissio.
- tieteenalakohtainen: Earth & Environmental Science,
- kuratoitu, sertifioitu (CoreTrustSeal, World Data System, WMO Information System),
- DOI-tunniste,
- maksuton,
- tutkimusjulkaisut tukevat Pangaean käyttöä julkaisun datalle (esim. Geoscience Data Journal, ESSD jne.),
- saksalaisten tutkimuslaitosten ylläpitämä.
- yleisrepositorio,
- kuratoitu,
- DOI-tunniste,
- maksullinen,
- data Yhdysvalloissa,
- hallinnoiva taho Yhdysvaltoihin rekisteröity yleishyödyllinen yhteisö.
Hakemistopalveluita
- listaa avoimen datan repositorioita ja tietokantoja tieteenalakohtaisesti,
- on osa Open Access Directory (OAD) -wikiä.
- datarepositorioiden hakemistopalvelu,
- listaa maksuttomia ja avoimia tutkimusdatarepositoriota,
- yhteishanke, jossa mukana University of Nottingham ja Lund University; hallinnoiva taho Jisc (Joint Information Systems Committee, UK).
- datarepositorioiden hakemistopalvelu,
- erilaisia suodattamismahdollisuuksia,
- rahoittaja Deutsche Forschungsgemeinschaft (DFG, German Research Foundation).
Linkit tarkistettu 2023-04-05.
Pitkäaikaissäilyttämisellä viitataan digitaalisen tiedon säilyttämiseen pysyvästi, kymmenien tai jopa satojen vuosien ajan. Se edellyttää säilytyspalvelua tarjoavalta organisaatiolta kaikin puolin luotettavaa toimintaa, jatkuvuutta ja osaamista. Kansallisesti suomalaisia yliopistoja ja valtiollisia tutkimuslaitoksia palvelee CSC:n Fairdata PAS-palvelu.
Palvelun hyödyntämistä pohditaan ensin yhdessä tutkijan ja yliopiston eli käytännössä UEF Datatuen kanssa. Säilytysratkaisussa otetaan kantaa aineiston arvon määrittelyyn, minkä apuna voi olla seuraavia Fairdata PAS-palvelun mainitsemia näkökulmia:
- Aineiston jatkokäyttömahdollisuudet.
- Aineistontuottamiseen on käytetty paljon resursseja.
- Aineisto on syntynyt osana tutkimusta, jota olisi vaikeaa, kallista tai mahdotonta toistaa.
- Aineisto on muutoin kansallisesti tai organisaation kannalta merkittävä.
Jos aineisto todetaan soveltuvaksi pitkäaikaissäilytykseen, yliopisto on yhteydessä Fairdata PAS-palveluun ja aineistoa voidaan ryhtyä valmistelemaan pitkäaikaissäilytykseen sopivaksi.
Lisätietoa, lähteet ja linkit
Kansalliset pitkäaikaissäilytyspalvelut. Digitalpreservation.fi. Sivustolla on kansallisiin pitkäaikaissäilytyspalveluihin liittyviä uutisia, termien ja teknisten ratkaisuiden määrittelyjä ja muita ohjeita sekä julkaisuja.
Mitä pitkäaikaissäilytys on?. Fairdata PAS-palvelu (Fairdata.fi).
Linkit tarkistettu 2023-04-05.
Tutkimusaineiston hävittämisessä on huomioitava tietoturva, sillä työhuoneen tai tietokoneen roskakori ei sovi tai ole tarpeeksi kaikelle aineistolle. Pääsääntöisesti tutkimuksen perusaineistot pitää hävittää tietoturvallisesti. Erityisen tärkeä tämä on silloin, jos aineistossa on henkilö- tai arkaluonteista tietoa.
Paperiaineiston voi tuhota tietoturvallisesti silppurilla, polttamalla tai laittamalla paperit työpaikan tarjoamaan tietoturvasäiliöön.
Tiedostojen kohdalla pelkästään tiedoston poistaminen (deletointi) ja tietokoneen roskakorin tyhjentäminen ei tarkoita, että tiedosto olisi tuhoutunut lopullisesti. Poistettuja tietoja voi palauttaa jopa kiintolevyn uudelleen alustamisen jälkeen. Tiedon lopulliseen hävittämiseen on olemassa erilaisia ohjelmia, jotka perustuvat esimerkiksi tietojen päällekirjoittamiseen tai kiintolevyn magnetointiin. Tallennusväline voidaan myös murskata mekaanisesti lukukelvottomaksi eli esimerkiksi USB-tikulla oleva aineisto voidaan hävittää tuhoamalla koko tikku.
Jos olet epävarma tutkimusdatan turvallisen hävittämisen tavoista, kysy neuvoa UEFin Digipalveluista tai UEF Datatuesta. UEFin tietoturvaohjeissa käsitellään myös aineistojen hävittämistä. Ohjeistuksia ja yhteyshenkilöt löytyvät UEFin sisäisiltä Heimo-palveluista (vaatii kirjautumisen UEF-tunnuksilla).
Lisätietoa, lähteet ja linkit
Aineiston hävittäminen, anonymisointi tai arkistointi tutkimuksen päättyessä. Tietosuojavaltuutetun toimisto.
Tietoturvaohjeet. Heimo-palvelut, vatii kirjautumisen UEF-tunnuksilla.
Linkit tarkistettu 2023-04-05.