
Aineistonhallinnan sanasto
Jyväskylän yliopisto edellyttää aineistonhallintasuunnitelman tekemistä kaikkien yliopistossa tehtävässä tutkimuksessa syntyvien tutkimusaineistojen kohdalla. Aineistonhallintasuunnitelmasta käy ilmi aineiston keskeiset ominaisuudet, siihen liittyvien eettisten kysymysten, oikeuksien sekä velvoitteiden hallinta, aineiston suunniteltu elinkaari ja suunnitelma aineiston avaamisesta.
Tutkimusaineistojen hallintatavan ohjenuorana ovat ja niiden mukaiset tutkimusaineistot. FAIR-periaatteiden avulla varmistetaan aineiston löydettävyys, saavutettavuus, yhteentoimivuus ja uudelleenkäytettävyys. FAIR-periaatteet voivat toteutua monella eri tavalla. Jyväskylän yliopistossa tehdyssä tutkimuksessa pyritään mahdollisimman laajaan FAIR-periaatteiden toteutumiseen kunkin aineiston erityispiirteet ja rajoitteet huomioiden.
Yliopisto ja keskeiset rahoittajat edellyttävät, että aineistojen hallinta suunnitellaan ja toteutetaan niin, että ne voidaan sopivassa vaiheessa tehdä mahdollisimman avoimesti saataville uudelleenkäyttöä varten. Avoimuus on siis aina lähtökohtainen periaate, jos aineiston avaamiselle julkisesti saataville ei ole eettisiä tai juridisia esteitä kuten henkilötiedot, muu salassapidettävyys tai liikesalaisuus. Vastuullinen johtaja perustelee tarvittaessa syyn rajoitettuun pääsyyn aineistonhallintasuunnitelmassa ja aineiston julkaistavissa kuvailu- eli metatiedoissa. Avoin data ja FAIR data merkitsevät osin eri asioita, sillä aineisto voi olla pääsyoikeuksiltaan hyvin rajattua ja silti FAIRia. Jos aineistoa ei em. syistä ole mahdollista julkaista avoimesti, avoimuus voidaan varmistaa esimerkiksi arkistoimalla aineisto aineistoarkistoon, missä se voi olla saatavilla erillisestä pyynnöstä sopimuksella. Ks. myös Tutkimusaineistojen avaaminen.
Tutkimusaineiston käyttö- julkaisu- ja jakeluoikeudet kuuluvat pääsääntöisesti aineiston alkuperäisille tekijöille, jollei esimerkiksi hanke- tai yhteistyösopimuksessa sovita muuta. Kun aineiston tekijä on työsuhteessa yliopistoon tai tuottaa aineistoa ulkoisen rahoittajan (erit. Suomen Akatemia ja EU), tekijöiden kotiorganisaatio omistaa oikeudet aineistoihin. Tämä tekee helpoksi mm. aineiston siirtämisen organisaation haltuun ja julkaistavaksi tai arkistoitavaksi, kun tutkimus päättyy. Tutkimusaineistoja ei tämänhetkisen lainsäädännön tulkinnan mukaan voi varsinaisesti omistaa, vaan puhutaan oikeuksista ja niistä sopimisesta.
°Õ±ð°ì¾±Âáä²Ô´Ç¾±°ì±ð³Ü²õlainsäädäntö ei pääsääntöisesti koske tutkimusaineistoja. Poikkeuksen muodostavat valokuvat, piirrokset ja taiteelliset tuotokset, esimerkiksi fiktiiviset kirjoitukset ja päiväkirjat. Myös omaperäiselle tietokannalle voi syntyä eurooppalaisen tekijänoikeuslainsäädännön määrittelemä tietokantaoikeus.
Pseudonyymi aineisto on edelleen henkilötietoa. Anonyymi aineisto ei (enää) sisällä henkilötietoja, eikä tietosuojalainsäädäntö koske sitä. Ks. Minimointi, pseudonymisointi ja anonymisointi
Henkilötietoja sisältävän aineiston luovuttaminen tarkoittaa sopimuksenvaraista luovuttamista perustellista syystä toiseen tutkimustarkoitukseen siinä vaiheessa, kun alkuperäinen tutkimus on meneillään. Luovuttamisesta on Jyväskylän yliopiston tietosuojailmoituksen mallipohjassa valmis malliteksti. Luovuttaminen on aina määräaikaista, ja aineiston rekisterinpitäjä sekä aineiston vastaanottava osapuoli laativat siitä erilisen sopimuksen. Tarkemmat ohjeet: Tutkijan tietosuojaohjeet | Jyväskylän yliopisto (jyu.fi)
Kuvailutietoja ylläpidetään yliopiston . Kuvailutiedot julkaistaan aina, ellei pakottavasta lainsäädännöstä, viranomaismääräyksestä tai aineiston luovuttajan kanssa tehdystä sopimuksesta muuta johdu. Kuvailutietojen julkaiseminen on vähimmäisedellytys aineiston löydettävyyden (Findability) takaamiselle.
Peruskuvailutietojen lisäksi aineistoa on tarpeen kuvailla tarkemmin ja kuvata esimerkiksi sen muuttujia, metodologiaa ja käsittelyä. Tällaista aineiston sisällöllistä, kontekstuaalista ja rakenteellista kuvailutietoa eli dokumentaatiota ylläpidetään erillisissä tiedostoissa aineiston yhteydessä ja se linkitetään peruskuvailutietoihin Converikseen. Dokumentaatio viittaa myös dokumentoinnin prosessiin osana tutkimuksen työnkulkuja. Tarpeeksi kattava selittävä dokumentaatio on edellytys aineiston pitkäaikaiselle yhteentoimivuudelle ja käytettävyydelle.
README-tiedosto on tehokas tapa laatia aineiston dokumentaatiota eli sisällönkuvailua. README-tiedoston tarkoitus on toimia aineiston sisältöä ja rakennetta selittävänä oheisdokumenttina, jonka avulla aineistoa voi aidosti tulkita ja ymmärtää oikein vielä pitkän ajan kuluttua. Näin varmistetaan se, että aineisto ei muutu käyttökelvottomaksi ja ettei sitä tulkita ja käytetä väärin.
Aineiston avaaminen (engl. making research data available) tarkoittaa sitä, että tutkija saattaa aineiston soveltuvat, jatkokäyttökelpoisiksi arvioimansa osat saataville jatkokäyttöä eli uusia tutkimus- ja muita käyttötarkoituksia varten joko avoimesti tai rajoitetuin pääsyoikeuksin. Avoin saatavuus tarkoittaa, että aineisto on kenen tahansa ladattavissa verkossa laadukaassa aineistorepositoriossa. Avoimuus voi kuitenkin olla monin eri tavoin rajoitettua, jos aineistoa ei ole eettisistä tai juridisista syistä (esim. henkilötiedot) mahdollista julkaista avoimesti. Tällöin aineiston hallinta voidaan suunnitella niin, että tutkija tarjoaa aineistoa sopivassa tutkimuksen vaiheessa arkistoitavaksi aineistoarkistoon rajoitetuin, kontrolloiduin pääsyoikeuksin. Aineisto voi olla saatavissa esimerkiksi vain tutkimuskäyttöön ja/tai vain tutkimuskäyttöön, opetukseen ja opinnäytteisiin. Arkisto auttaa tutkijaa julkaisemaan aineiston metatietojen ohessa rajoitusperustetiedot ja luvitetun pääsyn ehdot.
Aineiston arkistointi tarkoittaa sitä, että tutkija tekee aineistolle arvonmäärityksen, jonka perusteella hän katsoo, että se on luonteensa ja sisältönsä puolesta tutkimuksellisesti, historiallisesti ja kulttuurisesti arkistointikelpoista. Sitten hän luovuttaa arkistoitavan aineiston valitsemalleen tutkimusaineistoarkistolle, joka luovutuksen jälkeen vastaa aineiston pitkäaikaissäilytyksestä, jakelusta ja kuratoinnista. Jos tutkija säilyttää aineistoa yliopiston tai henkilökohtaisissa tallennusjärjestelmissä kuten Nextcloudissa, verkkolevyillä tai ulkoisilla kovalevyillä, kyse ei arkistoinnista vaan säilytyksestä. Luotettuja aineistoarkistoja ovat esimerkiksi Jyävskylän yliopiston tuleva aineistoarkisto, Kielipankki, Suomalaisen kirjallisuuden seuran arkisto ja Tietoarkisto.
Aineisto on mahdollista ja suositeltavaa julkaista sopivassa tutkimuksen vaiheessa, jos se ei sisällä henkilötietoja tai muuta salassa pidettävää tietoa eli on anonyymiä ja muutoin ei-arkaluonteista. Tutkijalla tai tutkijoilla on myös oltava oikeudet aineiston julkaisemiseen. Tästä syystä julkaistavaksi soveltuu yleensä tutkijan itsensä tuottama aineisto. Julkaiseminen tarkoittaa sitä, että tutkija tarjoaa aineiston ja tarvittavat dokumentaatiomateriaalit valitsemalleen digitaaliselle aineistorepositoriolle, joka ottaa sen vastaan ja julkaisee sen avoimesti ladattavana verkossa. FAIR-periaatteet täyttävä repositorio varustaa aineiston kuvailutiedoilla ja antaa sille pysyvän tunnisteen (yleensä DOI). Tutkija myös valitsee julkaistavalle aineistolle soveltuvan avoimen lisenssin kuten Creative Commons 4.0 Nimeä-Kansainvälinen. Repositorio auttaa tarvittaessa lisenssin valinnassa.
Tutkimusaineistojen avoin julkaisupalvelu, joka tarjoaa työkalut aineistojen kuvailuun (metatiedot) ja FAIRiin julkaisemiseen pysyvällä tunnisteella (PID varustettuna). Esimerkiksi JYX on repositorio. Vrt. aineistoarkisto, joka toteuttaa arkistolainsäädännön mukaista tehtävää ja arkistoi tutkimusaineistot.
Kun aineisto julkaistaan verkossa avoimesti kaikkien saataville, aineiston tekijä valitsee sille soveltuvan käyttölisenssin. Lisenssin avulla aineistoa on mahdollista käyttää FAIR-periaatteiden mukaisesti uusiin tarkoituksiin, kun käyttäjä tietää yksiselitteisesti, mihin tarkoitukseen ja millä ehdoilla aineistoa on luvallista käyttää. Lisenssin on oltava ihmis- ja koneluettava, ja julkaisukanavana toimiva repositorio vastaa sen julkaisemisesta yhdessä aineiston kanssa. Avoimen tiedon keskuksen aineistoasiantuntijat auttavat tarvittaessa sopivan lisenssin valinnassa.
Tutkimusaineistoille tavallisia lisenssejä ovat Creative Commons 4.0 -lisenssiperheen lisenssit.
Koodi- ja ohjelmistojulkaisuille suositeltuja lisenssejä ovat GNU- ja MIT-lisenssit.