Kemian laitoksella vauhditetaan kiertotaloutta ja hillitään ilmastonmuutosta.

Mitä tutkimusaineisto on?

Tutkimusaineisto on laaja käsite ja se kattaa monia erilaisia aineistotyyppejä.

Hyvän ja onnistuneen aineistonhallinnan ytimessä on kyky tunnistaa omat tutkimusaineistosi ja niiden keskeiset ominaisuudet, jotta osaat suunnitella ja toteuttaa niiden hallinnan hyvän tieteellisen käytännön ja FAIR-periaatteiden mukaisesti.

²Ñää°ù¾±³Ù±ð±ô³¾Ã¤±ô±ô¾±²õ±ð²õ³Ù¾± tarkoitetaan tutkimuksen aikana tuotettuja ja/tai hyödynnettyä aineistoa, johon tutkimustulokset pohjautuvat. Laajasti ajateltuna kaikki tutkimuksen alkupisteen ja lopputulosten välissä oleva voidaan tulkita tutkimusaineistoksi. Samassa tutkimuksessa voidaan käsitellä tutkimusta varten kerättävää aineistoa (esimerkiksi numeerinen tieto, teksti, kuvat, AV-aineistot, ohjelmistot, algoritmit, mittaustulokset, näytteet), tutkimusprosessin tuloksena syntyvää aineistoa (esim. dokumentaatio, laboratorio- ja kenttätyöpäiväkirjat, analyysit, tietokannat), aiemmin kerättyä aineistoa (esim. Tilastokeskus, arkistot) ja vielä käsitellä sitä koodein, jotka tulee myös huomioida. Tutkimusdatasta puhutaan silloin, kun viitataan nimenomaan digitaaliseen tutkimusaineistoon.

Erityisen tärkeää on tunnistaa aineistoksi myös tutkimuksen aikana tuotetut tietokannat, koosteet ja vastaavat sekundääriaineistot ja johdetut aineistot. Näitä tulee hallinnoida samoin periaattein kuin alkuperäisaineistoa (primääriaineisto) ja itse asiassa usein niiden avaaminen ja julkaiseminen on sekä helpompaa että mielekkäämpää kuin primääridatan. Erityisesti tämä on syytä huomioida tutkimuksissa, jotka lähtökohtaisesti perustuvat aiemmin kerätyn aineiston hyödyntämiseen. 

Esimerkiksi historiantutkimuksessa alkuperäisaineistot ovat arkistoissa, jotka huolehtivat niiden säilyttämisestä ja jakelusta sekä mahdollisesti hallinnoivat niihin liittyviä oikeuksia. Sen sijaan näistä aineistoista kootut tietokannat, korpukset ja muu johdettu aineisto on tutkijan hallinnoitavissa ja tarvittaessa julkaistavissa.

Tutkimusaineiston koostuminen ja keskeiset ominaisuudet

Tutkimusaineisto voi koostua useista eri osista. Aineistonhallinnan kannalta on tärkeää tunnistaa sellaiset kokonaisuudet aineistosta, jotka jakavat samat keskeiset ominaisuudet, jotka vaikuttavat sen hallintaan. Aineiston jaottelu oikein ja osien käsittely erillään mahdollistaa toimenpiteiden kohdistamisen oikein, minimoi riskejä sekä mahdollistaa osan aineistosta avaamisen, jos suljettuna pysyvä osa on pidetty erillään. 

Keskeisiä aineiston ominaisuuksia ovat datan alkuperä (onko se esimerkiksi tuotettu, kerätty itse, saatu näyte, uudelleenkäytettävä aineisto, johdettu aineisto), tiedostomuoto ja -koko, datan käyttö- ja omistusoikeudet, sisältääkö data henkilötietoja tai muuta arkaluonteista tietoa sekä minkälainen datan suunniteltu elinkaari on (tuhotaanko, säilytetäänkö, arkistoidaanko vai avataanko aineisto). Nämä ominaisuudet voivat vaihdella samankin tutkimuksen sisällä aineistotyypistä toiseen.

Tutkimusaineiston koostumista pohdittaessa erityishuomio tulee kiinnittää toisiinsa linkittyviin kysymyksiin aineiston sisältämistä henkilötiedoista ja aineiston elinkaaresta. Ilman huolellista suunnittelua ja sen mukaisesti tehtyä informointia henkilötietoja sisältävät aineistot tulee tuhota tutkimuksen päätyttyä. Aineiston löydettävyys, saavutettavuus ja uudelleenkäytettävyys voidaan varmistaa vain etukäteen oikein tehdyllä informoinnilla, jossa aineiston elinkaaren päätepiste huomioidaan. 

Mikäli aineiston päätepisteenä on julkaisu tai arkistointi, kannattaa koostamista katsoa myös siltä kannalta, minkälaisiin osioihin palastelu ja aineiston kuvailu edesauttaa aineiston löydettävyyttä ja käytettävyyttä. Tästä enemmän aineiston avaamisen ohjeissa.