Aineistonhallintasuunnitelma - Aineiston yleiskuvaus

Millaisia aineistoja käytät ja tuotat tutkimuksessasi?

Tutkimusaineiston käsite on hyvin laaja. Tutustu sen ³¾Ã¤Ã¤°ù¾±³Ù±ð±ô³¾Ã¤Ã¤²Ô ennen kuin aloitat aineistonhallintasuunnitelman ensimmäisen osion työstämisen.

Aineistonhallintasuunnitelma (DMP) alkaa datan tunnistamisella ja kuvaamisella. Tärkeitä muuttujia tässä ovat aineiston alkuperä, erilaiset käyttöoikeudet, aineistotyypit, henkilötiedot, tiedostomuodot ja aineiston eri osien elinkaaren päätepisteet.

Aineisto tulee luokitella ja kuvata lyhyesti eri tyyppien mukaan: esim. uudelleenkäytettävä olemassa oleva aineisto, itse keräämäsi alkuperäisaineisto tai ns. raakadata, käsitelty analyysiaineisto, jota muodostat tutkimuksen edetessä. Voit käyttää taulukkoa tai luetteloa. On suositeltavaa nimetä kukin aineistotyyppi niin, että voit helposti viitata niihin myöhemmin DMP:ssä.

Esimerkki aineistokoosteesta

Aineistotyypi ³¢Ã¤³ó»å±ð Henkilötietoja? Erityisryhmien henkilötietoja? Muutoin salassa pidettäviä tietoja (esim. sensitiivinen lajitieto)? Tiedostoformaatti  Arvio kosta ja karttumasta Elinkaaren päätepiste ja tuleva saatavuus
Analysoitu DNA-näyte Tuotettu DNA-raakadatasta Ei .xlsx, .csv 2 Gb Julkaistaan avoimesti
Tilastoaineisto X Valmis aineisto Tietoarkistosta Ei SPSS (.por, .sav)   Henkilökohtainen kopoio hävitetän
Verkkokysely Kerätty tutkimukseen osallistujilta °­²â±ô±ôä, terveystietoja .csv, 5 Mt Arkistoidaan (rajoitettu saatavuus)
Haastattelutallenne (video) Kerätty tutkimukseen osallistujilta °­²â±ô±ôä .avi, .mp4   Tuhotaan litteroinnin jälkeen
Haastattelun litteraatti Koostettu alkuperäistallenteista Ei .csv, .txt, .xlsx >10 Mt Arkistoidaan (rajoitettu saatavuus)
Valokuvat Itse tuotettu havainnointiaineisto °­²â±ô±ôä .tif, .jpeg, .gif, .raw   Arkistoidaan relevanteilta osin (rajoitettu saatavuus), muutoin hävitetään tutkimuksen lopulla

Pienemmissä tutkimusprojekteissa tämän tyyppinen taulukko on kätevä. Suuremmissa projekteissa se tarjoaa hyvän perustan perusteellisemmalle aineistoinventaarille, joka mahdollistaa systemaattisen aineistonhallinnan koko tutkimusprojektin ajan.

[OHJEET TÄYDENTYVÄT ESIMERKILLÄ INVENTAARIOTAULUKOSTA SYKSYLLÄ 2024].

Aineiston yhtenäisyys ja laatu

Aineiston laadun ja yhdenmukaisuuden varmistaminen tarkoittaa käytännössä toimenpiteitä, joilla ehkäistään rakenteellisia ja sisällöllisiä virheitä, jotka voisivat heikentää aineiston luettavuutta, ymmärrettävyyttä ja käytettävyyttä. Vaikka tätä kysymystä kysytään kaikilta Suomen Akatemian tai Science Europen DMP-mallien käyttäjiltä, se ei ymmärrettävästi ole yhtä relevantti kaikille datatyypeille.

Kuvaa tarvittaessa aineistonhallintasuunnitelmassa menetelmät, joilla varmistat, että aineisto saadaan lähteestä kuten mittalaitteesta tai anturista ehjänä ja muuttumattomana, ja miten varmistat sen sisällön turmeltumattomuuden sen koko sen elinkaaren ajan, esimerkiksi tilanteessa, jossa aineisto konvertoidaan tiedostomuodosta toiseen. Laatuun liittyviä ongelmia voi syntyä teknisen käsittelyn virheistä kuten laitteiden kalibrointi, muunnettaessa sitä formaatista toiseen tai kun alkuperäisaineistoa ryhdytään jalostamaan muistiinpanoiksi ja tietokannoiksi. Jos esimerkiksi kenttämuistiinpanoja tehdään paperille, varmistetaan, että kaikki tieto siirtyy digitaaliseen muotoon kokonaisuudessaan.  

Esimerkkejä hyvistä käytännöistä:

Versiohallintaa käytetään aineiston hallinnassa alkaen yhteisistä nimeämis- ja dokumentointikäytännöistä ja joissakin tapauksissa Git-repojen käytöstä. Git-repojen käyttö mahdollistaa eri versioihin palaamisen.

Mittauslaitteet kalibroidaan aina tarkasti laboratorion työprotokollan mukaisesti.

Kun analogista dataa muunnetaan digitaaliseen muotoon, käytetään korkeinta mahdollista resoluutiota tarkkuuden säilyttämiseksi.