Pseudonymisointi on prosessi, jossa
- suorat tunnisteet ja
- tarvittaessa vahvat epäsuorat tunnisteet poistetaan analyysiaineistotiedostoista.
Vahvat epäsuorat tunnisteet ovat tietoja, joista yksittäisen henkilön voi todennäköisesti päättelemällä tunnistaa, vaikka tiedoissa ei olisi suoria tunnisteita (esimerkiksi harvinainen sairaus, asuinkunta ja ammattinimiketieto yhdistettyinä).
Esimerkiksi nimet voidaan korvata kooditunnisteilla (esim. [R01H02] tai peitenimillä [Mira]. Pseudonymisoinnin purkulistausta säilytetään erillään analyysitiedostoista niin kauan, kuin suoria tunnisteita on tarpeen säilyttää tutkimusta varten. Vaihtoehtoja erillään säilyttämiseen ovat seuraavat:
1. Purkulistatiedostoa voi säilyttää eri JYU-tallennussjärjestelmässä kuin itse analyysidataa, esimerkiksi CollabRoomissa tai verkkoasemalle luotavassa kansiossa, jos nalyysitiedostoja säilytetään esimerkiksi Nextcloudissa.
2. Listauksen voi myös kryptata Cryptomator-salausohjelmalla, jolloin sitä voi säilyttää myös samassa tallennusjärjestelmässä kuin analyysidatatedostoja. Ks. ohje ja Cryptomatorilla.
Pseudonymisointi tarkoittaa, että suorien tunnisteiden lisäksi analyysidatasta poistetaan tietosuojasuojatoimena ns. vahvat epäsuorat tunnisteet, jotka eivät suoraan mahdollista henkilön tunnistamista, mutta jotka yhdistettynä keskenään tai henkilöstä muualla julkisesti saatavilla olevaan tietoon johtavat todennäköisesti henkilön tunnistamiseen (esimerkiksi harvinainen ammatti, sukupuoli, asuinpaikkakunta ja virkaikä yhdessä). Vahvoja epäsuoria tunnisteita on tyypillisesti kyselyjen avovastauksissa ja kirjoituksissa sekä haastatteluvastauksissa.