
Tilastotiede ja datatiede ovat avaimia yhä monimutkaisemman maailman ymmärtämiseen
Tiedon – ja virheellisen tiedon – määrä kasvaa huimaa vauhtia. Myös tiedon kerääminen on helpompaa kuin koskaan aiemmin.
Päätöksenteossa ja yhteiskunnallisessa vaikuttamisessa tarvitaan entistä ajantasaisempaa tietoa. Siksi on kehitettävä suurten tietomassojen analysointimenetelmiä ja sovellettava niitä käytäntöön. Näin voidaan arvioida entistä tarkemmin tapahtumien todennäköisyyttä.
Kausaalimalleilla ennustetaan ilmiöitä ja tapahtumia
Kausaalisuus on tieteen keskeisimpiä käsitteitä. Kausaalisuhteet kuvastavat eri muuttujien välisiä syy-seuraussuhteita ja niiden avulla tehdään päätelmiä siitä, miten jokin tekijä (syy) vaikuttaa toiseen tekijään (seuraus).
Kausaalisuhteiden päätteleminen ei aina ole suoraviivaista.
Klassinen esimerkki näennäisestä kausaalisuudesta on jäätelökorrelaatio, jossa tarkastellaan viikoittaista aineistoa jäätelön syömisestä ja hukkumisten määristä.
Aineistosta huomataan, että kumpikin on runsasta kesällä, mutta tämä ei silti tarkoita, että niiden välillä olisi syy-seuraussuhde. Kummankin ilmiön takaa löytyy selittävänä tekijänä kesäpäivän kuumuus.
Myös ihmisiä tutkittaessa esimerkiksi ikä, koulutus ja tulotaso ovat tekijöitä, jotka selittävät monien asioiden välisiä yhteyksiä.
Melkein kaikilla tieteen aloilla tarvitaan tilastollista ajattelua ja päättelyä
Jyväskylän yliopiston tilastotieteen kausaalipäättelytutkimus on Suomessa alallaan johtavassa asemassa. Matematiikan ja tilastotieteen laitoksella tutkitaan, millaisissa tilanteissa jokin kiinnostava kausaalivaikutus voidaan selvittää käytettävissä olevien aineistojen avulla.
Menetelmät sopivat monelle tieteenalalle, kertoo tilastotieteen yliopistonlehtori Santtu Tikka Jyväskylän yliopistolta:
”Kehittämämme uudenlaiset menetelmät mahdollistavat kokeellisten ja havainnoivien aineistojen yhdistämisen ja ottavat huomioon puuttuvan tiedon ja valikoitumisen."
Menetelmiä voidaan hyödyntää melkein kaikilla tieteenaloilla kuten ympäristötieteissä, ekologiassa, terveystieteissä, sosiaalitieteissä, psykologiassa ja bioinformatiikassa.”
Tilastotieteen tutkijana Santtu Tikan tavoitteena on tehdä kausaalitutkimuksesta mahdollisimman yksinkertaista ja käytännöllistä. Hän on tutkinut muun muassa kausaalivaikutusten identifioituvuusalgoritmeja ja kuinka niitä olisi mahdollista parantaa niin käytettävyyden kuin tilastollisen arvioinnin näkökulmasta.

Tilastotieteilijä nauttii yhteistyöstä eri alojen asiantuntijoiden kanssa
Tikan tutkimusten tuloksena syntyneitä menetelmiä on saatavilla avoimen lähdekoodin ohjelmistoina.
”Tilastotieteessä minua kiehtovat sen loputtomat mahdollisuudet. Monet ilmiöt, kuten ilmastonmuutos, ovat sellaisia, ettei niitä voida tutkia kokeellisesti. Tällöin on turvauduttava havainnoiviin aineistoihin, mutta kausaalipäättelyn keinoin näissäkin tilanteissa on joskus mahdollista tehdä kausaalisia johtopäätöksiä”, Tikka sanoo.
Tikka on ollut mukana , jossa tutkitaan lakiuudistusten vaikutuksia esimerkiksi perheiden elämään. Hankkeessa on tutkittu muun muassa isien perhevapaiden käytön syitä ja seurauksia. Hankkeessa kehitettiin uusia tilastollisia malleja, jotka soveltuvat erityisesti kausaalipäättelyyn.
Parasta Tikan mielestä hänen työssään ovat datan pyörittely ja erilaisten ihmisten kanssa työskenteleminen.
On todella avartavaa ja mielenkiintoista pohtia tilastotieteen ongelmia eri alojen asiantuntijoiden kanssa."
"Kun lopulta löydetään yhteinen kieli ja tutkimuksen tilastollinen ongelma selkeytyy, pääsee datan kanssa eteenpäin ja lopulta saadaan vastaus tutkimuskysymykseen tilastotieteen keinoin”, kertoo Tikka.
Tikka on jo saanut palkintoja tutkimuksistaan. Suomen Tilastoseura myönsi Leo Törnqvist -palkinnon Tikalle vuosina 2015–2016 parhaasta tilastotieteen alan pro gradu -tutkielmasta. Suomen tilastoseura myönsi hänelle väitöskirjapalkinnon vuonna 2017–2020.
Tilastotieteen väitöskirjatutkija tuntee parantavansa maailmaa
Nyt Jyväskylän yliopistossa väitöskirjatyötään tekevä Otto Tabell oli maisteriopintoja tehdessään kesätöissä lääkeyritys Orionilla, missä hän tutki tietyn lääkkeen annostuksen vaikutusta kuolleisuuteen.
Kyseisestä aineistosta syntyi lopulta hänen pro gradu –tutkielmansa.
”Analysoin aineistoa kausaalipäättelyn keinoin ja loin kausaalimallin lääkeannostuksen vaikutukselle 90 päivän kuolleisuuteen. Luomani mallin avulla pystyttiin vastaamaan tiettyihin ongelmakohtiin, joita aiempien tutkimusten analyysien kohdalla havaittiin”, kertoo Otto Tabell.
Nyt Tabell tekee kausaaliaiheesta väitöskirjatyötään Finnish Doctoral Program Network in Artificial Intelligence (AI-DOC) – tohtorikoulutuspilotissa. Hänen yksi tutkimuskysymyksensä on, miten useita erilaisia datalähteitä voi ja tulisi yhdistellä kausaalivaikutusten selvittämiseksi, silloin kun muuttujia on ryvästetty.
”Jos kiinnostuksen kohteena on esimerkiksi suolan lisäämisen vaikutus verenpaineeseen, on kausaalivaikutuksen identifioimiseksi voitu yhdistää esimerkiksi kokeellista tutkimusdataa sekä rekisteriaineistoja. Vastaavasti kausaalipäättelyssä muuttujien ryvästämisellä tarkoitetaan sitä, että usean muuttujan joukkoa tarkastellaan yhtenä muuttujana. Edellä mainitussa suolaesimerkissä tällainen muuttujajoukko voi olla esimerkiksi tutkimukseen osallistuneilta henkilöiltä kerätyt taustamuuttujat”, kiteyttää Tabell.
Tilastotieteen tutkimisessa tarvitaan ennen kaikkea pitkäjänteisyyttä. Usein joudutaan tutkimaan erilaisia lähestymistapoja tulosten löytämiseksi.
Mahtavaa on myös se, että pääsee tekemään merkityksellistä työtä."
Esimerkiksi mallintamalla kuluttajien ostopäätöksiä tai hahmottamalla ympäristönmuutoksen taustatekijöitä, voidaan luoda uudenlaisia suosituksia ja parantaa maailmaa", iloitsee Tabell.

Tilastotieteen ja datatieteen aloilta diplomi-insinööriksi Jyväskylässä
Tilastotiedettä ja datatiedettä voi opiskella Jyväskylän yliopistossa valmistuen luonnontieteiden kandidaatiksi ja filosofian maisteriksi.
Ensi vuonna eli vuonna 2026 Jyväskylän yliopistossa alkaa uusi tilastotieteen ja datatieteen diplomi-insinöörikoulutus.
Uusi diplomi-insinöörikoulutus vastaa osaajapulan tarpeisiin, ja siihen ammennetaan sisältöä Jyväskylän yliopiston tilastotieteen osaamisen vahvuuksista.
”Jyväskylässä tilastotieteen ja datatieteen koulutus perustuvat tilastotieteen vahvuuksiin ja yhteistyöhön informaatioteknologian tiedekunnan kanssa. DI-koulutuksessa tulee korostumaan todennäköisyyspohjainen päättely, tekoäly ja suurten datamassojen analytiikka. Koulutuksessa on otettu huomioon paremmin, millaista osaamisen tarvetta yrityksissä on, kertoo tilastotieteen professori Juha Karvanen Jyväskylän yliopistolta.
Alalla erinomaiset uranäkymät
Tilastotieteen ja datatieteen aloilla onkin luvassa varma työllistyminen, sillä aineistoja on koko ajan enemmän ja niiden käsittely vaatii tilastotieteilijöitä. Opiskelijat saavat helposti alansa kesätöitä, mikä usein syventyy valmistumisen jälkeen työpaikaksi. ۳ٱٲö erilaisten yritysten ja organisaatioiden kanssa on alalla arkipäivää.
Teemme paljon pro gradu –tutkielmia ja tutkimusyhteistyötä erilaisten yritysten ja organisaatioiden kanssa. Opiskelijat saavat jalan työelämän oven väliin jo opiskeluaikana”, sanoo Juha Karvanen.
Matematiikan ja tilastotieteen laitos myös tukee opiskelijoiden työharjoittelua myöntämällä heille harjoittelutukea.