18.8.2023 Koneoppiminen tuo liikuntatieteiden alalle uusia mahdollisuuksia – mutta toisaalta myös haasteita (Jauhiainen)
Jyväskylän yliopiston informaatioteknologian tiedekunnan Digitaalisen terveysälyn laboratoriossa valmistuneessa väitöskirjassa tutkittiin ennustavan koneoppimisen potentiaalia liikuntatieteiden sovelluksissa, keskittyen erityisesti datan ja menetelmien oikeaoppiseen hyödyntämiseen. Tutkimuksissa muun muassa ennustettiin urheiluvammoja sekä tunnistettiin jalkapallolahjakkuuksia.
Tutkimuksessa onnistuttiin ennustamaan urheiluvammoja noin 65 prosentin kokonaistarkkuudella.
– Vaikka käytössä oli yhteistyökumppaneiden keräämiä suuria ja kattavia datamääriä ja tulokset olivat tilastollisesti merkitseviä, ennustusvoima jäi vielä liian matalaksi käytännön kliinisessä työssä hyödynnettäväksi, Jauhiainen kertoo.
Ennustusvoima viittaa koneoppimismallin kykyyn tehdä ennustuksia uudella, mallin aiemmin näkemättömällä datalla. Käytännössä tämä tarkoittaa sitä, että yksittäisen urheilijan vammoja ei voida vielä ennustaa sillä tarkkuudella, että sen pohjalta kannattaisi tehdä muutoksia esimerkiksi harjoitteluun. Suurimmat datat koostuivat kaikkiaan noin 800 urheilijalta kerätystä data-aineistosta.
Vaikka tulosten ennustusvoima jäi matalaksi, Jauhiainen pitää tuloksia kuitenkin hyödyllisinä, sillä ne auttavat tukijoita muun muassa keräämään tulevaisuudessa entistä relevantimpaa dataa.
Jalkapallolahjakkuuksien ennustamisen tulokset olivat puolestaan lupaavampia; 14-vuotiaana kerätyn testidatan perusteella tunnistettiin tulevaisuudessa ulkomaiseen akatemiaan pelaamaan päässeet pelaajat noin 80 prosentin kokonaistarkkuudella.
Koneoppimistutkimuksessa tehtävät virheet voivat johtaa vääriin johtopäätöksiin
Koneoppimismenetelmien käyttö mahdollistaa suurien datamäärien hyödyntämisen sekä useiden muuttujien ja niiden epälineaaristenkin yhteyksien huomioimisen. Menetelmien avulla ongelmia voidaan tutkia datalähtöisesti ja löytää uutta ja jopa yllättävääkin tietoa. Toisaalta niillä on myös helppo tuottaa sattumalta lupaavilta näyttäviä ennuste- ja luokittelumalleja ja menetelmien houkuttelevuus ja saatavuus yhdistettynä puutteelliseen ymmärrykseen johtaa helposti virheellisiin malleihin, tuloksiin ja johtopäätöksiin.
Tutkimuksessaan Jauhiainen tunnisti monia liikuntatieteiden alan koneoppimistutkimuksissa toistuvia virheitä. Ennustusvoimaa pitäisi aina testata täysin uudella datalla mutta esimerkiksi monissa urheiluvammatutkimuksissa oli selkeitä viitteitä testidatan informaation vuotamisesta mallin koulutusvaiheeseen. Seurauksena tulokset ovat yliarvioituja ja todellinen ennustusvoima jää epäselväksi.
– Liikuntatieteissä data on myös usein haastavaa ja määrältään rajallista, mikä lisää riskejä entisestään. Onkin kriittisen tärkeää, että tutkijat tuntevat koneoppimismenetelmien ja datan oikeaoppisen käytön ja ovat tietoisia näihin liittyvistä riskeistä. Koneoppimistutkimuksia onkin paras toteuttaa monitieteisessä yhteistyössä, Jauhiainen painottaa.
Väitöskirjassa esiteltiin yksityiskohtaisesti yleisimmät riskit ja kehitettiin lähestymistapa, jolla voidaan saavuttaa luotettavia, toistettavia ja vertailukelpoisia tuloksia.
Väitöskirjatyötä ovat rahoittaneet Jenny ja Antti Wihurin rahasto, Jyväskylän yliopiston informaatioteknologian tiedekunta, KAUTE-säätiö, Emil Aaltosen säätiö sekä Ella ja Georg Ehrnroothin säätiö.
FM Susanne Jauhiaisen laskennallisen tieteen väitöskirjan "Potential of Predictive Modeling Methods for Individual Response: Applications and Prediction Protocols for Sports Sciences" tarkastustilaisuus 18.8.2023 klo 12. Vastaväittäjinä toimivat professori Olavi Airaksinen (Itä-Suomen yliopisto) ja dosentti Tuomo Kauranne (Arbonaut Ltd.). Kustoksena toimii dosentti Sami Äyrämö (Jyväskylän yliopisto). Väitöstilaisuuden kieli on suomi.
Yleisö voi seurata väitöstilaisuutta salissa Agora Auditorio 3 tai verkkovälitteisesti. Linkki suoraan lähetykseen: