Tekoäly tiedonhankinnassa

äܱٳٱ

Tekoäly on sateenvarjokäsite, joka viittaa inhimillistä älykkyyttä vaativia tehtäviä suorittavien mallien, järjestelmien ja (tieto-)koneiden teoriaan, kehittämiseen ja tutkimukseen. Tällä sivulla käsitettä käytetään sellaisista sovelluksista, jotka hyödyntävät tekoälyteknologioita avustaakseen tiedon hakemisessa ja tiedon tuottamisessa. 

Tekoälysovelluksilla on omat käyttötarkoituksensa: osa on kehitetty hyvinkin kapean tehtävän suorittamiseen, osa taas on yleiskäyttöisiä. Tekoälyn lukutaitoon kuuluu se, että osaa valita oikean työkalun oikeaan käyttötarkoitukseen, mutta myös se, että testaa ja kriittisesti arvioi eri työkalujen suoriutumista erilaisista tehtävistä.

Linkit työkalujen esittelyihin ja käyttövinkkeihin löydät seuraavasta tekstiosiosta.

Kaikki tällä sivustolla esitellyt sovellukset hyödyntävät jossain määrin suuria kielimalleja (LLM) ja ovat ainakin osittain generatiivisia. Generatiivinen tekoäly viittaa tekoälymalliin, joka voi luoda uutta sisältöä, kuten tekstiä, kuvia, ääntä tai koodia, perustuen koulutus- tai kehotedataan.

Generatiivisiin tekoälymalleihin – kuten myös tekoälyyn laajemmin – liittyy tutkimuseettisiä, laillisia ja moraalisia kysymyksiä, joista jokaisen käyttäjän on hyvä olla tietoinen. Useimmissa tapauksissa käyttäjä on viime kädessä itse vastuussa tekoälytyökalujen eettisestä ja lainmukaisesta hyödyntämisestä. Näistä kysymyksistä löydät lisää tietoa tämän sivun alaosasta.

Huomaathan, että tekoälyyn liittyvä tieto vanhenee nopeasti. Sovellusten käyttöliittymät päivittyvät sekä tekoälyä säätelevä lainsäädäntö ja lain tulkinnat muovautuvat. Vaikka näitä sivuja päivitetään säännöllisesti, niin varmista ajantasainen tieto aina myös itse!

ձäDZܰ

Sovellusten käyttötarkoitukset

Tiedonhankinnan näkökulmasta hyödylliset sovellukset voidaan jakaa kolmeen kategoriaan käyttötarkoituksen mukaan:

  • Tieteellisten lähteiden hakeminen – tietokantoihin integroidut tai viitetietokantoihin liitetyt tekoälyä hyödyntävät hakukoneet.
  • Ajantasaisen tiedon hakeminen verkosta – tekoälyn ja hakukoneen yhdistelmät.
  • Tutkimuksen ja tiedonhaun ideoiminen – chatbot-sovellukset.

Ohjeet ja linjaukset

JYU:n opiskelijoiden, tutkijoiden ja henkilökunnan tulee hyödyntää tekoälysovelluksia Jyväskylän yliopiston linjausten ja politiikan mukaisesti.

Tutkimuseettiset periaatteet

Tutkimusetiikan kannalta erityisesti generatiivisten tekoälymallien haasteena ovat:

  • "Mustan laatikon" ongelma – etenkin syväoppimista hyödyntävien tekoälyjärjestelmien päätöksentekoprosessit ovat usein läpinäkymättömiä. Tällöin käyttäjän on vaikea kattavasti ymmärtää ja selittää, miten esimerkiksi generatiivinen chatbotti päätyy tiettyyn lopputulokseen.
  • Toistettavuus – yksi tieteellisen tutkimuksen tavoitteista on toistettavuus, eli pyrkimys siihen, että tutkimusasetelma voidaan toistaa ja tutkimustulokset varmentaa. Luoviin tehtäviin suunnitellut generatiiviset tekoälymallit sisältävät kuitenkin satunnaisuutta toiminnassaan. Vaikka syöte olisi sama, lopputulos voi vaihdella joka kerta, kun malli suoritetaan.
  • Koulutusdata – tekoälymallin kouluttamiseen käytetty data saattaa olla heikkolaatuista, sisältää vääristymiä, misinformaatiota, disinformaatiota ja haitallisia stereotypioita. Generatiivinen chatbotti saattaa plagioida koulutusdataa joko suoraan tai alkuperäistä tekstiä hieman muokaten. Toisaalta myös käyttäjien itsensä syöttämä data päätyy mallien koulutusaineistoon, ellei tätä erikseen kiellä.

Tutkimuseettisen neuvottelukunnan (TENK) korostetaan eettisesti kestäviä tiedonhankinta-, tutkimus- ja analyysimenetelmiä. Tekoälysovellusten eettistä kestävyyttä voi yksittäisen käyttäjän kuitenkin olla vaikea arvioida, sillä kestävyyteen liittyvät esimerkiksi sellaiset kysymykset kuin: Millaisissa työoloissa mallien käyttämä koulutusdata on siistitty ja annotoitu? Millaisia ympäristö-, taloudellisia ja yhteiskunnallisia vaikutuksia taustalla olevan tekoälymallin kouluttamisella ja käytöllä voi olla?

Dokumentoi ja raportoi

  • ä辱äⱹ: Kun tekoälyä hyödynnetään tieteellisessä toiminnassa, sekä ohjelmistojen kehittäjien että käyttäjien tulisi pyrkiä mahdollisimman suureen läpinäkyvyyteen ja avoimuuteen. Kehittäjien tulisi avata kuinka ohjelmisto toimii ja millaisella datalla se on koulutettu. Käyttäjien puolestaan tulisi avata tekoälyn roolia tutkimusprosessissa sekä kerrottava yksityiskohtaisesti millaisia työkaluja ja miten tutkimuksessa on hyödynnetty.

Kun hyödynnät tekoälysovelluksia opinnoissa tai tieteellisessä toiminnassa, dokumentoi käyttö huolellisesti. Dokumentointi on edellytys sille, että pystyt raportoimaan tekoälyn hyödyntämisen totuudenmukaisesti sekä hyvän tieteellisen käytännön mukaisesti.

Tieteessä läpinäkyvyyden vaatimus läpäisee kaiken toiminnan. Tieteellisiä julkaisuja suunnitellessa on hyvä perehtyä myös tulevan julkaisukanavan linjauksiin tekoälysovellusten hyödyntämisestä ja raportoinnista.

Jyväskylän yliopiston linjausten mukaan opiskelijoiden on raportoitava generatiivisten tekoälysovellusten hyödyntäminen oppimistehtävien ja opinnäytetöiden tekemisessä. Jos opintojaksollasi on sallittua hyödyntää tekoälyä, mutta ei erillistä raportointiohjetta, voit käyttää alta löytyvää mallipohjaa raportoimiseen.

Tekoäly, henkilötiedot ja tietosuoja – ohjeistus perustutkinto-opiskelijoille ja väitöskirjatutkijoille

 ovat kaikki tiedot, jotka liittyvät tunnistettuun tai tunnistettavissa olevaan henkilöön. Tietosuoja puolestaan liittyy henkilötietojen suojaamiseen ja käsittelyn sääntelemiseen.

Jos aineiston rekisterinpitäjä on Jyväskylän yliopisto tai aineistoa käsitellään työsuhteessa yliopistoon:

Tarkasta yliopiston ohjeista missä (tekoäly)sovelluksissa voi käsitellä henkilötietoa. Älä syötä sovellukseen mitään henkilötietoja sisältävää aineistoa, ellei sovellusta ole erityisesti luotu käsittelemään henkilötietoja tietosuojalainsäädännön vaatimusten mukaisesti ja ellei sitä tarjota Jyväskylän yliopiston kautta ja yliopiston tunnuksilla käytettäväksi.

 

Jos olet itsenäinen rekisterinpitäjä etkä ole työsuhteessa yliopistoon:

Tarkasta, onko yliopistolla tarjolla opiskelijoille soveltuvaa, keskitetysti hankittua tekoälytyökalua.

Ennen kuin käytät tekoälyä hyödyntävää sovellusta, hanki perustiedot sovelluksen suorittamasta henkilötietojen käsittelystä: 

  • Mitä henkilötietoja sovellus kerää käyttäjistään (eli sinusta)? 
  • Asettaako sovelluksen tarjoaja käyttöehdoissaan rajoituksia henkilötietojen käsittelylle sovelluksessa (tähän sovellukseen saa/ei saa syöttää henkilötietoja)?
  • Noudattaako sovellus Euroopan Unionin yleistä tietosuoja-asetusta (GDPR)? Missä sovelluksen käyttäjän tai sovellukseen syötettävien henkilötietojen käsittely tapahtuu?
  • Jäävätkö sovellukseen syötetyt henkilötiedot palveluntarjoajan käyttöön pysyvästi? Jos jäävät, älä käytä sovellusta!

 

Arvioi sovellukseen syötettävä aineisto:

  • Oletko saanut aineiston tai sen osan luovutuksena jostain muualta? Kohdistuuko aineiston käyttöön sopimuksellisia rajoituksia?
  • Onko sinun mahdollista anonymisoida aineisto ennen tekoälyn käyttöä tai minimoida sovellukseen syötettäviä henkilötietoja?
  • Onko sovelluksen käyttäminen henkilötietojen käsittelyssä linjassa sen kanssa, mitä olet rekisteröidyille henkilötietoja kerätessä kertonut (Esim. onko sovelluksen tarjoaja mainittu henkilötietojen käsittelijänä tutkimuksessasi vai ei, johtaako sovelluksen käyttö henkilötietojen siirtoon EU:n ulkopuolelle, vaikka olet kertonut tutkittaville käsittelyn tapahtuvat EU:n sisäpuolella)

     

Älä toimi tutkittaville tai muille rekisteröidyille antamiesi tietojen vastaisesti!

Tekoäly ja tekijänoikeudet – ohjeistus perustutkinto-opiskelijoille ja väitöskirjatutkijoille

Perusteita

 tarkoittaa tekijän lähtökohtaista yksinoikeutta päättää teoksensa käytöstä – tietyin rajoituksin. Voimassa oleva tekijänoikeuslaki ei nimenomaisesti mainitse tekoälyä. Siksi voimassa olevaa lakia joudutaan tulkitsemaan ja soveltamaan uuteen tilanteeseen. Tekijänoikeudellisia kysymyksiä liittyy niin tekoälyn kouluttamiseen (oikeus käyttää teoksia koulutusdatana) kuin tekijänoikeudella suojatun materiaalin syöttämiseen tekoälyn käsiteltäväksi. Oman mausteensa keskusteluun tuo se, että tekijänoikeuslainsäädäntö eroaa jonkun verran Yhdysvaltojen ja Euroopan/Suomen välillä. Yhdysvaltojen tekijänoikeuslainsäädännössä tunnetaan ns. fair use -periaate, jonka on väitetty oikeuttavan tekoälyn kouluttamiseen internetistä avoimesti löytyvällä, mutta tekijänoikeuden suojaamalla materiaalilla. 

astui voimaan 1.8.2024 ja sitä aletaan soveltaa pääosin 2.8.2026. Tekoälysäädöstä sovelletaan tekijänoikeuslainsäädännön lisäksi.  Tekoälysäädöksen sisältämät määritelmät ja viittaukset olemassa olevaan tekijänoikeuslainsäädäntöön helpottavat tekoälyn tekijänoikeudellisten kysymysten arviointia ja huomioimista tekoälyä hyödynnettäessä. Tekoälysäädöksessä keskeisenä sääntelykohteena on tekoälyjärjestelmä, jollaa tarkoitetaan ”konepohjaista järjestelmää, joka on suunniteltu toimimaan käyttöönoton jälkeen vaihtelevilla autonomian tasoilla ja jossa voi ilmetä mukautuvuutta käyttöönoton jälkeen ja joka päättelee vastaanottamastaan syötteestä eksplisiittisiä tai implisiittisiä tavoitteita varten, miten tuottaa tuotoksia, kuten ennusteita, sisältöä, suosituksia tai päätöksiä, jotka voivat vaikuttaa fyysisiin tai virtuaalisiin ympäristöihin”.

 

Pysyvien kappaleiden valmistaminen

Mikäli tekoälyjärjestelmään syötetty materiaali jää tekoälyjärjestelmän käytettäväksi, on varmuudella kyse tekijänoikeuden haltijan lupaa edellyttävästä kopioinnista. Kyse voi olla myös yleisön saataville saattamisesta, mikäli tekoälyjärjestelmä myöhemmin toisintaa syötettyä teosta antamissaan vastauksissa tekijänoikeudellisesti merkityksellisen mittaisina katkelmina tai liian samankaltaisina muunnelmina. Tätä myöhempää käyttöä tekoälyjärjestelmän perusasiakkaan on kuitenkin vaikeampi arvioida. Tarkasta miten tekoälyjärjestelmä toimii ja kytke kappaleiden tallentaminen ja syötetyn materiaalin hyödyntäminen koulutuskäyttöön tarvittaessa pois päältä.

Peukalosääntö: hanki tekijänoikeuden haltijan lupa, mikäli tekoälyjärjestelmän tarjoaja tallentaa kappaleen siihen syöttämästäsi materiaalista omaa käyttöään varten.

Tilapäinen kappaleiden valmistaminen

Tekijänoikeudellisesti tilanne on tulkinnanvaraisempi, mikäli tekoälysovellus tallentaa vain tilapäisiä kappaleita syöttämästäsi materiaalista. Tällöin voi olla kysymys tekijänoikeuslain 11 §:n sallimasta tilapäisestä kopioinnista osana teknistä prosessia. Yksityisessä käytössä (johon opiskelukäyttö lukeutuu) on mahdollista vedota myös 12 §:n sallimaan teosten kappaleiden valmistamiseen yksityiseen käyttöön, mikäli kyse on julkistetusta teoksesta. Kappaleita ei kuitenkaan saa valmistaa yksityiseen käyttöön jos teos on tietokoneohjelma tai tietokanta. Oikeuskäytäntöä tästä ns. syöttödatasta ei vielä ole. Oikeudenhaltijat tai niitä edustavat järjestöt suhtautuvat tekoälyn käyttöön vähemmän sallivasti.  Esimerkiksi  ”Kun tekijänoikeudella suojattua sisältöä syötetään tekoälyohjelmaan, on kyse sellaisesta kopioinnista tai kappaleen valmistamisesta, johon tarvitaan tekijän tai kustantajan lupa." Tätä näkemystä voi selittää pelko tekoälyllä valmistettujen muunnelmien ammattikäytöstä ja oletus tekijänoikeudella suojatun sisällön jäämisestä tekoälyn kehittäjälle. 

Tekoälyn käyttäjän kannalta tilanne on ikävä. On tiedossa, että tekoälyn koulutuksessa on käytetty massoittain tekijänoikeuden suojaamaan materiaalia (tosin koulutuskäyttöä koskevat oikeustapaukset ovat vielä ratkaisematta). Samaan aikaan oikeudenhaltijat pyrkivät rajoittamaan tekijänoikeusperusteilla sellaista tekoälyn käyttöä, jossa tekoälyn tuottavuutta lisäävät ominaisuudet tulisivat esiin. Tiukasti tulkittuna kappaleen valmistamisrajoitus estäisi esimerkiksi tiivistelmän teettämisen tieteellisestä artikkelista tekoälyn avulla, ellei tekijänoikeuden lupaa ole hankittu. Käytännössä tiivistelmän teettäminen tai kysymyksien kysyminen sisällöstä on kuitenkin ensimmäinen toimenpide, mitä tekoälysovellukset ehdottavat ja mihin ne on suunniteltu. Opiskelutarkoituksiin soveltuva käytännönläheinen tulkinta on, että tekijänoikeuden haltijan lupaa edellyttävä kappaleen valmistaminen tapahtuu vasta sitten, kun kappale jää muutoin kuin tilapäisesti tekoälypalvelun tarjoajan haltuun. 

 

ձ쾱äԴǾܲlain sallima tekstin- ja tiedonlouhinta

ձ쾱äԴǾܲlain 13 b § mahdollistaa teoksen kappaleiden valmistamisen ja säilyttämisen tekstin- ja tiedonlouhintaa varten. Louhintaa voi suorittaa, elleivät tekijät ole pidättäneet tätä oikeutta. Mikäli tiedonlouhinta tapahtuu tieteellistä tutkimusta varten tutkimus- tai kulttuuriperintölaitoksessa, eivät oikeudenhaltijat voi kieltää louhintaa. Tiedonlouhinnan edellytyksenä on laillinen pääsy teokseen. Tämä voi tarkoittaa myös maksumuurin takana oleva sisältöä, kunhan pääsyoikeus on asianmukaisesti hankittu.

Tiedonlouhintaa koskevalla poikkeuksella voi perustella myös kappaleiden valmistamisen tekoälyllä analysointia varten. Vaikka voit käyttää tekoälysovellusta tekstinlouhintaan, et voi myöntää tekoälysovellukselle oikeuksia säilyttää tekoälylle syötettyjä teoksia tai käyttää niitä tekoälyn kouluttamiseen.

EU:n tekijänoikeus- ja lähioikeusdirektiivissä (Ns. DSM-direktiivi, EU) 2019/790) on määritelty, että tekstin- ja tiedonlouhintapoikkeuksen soveltamisalaan kuuluvat tutkimusorganisaatioiden lisäksi myös niihin yhteydessä olevat henkilöt. Tästä johtuen tiedonlouhintapoikkeuksesta hyötyvät muutkin kuin työsuhteessa olevat yliopistoyhteisön jäsenet eli opiskelijat, emeritukset/emeritat ja apurahatutkijat. Tutkimusta on kuitenkin suoritettava JYU-affilioituneena ja sen on täytettävä tieteellisen tutkimuksen kriteerit. 

Tekoälyn tuottamien tulosten hyödyntäminen

Pääsääntö on, että tekoälyn tuotoksilla ei ole tekijänoikeutta. Niiden ei katsota olevan omaperäisiä. Omaperäiseksi katsotaan vain teos, joka heijastaa luonnollisen henkilön persoonallisuutta, jota hän on voinut ilmentää tekemillään vapailla, luovilla valinnoilla.  Ei ole kuitenkaan täysin poissuljettua, etteikö joku onnistuisi myöhemmin kehittämään tekijän vapaita luovia valintoja ilmentävän tavan käyttää tekoälyä, jolloin tekijänoikeus muodostuisi tekoälyn käyttäjälle. Kynnys tässä on kuitenkin hyvin korkealla. 

Toinen usein esiin nouseva kysymys on se, voivatko tekoälyn luomat tuotokset loukata olemassa olevien teosten tekijänoikeuksia. Loukkaus voisi tapahtua, jos tekoäly tuottaa olemassa olevan teoksen muunnelman tai jopa suoran kopion. Jos käyttäjä pyytää suppealla sanallisella ohjeistuksella tekoälyä luomaan esimerkiksi kirjallisen tai kuvateoksen, on käyttäjän hyvin vaikea arvioida tekijänoikeusloukkausten mahdollisuutta (lukuun ottamatta yleisesti tunnettuja tai tekoälyn käyttäjän henkilökohtaisesti tuntemia teoksia). Eräänlainen rajatapaus on tietyn artistin tunnistettavan tyylin jäljittely. Tämän tyyppisellä käytöllä on tunnistettu olevan haitallisia vaikutuksia sisällöntuottajiin. Ainakin  onkin suunniteltu hylkäämään käyttäjien pyynnöt imitoida jonkun elävän artistin tyyliä. On tietysti myös tekoälypalvelujen tarjoajin intresseissä, että käyttäjät uskaltavat käyttää palvelua eikä käytöstä seuraa tekijänoikeuden loukkausvaatimuksia.  tekijänoikeusloukkausvaatimuksista, joita sen Copilot-tekoälyn (ohjeiden mukaisesta) käytöstä aiheutuu. 

Käyttäjä pystyy parhaiten arvioimaan tekijänoikeusloukkausten mahdollisuutta itse syöttämänsä materiaalin suhteen. Materiaalia tekoälylle syöttäessään ja tekoälyä käskyttäessään käyttäjän on siis syytä huolehtia, ettei hän pyydä tekoälyä laatimaan ja myöhemmin käytä sellaista teosta, joka tulkittaisiin tekoälysovellukseen syötetyn, tekijänoikeuden suojaaman teoksen muunnelmaksi. Teoksen muunteleminen ja saattaminen yleisön saataville nimittäin edellyttää tekijänoikeuden haltijan suostumusta. Tekoälyn käyttäminen esimerkiksi teoksen osien poistamiseen, lisäämiseen tai tyylin muuttaminen ovat muunnelmia. Esimerkkejä tällaisesta käytöstä voisivat olla vaikka pyynnöt ”suurenna tämän kuvan merenneidon pyrstöä 30 %” tai ”lisää tähän artikkeliin Yhdysvaltojen fair use -doktriinia koskeva osuus ja vertaile sitä Suomen tekijänoikeuslainsäädäntöön”.  Tekijän yksinoikeuden piirissä on päättää myös teoksen kääntämisestä toiselle kielelle.  Näistä rajoituksista poiketen tekijänoikeuslaki kuitenkin mahdollistaa julkistetun teoksen käytön parodiassa, karikatyyrissä tai pastississa. 

Yhteenveto tekijänoikeusnäkökulmista: 

  • Sallittua on: 
    • käyttää tekoälyä opiskelukäytössä analysoimaan tekstejä 
    • käyttää tekoälyä kielenkääntämiseen, kun tarkoitus on lisätä omaa ymmärrystäsi aiheesta
  • Ilman tekijänoikeuden haltijan lupaa on kielletty:
    • myöntää tekoälysovellukselle sisällön tilapäistä analyysiä laajempia oikeuksia syötettyyn sisältöön (kuten tekoälyn koulutuskäyttöön) 
    • julkaista tekoälyn avulla tehtyjä muunnelmia olemassa olevista teoksista. Parodia on kutenkin sallittua. 
    • valmistaa tekoälyllä toisen taiteilijan tyyliä selvästi imitoivia teoksia

Muista, että näiden lisäksi tulee huomioida yliopiston yleiset ohjeet tekoälyn käytöstä opiskelussa sekä kurssikohtaiset suoritusohjeet. Tekoälyn käyttö voi olla kokonaan kiellettyä esimerkiksi kielten opiskelussa.