Satunnaisprojektiot matriisin tekijöihin jakamisessa ja monisto-oppimisessa (Aizenbud)
Useat tieteelliset haasteet sisältävät suuria määriä korkeaulottuvuuksellista dataa. Samalla tiedetään, että pieni määrä piilossa pysyviä parametreja määrittää datan mielenkiintoisia osia. Väitöskirjassaan Aizenbud pyrki ratkaisemaan, kuinka pystymme tunnistamaan ja uuttamaan nämä parametrit.
MSc Yariv Aizenbudin tietotekniikan väitöskirjan "Random Projections for Matrix Decomposition and Manifold Learning" tarkastustilaisuus järjestetään perjantaina 13. jouluuta kello 12 alkaen Agoran salissa Beeta. Vastaväittäjänä toimii professori Keijo Ruotsalainen (Oulun yliopisto) ja kustoksena professori Pekka Neittaanmäki (Jyväskylän yliopisto). Väitöstilaisuuden kieli on englanti.
Aizenbudin väitöskirja on julkaistu sarjassa JYU Dissertations numerona 165, ISSN 2489-9003, ISBN 978-951-39-7965-2 (PDF). Pysyvä linkki julkaisuun:
վٱä:
Väitöskirja keskittyy ratkaisemaan ongelmia, jotka liittyvät satunnaisten muuttujien käytökseen korkeaulottuvuuksissa avaruuksissa. Päämotivaatio tulee siitä ymmärryksestä, että monet tieteelliset haasteet sisältävät suuria määriä korkeaulottuvuuksellista dataa. Samalla tiedetään, että pieni määrä ”piilossa pysyviä” parametreja määrittää datan ”mielenkiintoisia” osia. Kysymys kuuluukin, kuinka pystymme tunnistamaan ja uuttamaan nämä parametrit. Tämä väitöskirja keskittyy data-analyysin kahteen alueeseen: Numeeriseen lineaariseen algebraan ja ”manifold learning” eli ”monisto-oppimisen” termillä tunnettuun lähestymistapaan. Tässä väitöskirjassa esitellään Low-rank SVD ja LU approksimaatioalgoritmit. Ne muodostavat kompromissin tarkkuuden ja laskenta-ajan välillä. Nämä metodit parantavat nykyaikaisia algoritmeja Low-rank SVD ja LU approksimaatioille. Uudet tulokset poistavat rajoitteita, jotka liittyvät ratkaistavissa olevien haasteiden kokoon ja tarkkuuteen. Koska matriisin tekijöihin jakaminen on keskiössä melkein kaikessa nykyaikaisessa laskennassa, tämä väitöskirjan osio tarjoaa yleisesti hyödynnettäviä työkaluja moneen nykyaikaiseen suuren datan ja data-analyysin ongelmanratkaisuun. Väitöskirjan tulokset todistavat satunnaisprojektioiden tehokkuuden erilaisissa matriisin tekijöihin jakamisen metodeissa, sekä antavat uuden näkökulman korkeiden ulottuvuuksien data-analyysille. Nämä kaksi aluetta ovat useiden tutkimusongelmien ytimessä. Tällä tutkimuksen alueella on yhä useita vastaamattomia kysymyksiä, joiden tutkimuksessa satunnaisprojektiot voivat olla avuksi.