Takaisin

Onko sinun datasi big dataa?

Tiedon määrä kasvaa koko ajan. Mikä tekee tiedosta laadukasta, ja kuinka sitä voidaan hyödyntää parhaiten? Koko yliopiston yhteisessä Big data -päivässä Kuopion kampuksella aiheesta kuultiin erilaisia näkemyksiä ja esimerkkejä sovelluksista.

- Mitä oikeastaan on big data? Varastoidun raakatiedon määrä kasvaa joka päivä; tallennamme sitä valtavia määriä. Eniten uutta dataa tulee erilaisista tutkimuslaitteista – se ei siis ole ihmisen kirjoittamaa dataa. Osa taas tulee ihmisten sosiaalisten verkostojen kautta, puhelinsoitoista tai lääketieteellisistä rekistereistä, sanoi 40 vuotta tekoälytutkimuksen parissa työskennellyt Aalto yliopiston emeritusprofessori Erkki Oja puheenvuorossaan.

Ojan mukaan esimerkiksi Facebookissa on jo nyt neljäsosa koko maailman väestöstä, ja sinne on tallennettu tietoa jo yli 200 terabitin edestä. Youtubeen taas ladataan joka minuutti 300 tuntia videota, katselukertojen ylittäessä jo viisi miljardia kertaa joka päivä.

- Entä milloin sinun datasi sitten on big dataa? Kuinka arvokasta tietosi ovat, kun voluumia kasvatetaan ja maali onkin liikkuva, kysyi Oja.

- Big data on itse asiassa teknologiaa, joka koostuu tiedon hankinnasta, varastoinnista, jakamisesta, analyysistä, käsittelystä ja sovelluksista. Tekoäly on puolestaan digitaalisen maailman sisällä oleva kokoelma esimerkiksi haku- tai ja käännösohjelmia, pelejä, hahmontunnistusta, robotiikkaa, koneoppimista ja niin edelleen.

- Tekoälyn valovoimaisimmat hetket viime vuosina ovat olleet shakkimestaruuden ja go-mestaruuden voitot, tehokkainta käyttöä erilaiset kysymys-vastaus-järjestelmät.  Kuuma puheenaihe, eli syväoppiminen, taas on oikeastaan vain osa neuroverkkoja, siis tietokoneohjelmia.

Tekoälyn kehitys on parhaillaan käännekohdassa, joko kehitys voi lopahtaa kokonaan, tai toisaalta äityä nopeaan, vaaralliseenkin kasvuun. Oja itse suhtautuu kehitykseen optimistisesti, ja uskoo, että totuus löytyy jostain välimailta.

- Datan volyymit kasvavat valtavasti, ja tehokkailla algoritmeilla ja laitteistoilla niistä saadaan paljon enemmän irti. Viiden vuoden sisällä kaikesta tulee käytännöllisempää, eivätkä sovellukset ole enää niin eriytyneitä, hän totesi.

- Pelkkä big datan tuottaminen ei riitä, vaan täytyy tuottaa uutta tietoa ja teorioita, lisäsi apulaisprofessori Lauri Mehtätalo Itä-Suomen yliopiston tietojenkäsittelytieteen laitokselta.

- Big data ei ole kokeisiin pohjautuvaa tiedettä tai tutkimusta. Ymmärrystä asiaan syntyy vasta sitten, kun käyttää aikaa ajatteluun.

Päivän keskusteluissa pohdittiin myös, pitäisikö big dataa käyttää esimerkiksi koko populaation vai yksilön terveydenhoidon suunnitteluun – yksilön kohdalla täytyisi olla saatavilla kaikkia aikaisempi tieto ja tehtyjen mittausten tulokset. Isoja yhtenäisiä ryhmiä ei välttämättä löydy helposti, mutta silti variaatioita pitäisi saada pienemmäksi.

Teksti ja kuva: Marianne Mustonen

 

Lue lisää big datasta uusimmasta Saima-lehdestä