Big data luo tarpeen uudenlaiselle osaamiselle

Joululomalla oli hiemaan aikaa läpikäydä vanhoja tutkimusarkistoja. Vuosina 1983–87 syntynyttä väitöskirja-aineistoa ei ollut enää tallessa sähköisessä muodossa, mutta mappikaupalla oli tulostettuna mittausdataa, mallianalyysejä, dokumentteja, käsikirjoituksia, kuvia ja muuta sekalaista tutkimusaineistoa. Strukturoitua ja strukturoimatonta dataa, jonka jatkohyödyntämiseen taisivat aikanaan omat eväät loppua. Ehkä joku olisi osannut niitä jatkojalostaa, tai yhdistää omiin datoihin, jos aineistot olisivat sähköisesti olleet avoimemmin jaossa. Eipä eletty avoimen datan aikaa 1980-luvulla.

Erään arvion mukaan maailmassa tuotetaan päivittäin 2,5 kvintiljoonaa (2.5x1018) bittiä dataa. Ja määrä kasvaa eksponentiaalisesti. Yliopistossamme on syntynyt vuosien mittaan arvokasta aineistoa ainulaatuisista tieteellisistä hankkeista. Epäilen, että vain osaa tästä massiivisesta tietoaineksesta, big datasta, on hyödynnetty optimaalisesti. Näkemys tai osaaminen ehkä ristiriitaisen datan jatkokäsittelystä ja -hyödyntämisestä on puuttunut.

Tarvitaan uudenlaista osaamista – niin datatieteeseen erikoistuneita osaajia kuin parempaa alan osaamista laajemminkin – tutkijoittemme joukossa. Koska tämä edellyttää matematiikan, tilastotieteen ja tietojenkäsittelytieteen riittävää ymmärtämistä, tarvitaan valmiutta uuden oppimiseen. Uusissa rekrytoinneissa nämä valmiudet kannattaa selvittää.

Datatiedettä kehitetään toivoakseni tieteellisiä vahvuuksiamme hyödyntäen myös Itä-Suomen yliopistossa. On hyvä pohtia avoimen tieteen tavoitteiden saavuttamiseksi datatieteen alan uudenlaista koordinointia. Synnytetään verkosto, jossa ammattilaiset ovat keskenään vuorovaikutuksessa. He pystyvät yhteisin ajatuksin ja opein eri tieteenaloilta ratkomaan meille tärkeitä ongelmia ja kehittämään omaa tieteenalaansa.

Jokaisella tutkimusryhmällä on oikeutetusti omat intressinsä, mutta meidän tulee nähdä akuuttien tarpeiden taakse. Pitemmällä aikajänteellä parempi hyöty saadaan miettimällä yhteisesti koko tutkimusalueen kehittämistä, huomioiden niin data- kuin tilastotieteenkin mahdollisuudet. Molempien kehittyminen ja optimaalinen soveltaminen tukevat tutkimusta laajasti, nostavat tutkimuksemme tieteellistä tasoa ja luovat osaltaan edellytyksiä myös avoimen tieteen etenemiselle. Avoimuus edellyttää uutta rohkeaa ajattelua ja vanhojen henkisten ajattelumallien muutosta. Silloin kun joku saa hyödyntää dataasi, sinun kuuluu meritoitua alkuperäisen tiedon tuottajana.

JUKKA JURVELIN

Luonnontieteiden ja metsätieteiden tiedekunnan dekaani