Takaisin

Tekoälyagentti oppii pelaamaan tietokonepelejä ja pitää palkinnoista

Unityn ja Microsoftin pelikilpailuihin osallistuminen on osa tietojenkäsittelytieteen jatko-opiskelijoiden tekemää tutkimusta. Tekoälyn kehittäminen rajoitetussa peliympäristössä auttaa ymmärtämään syväoppimista.

Kuva pelistä, tyttö juoksee labyrintissä.

Kuvassa: Tekoälyagentilla on vielä monta ratkaistavaa tehtävää edessään.

Pelialan tunnetuimpiin kuuluvan yrityksen Unityn kilpailussa tehtävänä oli kehittää tekoäly, joka osaa pelata puzzle-tyyppistä peliä.

Peli näyttää ensisilmäyksellä pettävän yksinkertaiselta. Ihmiseltä ei menisi kauan aikaa selvittää, miten tyttö saadaan etenemään kivilabyrintissä. Mutta kuinka pelaamisesta suoriutuu tekoäly?

—Kyseessä on tutkimuksellinen ongelma, jota yritämme selvittää rajoitetussa peliympäristössä, kertoo vanhempi tutkija Ville Hautamäki tietojenkäsittelytieteen laitokselta.

Hautamäen erikoisalaa ovat puheteknologia, bioinformatiikka ja koneoppiminen. Pelialan kilpailuihin osallistuminen on osa hänen tutkimusryhmänsä työskentelytapaa.

—Tekoäly -termin kehitti aikoinaan John McCarthy, ajatuksenaan ”älykäs kone”. Tekoäly on yksi osa syväoppimista. Tämä kilpailu oli erityisen kiinnostava, sillä yritimme nyt ensimmäistä kertaa kehittää juuri tällaista tekoälyä.

Hautamäen, Anssi Kanerviston ja Janne Karttusen tiimi pääsi pelissä tasolle 10 saakka, voittoon olisi tarvittu selviäminen tasosta 20. Se ei kuitenkaan olisi ollut mahdollista, sillä aika ja tietokoneen kapasiteetti eivät tällä kertaa riittäneet tekoälyn opettamiseen.

—Tässä kilpailussa tehtävänä oli opettaa tekoälyagenttia toimimaan simulaatiossa ei-strukturoidussa tilassa, eli agentin piti oppia reagoimaan ympäristön muutoksiin. Se pelaa itse peliä ja oppii lukemattomien toistojen jälkeen käyttämään saamaansa tietoa, Hautamäki selvittää.

—Jokainen uusi taso on ”tabula rasa”, tyhjä tilanne, sillä huone muuttuu joka kerta. Agentti ei siis opettele muistamaan ulkoa tiettyjä liikesarjoja.

—Esimerkiksi vitostasolla ovi on kiinni, ja agentin täytyy tajuta ottaa avain ja avata sillä ovi. Kymppitasolla taas agentin on siirrettävä kiviblokki tiettyyn paikkaan.

Hautamäen mukaan tehtävät eivät ole mitenkään vaikeita ihmiselle, mutta agentille ovat. Olennaista agentin kehittämisessä on hahmon kontrollointi, että se osaa tehdä tietyt liikkeet. Lopulta agentti saa palkinnon, kun pääsee etenemään ovesta, eli tekee tietyn sarjan liikkeitä tilassa.

—Koodissa ei siis lue, että käänny nyt vasemmalle, hän selvittää.

Agentti pelaa peliä hirvittävällä nopeudella, jopa useiden kymmenien vuosien edestä, kuten kilpailun voittajatiimin agentti.

– Tietokoneen laskentakapasiteetti antoi siis valitettavasti etua joillekin tutkimusryhmille.

 

Minecraft -kilpailussa kehitetään jälleen uutta agenttia

Parhaillaan tutkimusryhmä osallistuu Microsoftin järjestämään Minecraft-peliin, joka päättyy vuoden lopussa.

— Tässä pelissä tasot luodaan automaattisesti. Hahmo pelaa peliä koko ajan, ja yhtä hahmoa saa opettaa vain päivän ajan, Hautamäki sanoo.

—Kilpailun järjestäjä tsekkaa koodit ja ajaa ne, joten tällä kertaa tehtävä on vaikeampi. Toisaalta laskentakapasiteettietua ei saa samalla tavoin, eli peli on sillä tavalla reilumpi kaikille tiimeille. MineRL Round 1 loppui Top10 -tiiminä, ja nyt tavoitteemme on päästä Top5 -joukkoon, Hautamäki sanoo.

—Microsoft antoi kilpailun alussa myös esimerkkejä, miten ihminen on pelannut peliä. Niitä voidaan hyödyntää agentin kehittämisessä. Sen sijaan aikaisempaan Unityn peliin tekemäämme tekoälyä ei pystytty hyödyntämään, se ei osannut pelata tätä peliä.

—Meitä kiinnostaa yleisempi tekoäly, joka pystyy ratkomaan tehtäviä. Itseoppinut agentti on huomattavan paljon joustavampi, Hautamäki sanoo.

Tulevaisuudessa tekoälyä käytetään muun muassa robotiikassa entistä enemmän, myös kotona. Tutkijoiden tähtäimessä luulisi olevan kaiken kattava, suuri tekoäly.

Hautamäen mukaan ei kuitenkaan haluta tehdä yhtä isoa tekoälyä, vaan riittävän pientä.

—Robotti kotona ei tarvitse enemmän elektroniikkaa, vaan enemmän älyä.

—Olisiko mahdollista kehittää menetelmä, joka antaa palautetta siitä, miten tekoälyn pitäisi toimia? Kyseessä voisi olla robotti, joka osaa toimia tietyssä ympäristössä, kuten esimerkiksi robotti-imuri.

—Robottibisnes on jo nykyään erittäin suurta. Tulevaisuudessa sen merkitys esimerkiksi terveys- ja hoivapalveluissa tulee kasvamaan merkittävästi.

Teksti: Marianne Mustonen
Kuva: Tiimin pelivideo Youtubessa

 

Lue lisää ja katso pelivideot: