Takaisin

Taitavat äänenkäyttäjät onnistuvat huijaamaan teknologisia puhujantunnistusmenetelmiä

Väitös tietojenkäsittelytieteen alalta
Väittelijä:  FM Rosa González Hautamäki
Aika ja paikka: 16.11.2017 klo 12, Louhela auditorio, Joensuun tiedepuisto

FM Rosa González Hautamäki on tutkinut tietojenkäsittelytieteen alaan kuuluvassa väitöskirjatutkimuksessaan ihmisen tuottaman äänenmuuntelun haasteita oikean puhujan havaitsemisen tarkkuuden kannalta. Äänen perusteella tunnistamisen haasteena on perinteisesti ollut se, että ääntä pystytään muuttamaan monin tavoin. González Hautamäen tutkimuksen mukaan taitava äänenkäyttäjä voi huijata jopa edistyneitä automaattisia järjestelmiä, sillä ne eivät vielä pysty tunnistamaan äänenmuuntelua kattavasti.

Mobiililaitteisiin saa nykyään sovelluksia, jotka toimivat äänikäskyillä. Niiden avulla voi sanella viestejä, kääntää lauseita ja tehdä hakuja käyttämällä vain ääntä. Suuri elektronisten palvelujen käyttö on laajentanut äänellä toimivien sovellusten kysyntää esimerkiksi yleisen turvallisuuden tai äänitunnisteiden autenttisuuden varmistamisessa. Äänitoimintojen kasvaneen suosion myötä myös niihin kohdistuvat väärinkäytökset voivat lisääntyä. Puhujan äänen tunnistamishyökkäyksissä käytetään erilaisia teknisiä menetelmiä kuten puhesynteesiä sekä nauhoitetun äänen käyttöä. Vastatoimia näille teknisille hyökkäyksille tutkitaan nykyään tiedeyhteisössä laajalti. Ihmisen tuottaman äänenvaihtelun vaikutusta puhujantunnistukseen esimerkiksi imitaattoreiden tai äänen peittämisen avulla ei kuitenkaan ole vielä tutkittu laajalti.

Äänen imitointi on yleistä viihdeteollisuudessa, jossa ammattilaiset ja amatöörit voivat kopioida muiden puhujien, yleensä julkisuuden henkilöiden äänten erityispiirteitä ja puhekäyttäytymistä. Lisäksi imitointia käytetään esimerkiksi tilanteissa, joissa pyritään pysymään tuntemattomana. Tällaista äänenmuuntamista käytetään esimerkiksi kiristysrikoksissa ja uhkaussoitoissa, joiden selvittämiseksi ja ehkäisemiseksi on tärkeää parantaa puhujantunnustuksen luotettavuutta.  

Puhujantunnistamisen tehokkuuden lisäämiseksi on tärkeää analysoida äänen imitoinnin ja peittelyn vaikutusta. Tässä tutkimuksessa on tutkittu kahden ammatti-imitaattorin puhetta tilanteissa, joissa he matkivat kahdeksan tunnetun suomalaisen puhetta. Lisäksi puheen peittelyn tutkimuksessa on mukana 60 ihmisen puhenäytteet, joissa puhujat ovat muutelleet ääntään identiteettinsä peittämiseksi. Tutkimuksessa on tarkasteltu automaattisten järjestelmien puhujantunnistamisen tarkkuutta, kuuntelijoiden mahdollisuutta erotella puhujat toisistaan sekä puheakustiikkaa luonnollisten ja muunneltujen äänien välillä.

Tutkimuksessa havaittiin, että imitaattorit pystyivät huijaamaan automaattisia järjestelmiä ja kuuntelijoita tietyntyyppisissä tapauksissa. Automaattisten järjestelmien tai kuuntelijoiden kyky tunnistaa oikea puhuja heikkenee esimerkiksi lapsenkaltaisella äänellä puhuttaessa.

FM Rosa González Hautamäen tietojenkäsittelytieteen alaan kuuluva väitöskirja Human-induced voice modification and speaker recognition. Automatic, perceptual and acoustic perspectives (Muunnettu puhe ja puhujantunnistus. Automaattisen tunnistuksen, puheen havaitsemisen ja akustiikan näkökulmasta) tarkastetaan Itä-Suomen yliopiston luonnontieteiden ja metsätieteiden tiedekunnassa. Vastaväittäjänä toimii dosentti Okko Räsänen, Aalto-yliopisto ja kustoksena apulaisprofessori Tomi Kinnunen, Itä-Suomen yliopisto.

Väittelijän painolaatuinen kuva on osoitteessa https://kuvapankki.uef.fi/A/UEF+kuvahakemisto/12516?encoding=UTF-8