Proovi tippida Google'isse kaks küsimust: inglise keeles «Who is the prime minister of Estonia?» ja eesti keeles «Kes on eesti peaminister?». Ingliskeelse küsimuse peale annab Google selge vastuse «Jüri Ratas» koos asjaliku lisainfoga. Eestikeelse küsimuse peale saad ainult linke vikipeediasse ja valitsuse veebilehtedele, kirjutab TTÜ professor Tanel Tammet.
Tanel Tammet: milleks tehismõistusele eesti keel? (1)
Eelmisel nädalal Kultuurikatlas peetud tehismõistuse-konverentsil oli kohal üle pooletuhande osalise, valdavalt praktikutest arendajad Eesti ettevõtetest. Suur osa ettekannetest keskendus masinõppele.
Veel kümme aastat tagasi oli masinõpe lapsekingades, tänaseks päevaks on see muutunud aga väga tähtsaks valdkonnaks – meil on olemas nii reaalsed edulood kui ka hulk pöörast optimismi maailma muutva tarkvara ehitamiseks.
Paljudel on praktiline tehisintellekti-kogemus Google'i otsimootori, Apple'i Siri või Facebooki kasutamisest, kus tehismõistus alati välja küll ei paista, kuid taustal on ta põhiotsustaja. Proovi tippida Google'isse kaks küsimust: inglise keeles «Who is the prime minister of Estonia?» ja eesti keeles «Kes on eesti peaminister?». Ingliskeelse küsimuse peale annab Google selge vastuse «Jüri Ratas» koos asjaliku lisainfoga. Eestikeelse küsimuse peale saad ainult linke vikipeediasse ja valitsuse veebilehtedele.
Tehisintellektist rääkides ei mõtle praktikud mitte ulmefilmide mõtlevatest robotitest, vaid sellest, kuidas muuta tarkvara nii, et arendaja ei peaks kõiki süsteemi tegevusi ja detaile ükshaaval välja mõtlema ja valmis programmeerima. Eesmärgiks on see, et süsteem õpiks etteantud näidete varal ise õigeid valikuid tegema.
Arusaadavalt nõuab see väga palju reaalelulisi näiteid. Suurandmetest rääkimine ongi sujuvalt läinud üle tehismõistusest rääkimiseks, mis siis nendest andmetest tegelikult sotti peaks saama. Lihtsamate otsuste õppimine töötab juba kenasti, aga keeruliste valikute õppimine ja inimesega praktilise dialoogi pidamine veel hästi välja ei tule. Sestap ehitatakse valdavalt tehisnitellekti-lahendusi nii, et suure osa tarkvara teeb valmis arendaja, misjärel kasutatakse näiteid erivariantide õppimiseks ja kogu süsteemi tuunimiseks.
Kust tulevad näited, mille põhjal iseõppivad tarkvarasüsteemid oma valikuid ja asjadest arusaamist kujundavad? Üldjuhul arendajate oma ümbruskonnast ehk peamiselt inglise, hiina, india, vene ja saksa keele- ja kultuuriruumist. Vaevalt on kellelgi peale meie endi tõsist huvi tõsta eesti keel tarkvaraga läbipõimitud keeleks.
Tehismõistus automaatselt kõiki keeli ei tunne
Facebooki uudisvoog on pealtnäha lihtsalt mehaaniline loetelu sinu sõprade postitustest läbisegi reklaamidega, aga selle taga on õppivad tehisintellektisüsteemid, mis alaliselt katsetavad, millised uudised on kutsuvamad ja mida lugejatele eeskätt välja valida.
Facebook mõjutab meie maailmavaadet keelte najal, millest Facebooki tehismõistus aru saab ja kultuuride najal, mille esindajad Facebooki rohkem kasutavad.
Massachusettsi tehnoloogiainstituut on loonud huvitava süsteemi iseõppivate autode valikute kujundamiseks olukordades, kus auto peab otsustama, kellele otsa sõita ja kelle elu säästa. Sellelt morbiidselt lehelt saab järgi uurida, mis on sinu eelistused, aga süsteem õpib samas reaalsete inimeste eelistusi ja hoiakuid. Tõenäoliselt hakkavad autod ühel päeval tõepoolest kasutama selliselt õpitud valikuid.
Kui mõtleme kasvõi e-riigi, e-kooli ja muude e-asjade parandamisest, siis põhiliseks takistuseks on IT-arendajate vähesus. Tehisintellekt võimaldaks taolisi süsteeme lihtsalt kiiremini ja odavamalt ehitada, aga eelduseks on jällegi asjatundlikud arendajad, kes suudavad tehismõistuse-algoritme oma süsteemidesse kombineerida ning neid asjakohaste näidete ja sobiva konteksti peal õpetada.
Ja kui me ei taha edaspidi leppida e-süsteemidega, mis oskavad ainult teha valikuid võõrkeeletes, siis peame õppima oma süsteeme efektiivselt ehitama, meie keelest aru saama ja meie tekstide, näidete ja eelistuste põhjal valikuid tegema