Päevatoimetaja:
Mart Raudsaar

Anto Veldre: infoühiskonnast hereetiliselt III

Juhime tähelepanu, et artikkel on rohkem kui viis aastat vana ning kuulub meie arhiivi. Ajakirjandusväljaanne ei uuenda arhiivide sisu, seega võib olla vajalik tutvuda ka uuemate allikatega.
Toimetaja: Berit-Helena Lamp
Copy
Riigi Infosüsteemi Ameti infoturbe ekspert Anto Veldre.
Riigi Infosüsteemi Ameti infoturbe ekspert Anto Veldre. Foto: Toomas Huik

Infoturbe ekspert Anto Veldre kirjutas värskes Sirbis rahvuspoliitikast tehnikamaailma äärealal.

Käimas on väga kiired tehnoloogilised protsessid, mis jagavad maailma kaheks – rahvused ja keeled, millel on täisfunktsionaalne arvutitugi, ning rahvused ja keeled, millel seda ei ole. Meie käitumisest järgmise 10–15 aasta jooksul oleneb, kas eesti keelel põhinev rahvuskultuur ja mõtteviis jääb elama või assimileerivad võõrkultuuri tehnovahendid meid teise, meile võõrasse keelde ja kultuuri.

Eestikeelse keeletehnoloogia arendamine on ülesanne, mis tuleneb otseselt põhiseadusest. Et ravi oleks asjakohane ja tõhus, tuleb kõigepealt osutada probleemile. Mida keerulisem ja erinevam on keel (vähemasti indo-euroopa keeltega võrreldes), mida väiksem on keele kandjate hulk ja rahvuslik koguprodukt, seda vähetõenäolisem, et see keel suudetakse üle viia robotiajastusse. Heal juhul suudetakse säärane keel liivi keele sarnaselt konserveerida või jääb see köögi- ja suhtlemiskeeleks.

Üheks rahvuskultuurile oluliseks valdkonnaks on koopiaõigus. (Autor soovib autoriõigust nimetada koopiaõiguseks, mida see ju tegelikult on. – toim.) Eesti peaks koopiaõigust kasutama hästi sissetöötatud tõhusa relvana oma vaenlaste vastu. Samuti on selge, et koopiaõigus toimib vaid suurel turul ning me vajame oma rahvuskultuuri säilitamiseks teatavaid kompensatsioonimeetmeid (nt subtiitrite puhul).

Euroopa keel

Kuidas üldse suudab üks rahvuskeel võõrastele mõjudele vastu seista? Tehnika vaatevinklist on kriitiliseks valdkonnaks just oskussõnad. Omakeelsed terminid ei teki iseenesest. Eesti keele puhul on oskussõnade teke aga jäetud suuresti juhuse hooleks. Meil puudub keskne riiklik organisatsioon, kes seiraks tehnoloogia arengut ning üritaks ennetavalt termineid luua. Olulistest terminitest on meil sageli mitu isetekkelist varianti (nt raal, arvuti), nii et tehniku kõnepruugi järgi saab tavaliselt tuvastada tema haridustee.

Uueks jõuks eesti keele kujundamisel on saanud Euroopa Liit. «Säädus nõuab», et tähtsamad direktiivid ja määrused oleksid tõlgitud eesti keelde. Paraku ilmneb tehniliste tekstide tõlkimisel, et vastavaid oskussõnu meil polegi ning siis peavad Luxembourgis resideerivad tõlkijad kiirkorras termineid leiutama. Teine ja nukram võimalus: oskussõna on meil olemas, kuid nii niru, et täpsust vajavad IT-mehed pruugivad ingliskeelseid termineid edasi.

Näiteid EÜ seadusandlusest: «tugev robotlõks», «kasutatav andmebaasihaldus on ajakohane ja seda paigatakse pidevalt uute avastatud vallutuste korral»; «süsteemil on range autentimis- ja seansihaldus, mis vähemalt nõuab, et… »; «mandaati ei saa ära arvata ega üle kirjutada nõrkade kontohaldusfunktsioonide kaudu (nt konto loomine, salasõna muutmine, salasõna taastamine, nõrgad seansi identifikaatorid)»; «süsteem kasutab piisavat transpordikihi kaitset, selleks kasutatakse kõiki järgmisi meetmeid või vähemalt sama tugevaid meetmeid»; «süsteem seab turvalipu kõikidele tundlikele küpsistele»; «server konfigureerib kooskõlas parimate tavadega TLS-pakkuja üksnes krüpteerimisalgoritmide toetamiseks».

Olles ise infoturvaja, loen ja mõistan säärast teksti suurte raskustega, ning ainult siis, kui pidevalt algkeelde tagasi tõlgin. «Robotlõks» on asi, mida meil tuntakse CAPTCHA nime all, vallutused on ebaõnnestunud vaste sõnale exploit, «tundlikke küpsiseid» tunnevad tehnikud «turvakukidena» ning mulle jääb originaali kiikamata mõistetamatuks, mis või kes on TLS-pakkuja. Eraldi probleemiks on indo-euroopa süntaksiloogika. Sellise kvaliteediga on euromääruse täitmine vaevalt võimalik – tsiteeritu ei ole eesti keel.

Google’i tõlkur

Mõni aasta tagasi tekkis vajadus Soome firmaga üks leping sõlmida. Kuna seadus nõudis eestikeelset teksti, siis pistsime lepingu Google’i tõlkurisse ja lasime selle partnerite jaoks inglise keelde teisendada. Selgus, et lepingu olulised kohad ei olnud soomlastele arusaadavad (otse soome keelde tõlkimise kvaliteet on veelgi nirum). Raviks kõpitsesime keerulisi kohti eesti keeles lihtsamaks, et tõlkur suudaks produtseerida mingi enam-vähem arusaadava teksti.

Prooviks lasin tõlkuril inglise keelde ja sealt tagasi teisendada kaks lõiku meie presidendi kärajapäeva kõnest. Tulemus sai uskumatult hea: «See tähtis küsimus ei kao kuhugi. Seega tuleb alustada midagi muud. Sest me ei saa ju piltlikult öeldes olema hästi ehitatud ja ressursitõhusa maja heas asukohas – bussipeatus ja ATM üle tänava, kauplus, kool ja töö kolme minuti jalgrattaga sõitma minema – kuid kui maja on õhus, kui seal kopitanud või midagi veel haiseb, siis me tahame elada ei taha.

Ehk kui me räägime riigi masinad, poldid ja mutrid samuti raha määrdeained, mis selle masina tööle ning lase kadedus, siis on see masin lisaks kõigele muule ka hinge. Nagu hästi, me peaksime teadma klassika avaldused: hing tuleb hoolitseda. Riigi ja rahva hinge jaoks.»

Hüpotees: looduses ei eksisteeri piisavalt eestikeelseid korpusi, et statistilist meetodit pruukivat tõlkurit eales meie keele jaoks rahuldavaks treenida.

Võõra kultuuri vidinad

Kui ingliskeelses tehnikamaailmas tekib uus toode, meetod või toiming, siis jõuab see Eestisse eelkõige kommertskanaleid pidi. Turg toimib, firma asub toodet müüma. Kulud tuleb hoida all, sestap tellitakse lokaliseerimine odavalt. Nii tekivadki ebakvaliteetsed tõlked.

Vanasti põdes põhiliselt kasutusjuhendite keel, nüüd oleme jõudnud olukorrani, kus mobiiltelefonide eestikeelsed menüüd sisaldavad õudseid värdkeelendeid ja libaterminoloogiat. Sisulised probleemid on seotud etteantud kujunduse ja märgimahuga. Ingliskeelne tekst kipub olema eestikeelsest lühem. Kui peakontorist antakse ette ekraanilaius ja tähemärkide maksimumarv, siis eestikeelne tekst sinna ära ei mahu ning tõlkijad hakkavadki trikitama.

Kui vigase kasutusjuhendi puhul jookseb tõlkeviga silme eest läbi korra-kaks, siis pidevalt kaasaskantava seadme puhul töllerdab ebakeelend silme ees pidevalt, kuni kinnistub. Arvestades mobiilseadmete arvu järsku kasvu laste taskutes, pole raske ära arvata, mis juhtub järgmiseks: vigased keelendid muutuvad normiks.

Üha enam esineb olukordi, kus seadme funktsionaalsusest ongi võimalik aru saada vaid inglise, saksa vm suurkeelele tagasi lülitudes. Juba on teada esimesed juhtumid, kui tõlkevead võivad põhjustada tehnilisi probleeme (s.t seade ei tööta) või turvaprobleeme (seade töötab, kuid ohustab omaniku vara).

Olukorras, kus tõlge eesti keelde on vaid näiline ning ega kätke endas iseseisvalt mõistetavat kvaliteeti, on ehk mõttekam hoida oma seadmete menüüd ingliskeelsena. Pisiasi, kuid TJA võiks müüki mitte lubada mobiilseadmeid ja klaviatuure, millel puuduvad klahvid kõigi nelja täpitähe jaoks.

Menüüd ja juhendid

Nugiblogis on põhjalik kirjutis, kus kritiseeritakse Samsungi mobiiltelefoni eestikeelset menüüd: kaasaskantav kuumkoht (p.o wifi leviala), antud nimi (p.o eesnimi), sissetulev edastamine.

Näiteid Samsungi kodukinosüsteemi kasutusjuhendist: «vaimne omand» (p.o intellektuaalomand); «kasutage münti, et keerata ava katet kinnitamiseks päripäeva (vastupäeva kinnitamine keerab selle lahti)»; «vaadake numbrit 2 (Tiitrite funktsioon) allpool rohkemate detailide saamiseks mis puudutab subtiitrite kasutamist DivX plaatidega»; Bluetooth: «elektrilisi segajaid võivad tekitada seinad, nurgad või kontoreid eraldavad seinad»; Parental Control: mida kõrgem on tase, seda lähemal on sisu vägivaldsele või täiskasvanutele mõeldud sisule».

Pärleid Sony PlayStationi manuaalist: «akul on piisav laeng»; «sooritage internetiühenduse test, kui ühendus on õige, saate ühenduse internetiga»; «kõvaketta maht on rehkendatud kümnendmatemaatika abil (1 GB = 1 000 000 000 baiti)»; «disain ja tehnilised andmed võivad ette teatamata muutuda»; «kuritahtlikult kopeeritud plaadimaterjali esitamisel võib kosta ebanormaalset heli või esineda häireid».

Intelligentsed agendid ja rääkivad külmkapid

Intelligentne agent on definitsiooni kohaselt ilma kehata robot (vahendusprogramm). Ta istub internetis ning jälgib seal sündmusi ja mustreid, mida tal jälgida on kästud. Samuti võib intelligentset agenti pruukida muudatuste tegemisel välises keskkonnas – sündmuste torkamiseks kellegi teise kalendrisse, sünnipäevaõnnitluse saatmiseks, väärtpaberitehinguks.

Praegustes mobiiltelefonides on intelligentse agendiga juba algust tehtud. Apple’i nutifööni jaoks loodi Siri-nimeline programm, mis suudab mõista lihtsamaid häälkorraldusi ning isegi küsimustele vastata. Kahjuks eestikeelne tugi puudub ning seda pole ka ette näha. Keeleteadlastel on kindlasti sadu vabandusi, miks see nii on, kuid tulemus väljendub elukvaliteedis. Ingliskeelse kõneleja külmutuskapp avaneb õige sõna peale ning kannab inimhäälega ette kapi sisust, eestlane aga peab endistviisi minema oma külmkapi ust käsitsi lahti kangutama ja vorste ükshaaval üle lugema.

Probleem muutub tõsiseks siis, kui intelligentne agent jõuab igasse ingliskeelsesse mobiiltelefoni. Teisisõnu, siis kui igal lasteaialapsel on taskus riist, mis suurt koera kohates ise politseisse helistab ja hulkuvast koerast täiskasvanu häälega ette kannab. Tõsi, tagasihoidlik võimalus on ka eestlastel: ... tuleb lapsele õpetada inglise keelt, mida aparaadid mõistavad.

Juhul kui me ei suuda oma keelt robotitele selgeks õpetada, siis juhtub vältimatu: me hakkame robotite ja tarkade esemetega rääkima inglise keeles. Mida rohkem tarku esemeid, seda rohkem inglise keelt.

Positiivne tegevuskava

Meil tuleb sooritada järsk, riiklikult subsideeritud hüpe keeletehnoloogias. Kui senine rahastamine ei ole edu toonud, siis tuleb rahastamist järsult (näiteks kümme korda) suurendada. On vaja tõsta eesti keele automaattugi järgmisele tasemele:

– kirjeldada meie keel ja selle eri kihid (morfoloogia, süntaks, foneetika jne) matemaatilis-loogiliselt (praegu on osad olemas, aga tervikut millegipärast ei moodustu või on see koopiaõigusega kaitstud);
– tagada automaattõlge eesti keelde mitte halvemal tasemel kui suurkeeltel omavahel – tõenäoliselt ei ole see statistilise meetodiga saavutatav, seega tuleb kasutada mitmekihilist algoritmilist meetodit;
– tagada automaatne kõnetuvastus tasemel, mis ei jää oluliselt maha inglise keele vastavast toest;
– tuua eesti keel arvutitoelt nn 1. grupi keelte hulka ja hoida seda seal.

Tuleb välja töötada rahalis-seaduslikud mehhanismid, mis võtaksid meie keeletehnoloogiafirmadelt huvi pisikesi pisiparandusi tehes igavesti toiduahelas püsida. Selle asemel tuleb nad suunata otse lõppresultaadi kallale. Ühtlasi tuleks rahastada vaid neid firmasid, kes toodavad avatud lähtekoodiga tulemust. Riiklikult toetatud avalik litsents peaks otseselt keelama keeletehnoloogiavahendite mis tahes kasutuse sõjapidamiseks või luureks Eesti vastu, anneksiooni või kuritegude sooritamiseks.

Keeleinspektsioonile tuleks anda volitus kontrollida olulises tiraažis (1000+) levivate menüüde ja juhendite tõlkeid ning vigaste ja väärtõlgete osas anda õigus trahvide määramiseks samas suurusjärgus koopiaõigusega. Väärtõlked tuleb muuta majanduslikult ebaotstarbekaks.

Ühtlasi tuleb luua mehhanismid piiramaks koopiaõiguse rakendusvälja rahvuskultuurile olulistes valdkondades (sellistes, kus turg ei suuda olukorda reguleerida):
– lasteaia õppematerjalid (laulud, luuletused),
– 20 aasta pärast mis tahes õppematerjal kuni keskhariduse tasemeni,
– eestikeelsed subtiitrid (kui rahvuskultuuri kestmiseks vältimatult vajalik eeltingimus).

Tuleb järsult ja oluliselt parandada eestikeelse arvuti- ja üldse tehnikaterminoloogia arendust. Olemasolev isevoolu teed lastud sõnaloome enam ei võimalda olulisi kontseptsioone emakeeles õpetada.

Ühtlasi on vaja teha ka üks valusalt põhimõtteline otsus: vene keeletehnoloogiat me riiklikult ei toeta. Sellel otsusel võivad olla teatavad poliitilised ja rahvuspoliitilised tagajärjed.

Tagasi üles