Lugemine.

FOTO: SCANPIX

Peame iseenesestmõistetavaks, et omaette lugedes ei loe me lauseid kõva häälega ette, vaid loeme mõttes, vaikides. Ometi ei ole see alati nii olnud. Veel hilisantiigis peeti vaikides lugemist suureks imeks.

Augustinus kirjeldab 4. sajandil hämmastusega, kuidas tolle sajandi üks mõjukamaid vaimulikke Püha Ambrosius loeb ainult silmadega, ilma et ta suu liiguks. Sellist vaikides lugemist peeti erakordseks ja juba tekstide loomisel arvestati, et need on eelkõige teistele esitamiseks. Ilma sõnavahedeta kirjutatud antiiksed tekstid ei olnudki sobivad omaette lugemiseks.

Sajandite jooksul on nii tekstid kui ka lugemisviis palju muutunud. Sõnavahedega tekstis on võimalik pilguga haarata kogu sõna, ilma tähthaaval veerimata. See teeb vaikides lugemise palju kiiremaks. Vaevalt et inimesed enam häälega lugemise juurde tagasi pöörduvad, vähemalt need, kes algkoolieast väljas. Aga nüüd võib ettelugemise enda peale võtta tekst-kõne süntesaator, mis suudab ette lugeda igasugust digitaalset teksti, olgu selleks siis tekstisõnum mobiilis, ajaleheartikkel või e-raamat. Ja süntesaator võib lugeda teksti palju kiiremini kui inimene.

Eesti Keele Instituudis on kõnesünteesiga tegeletud juba üle 40 aasta, aga nüüd on tehniline areng jõudnud nii kaugele, et sünteeshääli hakatakse aina enam ka kasutama. Seega on päevakorda kerkinud teema, kuidas peaks kõlama üks ilus eestikeelne sünteeshääl. Osaliselt oleneb sünteeshääle kvaliteet sünteesimeetodist ning inimese häälest, mida sünteeshääle loomiseks on kasutatud.

Teisalt sõltub kõne kvaliteet sellest, kui hästi teksti analüüsil suudetakse määrata, mis vältes sõna lugeda ja kas sõna tuleks palataliseerida või mitte. Selles tuginetakse õigekeelsussõnaraamatule, mis annab ka häälduse kohta juhiseid. Siiski on õigekeelsussõnaraamatus ligi 300 sõna, mida on lubatud hääldada nii teises kui ka kolmandas vältes.

Kui inimkõneleja puhul on selline valikuvabadus tervitatav, siis masinale tuleb ette anda üks variantidest. Seetõttu oleme püüdnud välja selgitada nende sõnade hääldustava. Selleks oleme korraldanud erinevais Eesti paigus lugemiskatseid, kus palume inimestel ette lugeda väikese teksti. Näiteks on lugemiskatses lause «Toimekas sepp tagus kangelase mõõka», mille puhul tahame teada saada, kas inimesed hääldavad sõnu toimekas ja kangelane teises või kolmandas vältes. 50 inimese andmete põhjal võib juba praegu öelda, et enamik inimesi hääldab sõna toimekas teises vältes ja kangelane kolmandas vältes. Sama lugemiskatsega uurime ka teisi varieeruvaid nähtusi, näiteks huvitab meid, kas inimesed hääldavad sellist tüüpi sõnu nagu paat ja roos palataliseeritud lõpuhäälikuga või mitte. Hääldusuuringud aitavad muuta eestikeelset sünteeskõnet loomulikumaks, mistõttu oleme paremini valmis ajaks, kui vaikides lugemise aeg peaks jälle läbi saama.