EKI keelekool: eestikeelsed automaat­subtiitrid on jõudnud otse-eetrisse

Susanna Oja
, Eesti Keele Instituudi keeletehnoloogia kompetentsikeskuse juht
Copy
TalTechi keeletehnoloogia laboratoorium on loonud subtiitrite genereerimiseks kõnetuvastusel põhineva kiirkirjutaja lahenduse.
TalTechi keeletehnoloogia laboratoorium on loonud subtiitrite genereerimiseks kõnetuvastusel põhineva kiirkirjutaja lahenduse. Foto: EKI

Praegusel ajal, kus inimesed peavad saama hakkama ülemaailmse pandeemia ja sõjaolukorraga, on eriti oluline, et operatiivne info jõuaks kõikide meie ühiskonna liikmeteni võimalikult kiiresti. Automaatsed reaalajalised subtiitrid on üks samm selle saavutamisel. Keeletehnoloogia arengutest kirjutab Eesti Keele Instituudi keeletehnoloogia kompetentsikeskuse juht Susanna Oja.

Kuni eelmise aastani oli meie ainus võimalus eestikeelsete reaalajaliste subtiitrite tekitamiseks nn inimliidese kasutamine ehk et kaadri taga toimetas üks usin inimene, kes kõik kuuldu võimalikult kiiresti kirja pani. Kuid nüüd on TalTechi keeletehnoloogia laboratoorium loonud subtiitrite genereerimiseks kõnetuvastusel põhineva kiirkirjutaja lahenduse.

Alates 1. märtsist on võimalik ETV otsesaadetele lisada automaatselt genereeritud reaalajalisi subtiitreid, mille kõige olulisemaks sihtgrupiks on eesti keelt kõnelevad vaegkuuljad. Nendel ei ole võimalik otsesaadetest – uudistest, pressikonverentsidest, valimisstuudiotest jms – päevakajalist infot kuulata, mis tähendab, et oluline teave jõuab nendeni alati teatava viivitusega. Kuna informatsioon võib muutuda ruttu, eriti kriisiolukordades, on oluline, et ka nemad saaksid info kätte samaaegselt ülejäänud eesti keele kõnelejatega.

Lisaks ligipääsetavuse parandamisele saavad eestikeelsed subtiitrid olla kasulikuks abivahendiks ka teistele sihtgruppidele: näiteks neile, kes õpivad eesti keelt teise keelena. Kõik, kes mõnda võõrkeelt on õppinud, teavad, et õpitavast keelest on märksa lihtsam aru saada, kui lisaks kuulamisele on võimalik jälgida räägitavat tekstina. Samuti on subtiitrite abil võimalik suurendada kuuldud info vastuvõtmist nii keeleõppijate kui ka emakeele kõnelejate jaoks. On inimesi, kes omandavad infot paremini kuulates, kuid mõnele inimesele jääb sisu oluliselt paremini meelde, kui tal on võimalik seda lugeda. Lisaks teevad subtiitrid võimalikuks info edastamise neile, kes viibivad mürarikkas keskkonnas ning kellel pole võimalik saadet kuulata.

Loomulikult on eestikeelsel kõnetuvastusel veel arenguruumi ning tänastes subtiitrites võib vahel kohata kentsakaid vigu, kuid siiski on see oluline abivahend teabe edastamisel. Hetkel on kõnetuvastuse täpsus umbes 85 protsenti, kuid ära ei tohi unustada, et ka inimesed ei tuvasta kõnet alati sajaprotsendiliselt. Mõelge kõikidele nendele kordadele, kui olete kuulnud oma vestluskaaslast lausumas midagi eriti kummalist, et siis hiljem avastada, et see, mida sina kuulsid, polnud üldse see, mida tema ütles.

Lisaks sõltub tuvastuse kvaliteet ka sellest, kui selgelt või kiiresti kõneleja räägib, kui palju on taustamüra, kui hea on salvestuse kvaliteet jms. TalTechi teadlased tegelevad pidevalt kõnetuvastuse edasiarendamisega, mis tõstab aja jooksul ka subtiitrite kvaliteeti.

Automaatsed subtiitrid on meie väikese keele jaoks täna juba tegelikkus ning sellise keeletehnoloogilise taseme üle tasub meil palju uhkust tunda.

Kommentaarid
Copy
Tagasi üles