Eesti keele sõnaraamat. FOTO: Urmas Luik/Parnu Postimees

Tuhandeid aastaid on sõnaraamatud püsinud paberil üsna muutumatuna. Veeb lõi uued võimalused – nüüd soovime kogu vajaliku info sõna kohta kätte saada ainsa otsinguga.

Muutunud on ka sõnastike koostamine. Enam ei võeta ette tühja paberit või andmebaasi, kuhu hakata a-tähega algavaid sõnu kirjutama, vaid analüüsitakse tekste, et sõnastiku jaoks sobivad sõnad korraga välja noppida. Töö lihtsustamiseks ja vigade vältimiseks kasutatakse spetsiaalset tarkvara – sõnastikusüsteemi.

Üht sellist, nimega Ekilex, arendame praegu Eesti Keele Instituudi jaoks. Eesmärk on koondada ühtsesse andmebaasi ja ajakohastada aastate jooksul koostatud sõnakogud, et neid siis avaldada Sõnaveebis just lugejale kõige sobivamal viisil.

Kui otsing mitmest sõnastikust korraga on varemgi võimalik olnud, siis sõnastike sisulist ühendamist ei ole maailmas veel kuskil proovitud. EKI on selle ambitsioonika eesmärgi endale võtnud, ja Ekilex peab seda tehniliselt võimaldama.

Mis me siis teisiti teeme? Kõige üldisemalt võibki öelda, et taaskasutame andmeid. Kui mingi info ühes sõnastikus juba on, siis pole seda mõtet teise uuesti lisada, pigem tasub täiendada olemasolevat. Näiteks eesti märksõnade valik ja tähenduste seletused on paljude sõnastike jaoks üsna põhjalikult läbi mõeldud. Seega, kui praegu hakata koostama uut sõnastikku, näiteks eesti-araabia, siis ei ole enam tarvis alustada märksõnadest ja seletustest, vaid võib keskenduda araabia vastete lisamisele. Sama puudutab uusi sõnu: kui uus sõna või tähendus on kord Ekilexi lisatud, siis on ta olemas kõigi ülejäänud sõnastike jaoks.

Teine asi, mida taaskasutame, on teadmised sõnastike parima koostamisviisi kohta. Leksikograafia ja terminoloogia on teadusharud, mis seda uurivad, ja mõlemaga tegeletakse EKIs rahvusvahelisel tasemel. Praktikasse jõuavad teadustulemused just Ekilexi kaudu. Süsteem suunab koostajat sisestama andmeid viisil, mis aitab vältida vigu ja võimaldab tööd teha tööd lihtsamalt ja kiiremini.