Lea Danilson-Järg: väikesed ja suured liialdused ning statisika

Lea Danilson-Järg
, Siseministeeriumi rahvastiku- ja perepoliitika osakonna juhataja
Copy
Eelmine rahvaloendus toimus Eestis 2012. aasta alguses.
Eelmine rahvaloendus toimus Eestis 2012. aasta alguses. Foto: Urmas Luik / Pärnu Postimees

Lugedes matemaatikute Krista Fischeri ja Tõnu Kollo artiklit «Tõde Eesti rahva kohta» ja keeleteadlase Martin Ehala artiklit «Statistikaamet tegutseb vahendeid valimata» on esmapilgul üllatav, kui erinevad on statistika tegijate ja selle kasutajate hinnangud kavandatava rahvaloenduse andmekvaliteedile, kirjutab siseministeeriumi rahvastiku- ja perepoliitika osakonna juhataja Lea Danilson-Järg.

Veidi järele mõeldes tuleb tõdeda, et teenuse osutaja ja kasutaja hinnangud erinevad tihtipeale ka muudes eluvaldkondades. Kui teenuse pakkuja puhul on tegemist sisuliselt monopoliga, nagu riikliku statistika puhul, on tarbijad enamasti ka üsna ebavõrdses olukorras - nende jutt langeb sageli kurtidele kõrvadele. Statistikametil on täna seoses loendusega suur vastutus ja võimalus näidata, et arvestab andmetarbijatega hoolimata enda monopoolsest positsioonist.

Üks võimalus monopole ohjes hoida on kehtestada seadused, mis vastavat tegevusvaldkonda korraldavad. Rahvaloendust reguleerib riikliku statistika seadus, mis sõnastab nii loenduse olemuse, eesmärgi kui ka kogutavad andmed. Kehtivast seadusest tulenevalt ei tohiks olla täna küsimustki, milliseid andmeid loendusel kogutakse või kas loendust tohib asendada osaliselt valimuuringuga. Seaduse järgi on loendus kõikne uuring ning seaduses loetletud andmed tuleks seega koguda kõigi inimeste kohta.

Oli üllatav, et matemaatikute Fischeri ja Kollo artiklis püütakse jätta muljet, justkui inimestelt küsitud andmed oleksid ebatäpsemad kui registriandmed. Põhjenduseks tuuakse, et kõiki inimesi ei saada loendusel kätte, inimesed ei taha loendusel õiget elukohta öelda ning luiskavad muudegi tunnuste kohta. Niisuguste väidete peale tahaks küsida, et miks kulutavad statistikaametid Eestis ja teistes riikides igal aastal palju miljoneid eurosid küsitlusuuringutele, kui inimeste vastuseid ei saa nende arvates uskuda? Miks soovitab meie statistikaamet kombineerida ka registripõhist loendust 60 000 inimese küsitlusuuringuga? Ja kuidas saab olla nii, et statistikaamet kasutab prooviloenduse usaldusväärsuse hindamise kriteeriumina just küsitlusuuringutes kogutud andmetega kõrvutamist?

Seaduse järgi on loendus kõikne uuring ning seaduses loetletud andmed tuleks seega koguda kõigi inimeste kohta.

Muidugi satub küsitlustele vastajate sekka alati teadlikult valevastuste andjaid ja «naljamehi», kuid nende hulk ja sellest tulenev viga on suurusjärgu võrra väiksem kui näiteks registris oleva elukoha ja sellest tulenevalt leibkonnaliikmete andmete puhul. Samuti on selline «naljameeste» viga juhuslik ega põhjusta andmete süstemaatilist moonutust. Lugupeetud matemaatikud on artiklis ka ise tunnistanud, et elukohaandmed on kuni 20 protsendi inimeste puhul registris valed. Leibkonnaliikmete andmete veamäärast nad targu ei kirjuta. See veamäär kipub olema suurem kui elukohaandmetel, sest ühe inimese ebaõige elukoht mõjutab enamasti kaht leibkonda, nii selle suurust ja koostist, aga ka näiteks seda, kui palju tube või elamispinda ühe isiku kohta jagub.

Matemaatikutele näib, et kuna kõikne loendus ei aitaks registriandmeid paremaks teha, sest loendusel saadud andmed on konfidentsiaalsed, aga igapäevase elu ja teenuste osutamise aluseks on registrid, pole rahvastiku tegelikku paiknemist vajagi loendusel uurida. Siinjuures jääb neil tähelepanuta, et registritel ja loendusel on täiesti erinevad eesmärgid - loenduse peamine eesmärk on saada teada rahvastiku tegelik olukord, registrite eesmärk on aga hallata teenuste osutamist – koolikohad, toetused, dokumendid jne.

Neid kahte funktsiooni on teoreetiliselt võimalik, kuid praktiliselt pea võimatu ühitada. Täna on meil omavalitsuste vahel konkurents, inimesed valivad ise, kuhu end registreerida ja maksta makse, et saada vastu teenuseid. See sunnib omavalitsusi pingutama inimeste heaolu nimel, mis on positiivne. Loogiline oleks valida loenduse meetod reaalse olukorra järgi, mitte unistada sellest, kuidas elu ja inimeste käitumist registrite jaoks sobivaks painutada.

Fischeri ja Kollo poolt keeleoskuse määratlemise kohta väidetuga ei saa samuti nõustuda. Formaalse keeleõppe kogemus, millest nemad lähtuda soovitavad, ei tähenda, et inimene keelt oskab. Samas informaalne õpe, olgu või e-õppe vormis, võib anda tegelikult hea keeleoskuse. Kui vaadata eelmise loenduse tulemusi, siis vaatamata formaalse keeleõppe läbimisele hindas ligi kolmandik mitte-eesti emakeelega noori enda eesti keele oskuse nii kehvaks, et jättis selle loendusel märkimata.

Vahel öeldakse naljatledes, et on väikesed valed, suured valed ja statistika. 

Kui me oleks lähtunud registri andmetest, oleksime nende puhul näinud ilmselt sajaprotsendilist riigikeele oskust. Kuna keeleoskus muutub ka pärast formaalse tunnistuse saamist, on selle küsimine inimestelt endilt kindlasti jätkuvalt põhjendatud ja asjakohane. Pealegi on meil olemas andmed üksnes väikese osa (hinnanguliselt umbes viiendiku) elanikkonna kohta, kes on alates nullindatest hariduse omandanud või riiklikke keeleeksameid sooritanud.

Matemaatikud võtavad oma loo kokku väga õige küsimusega: «oleme lõpuks valiku ees: milline lähenemine viib meid lähemale tõele?», pidades sellega silmas loenduse korraldust, ning leiavad, et: «Seda vastust ei anna vaidlus ega eri arvamuste kõrvutamine, vaid konkreetne uuring, näiteks prooviloendus.» Hiljuti lõppenud teine prooviloendus paraku sellele küsimusele vastava uuringu mõõtu välja ei anna.

Põhjuseks on prooviloenduse hindamise kriteeriumid, mis piirduvad hinnangu andmisel üldjaotustega ning võimaldavad nii mööda vaadata suurtest ja süstemaatilistest vigadest. Vähe sellest, andmete tegelikkusele vastavus määrab vaid neljandiku loendustunnuse kvaliteedi koondhindest – sama suur kaal on omistatud näiteks ka sellele, mitu päeva jääb loendusmomendi ja andmekogust loenduse jaoks andmete võtmise vahele.

Vahel öeldakse naljatledes, et on väikesed valed, suured valed ja statistika. Rahvaloenduse puhul on täna reaalne oht, et nii võibki minna. Loodetavasti jätkub sel nädalal loenduse teemat arutaval valitsusel otsustavaust nõuda riikliku statistika seaduse täitmist ehk kõikset loendust, mille käigus kogutakse andmeid, mitte ei töödelda ümber registrites olemasolevat. Ainult nii saame teada, milline on olnud Eesti viimase 10 aasta rahvastiku- ja ühiskonnaareng. Ainult nii saame tegelikkust usaldusväärselt peegeldava loenduse, mis aitab töötada välja poliitikaid, et seda arengut suunata.

Kommentaarid
Copy
Tagasi üles