Päevatoimetaja:
Mart Raudsaar

Kaja Sõstra: statistika on teadus, mis baseerub andmete usaldusväärusel (1)

Kaja Sõstra, Statistikaameti juhtivanalüütik
Kaja Sõstra, Statistikaameti juhtivanalüütik Foto: Erakogu

Statistika aluseks olevate uuringute meetodid võib laias laastus jagada kolme rühma: loendused, valikuuringud ja andmekogudest, -registritest saadud andmete taaskasutamine. Igal meetodil on oma positiivsed ja negatiivsed küljed, aga ühtegi neist uuringumeetoditest ei saa kuulutada mõttetuks, nagu seda tegi Tiit Toomsalu oma artiklis, kirjutab Statistikaameti juhtivanalüütik Kaja Sõstra.

Loendus on ajalooliselt kõige vanem statistika tegemise meetod – teame näiteks piiblist lugu rahvaloendusest, mille ajal sündis Kristus. Seetõttu on loenduse metoodika kõige põhjalikumalt läbi töötatud ja ilmselt ka statistika kasutajatele kõige arusaadavam. Loenduse eeliseks on täpsus, sest küsitletud on kõiki või peaaegu kõiki inimesi või majapidamisi, selle puuduseks on aga kõrge hind.

Valikuuringute metoodikat on kasutatud ja arendatud juba üle 100 aasta. Alguses tekitas see lähenemine küll kahtlusi, aga tänaseks on valikuuring ennast igati õigustanud ja laialdaselt kasutusel. Valikuuringu eeliseks võrreldes loendusega on madalam hind, paindlikkus ja kiiremad tulemused. Puuduseks on tulemuste madalam täpsus ja andmetöötluse keerukus.

Viimastel kümnenditel on kõikjal Euroopas ja maailmas arendatud registriandmete, aga ka suurandmete kasutamise metoodikat. See on statistikas kõige uuem suund ja seetõttu ka kõige vähem praktiseeritud. Registrite kui andmeallika taaskasutuse eelisteks on ajakohasus ja kogu populatsiooni hõlmatus, miinusteks aga statistika jaoks vajalike tunnuste puudumine, definitsioonide erinevus ning sõltuvus õigusruumi muutustest. Kõige uuemaks suunaks statistika tegemisel on erinevate andmeallikate kombineerimine, et kasutada parimal viisil nende eeliseid ja kompenseerida puudusi.

Usaldusväärsed ja võrreldavad andmed

Võib tekkida küsimus, miks ei kasuta me registrite andmeid puhkudel, kus see oleks Tiit Toomsalu arvates ainumõeldav? Me ei saa ühte patta panna õunu ning apelsine ehk ainult palgasummast, mida on võimalik teada saada tulu- ja sotsiaalmaksu kuudeklaratsioonilt, jääb näiteks keskmise palga usaldusväärseks arvutamiseks väheks. Oluline on lisaks teada, millise tööaja eest palk välja maksti. Seda mõjutavad omakorda töökoormus ja -graafik, ületunnitöö ning töölt puudumised. Registritest saab tööaja komponentide kohta infot ainult osaliselt. Keskmist palka on sama metoodika alusel Eestis arvutatud juba aastaid, keskmise brutokuupalga usaldusvahemik on pluss-miinus üks protsent, mis on valikuuringu kohta väga kõrge usaldusväärsus.

Tagasi üles