Andmed on igal pool. Suure osa neist moodustavad numbrite, piltide, videomaterjali, helisalvestiste jms kõrval kõiksugust teksti sisaldavad andmed ehk tekstiandmed, näiteks kirjandusteosed, uudised, seadused, veebifoorumid, klientide kirjalik tagasiside, blogid, sõnumid, tviidid jne. Tekstiandmete heast kättesaadavusest on võimalik võita väga erinevate valdkondade esindajatel.

Keeleuurijad saavad huvipakkuva keelenähtuse uurimisel rakendada erinevaid grammatilise analüüsi vahendeid (nt morfoloogiline või süntaksianalüsaator), mis tuvastavad sõnaliike, algvorme, lauseliikmeid jne. Ometi pole grammatilise analüüsi vahendid vaid keeleteaduslikuks kasutamiseks – ka näiteks sõnapilvede koostamisel aitab algvormide leidja ehk lemmatiseerija vältida olukorda, et neis ei korduks ühe sõna erinevad vormid (nt keel, keele, keelt). Sõnapilved saab veelgi paremaks, kui eemaldada sealt sisutühjad sõnad – ka see on automaatselt tehtav.

Grammatiline analüüs on paljude teiste tekstianalüüsi ülesannete lahendamisel silmale nähtamatuks abimeheks. Üheks seesuguseks on näiteks meelestatuse analüüs, mis võimaldab erinevaid tekstilõike automaatselt kategoriseerida positiivseks, negatiivseks ja neutraalseks (või enamateks klassideks). Näiteks saavad ettevõtted kasutajate nii otse kui sotsiaalmeedias antud tagasiside põhjal kiire ülevaate inimeste hoiakutest nende toote/teenuse suhtes. Niisamuti on tekstikaeve abil võimalik klassifitseerida näiteks e-kirju nendes sisalduva teema järgi ning seejärel automaatselt suunata kiri inimeseni, kes sellele vastata oskab. Tekstianalüüsi rakendatakse ka spämmikirjade filtreerimisel, vihakõne tuvastamisel, küberkuritegevuse ja terviseriskide ennetamisel ja mitmel pool mujal. Need üksikud näited sellest, kuidas tekstikaeve saab enda või ühiskonna heaks tööle panna, võiks inspireerida neid, kes pole oma tekstiandmetega veel midagi peale hakanud.