425 Works

Militerm v20180801

Tiina Soon
Militerm on sõjanduse, julgeoleku- ja kaitsepoliitika terminite andmebaas, kus saab märksõnu otsida eesti, inglise, prantsuse ja saksa keeles. Eesti- ja ingliskeelsete terminite juures on ka oskussõnade definitsioonid.

Esterm v20180302

Tiina Soon
Esterm on Eesti Keele Instituudi mitmekeelne terminibaas, mis sisaldab peamiselt Euroopa Liidu ja Eesti Vabariigi õigusaktide termineid. Terminibaas koondab üle 50 valdkonna terminoloogiat.

Emotsioonidetektor Google Chrome'i laiendusena

Hille Pajupuu
Emotsioonidetektoriga saab hinnata veebikirjutise emotsionaalset mõju. Selleks tuleb esmalt emotsioonidetektor installeerida, seejärel välja valida tekst ja klikata ikoonile. Detektor annab tekstile üldhinnangu: neutraalne, positiivne, negatiivne või vastuoluline. Tekstis märgitakse ära emotsioonitaju mõjutavad võtmesõnad ning ortograafiliste tekstilõikude emotsionaalsus (lilla - negatiivne, roheline - positiivne, kollane - vastuoluline, hall - ekstreemne).

Seto sõnastik

Indrek Hein
Esimene seto veebisõnastik sisaldab üle 6000 märksõna, mida saab otsida nii murdekeelse kirjapildi kui ka lihtsustatud ja ilma diakriitiliste märkideta variandi järgi.

e-keelenõu

Tõnis Nurk
Ühispäring keeleinfot sisaldavatest allikatest. Portaali peaeesmärgiks on pakkuda lõpptarbijale intuitiivselt lihtsal viisil vastuseid keelealastele küsimustele, nt normingukohasus, vasted teistes keeltes, selgitused, etümoloogia, kasutusinfo jms.

Subtiitrite helindaja

Meelis Mihkla
Subtiitrite helindamise ning tele-eetrisse edastamise tarkvaralahenduse eesmärk on ETVs kasutatavate subtiitrifailide alusel kõnesüntesaatoriga helifailide genereerimine ning eraldi helikanalis digitelevisiooni eetrisse edastamine. Ühisprojekti on kaasatud Eesti Keele Instituut (EKI), Eesti Rahvusringhääling (ERR) ja Eesti Pimedate Liit (EPL).

e-keelenõu

Tõnis Nurk
Ühispäring keeleinfot sisaldavatest allikatest. Portaali peaeesmärgiks on pakkuda lõpptarbijale intuitiivselt lihtsal viisil vastuseid keelealastele küsimustele, nt normingukohasus, vasted teistes keeltes, selgitused, etümoloogia, kasutusinfo jms.

Ersa prosoodia korpus

Pärtel Lippus
Ersa sõnaprosoodia uurimiseks kogutud andmestik. Sisaldab raamlauses loetud testsõnu 8 keelejuhilt. Iga keelejuht luges 100 lauset, iga lause sisaldas testsõna kord lause keskel, kord lause lõpus. Vt lähemalt: Lehiste, I., Aasmäe, N., Meister, E., Pajusalu, K., Teras, P., & Viitso, T.-R. (2003). Erzya prosody. Helsinki: Finno-Ugrian Society.

Kõneravi harjutuste mallid

Hannalore Taal
Harjutuste​ ​mallid,​ ​mille​ ​peale​ ​on​ ​logopeedidel​ ​võimalik​ ​luua​ ​kõneravi.ee keskkonda​ ​uusi​ ​harjutusi

etTenTen korpus

Heiki-Jaan Kaalep
etTenTen korpus on internetist alla laetud eestikeelsete veebilehtede korpus. Korpuses on 270 miljonit sõna 686 000 veebilehelt. Algmaterjal Korpuse tekstid korjas internetist ja teisendas utf-8 kodeeringus teksti kujule Vit Suchomel. Veebirobotiga laeti alla 1 173 702 veebilehte, kusjuures juba olemas olevate lehtede koopiad jäeti kõrvale; kõrvale jäeti ka lehed, mis on esindatud Eesti kirjakeele koondkorpuses. (http://www.cl.ut.ee/korpused/segakorpus/). Kasutati Jan Pomikaleki doktoritöö käigus loodud programme jusText ja onion (code.google.com/p/justext, code.google.com/p/onion)

Corpus of Estonian fiction D

Kadri Muischnek
A text corpus containing Estonian fiction texts from 1990. onwards, 5,6 million words.

Mitmikute sagedusloendid

Kadri Muischnek
Lemmade ja sõnavormide mitmikute (n-grammide) sagedusloendid Tasakaalus korpuse põhjal

Eesti keele A1-C1 õpikute korpus 2018

Jelena Kallas & Kristina Koppel
Korpus sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute tekstidest eraldatud täislauseid. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Kõik korpuse laused on keeletaseme piirides unikaalsed. Korpuse aluseks on Eesti keele A1-C1 õpikute korpus 2017, mis koosnes ca 200 000 sõnest ja ca 24 000 lausest. Eesti keele A1-C1 õpikute korpuse 2017 sisust ekstraheeritud täislausetest loodigi Eesti keele A1-C1 õpikute korpus 2018, millega kaasnes käsitsi kontroll (sisse jäeti...

Mallipõhine faktituletaja

Sven Laur
Tarkvarakomponent suudab vabatekstidest õppida erinevaid seoseid ning nende abil eraldada struktureeritud infot. Seosed võivad olla lihtsad nagu isikunimed ja organisatsioonid või keerulisemad nagu firmade peakontorite asukohad. Meetod vajab sisendiks korpust, milles on meid huvitav seos märgendatud. Seejärel leitakse automaatselt sobivad mallid ja koostatakse mudel, mis antud seost võimalikult hästi tuvastaksid. Tulemusena saame märgendamata vabatekstidest leida uusi seosele vastavaid näiteid.

Estonian Wordnet (kb72-LAST)

Heili Orav & Kadri Vare
Eesti Wordnetis (versioon 72) on praeguse seisuga (oktoober 2015) 74 720 mõistet, milles sõnu 101 761, semantilisi suhteid 239 719 ja seoseid Princetoni Wordnetiga (1.5) 108 202. Kõik mõisted on varustatud vähemalt ühe keelesisese suhtega ja vähemalt ühe ILI-suhtega.

Maailma maade nimed

Tiina Laansalu
Loendi aluseks on Emakeele Seltsi keeletoimkonna poolt 1996. aastal läbi arutatud väliskohanimede (sh riiginimede) kirjapilt keelekorraldussõnaraamatu kohanimelisas. Loendit on hiljem pidevalt täpsustatud ja ajakohastatud. Loend on ühtlustatud standardis ISO 3166-1 antud valikuga.

Kõnesünteesi kõnekorpus Eva

Liisi Piits
Tulemust on kasutatud eestikeelsete sünteeshäälte loomiseks, korpus on kõnesünteesi akustiliseks baasiks.

Eesti-vene sõnaraamat

Jelena Kallas
Eesti-vene sõnaraamat sisaldab tänapäeva eesti kirjakeele põhisõnavara, hulgaliselt erialatermineid, aga ka keeles kinnistunud uut ja moodsat ainest. Sõnavaliku aluseks on õigekeelsussõnaraamatu märksõnastik ja Eesti Keele Instituudis koostatud kirjakeele seletussõnaraamat. Eesti näitestik põhineb paljuski kirjakeele seletussõnaraamatul.

Eesti keele A1-C1 õpikute korpus 2018

Jelena Kallas & Kristina Koppel
Korpus sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute tekstidest eraldatud täislauseid. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Kõik korpuse laused on keeletaseme piirides unikaalsed. Korpuse aluseks on Eesti keele A1-C1 õpikute korpus 2017, mis koosnes ca 200 000 sõnest ja ca 24 000 lausest. Eesti keele A1-C1 õpikute korpuse 2017 sisust ekstraheeritud täislausetest loodigi Eesti keele A1-C1 õpikute korpus 2018, millega kaasnes käsitsi kontroll (sisse jäeti...

Corpus of Estonian newspaper texts D

Kadri Muischnek
Corpus of Estonian newspaper texts, 182 million words Markup: TEI P5 XML Encoding: UTF8

Tilde masintõlge

Margit Krum
Lõppkasutajatele on lihtsalt ja tasuta kättesaadavad (veebilehitseja kaudu http://www.masintõlge.ee ja http://www.masintolge.ee) parima kvaliteediga masintõlkeprogrammid eesti keelest kultuuriliselt, majanduslikult olulistesse keeltesse (inglise, vene, soome, saksa, prantsuse) ja tagasi eesti keelde.

Estonian Wordnet (kb71-STABLE)

Heili Orav
Eesti Wordnetis (versioon 71) on praeguse seisuga (veebruar 2015) u 73 000 mõistet, milles sõnu u 98 700, semantilisi suhteid üle 230 000 ja ingliskeelseid suhteid üle 105 000. Kõik mõisted on varustatud vähemalt ühe keelesisese suhtega ja vähemalt ühe ILI-suhtega.

Registration Year

 • 2015
  82
 • 2016
  90
 • 2017
  71
 • 2018
  82
 • 2019
  99

Data Centers

 • Keeleressursid. The Center of Estonian Language Resources
  425