441 Works

Eesti Keele Instituudi mõisteline sõnavarakartoteek

Tiina Laansalu
Mõistelise sõnavarakartoteegi idee pärineb Andrus Saarestelt. Kogumistöö algas 1920ndatel ja kestis 1930ndate keskpaigani. Mõistelises kogus on sõnavara jaotatud mitte kihelkondade, vaid mõistete järgi. Materjali on kogutud järgmiste valdkondade kohta: abielu, aeg, aiandus, armuelu, ehitused, heinategu, ilmastik, inimene, kalandus, karjandus, keha, kehakatted, käsitöö, liiklus, linatöö, loomastik, maapõuevarad, maastik, merelinnud, merendus, mesindus, metsandus, mõõdud, mängimine, märk, nõidus, nõud, puutöö, põllundus, suguvõsa, sõidukid, taevalaotus, tahtmine, taimestik, tervis, toitlus, tuli, tundeelu, tunnetamine, töö, usund, veekogud, veesõidukid, viin, vill, värv,...

Segakorpus: Riigikogu ver.2.0

Kadri Muischnek
Riigikogu korpus. TEI P5 XML märgendus, UTF8 kodeering. Morfoloogiline analüüs ja ühestamine, automaatselt tehtud.

Eesti keele assotsiatsioonisõnastik

Ene Vainik
Veebisõnastik, mis esitab eesti keele sõna-assotsiatsioone nende tugevuse kahanevas järjekorras. Saadaval nii absoluutsagedused kui tugevusprotsent. 1296 märksõna, 37602 vastust. Psühholingvistiliste katsete tulemused (2016-2018), keskmine vastuste arv 300. Võimalik tulemusi filtreerida vastajate soo, ea ning hariduse alusel. Päringud võimalikud nii märksõnade kui vastuste väljal, sõnastik on varustatud siselinkidega, kirjelduse ja kasutusjuhendiga.

Eesti keele assotsiatsioonisõnastik

Ene Vainik
Veebisõnastik, mis esitab eesti keele sõna-assotsiatsioone nende tugevuse kahanevas järjekorras. Saadaval nii absoluutsagedused kui tugevusprotsent. 1296 märksõna, 37602 vastust. Psühholingvistiliste katsete tulemused (2016-2018), keskmine vastuste arv 300. Võimalik tulemusi filtreerida vastajate soo, ea ning hariduse alusel. Päringud võimalikud nii märksõnade kui vastuste väljal, sõnastik on varustatud siselinkidega, kirjelduse ja kasutusjuhendiga.

Eesti keele sõna-assotsiatsioonide andmebaas

Ene Vainik
Relatsiooniline andmebaas MS Office Accessi vormingus. Tabelid üksikvastuste kohta (ligi 400000 kirjet), seostatud tabelitega stiimulite, vastajate, ning vastajate (414) parameetrite (iga, sugu, haridus, elukoht, emakeel, amet, käelisus) kohta. Tabelite andmeväljad sisu osas kirjeldatud. Sisaldab valmis päringuid sõnaliste andmete kokkuvõtetega. Andmeid eesti keele sõnaassotsiatsioonide kohta on kogutud 2016-2018 vabatahtlikelt kodanikuteaduse kampaania korras. 1296 märksõna¸keskmiselt 300 vastust märksõna kohta. Andmebaasis 40 000 erinevat vastusevarianti (sisaldab ka unikaalseid vastuseid). Konfidentsiaalne info on eemaldatud.

Eesti keele sõna-assotsiatsioonide andmebaas

Ene Vainik
Relatsiooniline andmebaas MS Office Accessi vormingus. Tabelid üksikvastuste kohta (ligi 400000 kirjet), seostatud tabelitega stiimulite, vastajate, ning vastajate (414) parameetrite (iga, sugu, haridus, elukoht, emakeel, amet, käelisus) kohta. Tabelite andmeväljad sisu osas kirjeldatud. Sisaldab valmis päringuid sõnaliste andmete kokkuvõtetega. Andmeid eesti keele sõnaassotsiatsioonide kohta on kogutud 2016-2018 vabatahtlikelt kodanikuteaduse kampaania korras. 1296 märksõna¸keskmiselt 300 vastust märksõna kohta. Andmebaasis 40 000 erinevat vastusevarianti (sisaldab ka unikaalseid vastuseid). Konfidentsiaalne info on eemaldatud.

Eesti ajakirjanduse korpus

Kadri Muischnek
Korpus sisaldab eesti ajalehti, 182 miljonit sõna. TEI P5 XML märgendus, UTF8 kodeering.

Liivi prosoodia korpus

Pärtel Lippus
Korpus koosneb 12 keelejuhi salvestustest, kes loevad liivikeelseid lauseid. Loend koosneb 102st lausest, kus igas lauses on üks testsõna osalause lõpus ja teine testsõna lause lõpus. Osa keelejuhte loeb sarnast lätikeelset sõnaloendit. Materjal kasutati liivi sõnarposoodia uurimiseks, uurimus on avaldatud: Lehiste, I., Teras, P., Ernštreits, V., Lippus, P., Pajusalu, K., Tuisk, T., & Viitso, T.-R. (2008). Livonian prosody. Helsinki: Suomalais-ugrilainen Seura.

Anafooride suhtes märgendatud Eesti sõltuvuspuude pank

Kaili Müürisep
Anafooride suhtes märgendatud korpuses on praegu ca 107000 sõna mahus tekste, milles on u 4200 märgendatud asesõna, millest u 3200 on ühendatud oma viitealusega, ülejäänud tuhandel asesõnal viitealus tekstis puudub. Tekstideks on ajalehetekstid ning üks teadustekst (ajakirja Eesti Arst 2004. aasta aastakäik). Märgendatud on järgmised asesõnad kõigis käändevormides ja nende viitealused: isikulised asesõnad (mina/ma, sina/sa, tema/ta, meie/me, teie/te, nemad/nad). Kokku on korpuses 1734 isikulist asesõna, neist 1320 on ühendatud viitealustega. näitav asesõna see esineb korpuses...

Suur eesti-prantsuse sõnaraamat

Madis Jürviste
A comprehensive bilingual general language translation dictionary (work in progress).

Eesti piiblitõlke ajalooline konkordants

Kristiina Ross
Andmebaasi eesmärk on pakkuda ülevaadet vaimuliku eesti keele kujunemisloost 17. sajandil ja 18. sajandi alguses. Andmebaas sisaldab tõlketekste ja nende põhjal koostatud sõnastikku ning võimaldab (valminud osades) otsinguid a) autorite või tekstide kaupa, b) kindla piiblikoha järgi ning c) tänapäevastatud märksõna järgi.

Suulise keele korpus

Andriela Rääbis
The Department of Estonian Language initiated the corpus of spoken Estonian in 1997. The corpus is compiled by the research group of Spoken Estonian (Tiit Hennoste, Airi Jansons, Liina Lindström, Andriela Rääbis, Olga Gerassimenko, Krista Strandson, Piret Toomet, Riina Vellerind). The corpus is transcribed by the transcription of conversational analysis (CA). Each tape is provided with a header that lists in all 44 situational factors that have been found to affect language use in the...

Süntaksi eeltöötlusmoodulid

Kaili Müürisep
Eeltöötlusmoodulid Eesti keele Koondkorpuse xml-märgendusega teadus- ja ajakirjandustekstide jaoks, teevad tekstid parserite jaoks sobivamale kujule ning (soovi korral) nummerdavad laused.

Väike murdesõnastik

Indrek Hein
Annab ülevaate eesti murdesõnavarast ja sõnade levikust.

UD Estonian ver.2.3

Kadri Muischnek & Kaili Müürisep
UD Estonian is a converted version of the Estonian Dependency Treebank (EDT), originally annotated in the Constraint Grammar (CG) annotation scheme, and consisting of genres of fiction, newspaper texts and scientific texts. The treebank contains 30,723 trees, 434,245 tokens.

Eesti keele käsiraamat

Kristiina Ross & Mati Erelt
Pakub üldharivaid teadmisi eesti kirjakeele grammatika ja sõnavara ehituse kohta. Esitus on võimalikult lihtne, välditud on tavakasutajale tarbetuid üksikasju. Praktiline abivahend kirjakeele korrektseks kasutamiseks.

Eesti-läti sõnaraamat

Indrek Hein & Margit Langemets
Kahesuunaline läti-eesti sõnaraamat, mis sisaldab ligi 47 000 märksõnaartiklit.

Kihnu sõnaraamat

Jüri Viikberg
„Kihnu sõnaraamat“ hõlmab sõnavara murdekeelest, mida kõneldakse Kihnus ja Manijal. Raamatusse on mahtunud enam kui 6000 sõna, lisaks veel valik isiku- ning kohanimesid. Märksõnade hulka on valitud nii Kihnule iseloomulikke iidseid sõnu kui ka neid, mis on murdekeelde tulnud alles viimastel kümnenditel. Sõnade tarvitamist hõlbustavad lisatud põhivormid ja näitelaused nii kihnu kui ka kirjakeeles. Sõnaraamatu on koostanud Reene Leas, Reti Könninge, Silvi Murulauk ja Ellen Niit ning toimetanud Karl Pajusalu ja Jüri Viikberg. Sõnaraamat on...

Norra-eesti sõnaraamat

Ülle Viks
Sisaldab u 19 000 eesti ja 21 000 norra märksõna, millele on lisatud grammatilised andmed ja hulgaliselt näiteid sõnade kasutamise kohta. Raamatus on ka lühiülevaated eesti ja norra keelest. Turid Farbregd, Sigrid Kangur, Ülle Viks. Norra-eesti : eesti-norra sõnaraamat. Eesti Keele Sihtasutus. Tallinn 1998, 2. trükk 2005 (3. trükk ilmub 2013).

Keelehoiakud Eesti keelekeskkondades 2015

Andres Karjus & Martin Ehala
Tartu Ülikooli uurimisprojekti Eesti keele kestlikkus avatud maailmas (EKKAM) tellimusel 2015. aasta kevadel Eestis läbi viidud keelehoiakuid puudutava küsimustiku vastused. Demograafiliselt tasakaalustatud valimis on 1006 vastajat vanuses 15-74. Küsimused hõlmavad vastajate demograafilist infot, keeleoskust, igapäevaseid keelevalikuid, keelehoiakuid, keelepoliitilisi vaateid. Küsimustikule oli võimalik vastata nii eesti kui vene keeles, vastavalt küsitletava valikule (ankeedi valik on andmestikus salvestatud). Andmestikus on 200 tunnust, millest suurema osa moodustavad küsimuste vastused, lisaks mõned küsimuste vastustest tuletatud tunnused. Andmestikuga kaasas on...

e-keelenõu

Tõnis Nurk
Ühispäring keeleinfot sisaldavatest allikatest. Portaali peaeesmärgiks on pakkuda lõpptarbijale intuitiivselt lihtsal viisil vastuseid keelealastele küsimustele, nt normingukohasus, vasted teistes keeltes, selgitused, etümoloogia, kasutusinfo jms.

Mitmikute sagedusloendid

Kadri Muischnek
Lemmade ja sõnavormide mitmikute (n-grammide) sagedusloendid Tasakaalus korpuse põhjal

Registration Year

  • 2015
    82
  • 2016
    90
  • 2017
    71
  • 2018
    82
  • 2019
    115