425 Works

Inglise-eesti meresõnaraamat

Indrek Hein
Sisaldab üle 30 000 märksõna. Peale merenduslike tavaterminite leiab sõnaraamatust ka purjelaevu, puulaevu, merekaubandust, mereõigust, merekindlustust, konteinervedusid, kalandust, sõjalaevastikku, raadiolokatsiooni, hüdromehaanikat, okeanograafiat, purjesporti jms puutuvaid sõnu.

Kollokatsioonid

Kadri Muischnek
Kollokatsioonide leidja abil saab leida vastavalt päringule üksikuid kollokatsioone, kuid selleks, et teada saada kollokatsioonide pingerida, ongi abiks siin esitatud sagedusloendid kollokatsioonide leidja alusmaterjalist. Tänu pingeridadele on võimalik vaadelda valitud statistiku või lihtsalt kollokatsioonipaari sageduse alusel järjestatud 5000 sagedasemat/olulisemat Tasakaalus korpuses leiduvat kollokatsioonipaari, mis esinesid korpuses kümme või enam korda. Esitatud on sarnaselt kollokatsioonide leidja pakutud võimalustega teatud sõnaliiki kuuluva lemma sagedasemad kollokatsioonid teise lemmaga, teatud sõnaliiki kuuluva sõnavormi sagedasemad kollokatsioonid teise sõnavormiga ja teatud...

Osalausestaja

Siim Orasmaa
Osalausepiiride tuvastaja

TimeML annotated corpus of Estonian newspaper articles

Siim Orasmaa
Estonian TimeML Annotated Corpus (ver 2.0) The corpus consists of 80 Estonian newspaper articles (approx. 22,000 word tokens) with manually corrected morphological and dependency syntactic annotations, and with manually added temporal semantic annotations. This corpus is a subcorpus of Estonian Dependency Treebank ( https://github.com/EstSyntax/EDT ). Temporal semantic annotations are based on an adaption of the TimeML specification ( http://www.timeml.org/ ), and consist of EVENT, TIMEX and TLINK annotations. The creation process of the corpus, along...

Tekstide helindaja

Indrek Hein
Heliraamatute genereerija Vox Populi, mis kasutab EKI kõnesünteesi ja hääldusbaasi, et pikemaid tekste helindada.

Eesti-prantsuse paralleelkorpus

Madis Jürviste
Aligned parallel translation corpus containing 65 million words (including both languages).

Eesti Wordnet (2.0 beeta)

Heili Orav & Kadri Vare
Esimene XML versioon Eesti Wordnetist.

Eesti keele spontaanse kõne foneetiline korpus v.1.0.4

Pärtel Lippus
The aim of the corpus is to compile a large amount of quality recordings of spontaneous Estonian and segment it phonetically on different levels. The project started in autumn 2006. The total size of the corpus is approximately 90 hours of speech from 130 speakers with different dialectological and social background. Speakers are from different age groups. They are asked to participate with face-to-face invitation and they are aware of the purpose of the recordings....

Eesti Speechdat andmebaas

Einar Meister
Korpus SpeechDat formaadis.

Eesti keele käsiraamat

Kristiina Ross & Mati Erelt
Pakub üldharivaid teadmisi eesti kirjakeele grammatika ja sõnavara ehituse kohta. Esitus on võimalikult lihtne, välditud on tavakasutajale tarbetuid üksikasju. Praktiline abivahend kirjakeele korrektseks kasutamiseks.

Võru murde HTS-kõnesüntesaator

Meelis Mihkla
Loeb ette võrumurdelist teksti.

Eesti keele sõnapered - indeks

Indrek Hein & Silvi Vare
Indeks võimaldab teada saada, kas otsitav sõna esineb sõnaperede raamatus ning millis(t)es sõnapere(de)s ja millises plokis ta täpsemalt asub. Otsida on võimalik nii elektroonilise indeksi kaudu päringuaknas kui ka pereliikmete loenditest pdf-formaadis. Vajadusel on võimalik sõna olemasolu kontrollida ka perepeade pdf-loendist.

Liivi-saksa sõnaraamat

Margit Langemets
Sjögren-Wiedemanni sõnaraamatu liivi-saksa veebiversioon.

Eesti Keele Instituudi fonoteek

Liis Ermus
Eesti Keele Instituudi fonoteegi leheküljel saab kuulata eesti murrete, soome-ugri keelte ja väliseesti keele helinäiteid.

Militerm

Tiina Soon
Militerm on sõjanduse, julgeoleku- ja kaitsepoliitika terminite andmebaas, kus saab märksõnu otsida eesti, inglise, prantsuse ja saksa keeles. Eesti- ja ingliskeelsete terminite juures on ka oskussõnade definitsioonid.

EstNLTK tokenizer

Sven Laur
Word tokenizer from the Estonian NLTK toolkit

Eesti õigekeelsussõnaraamat ÕS 2006

Margit Langemets
See sõnaraamat on vananenud ning sobib kasutamiseks vaid teadustöös. Kehtivat keelenormi kajastab "Eesti õigekeelsussõnaraamat ÕS 2013" ÕS ajakohane versioon asub aadressil http://www.eki.ee/dict/qs/.

Eesti keele A1-C1 õpikute korpus 2018

Jelena Kallas & Kristina Koppel
Korpus sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute tekstidest eraldatud täislauseid. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Kõik korpuse laused on keeletaseme piirides unikaalsed. Korpuse aluseks on Eesti keele A1-C1 õpikute korpus 2017, mis koosnes ca 200 000 sõnest ja ca 24 000 lausest. Eesti keele A1-C1 õpikute korpuse 2017 sisust ekstraheeritud täislausetest loodigi Eesti keele A1-C1 õpikute korpus 2018, millega kaasnes käsitsi kontroll (sisse jäeti...

Eesti keele A1-C1 õpikute korpus 2017

Jelena Kallas & Kristina Koppel
Sisaldab korpusest „Eesti keele õpikute korpus A1–C1" eraldatud täislauseid. Korpus koosneb u 200 000 sõnest ja 24 000 lausest. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Laused on morfoloogiliselt märgendatud. Kõik korpuse laused on keeletaseme piirides unikaalsed.

MILITERM

Tiina Soon
MILITERM on sõjanduse, julgeoleku- ja kaitsepoliitika terminite andmebaas, kus saab märksõnu otsida eesti, inglise, prantsuse ja saksa keeles. Eesti- ja ingliskeelsete terminite juures on ka oskussõnade definitsioonid.

Eesti keele A1–C1 õpikute sisu korpus 2017

Jelena Kallas & Kristina Koppel
Sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute materjali. Korpuses on u 500 000 sõnet ning korpuses on märgendatud tekstiüksused (enamasti eristatakse harjutust, sõnavaraplokki ja suuremat seotud teksti), tekstilõigud (ühel real asuv tekst), laused ja osalaused . Korpus on morfoloogiliselt märgendatud. Korpuses on kaheksa õpikut: 1. Pesti, M., Ahi, H. (2015). E nagu Eesti: eesti keele õpik algajatele. Tallinn: Kiri-Mari Kirjastus. 2. Kitsnik, M., Kingisepp, L. (2002). Avatud uksed: eesti...

Kihnu sõnaraamat

Jüri Viikberg
„Kihnu sõnaraamat“ hõlmab sõnavara murdekeelest, mida kõneldakse Kihnus ja Manijal. Raamatusse on mahtunud enam kui 6000 sõna, lisaks veel valik isiku- ning kohanimesid. Märksõnade hulka on valitud nii Kihnule iseloomulikke iidseid sõnu kui ka neid, mis on murdekeelde tulnud alles viimastel kümnenditel. Sõnade tarvitamist hõlbustavad lisatud põhivormid ja näitelaused nii kihnu kui ka kirjakeeles. Sõnaraamatu on koostanud Reene Leas, Reti Könninge, Silvi Murulauk ja Ellen Niit ning toimetanud Karl Pajusalu ja Jüri Viikberg. Sõnaraamat on...

Loengute korpus

Einar Meister
Korpus sisaldab akadeemiliste loengute ja suuliste konverentsiettekannete salvestisi.

Võru-eesti paralleelkorpuse kasutajaliides

Sulev Iva
Otsida saab mitu sõna korraga, hetkel miinusmärki väljajättena ei toetata.Vaikimisi otsitakse mitte terveid sõnu vaid sõnesid pikemate sõnede sees.

Registration Year

  • 2015
    82
  • 2016
    90
  • 2017
    71
  • 2018
    82
  • 2019
    99

Data Centers

  • Keeleressursid. The Center of Estonian Language Resources
    425