71 Works

Eesti keele käsiraamat

Kristiina Ross & Mati Erelt
Pakub üldharivaid teadmisi eesti kirjakeele grammatika ja sõnavara ehituse kohta. Esitus on võimalikult lihtne, välditud on tavakasutajale tarbetuid üksikasju. Praktiline abivahend kirjakeele korrektseks kasutamiseks.

Võru murde HTS-kõnesüntesaator

Meelis Mihkla
Loeb ette võrumurdelist teksti.

Eesti keele sõnapered - indeks

Indrek Hein & Silvi Vare
Indeks võimaldab teada saada, kas otsitav sõna esineb sõnaperede raamatus ning millis(t)es sõnapere(de)s ja millises plokis ta täpsemalt asub. Otsida on võimalik nii elektroonilise indeksi kaudu päringuaknas kui ka pereliikmete loenditest pdf-formaadis. Vajadusel on võimalik sõna olemasolu kontrollida ka perepeade pdf-loendist.

Liivi-saksa sõnaraamat

Margit Langemets
Sjögren-Wiedemanni sõnaraamatu liivi-saksa veebiversioon.

Eesti Keele Instituudi fonoteek

Liis Ermus
Eesti Keele Instituudi fonoteegi leheküljel saab kuulata eesti murrete, soome-ugri keelte ja väliseesti keele helinäiteid.

Militerm

Tiina Soon
Militerm on sõjanduse, julgeoleku- ja kaitsepoliitika terminite andmebaas, kus saab märksõnu otsida eesti, inglise, prantsuse ja saksa keeles. Eesti- ja ingliskeelsete terminite juures on ka oskussõnade definitsioonid.

EstNLTK tokenizer

Sven Laur
Word tokenizer from the Estonian NLTK toolkit

Eesti keele A1-C1 õpikute korpus 2017

Jelena Kallas & Kristina Koppel
Sisaldab korpusest „Eesti keele õpikute korpus A1–C1" eraldatud täislauseid. Korpus koosneb u 200 000 sõnest ja 24 000 lausest. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Laused on morfoloogiliselt märgendatud. Kõik korpuse laused on keeletaseme piirides unikaalsed.

MILITERM

Tiina Soon
MILITERM on sõjanduse, julgeoleku- ja kaitsepoliitika terminite andmebaas, kus saab märksõnu otsida eesti, inglise, prantsuse ja saksa keeles. Eesti- ja ingliskeelsete terminite juures on ka oskussõnade definitsioonid.

Eesti keele A1–C1 õpikute sisu korpus 2017

Jelena Kallas & Kristina Koppel
Sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute materjali. Korpuses on u 500 000 sõnet ning korpuses on märgendatud tekstiüksused (enamasti eristatakse harjutust, sõnavaraplokki ja suuremat seotud teksti), tekstilõigud (ühel real asuv tekst), laused ja osalaused . Korpus on morfoloogiliselt märgendatud. Korpuses on kaheksa õpikut: 1. Pesti, M., Ahi, H. (2015). E nagu Eesti: eesti keele õpik algajatele. Tallinn: Kiri-Mari Kirjastus. 2. Kitsnik, M., Kingisepp, L. (2002). Avatud uksed: eesti...

Kihnu sõnaraamat

Jüri Viikberg
„Kihnu sõnaraamat“ hõlmab sõnavara murdekeelest, mida kõneldakse Kihnus ja Manijal. Raamatusse on mahtunud enam kui 6000 sõna, lisaks veel valik isiku- ning kohanimesid. Märksõnade hulka on valitud nii Kihnule iseloomulikke iidseid sõnu kui ka neid, mis on murdekeelde tulnud alles viimastel kümnenditel. Sõnade tarvitamist hõlbustavad lisatud põhivormid ja näitelaused nii kihnu kui ka kirjakeeles. Sõnaraamatu on koostanud Reene Leas, Reti Könninge, Silvi Murulauk ja Ellen Niit ning toimetanud Karl Pajusalu ja Jüri Viikberg. Sõnaraamat on...

Mulgi sõnastik

Tiina Laansalu
Mulgi veebisõnastikust saab sõnu otsida nii märksõna (murdekuju), kirjakeelse vaste (tähenduse) kui ka stiili järgi. Märksõnade juurde on enamasti lisatud ka näitelaused ning viited teistele sama või lähedase tähendusega sõnadele.

Tekstide helindaja ja heliraamatute genereerija

Meelis Mihkla
Teisendab txt- ja html-formaadis tekstid helifailideks ja lisab ePub3 formaadis e-raamatule sünteeskõnes kuulatavad audiofailid. Helindaja ja genereerija Vox Populi koosneb kahest komponendist – tekstide helindajast ja hääldussõnastikust. Nende kahe koostöös ja Eest Keele Instituudi kõnesünteesi kaasates saab kasutaja saadetud tekstifailist sünteeshäälega audiofail.

Mulgi sõnastik

Tiina Laansalu
Mulgi veebisõnastikust saab sõnu otsida nii märksõna (murdekuju), kirjakeelse vaste (tähenduse) kui ka stiili järgi. Märksõnade juurde on enamasti lisatud ka näitelaused ning viited teistele sama või lähedase tähendusega sõnadele.

EstNLTK sentence splitting

Sven Laur
Estonian NLTK toolkit - detecting sentence boundaries

Eesti-mari sõnaraamat

Sven-Erik Soosaar
Sõnaraamat sisaldab umbes 9800 märksõna. Sõnaraamatu sihtgrupiks on mari keelest ja kultuurist huvitatud eestlased ning eesti keelt õppivad marid. Sõnastiku näitelaused ja -fraasid on abiks nii keeleõppijatele kui ka tõlkijatele. Kuigi mari keelel on kaks kirjakeelt – niidumari keel ja mäemari keel –, sisaldab sõnaraamat vaid niidumari vasteid, sest enamasti peetakse mari keelest rääkides silmas just niidumari keelt. Sõnaraamat on kättesaadav ainult elektrooniliselt.

EstNLTK tokenizer

Sven Laur
Word tokenizer from the Estonian NLTK toolkit

Eesti viipekeele - eesti keele veebisõnastik

Margit Langemets
Sõnastik sisaldab üle 4000 märksõna ning võimaldab otsingut eestikeelse sõna või eesti viipekeele viipe alusel. Sõnastik on mõeldud nii eesti viipekeele õppijatele kui ka eesti viipekeele kasutajatele eesti keele õppimiseks.

Vanema eestikeelse algupärase ilukirjanduse kogu

Marin Laak & Vilve Asmer
Eesti vanema ilukirjanduse tekstide kogu veebikeskkonnas "Kreutzwaldi sajand. Eesti kultuurilooline veeb." Kollektsioonis elektrooniliselt taasavaldatud raamatud põhinevad olulisemate Eesti autorite aastatel 1854-1944 ilmunud esmatrükkidel. Tekstid on esitatud keeleparandusteta, kuid tehniliselt redigeeritud. "Kreutzwaldi sajand. Eesti kultuurilooline veeb" esitab raamatud kolmes versioonis: 1) skaneeritud pildina originaalesmatrükist, 2) html-versioonina, mille leheküljed vastavad trükitud raamatu lehekülgedele, 3) allalaetava e-pubina. Siinne tekstikorpus sisaldab valikut veebikeskkonnas saadaval olevatest raamatutest, mis on teisendatud tekstifailideks. Tekstifailidele on igaks juhuks lisatud ka originaalfailid. HTML-failidest teisendatud...

Eesti Keele Instituudi mõisteline sõnavarakartoteek

Tiina Laansalu
Mõistelise sõnavarakartoteegi idee pärineb Andrus Saarestelt. Kogumistöö algas 1920ndatel ja kestis 1930ndate keskpaigani. Mõistelises kogus on sõnavara jaotatud mitte kihelkondade, vaid mõistete järgi. Materjali on kogutud järgmiste valdkondade kohta: abielu, aeg, aiandus, armuelu, ehitused, heinategu, ilmastik, inimene, kalandus, karjandus, keha, kehakatted, käsitöö, liiklus, linatöö, loomastik, maapõuevarad, maastik, merelinnud, merendus, mesindus, metsandus, mõõdud, mängimine, märk, nõidus, nõud, puutöö, põllundus, suguvõsa, sõidukid, taevalaotus, tahtmine, taimestik, tervis, toitlus, tuli, tundeelu, tunnetamine, töö, usund, veekogud, veesõidukid, viin, vill, värv,...

EstNLTK morphological analysis

Sven Laur
Estonian NLTK toolkit - morphological analysis for Estonian. Uses Vabamorf tagset. Takes unannotated text as input.

Maailma maade nimed

Tiina Laansalu
Loendi aluseks on Emakeele Seltsi keeletoimkonna poolt 1996. aastal läbi arutatud väliskohanimede (sh riiginimede) kirjapilt keelekorraldussõnaraamatu kohanimelisas. Loendit on hiljem pidevalt täpsustatud ja ajakohastatud. Loend on ühtlustatud standardis ISO 3166-1 antud valikuga.

Estonian Wordnet (kb71-LAST)

Heili Orav
The atom of a wordnet-type thesaurus is a synonym set (also called a synset), which is a set containing all the synonymous words or multi-word units that express the same concept. All words in a synset belong into the same part of speech. THIS IS THE NEWEST VERSION

Eesti Wordnet (2.0 beeta)

Heili Orav & Kadri Vare
Esimene XML versioon Eesti Wordnetist.

Vanema eestikeelse algupärase ilukirjanduse kogu

Marin Laak & Vilve Asmer
Eesti vanema ilukirjanduse tekstide kogu veebikeskkonnas "Kreutzwaldi sajand. Eesti kultuurilooline veeb." Kollektsioonis elektrooniliselt taasavaldatud raamatud põhinevad olulisemate Eesti autorite aastatel 1854-1944 ilmunud esmatrükkidel. Tekstid on esitatud keeleparandusteta, kuid tehniliselt redigeeritud. "Kreutzwaldi sajand. Eesti kultuurilooline veeb" esitab raamatud kolmes versioonis: 1) skaneeritud pildina originaalesmatrükist, 2) html-versioonina, mille leheküljed vastavad trükitud raamatu lehekülgedele, 3) allalaetava e-pubina. Kui kontakteerute ressursi haldajatega, siis võite teadusotstarveteks kasutamiseks saada tekstikorpuse. See sisaldab valikut veebikeskkonnas saadaval olevatest raamatutest, mis on teisendatud tekstifailideks....

Registration Year

  • 2017
    71

Data Centers

  • Keeleressursid. The Center of Estonian Language Resources
    71