493 Works

Corpus of Estonian scientific texts

Kadri Muischnek

Morphological Toolset for Estonian

Indrek Hein

Estonian Open Parallel Corpus

Martin Luts

Estonian Wordnet (kb69a-LAST)

Heili Orav

Corpus of Estonian newspaper texts

Kadri Muischnek

Corpus of the Proceedings of Estonian Parliament

Kadri Muischnek

Hariduse ja kasvatuse sõnaraamat

Indrek Hein
Sisaldab 4850 terminit mitmesugustelt hariduse ja kasvatuse aladelt: kasvatus ja areng, alusharidus, põhi- ja keskharidus, kutse- ja kõrgharidus, andragoogika, eripedagoogika jne. Igale eesti terminile on antud inglise, saksa, soome ja vene vaste ning enamasti ka seletus.

e-keelenõu

Tõnis Nurk
Ühispäring keeleinfot sisaldavatest allikatest. Portaali peaeesmärgiks on pakkuda lõpptarbijale intuitiivselt lihtsal viisil vastuseid keelealastele küsimustele, nt normingukohasus, vasted teistes keeltes, selgitused, etümoloogia, kasutusinfo jms.

Uudiste lugeja Androidis

Meelis Mihkla
Rakendus loeb eesti keeles ette värskeid uudiseid. Kasutajal on võimalik valida kolme sünteeshääle ja erinevate lugemiskiiruste vahel.

Eesti murrete sõnaraamat (24.—28. vihik; lõpetis—ninaõrs)

Tiina Laansalu
Eesti murrete sõnaraamat haarab võimalikult kogu murdesõnavara. Sõnu saadab häälikuline ja grammatiline iseloomustus, levik ning selgub sõnade tähendus. Näitelaused toovad esile murdesõnadega seotud tähenduslikke ja grammatilisi nähtusi.

Eesti keele sõnapered - indeks

Indrek Hein & Silvi Vare
Indeks võimaldab teada saada, kas otsitav sõna esineb sõnaperede raamatus ning millis(t)es sõnapere(de)s ja millises plokis ta täpsemalt asub. Otsida on võimalik nii elektroonilise indeksi kaudu päringuaknas kui ka pereliikmete loenditest pdf-formaadis. Vajadusel on võimalik sõna olemasolu kontrollida ka perepeade pdf-loendist.

Eesti Wordnet (kb73-VIIMANE)

Heili Orav & Kadri Vare
Eesti Wordnetis (versioon 73) on praeguse seisuga (märts 2016) 77 878 mõistet, milles sõnu 106 202, semantilisi suhteid 248 996 ja seoseid Princetoni Wordnetiga (1.5) 112 283. Kõik mõisted on varustatud vähemalt ühe keelesisese suhtega ja vähemalt ühe ILI-suhtega.

Eesti etümoloogiasõnaraamat

Margit Langemets
2012. aastal ilmunud „Eesti etümoloogiasõnaraamatu“ elektrooniline versioon. Sisaldab teavet eesti keele sõnatüvede päritolu ja sõnade omavaheliste päritoluseoste kohta (laenud, omatüved, tehistüved jm). Sisaldab „ÕS 2006“ sõnatüvede etümoloogiaid (v.a võõrsõnatüved).

etTenTen korpus, morfoloogiliselt ühestatud

Kadri Muischnek
etTenTen korpus on internetist alla laetud eestikeelsete veebilehtede korpus. Korpuses on 270 miljonit sõna 686 000 veebilehelt. vt veel http://www2.keeleveeb.ee/dict/corpus/ettenten/about.html Algmaterjal Korpuse tekstid korjas internetist ja teisendas utf-8 kodeeringus teksti kujule Vit Suchomel. Veebirobotiga laeti alla 1 173 702 veebilehte, kusjuures juba olemas olevate lehtede koopiad jäeti kõrvale; kõrvale jäeti ka lehed, mis on esindatud Eesti kirjakeele koondkorpuses. (http://www.cl.ut.ee/korpused/segakorpus/). Kasutati Jan Pomikaleki doktoritöö käigus loodud programme jusText ja onion (code.google.com/p/justext, code.google.com/p/onion)

Eesti keele käsiraamat

Kristiina Ross & Mati Erelt
Pakub üldharivaid teadmisi eesti kirjakeele grammatika ja sõnavara ehituse kohta. Esitus on võimalikult lihtne, välditud on tavakasutajale tarbetuid üksikasju. Praktiline abivahend kirjakeele korrektseks kasutamiseks.

Estonian Wordnet (kb71-LAST)

Heili Orav
The atom of a wordnet-type thesaurus is a synonym set (also called a synset), which is a set containing all the synonymous words or multi-word units that express the same concept. All words in a synset belong into the same part of speech. THIS IS THE NEWEST VERSION

Seto sõnastik

Indrek Hein
Esimene seto veebisõnastik sisaldab üle 6000 märksõna, mida saab otsida nii murdekeelse kirjapildi kui ka lihtsustatud ja ilma diakriitiliste märkideta variandi järgi.

Hiiu sõnaraamat

Tiina Laansalu
Sõnastik kuulub Eesti Keele Instituudi väikeste murdesõnastike sarja ja on maailma esimene hiiu keele sõnaraamat. See sisaldab 6300 märksõna ning esitab hiiu keele põhisõnavara ja murdesõnu kõigist Hiiumaa murrakutest. Kuna hiiu keele omapära tuleb esile eeskätt tema häälikulises küljes, siis on sõnastikus näidatud ka üldtuntud sõnade puhul nende hiiupärast hääldust. Samuti on märksõnade juures näitelaused koos viitega kihelkonnale, kust näide on kirja pandud.

Eesti kohanimeraamat

Peeter Päll & Marja Kallasmaa
Dictionary of Estonian Place Names

Eesti kohanimeraamat

Peeter Päll & Marja Kallasmaa
Dictionary of Estonian Place Names

Eesti keele ühendkorpus 2017

Jelena Kallas & Kristina Koppel
Korpus on loodud Eesti Keele Instituudi ja Lexical Computing Ltd. koostöö raames. Korpuse suurus on 1,3 miljardit sõnet. Korpuse alus on Eesti keele ühendkorpus 2013, mida Lexical Computing Ltd. uuendas 2017. aastal Eesti Keele Instituudi tellimusel. Allkorpused on Eesti keele koondkorpus 1990-2008, Eesti keele veebikorpus 2013, Eesti keele veebikorpus 2017 ja Eesti Vikipeedia 2017 korpus. Veebikorpused on internetist alla laetud eestikeelsete veebilehtede korpus. Korpuse loomisel on kasutatud aadressil http://corpus.tools kirjeldatud programme: SpederLing, JustText, Chared, Onion...

Eesti keele A1-C1 õpikute korpus 2018

Jelena Kallas & Kristina Koppel
Korpus sisaldab A1, A2, B1, B2 ja C1 keeleoskustasemega eesti keele õppijatele suunatud õpikute tekstidest eraldatud täislauseid. Korpuses on märgendatud tekstistruktuuri üksused lause ja osalause . Kõik korpuse laused on keeletaseme piirides unikaalsed. Korpuse aluseks on Eesti keele A1-C1 õpikute korpus 2017, mis koosnes ca 200 000 sõnest ja ca 24 000 lausest. Eesti keele A1-C1 õpikute korpuse 2017 sisust ekstraheeritud täislausetest loodigi Eesti keele A1-C1 õpikute korpus 2018, millega kaasnes käsitsi kontroll (sisse jäeti...

EstNLTK teek Pythoni jaoks (ver.1.4)

Sven Laur
EstNLTK provides common natural language processing functionality such as paragraph, sentence and word tokenization, morphological analysis, named entity recognition, etc. for the Estonian language.

Keelehoiakud Eesti keelekeskkondades 2015 andmestik

Andres Karjus & Martin Ehala
Tartu Ülikooli uurimisprojekti Eesti keele kestlikkus avatud maailmas (EKKAM) tellimusel 2015. aasta kevadel Eestis läbi viidud keelehoiakuid puudutava küsimustiku vastused. Demograafiliselt tasakaalustatud valimis on 1006 vastajat vanuses 15-74. Küsimused hõlmavad vastajate demograafilist infot, keeleoskust, igapäevaseid keelevalikuid, keelehoiakuid, keelepoliitilisi vaateid. Küsimustikule oli võimalik vastata nii eesti kui vene keeles, vastavalt küsitletava valikule (ankeedi valik on andmestikus salvestatud). Andmestikus on 200 tunnust, millest suurema osa moodustavad küsimuste vastused, lisaks mõned küsimuste vastustest tuletatud tunnused. Andmestikuga kaasas on...

Sünonüümisõnastik

Indrek Hein & Asta Õim
Pakub kirjas ja kõnes kasutatavaid sünonüüme, sealhulgas valiku vanemaid, murdelisi ning kõnekeelseid sõnu või väljendeid, samuti termineid ning kantselei- ja stampkeelendeid.

Registration Year

  • 2020
    46
  • 2019
    121
  • 2018
    82
  • 2017
    71
  • 2016
    90
  • 2015
    82