520 Works

Kõnesünteesi kõnekorpus Lee

Liisi Piits
Korpus sisaldab 10-aastase tüdruku eesti keeles etteloetud lauseid ja helile vastavaid tekstifaile. Tekst ja heli lõigatud lauseteks, v.a 103 lauset, mis on esitatud lõikudena. Diskreetimissagedus: 48000 Hz

Kõnesünteesi kõnekorpus Liivika

Liisi Piits
Korpus sisaldab 48-aastase naise eesti keeles etteloetud lauseid ja helile vastavaid tekstifaile. Tekst ja heli lõigatud lauseteks, v.a 3 arvamusartiklit, mis on lauseteks lõikamata. Diskreetimissagedus: 48000 Hz

Eesti veebilausete korpus 2020

Kristina Koppel
Korpus sisaldab "Eesti keele ühendkorpusest 2019" ja "Eesti uudisvoogude korpusest 2020" heade näitelausete tuvastamise tööriista GDEX ehk Good Dictionary Examples (Kilgarriff jt 2008; eesti mooduli kohta Koppel 2020) abil välja valitud lauseid ja "Eesti keele naabersõnade sõnastiku 2019" näitelauseid (loe lähemalt Koppel 2020). Korpus ei sisalda terviktekste. Korpuse suurus on 331 491 665 sõnet, 280 961 465 sõna ja 27 987 754 lauset. Kirjandusviited: Kilgarriff, Adam, Milos Husák, Katy McAdam, Michael Rundell, Pavel Rychlý 2008....

Uudiste lugeja Androidis

Meelis Mihkla
Rakendus loeb eesti keeles ette värskeid uudiseid. Kasutajal on võimalik valida kolme sünteeshääle ja erinevate lugemiskiiruste vahel.

Tekstide helindaja ja heliraamatute genereerija

Meelis Mihkla
Teisendab txt- ja html-formaadis tekstid helifailideks ja lisab ePub3 formaadis e-raamatule sünteeskõnes kuulatavad audiofailid. Helindaja ja genereerija Vox Populi koosneb kahest komponendist – tekstide helindajast ja hääldussõnastikust. Nende kahe koostöös ja Eest Keele Instituudi kõnesünteesi kaasates saab kasutaja saadetud tekstifailist sünteeshäälega audiofail.

Eesti murrete sõnaraamat (24.—28. vihik; lõpetis—ninaõrs)

Tiina Laansalu
Eesti murrete sõnaraamat haarab võimalikult kogu murdesõnavara. Sõnu saadab häälikuline ja grammatiline iseloomustus, levik ning selgub sõnade tähendus. Näitelaused toovad esile murdesõnadega seotud tähenduslikke ja grammatilisi nähtusi.

EstNLTK sentence splitting

Sven Laur
Estonian NLTK toolkit - detecting sentence boundaries

Ersa prosoodia korpus

Pärtel Lippus
Ersa sõnaprosoodia uurimiseks kogutud andmestik. Sisaldab raamlauses loetud testsõnu 8 keelejuhilt. Iga keelejuht luges 100 lauset, iga lause sisaldas testsõna kord lause keskel, kord lause lõpus. Vt lähemalt: Lehiste, I., Aasmäe, N., Meister, E., Pajusalu, K., Teras, P., & Viitso, T.-R. (2003). Erzya prosody. Helsinki: Finno-Ugrian Society.

Eesti kohanimeraamat

Peeter Päll & Marja Kallasmaa
Dictionary of Estonian Place Names

Eesti kohanimeraamat

Peeter Päll & Marja Kallasmaa
Dictionary of Estonian Place Names

e-keelenõu

Tõnis Nurk
Ühispäring keeleinfot sisaldavatest allikatest. Portaali peaeesmärgiks on pakkuda lõpptarbijale intuitiivselt lihtsal viisil vastuseid keelealastele küsimustele, nt normingukohasus, vasted teistes keeltes, selgitused, etümoloogia, kasutusinfo jms.

Ametniku soovitussõnastik

Tiina Paet
Sõnastik kõigile neile, kellel on vaja kirjutada ametliku sisuga kirjakeelset teksti. Sõnastik pakub nõuandeid ja soovitusi, kuidas väljenduda lihtsamalt, selgemalt ja täpsemalt.

Sünonüümisõnastik

Indrek Hein & Asta Õim
Pakub kirjas ja kõnes kasutatavaid sünonüüme, sealhulgas valiku vanemaid, murdelisi ning kõnekeelseid sõnu või väljendeid, samuti termineid ning kantselei- ja stampkeelendeid.

Võõrsõnade leksikon

Tiina Paet
2012. aastal raamatuna ilmunud „Võõrsõnade leksikoni“ veebiversioon. Sisaldab 33 000 levinumat võõrsõna, tsitaatsõna, laensõna, lühendit, sententsi ja väljendit. See on ka esimene eestikeelne võõrsõnakogu, mis esitab morfoloogilise info: käänamise ja pööramise ning muuttüübid. Võrreldes varasemate väljaannetega on lisatud on uusi sõnu, uuendatud seletusi ning täpsustatud sõnade etümoloogiat.

Seto sõnastik

Indrek Hein
Esimene seto veebisõnastik sisaldab üle 6000 märksõna, mida saab otsida nii murdekeelse kirjapildi kui ka lihtsustatud ja ilma diakriitiliste märkideta variandi järgi.

Eesti keele spontaanse kõne foneetiline korpus v.1.0.3

Pärtel Lippus
The aim of the corpus is to compile a large amount of quality recordings of spontaneous Estonian and segment it phonetically on different levels. The project started in autumn 2006. The total size of the corpus is approximately 80 hours of speech from 120 speakers with different dialectological and social background. Speakers are from different age groups. They are asked to participate with face-to-face invitation and they are aware of the purpose of the recordings....

Estonian Wordnet (kb71-LAST)

Heili Orav
The atom of a wordnet-type thesaurus is a synonym set (also called a synset), which is a set containing all the synonymous words or multi-word units that express the same concept. All words in a synset belong into the same part of speech. THIS IS THE NEWEST VERSION

Eesti keele sõnapered - indeks

Indrek Hein & Silvi Vare
Indeks võimaldab teada saada, kas otsitav sõna esineb sõnaperede raamatus ning millis(t)es sõnapere(de)s ja millises plokis ta täpsemalt asub. Otsida on võimalik nii elektroonilise indeksi kaudu päringuaknas kui ka pereliikmete loenditest pdf-formaadis. Vajadusel on võimalik sõna olemasolu kontrollida ka perepeade pdf-loendist.

Eesti keele käsiraamat

Kristiina Ross & Mati Erelt
Pakub üldharivaid teadmisi eesti kirjakeele grammatika ja sõnavara ehituse kohta. Esitus on võimalikult lihtne, välditud on tavakasutajale tarbetuid üksikasju. Praktiline abivahend kirjakeele korrektseks kasutamiseks.

Eesti-mari sõnaraamat

Sven-Erik Soosaar
Sõnaraamat sisaldab umbes 9800 märksõna. Sõnaraamatu sihtgrupiks on mari keelest ja kultuurist huvitatud eestlased ning eesti keelt õppivad marid. Sõnastiku näitelaused ja -fraasid on abiks nii keeleõppijatele kui ka tõlkijatele. Kuigi mari keelel on kaks kirjakeelt – niidumari keel ja mäemari keel –, sisaldab sõnaraamat vaid niidumari vasteid, sest enamasti peetakse mari keelest rääkides silmas just niidumari keelt. Sõnaraamat on kättesaadav ainult elektrooniliselt.

etTenTen korpus, morfoloogiliselt ühestatud

Kadri Muischnek
etTenTen korpus on internetist alla laetud eestikeelsete veebilehtede korpus. Korpuses on 270 miljonit sõna 686 000 veebilehelt. vt veel http://www2.keeleveeb.ee/dict/corpus/ettenten/about.html Algmaterjal Korpuse tekstid korjas internetist ja teisendas utf-8 kodeeringus teksti kujule Vit Suchomel. Veebirobotiga laeti alla 1 173 702 veebilehte, kusjuures juba olemas olevate lehtede koopiad jäeti kõrvale; kõrvale jäeti ka lehed, mis on esindatud Eesti kirjakeele koondkorpuses. (http://www.cl.ut.ee/korpused/segakorpus/). Kasutati Jan Pomikaleki doktoritöö käigus loodud programme jusText ja onion (code.google.com/p/justext, code.google.com/p/onion)

Hiiu sõnaraamat

Tiina Laansalu
Sõnastik kuulub Eesti Keele Instituudi väikeste murdesõnastike sarja ja on maailma esimene hiiu keele sõnaraamat. See sisaldab 6300 märksõna ning esitab hiiu keele põhisõnavara ja murdesõnu kõigist Hiiumaa murrakutest. Kuna hiiu keele omapära tuleb esile eeskätt tema häälikulises küljes, siis on sõnastikus näidatud ka üldtuntud sõnade puhul nende hiiupärast hääldust. Samuti on märksõnade juures näitelaused koos viitega kihelkonnale, kust näide on kirja pandud.

Idamurde sõnastik

Tiina Laansalu & Ellen Niit
Sõnastik kuulub Eesti Keele Instituudi väikeste murdesõnastike sarja. Sõnastik sisaldab 7000 märksõna ning on mõeldud kõigile, kes kasutavad oma töös või õpingutes murdekeelt või kes on pärit Ida-Eestist ja keda paelub esivanemate kõnepruuk.

Hariduse ja kasvatuse sõnaraamat

Indrek Hein
Sisaldab 4850 terminit mitmesugustelt hariduse ja kasvatuse aladelt: kasvatus ja areng, alusharidus, põhi- ja keskharidus, kutse- ja kõrgharidus, andragoogika, eripedagoogika jne. Igale eesti terminile on antud inglise, saksa, soome ja vene vaste ning enamasti ka seletus.

Eesti mõistatuste andmebaas

Mare Kõiva & Jaak Krikmann
Andmebaas on rajatud Eesti Kirjandusmuuseumi folkloristika osakonnas. Baasi aluseks oli 2800 Word 7.0 formaadis andmetabelit, mille põhjal toodeti akadeemilise väljaande "Eesti mõistatused" (EM) põhiköidete I (2001) ja II (2002) käsikiri. Andmebaas on kasutatav kolmes variandis, siinne versioon on xml-kujule teisendatud "baas-lugemik", mis esitab 95 751 eesti mõistatusteksti kirjed 20 000 kirje kaupa EM I–II tüüpide ja tekstide järjekorras (erinevalt andmebaasi kasutajaliidesest, kus on kirjed esitatud 1000 kaupa). Andmebaasi juurde kuuluvad abimaterjalid (millest kõiki pole siinses...

Registration Year

  • 2020
    73
  • 2019
    121
  • 2018
    82
  • 2017
    71
  • 2016
    90
  • 2015
    82