425 Works

Maltparseri treenitud mudel (UD)

Kaili Müürisep
Eesti keele süntaksianalüüsi mudel MaltParserile (http://www.maltparser.org/), treenitud EstUD v2.2 puudepangal.

Kirjandusajalooline veebikeskkond "ERNI. Eesti kirjanduslugu tekstides 1924 – 1925"

Marin Laak & Tiina Saluvere
ERNI on kirjandusloo õppeprogramm, mis esitab materjale 1920. aastate kirjanduselu kohta. ERNI kujutab üht kirjandusloo peatükki, eesti kirjanduse 1920. aastaid interaktiivses keskkonnas, tervikliku kirjandusajaloolise ruumina. ERNI sisaldab raamatukogu, kriitikaantoloogiat, fotogaleriid, autorite tutvustusi, kirjanduslike terminite sõnastikku ja ajatelge. Gümnaasiumi kirjandustundideks leiab abi küsimustikust ja kirjandiõpetusest. Kriitika ajaloo kursust kõrgkoolis saab elavdada kasutades programmi intertekstuaalse ja retseptsiooniajaloolise tekstide koguna. ERNIs leiduvad trükimaterjalid pärinevad Eesti Kirjandusmuuseumi Arhiivraamatukogust, kirjanike fotod Kultuuriloolise Arhiivi fotokogust (Vanemuise 42, Tartu). Raamatute kujundused on...

Inimesed

Tanel Alumäe
Androidi rakendus, mis võimaldab kiiresti ja mugavalt otsida aadressiraamatus sisalduvaid kontaktandmeid, samas ka näide reeglipõhise keelemudeliga eestikeelsest kõnetuvastusest.

Audiovisuaalse kõnesünteesi veebirakendus

Einar Meister
Pea mudel töötab Internet Explorer veebisirvijaga ning lisaks tuleb veebisirvijale paigaldada Cortona 3D tarkvara. Seda on võimalik saada siit.

Võru ja Setu ilukirjanduskorpus

Sulev Iva
Ilukirjanduse korpuse kogumahuks on ca 350 000 sõna, korpus on viimase aasta jooksul muudetud tekstiarhiivist avalikuks keelekorpuseks koos vajaliku kasutajaliidesega, mis asub aadressil http://synaq.org/ilo.

Võro ja seto kirjanduskogu

Sulev Iva
Ilukirjanduse korpuse kogumahuks on ca 350 000 sõna, korpus on viimase aasta jooksul muudetud tekstiarhiivist avalikuks keelekorpuseks koos vajaliku kasutajaliidesega, mis asub aadressil http://synaq.org/ilo.

Kollokatsioonide tuvastaja

Kadri Muischnek
Kollokatsioonid on sellised sõnapaarid, mille liikmed esinevad üksteise naabruses sagedamini kui võiks eeldada nende üksikult esinemise sageduste põhjal. Tüüpilised kollokatsioonid on püsiühendid - näiteks ühendverbid või idiomaatilised väljendid. Püsiühendid võivad muidugi koosneda ka rohkem kui kahest sõnast, kuid meie kollokatsioonide otsija suudab tuvastada ainult kahesõnalisi ühendeid. Kollokatsioonide otsimisel arvestatakse võimalike kollokaatide kandidaatidena samas osalauses esinevaid sõnavorme või lemmasid. Kollokatsioone saab otsida kolmel viisil: 1) teatud lemma olulisi kollokaate sõnavormidena 2) teatud lemma olulisi kollokaate lemmadena...

Osalausestaja

Siim Orasmaa
Osalausepiiride tuvastaja

Maltparseri treenitud mudel

Kadri Muischnek
MaltParseri eesti keele analüüsiks vajalik mudel model.mco, treenitud eesti keele sõltuvupuude pangal, ühildub MaltParseri versiooniga 1.8.1. Sisaldab ka teisendajat eesti keele CG morfoloogilise ühestaja või süntaktilise analüsaatori väljundi kujult MaltParseri treenitud mudeli jaoks sobivale conll-kujule. Analüüsiks on vajalik MaltParseri analüsaator: http://www.maltparser.org/.

Foneetikakorpuse otsimootor

Pärtel Lippus
Veebipõhine otsingumootor võimaldab otsida korpusest ühe sõna piires, vastuseks antakse 2-sekundiline helilõik ja selle märgendus.

Emotional

Hille Pajupuu
Project Statistical Models of the Emotionality of Speech and Written Text (2011-2014) was supported by the National Programme for Estonian Language Technology (2011-2017) of the Estonian Ministry of Education and Research.

Uudistekorpus

Einar Meister
Kogutud ja käsitsi märgendatud 30 tundi teleuudiseid.

Eesti Wordnet (2.1)

Heili Orav & Kadri Vare
XML versioon Eesti Wordnetist.

Idamurde sõnastik

Tiina Laansalu & Ellen Niit
Sõnastik kuulub Eesti Keele Instituudi väikeste murdesõnastike sarja. Sõnastik sisaldab 7000 märksõna ning on mõeldud kõigile, kes kasutavad oma töös või õpingutes murdekeelt või kes on pärit Ida-Eestist ja keda paelub esivanemate kõnepruuk.

EKI terminibaaside süsteem

Tõnis Nurk
Terminology Management Software of IEL

EstNLTK sentence splitting

Sven Laur
Estonian NLTK toolkit - detecting sentence boundaries

Põhjatuule ja päikese korpus v.1.0.3

Pärtel Lippus
Recordings of the tale “Põhjatuul ja päike” (North Wind and the Sun) read by the same speakers who participated in the Phonetic Corpus of Estonian Spontaneous Speech. Most of the speakers read the text two times. The text is annotated using Praat TextGrids: words in standard orthography and phonemes in SAMPA.

Eesti keele ühendkorpus 2017

Jelena Kallas & Kristina Koppel
Korpus on loodud Eesti Keele Instituudi ja Lexical Computing Ltd. koostöö raames. Korpuse suurus on 1,3 miljardit sõnet. Korpuse alus on Eesti keele ühendkorpus 2013, mida Lexical Computing Ltd. uuendas 2017. aastal Eesti Keele Instituudi tellimusel. Allkorpused on Eesti keele koondkorpus 1990-2008, Eesti keele veebikorpus 2013, Eesti keele veebikorpus 2017 ja Eesti Vikipeedia 2017 korpus. Veebikorpused on internetist alla laetud eestikeelsete veebilehtede korpus. Korpuse loomisel on kasutatud aadressil http://corpus.tools kirjeldatud programme: SpederLing, JustText, Chared, Onion...

Eesti Keele Instituudi mõisteline sõnavarakartoteek

Tiina Laansalu
Mõistelise sõnavarakartoteegi idee pärineb Andrus Saarestelt. Kogumistöö algas 1920ndatel ja kestis 1930ndate keskpaigani. Mõistelises kogus on sõnavara jaotatud mitte kihelkondade, vaid mõistete järgi. Materjali on kogutud järgmiste valdkondade kohta: abielu, aeg, aiandus, armuelu, ehitused, heinategu, ilmastik, inimene, kalandus, karjandus, keha, kehakatted, käsitöö, liiklus, linatöö, loomastik, maapõuevarad, maastik, merelinnud, merendus, mesindus, metsandus, mõõdud, mängimine, märk, nõidus, nõud, puutöö, põllundus, suguvõsa, sõidukid, taevalaotus, tahtmine, taimestik, tervis, toitlus, tuli, tundeelu, tunnetamine, töö, usund, veekogud, veesõidukid, viin, vill, värv,...

Liivi-saksa sõnaraamat

Margit Langemets
Sjögren-Wiedemanni sõnaraamatu liivi-saksa veebiversioon.

Eesti Keele Instituudi fonoteek

Liis Ermus
Eesti Keele Instituudi fonoteegi leheküljel saab kuulata eesti murrete, soome-ugri keelte ja väliseesti keele helinäiteid.

Web13 analüüsitud estnltk ver.1.6.b abil - json vormingus

Sven Laur
Web13 analüüsitud estnltk ver.1.6.b abil - json vormingus

Registration Year

  • 2015
    82
  • 2016
    90
  • 2017
    71
  • 2018
    82
  • 2019
    99

Data Centers

  • Keeleressursid. The Center of Estonian Language Resources
    425