Eesti keele puudepank

Kadri Muischnek
Morfoloogiliselt ja sõltuvussüntaktiliselt analüüsitud eestikeelsed tekstid, kokku umbes 400 000 sõna 30 000 lauses. Tekstid on pärit eesti keele Tasakaalus korpusest http://www.cl.ut.ee/korpused/grammatikakorpus/ ja Koondkorpusest http://www.cl.ut.ee/korpused/segakorpus/ ning jagunevad ilukirjanduse, ajakirjanduse, teaduse ja populaarteaduse tekstiklasside vahel. Tekstid on esmalt analüüsitud reeglipõhise, kitsenduste grammatikal põhineva sõltuvussüntaktilise analüsaatoriga; automaatselt analüüsitud faile on parandatud käsitsi. Publikatsioon: Muischnek, Kadri; Müürisep, Kaili; Puolakainen Tiina (2014). Dependency Parsing of Estonian : Statistical and Rule - based Approaches Human Language Technologies - The Baltic...
This data center is not currently reporting usage information. For information on how your repository can submit usage information, please see our Documentation.