Estonian National Corpus 2017

View resource name in all available languages

Eesti keele ühendkorpus 2017

Korpus on loodud Eesti Keele Instituudi ja Lexical Computing Ltd. koostöö raames. Korpuse suurus on 1,3 miljardit sõnet. Korpuse alus on Eesti keele ühendkorpus 2013, mida Lexical Computing Ltd. uuendas 2017. aastal Eesti Keele Instituudi tellimusel.
Allkorpused on Eesti keele koondkorpus 1990-2008, Eesti keele veebikorpus 2013, Eesti keele veebikorpus 2017 ja Eesti Vikipeedia 2017 korpus. Veebikorpuste sisu on internetist alla laetud eestikeelsed veebilehed. Korpuse loomisel on kasutatud aadressil http://corpus.tools kirjeldatud programme: SpederLing, JustText, Chared, Onion and wiki2corpus. Korpus on lemmatiseeritud, märgendatud ja ühestatud analüsaatori EstNLTK abil.


You don’t have the permission to edit this resource.