[ENGLISH] Training and testing sets from MIM-GOLD 21.05, which is a gold standard for PoS-tagging and lemmatization of Icelandic texts. The gold standard contains approximately 1 million running words with manually annotated PoS-tags and lemmas. The texts are from The Tagged Icelandic Corpus (MÍM), which was published in 2013. The tagset was revised in 2019-2020. It builds upon a tagging scheme created for the Icelandic Frequency Dictionary in 1991. All changes to the tagging scheme are described in the package.
[ICELANDIC] Þjálfunar- og prófunargögn úr MÍM-GULL 21.05 sem er gullstaðall fyrir málfræðilega mörkun og lemmun íslenskra texta. Gullstaðallinn inniheldur u.þ.b. 1 milljón orða og eru mörkin og lemmurnar handyfirfarin. Textarnir eru úr Markaðri íslenskri málheild (MÍM), sem var gefin út 2013. Markamengið var endurskoðað 2019-2020. Það byggir á markaskrá sem var gerð fyrir Íslenska orðtíðnibók árið 1991. Öllum breytingum á markamenginu er lýst í skrá sem fylgir gullstaðlinum.