[ENGLISH] MIM-GOLD 21.05 is a gold standard for PoS-tagging and lemmatizing Icelandic texts. This new version contains the same texts as version 20.05 but lemmas have been added and some corrections have been made to the PoS-tagging. The gold standard contains approximately 1 million running words with manually annotated PoS-tags and lemmas. The texts are from The Tagged Icelandic Corpus (MÍM), which was published in 2013. The tagset was revised in 2019-2020. It builds upon a tagging scheme created for the Icelandic Frequency Dictionary in 1991. The tagging scheme is described in the package.
[ICELANDIC] MÍM-GULL 21.05 er gullstaðall fyrir mörkun of lemmun íslenskra texta. Þessi nýja útgáfa inniheldur sama texta og útgáfa 20.05 en lemmum hefur verið bætt við og einhver mörk leiðrétt. Gullstaðallinn inniheldur u.þ.b. 1 milljón orða og mörkin eru handyfirfarin. Textarnir eru úr Markaðri íslenskri málheild (MÍM), sem var gefin út 2013. Markamengið var endurskoðað 2019-2020. Það byggir á markaskrá sem var gerð fyrir Íslenska orðtíðnibók árið 1991. Markamenginu er lýst í skrá sem fylgir gullstaðlinum.