MIM-GOLD 20.05 is a gold standard for PoS-tagging Icelandic texts. This new version uses a revised tagset. The gold standard contains approximately 1 million running words with manually annotated PoS-tags. The texts are from The Tagged Icelandic Corpus (MÍM), which was published in 2013.
The tagset was revised in 2019-2020. It builds upon a tagging scheme created for the Icelandic Frequency Dictionary in 1991. All changes to the tagging scheme are described in the package.
-----------
MÍM-GULL 20.05 er gullstaðall fyrir mörkun íslenskra texta. Þessi nýja útgáfa notast við endurskoðað markamengi. Gullstaðallinn inniheldur u.þ.b. 1 milljón orða og mörkin eru handyfirfarin. Textarnir eru úr Markaðri íslenskri málheild (MÍM), sem var gefin út 2013.
Markamengið var endurskoðað 2019-2020. Það byggir á markaskrá sem var gerð fyrir Íslenska orðtíðnibók árið 1991. Öllum breytingum á markamenginu er lýst í skrá sem fylgir gullstaðlinum.