What's New

 corpus 
corpus
Description:
Gagnasafnið tengir lista íslenskra heita borga við enskt heiti þeirra. Gögnin voru unnin úr upplýsingum frá utanríkisráðuneytinu og Stofnun Árna Magnússonar, ásamt viðbótum. This dataset maps Icelandic-language city names ...
 This item contains 1 file (4.89 KB).
 
Publicly Available
 corpus 
corpus
Description:
Gagnasafnið tengir lista íslenskra heita landa og svæða við ISO 3166-1 alpha-2 landakóða. Gögnin eru unnin úr upplýsingum frá Sameinuðu þjóðunum og Stofnun Árna Magnússonar, ásamt viðbótum. This dataset maps a list of ...
 This item contains 1 file (6.91 KB).
 
Publicly Available
 corpus 
corpus
Description:
Gagnasafnið inniheldur upplýsingar um hvaða forsetningar skal nota með ýmsum löndum og sjálfstjórnarsvæðum. Forsetningarnar eru tengdar við ISO 3166-1 alpha-2 landakóða. Gögnin voru unnin úr upplýsingum frá utanríkisráðuneytinu ...
 This item contains 1 file (3.43 KB).
 
Publicly Available

Most Viewed Items

Top Last Week
 corpus 
corpus
Description:
The Icelandic Contemporary Corpus (IceConTree) is a machine-parsed treebank parsed according to the IcePaHC annotation scheme. It consists of texts from the Icelandic Gigaword Corpus, parsed using the IceNeuralParsingPipeline. ...
 This item contains 1 file (3.92 GB).
 
Publicly Available
 toolService 
toolService
Description:
GreynirCorrect er Python-pakki og skipanalínutól sem leiðréttir ósamhengisháðar ritvillur í íslenskum texta. GreynirCorrect reiðir sig á Tokenizer-pakkann, eftir sömu höfunda, til að tilreiða textann. Frekari upplýsingar ...
 This item contains 2 files (6.34 MB).
 
Publicly Available
 corpus 
corpus
Description:
GreynirCorpus inniheldur 7 milljónir málsgreina, að mestu úr fréttatextum, sem hafa verið fullþáttaðar með sjálfvirkum regluþáttara. Málheildin inniheldur einnig gullstaðal með 2.610 handþáttuðum þáttunartrjám. GreynirCorpus ...
 This item contains 2 files (1.52 GB).
 
Publicly Available