<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
<channel>
<title>Clarin IS</title>
<link>http://hdl.handle.net/20.500.12537/4</link>
<description>Clarin IS Collection</description>
<pubDate>Tue, 07 Apr 2026 03:24:36 GMT</pubDate>
<dc:date>2026-04-07T03:24:36Z</dc:date>
<item>
<title>Sports Terminology 26.03</title>
<link>http://hdl.handle.net/20.500.12537/380</link>
<description>Sports Terminology 26.03
Sigurðsson, Einar Freyr; Magnússon, Magnús Már; Jasonarson, Atli; Steingrímsson, Steinþór
This dataset contains terminology from basketball, chess, football, golf and gymnastics. The vocabulary found here originates in a test suite at WMT25 (Conference on Machine Translation) where sports segments were translated from English to Icelandic. The data is published in TBX-format, one file for each subdomain, containing an English term, with Icelandic translations and part-of-speech.&#13;
&#13;
Gögnin sem hér eru birt innihalda íþróttaorð, nánar tiltekið úr körfubolta, skák, fótbolta, golfi og fimleikum. Orðaforðinn á uppruna sinn í verkefni á vélþýðingaráðstefnunni WMT25 þar sem íþróttatexti var þýddur úr ensku á íslensku. Gögnin eru birt á TBX-sniði, ein skrá fyrir hverja íþrótt og innihalda orð á ensku, þýðingar þeirra á íslensku og orðflokk.
</description>
<pubDate>Fri, 20 Mar 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/380</guid>
<dc:date>2026-03-20T00:00:00Z</dc:date>
</item>
<item>
<title>Spjallromur 26.03 - Icelandic Conversational Speech</title>
<link>http://hdl.handle.net/20.500.12537/379</link>
<description>Spjallromur 26.03 - Icelandic Conversational Speech
Fong, Judy, Y.; Borsky, Michal; Runarsson, Pall; Hedström, Staffan; Jónsson, Ólafur Helgi; Hólmfriðardóttir, Lára Margrét H.; Þorsteinsdóttir, Sunneva; Eiríksdóttir, Málfriður Anna; Mollberg, David Erok; Magnúsdóttir, Eydís Huld; Þórhallsdóttir, Ragnheiður; Gudnason, Jon
[ENGLISH]&#13;
Spjallromur is an open source conversational speech corpus for speech technology development. The corpus is 21 hrs and 20 mins long, with 54 total conversations, 102 speakers. The data was collected for one year (September 2020 - September 2021) by Reykjavík University. There are two parts, the first part has full conversations, while the second part has half conversations.&#13;
This item contains additional manual transcriptions for 21 full conversations, produced by three transcribers. Includes turn-level timestamps and speaker labels. Seven conversations have multiple transcriptions for inter-annotator comparison.&#13;
&#13;
[ÍSLENSKA]&#13;
Spjallrómur er gagnasafn samræðumálheildar ætlað fyrir þróun á máltæknilausnum, sem gefið er út með opnu leyfi. Gagnasafnið er 21 klst og 20 mín að lengd, alls 54 samtöl og 102 viðmælendur. Gögnunum var safnað í eitt ár (september 2020 - september 2021) af Háskólanum í Reykjavík. Það eru tveir hlutar, sá fyrri hluti hefur heil samtöl, en seinni hlutinn hefur hálf samtöl.&#13;
Hér eru, til viðbótar, handgerðar umritanir fyrir 21 heilt samtal sem voru umrituð af þremur einstaklingum. Það eru tímastimplar til staðar þegar mælendur skiptast á að tala ásamt mælendamerkingum. Sjö samtalanna hafa fleiri en eina umritun sem bera má saman.
</description>
<pubDate>Mon, 02 Mar 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/379</guid>
<dc:date>2026-03-02T00:00:00Z</dc:date>
</item>
<item>
<title>Icelandic-Polish Dictionary</title>
<link>http://hdl.handle.net/20.500.12537/378</link>
<description>Icelandic-Polish Dictionary
Úlfarsdóttir, Þórdís; Jónsdóttir, Halldóra; Bartoszek, Stanislaw; Kieliszewska, Aleksandra; Ambroziak, Mirosław Ólafur; Młyńska, Emilia; Bartoszek, Paweł
[ISL]&#13;
Íslensk-pólsk orðabók er gefin út af Stofnun Árna Magnússonar í íslenskum fræðum. Í henni eru um 54 þúsund íslensk uppflettiorð ásamt orðasamböndum og notkunardæmum. Allt efnið er þýtt á pólsku. Orðabókinni er ætlað að þjóna þörfum mismunandi notendahópa en helsti markhópurinn er pólskumælandi íbúar Íslands. Einnig kennarar og nemendur á öllum skólastigum, svo og þýðendur milli íslensku og pólsku. Íslenska ritstjórnin annast íslenska hluta orðabókarinnar ásamt tæknivinnslu, en vinna við pólsku er í umsjón pólsku ritstjórnarinnar. Orðabókin er aðgengileg á https://polska.arnastofnun.is en þar er að finna frekari upplýsingar.&#13;
&#13;
[EN]&#13;
The Icelandic-Polish Dictionary is published by the Árni Magnússon Institute for Icelandic Studies. It contains about 54,000 Icelandic headwords as well as phrases and usage examples. All the material is translated into Polish. The dictionary is intended to serve the needs of various user groups, but the primary target group is Polish-speaking residents of Iceland. Also teachers and students at all school levels, and translators between Icelandic and Polish. The Icelandic team manages the Icelandic part of the dictionary and the development of its computer system. The work on the Polish is done by the Polish editors. The dictionary is accessible at https://polska.arnastofnun.is, where further information can be found.
</description>
<pubDate>Fri, 13 Feb 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/378</guid>
<dc:date>2026-02-13T00:00:00Z</dc:date>
</item>
<item>
<title>Icelandic-French Dictionary</title>
<link>http://hdl.handle.net/20.500.12537/377</link>
<description>Icelandic-French Dictionary
Úlfarsdóttir, Þórdís; Jónsdóttir, Halldóra; Davíðsdóttir, Rósa Elín; Salaün, Jean-Christophe; Heenen, François; Pétursdóttir, Ólöf
[ISL]&#13;
Íslensk-frönsk orðabók er gefin út af Stofnun Árna Magnússonar í íslenskum fræðum í samstarfi við Stofnun Vigdísar Finnbogadóttur í erlendum tungumálum. Orðabókin nefnist Lexía. Í henni eru um 54 þúsund íslensk uppflettiorð ásamt orðasamböndum og notkunardæmum. Allt efnið er þýtt á frönsku. Orðabókinni er ætlað að þjóna þörfum mismunandi notendahópa, einkum kennurum og nemendum á efri skólastigum, svo og þýðendum milli íslensku og frönsku. Íslenska ritstjórnin annast íslenska hluta orðabókarinnar ásamt tæknivinnslu, en vinna við franska hlutann er í umsjón frönsku ritstjórnarinnar. Orðabókin er aðgengileg á https://lexia.arnastofnun.is en þar er að finna frekari upplýsingar.&#13;
&#13;
[EN]&#13;
The Icelandic-French Dictionary is published by the Árni Magnússon Institute for Icelandic Studies, in collaboration with the Vigdís Finnbogadóttir Institute for Foreign Languages. The dictionary is named Lexía. It contains about 54,000 Icelandic headwords as well as numerous phrases and usage examples. All the material is translated into French. The dictionary is intended to serve the needs of various user groups, especially teachers and students at higher school levels, and translators between Icelandic and French. The Icelandic team manages the Icelandic part of the dictionary and the development of its computer system, while work on the French part is under the supervision of the French editorial team. The dictionary is accessible at https://lexia.arnastofnun.is, where further information can be found.
</description>
<pubDate>Tue, 10 Feb 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/377</guid>
<dc:date>2026-02-10T00:00:00Z</dc:date>
</item>
<item>
<title>Islex - Icelandic-Scandinavian multilingual dictionary (2026-02)</title>
<link>http://hdl.handle.net/20.500.12537/376</link>
<description>Islex - Icelandic-Scandinavian multilingual dictionary (2026-02)
Úlfarsdóttir, Þórdís; Jónsdóttir, Halldóra
[ISL]&#13;
ISLEX er margmála skandinavísk orðabók með íslenskum uppflettiorðum og þýðingum á dönsku, sænsku, norsku (bókmáli og nýnorsku), færeysku og finnsku. ISLEX er samstarfsverkefni fræða- og háskólastofnana á Íslandi, í Danmörku, Svíþjóð, Noregi, Færeyjum og Finnlandi. Þær eru: Stofnun Árna Magnússonar í íslenskum fræðum í Reykjavík, Det Danske Sprog- og Litteraturselskab í Kaupmannahöfn, Institutionen för svenska språket við Háskólann í Gautaborg, Institutt for lingvistiske, litterære og estetiske studier við Háskólann í Bergen, Fróðskaparsetur Færeyja í Þórshöfn og Háskólinn í Helsinki, Finnlandi. Íslenska ritstjórnin ber ábyrgð á viðfangsmálinu (íslensku) ásamt mótun og þróun tölvukerfisins. Vinna við markmálin er í umsjón og á ábyrgð ritstjórna í hverju landi fyrir sig. Orðaforði ISLEX er um 55.000 orð.&#13;
&#13;
[EN]&#13;
ISLEX is a multilingual dictionary with Icelandic as a source language and translations in Danish, Swedish, Norwegian (Bokmål and Nynorsk), Faroese, and Finnish. ISLEX is a collaborative project between research and university institutions in Iceland, Denmark, Sweden, Norway, the Faroe Islands and Finland. These are: the Árni Magnússon Institute for Icelandic Studies in Reykjavík, the Danish Society for Language and Literature in Copenhagen, the Department of Swedish Language at the University of Gothenburg, the Department of Linguistic, Literary and Aesthetic Studies at the University of Bergen, the University of the Faroe Islands in Tórshavn and the University of Helsinki, Finland. The Icelandic editorial team is responsible for the source language as well as the development of the computer system. Work on the target languages is under the supervision and responsibility of editorial teams in each respective country. The vocabulary of ISLEX is approximately 55,000 words
</description>
<pubDate>Wed, 11 Feb 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/376</guid>
<dc:date>2026-02-11T00:00:00Z</dc:date>
</item>
<item>
<title>A Dictionary of Contemporary Icelandic</title>
<link>http://hdl.handle.net/20.500.12537/375</link>
<description>A Dictionary of Contemporary Icelandic
Úlfarsdóttir, Þórdís; Jónsdóttir, Halldóra
[ISL]&#13;
Íslensk nútímamálsorðabók (ÍNO) er veforðabók sem er gefin út af Stofnun Árna Magnússonar í íslenskum fræðum. Orðaforðinn er um 56 þúsund uppflettiorð auk orðasambanda og notkunardæma. Undirstaða verkefnisins er skandinavíska margmála orðabókin ISLEX sem einnig er gefin út af Árnastofnun. Íslensk nútímamálsorðabók lýsir orðaforðanum í íslensku frá því um 1950 til dagsins í dag. Einnig er hér að finna ýmis mikilvæg orð úr eldra máli svo og forníslensku sem vænta má að nemendur geti rekist á í námi sínu. Ritstjórar ÍNO eru Halldóra Jónsdóttir og Þórdís Úlfarsdóttir. Orðabókin er aðgengileg á https://islenskordabok.arnastofnun.is en þar er að finna frekari upplýsingar.&#13;
&#13;
[EN]&#13;
A Dictionary of Contemporary Icelandic (ÍNO) is an online dictionary published by the Árni Magnússon Institute for Icelandic Studies. The vocabulary consists of approximately 56,000 headwords, as well as phrases and examples of use. The project is based on the multilingual Scandinavian dictionary ISLEX, also published by the Árni Magnússon Institute.&#13;
The dictionary is centred on Icelandic vocabulary from around 1950 to the present day. It also includes various important words from older stages of the language, as well as Old Norse, which students are likely to encounter in their studies. The editors of ÍNO are Halldóra Jónsdóttir and Þórdís Úlfarsdóttir. The dictionary is available at https://islenskordabok.arnastofnun.is, where further information can be found.
</description>
<pubDate>Tue, 10 Feb 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/375</guid>
<dc:date>2026-02-10T00:00:00Z</dc:date>
</item>
<item>
<title>IceBERT-PoS (12-09-2025)</title>
<link>http://hdl.handle.net/20.500.12537/374</link>
<description>IceBERT-PoS (12-09-2025)
Jónsson, Haukur Páll
The IceBERT-PoS model is an adaptation of IceBERT (https://huggingface.co/mideind/IceBERT) specifically trained for tagging. Detailed README is available at https://huggingface.co/mideind/IceBERT-PoS.&#13;
&#13;
Líkanið IceBERT-PoS er aðlögun á IceBERT (https://huggingface.co/mideind/IceBERT) sem er sérþjálfað fyrir mörkun. Ítarlega README-skrá er að finna á https://huggingface.co/mideind/IceBERT-PoS.
</description>
<pubDate>Tue, 09 Dec 2025 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/374</guid>
<dc:date>2025-12-09T00:00:00Z</dc:date>
</item>
<item>
<title>BinPackage 1.1.0 (2025-12-09)</title>
<link>http://hdl.handle.net/20.500.12537/373</link>
<description>BinPackage 1.1.0 (2025-12-09)
Þorsteinsson, Vilhjálmur; Óladóttir, Hulda; Þórðarson, Sveinbjörn
BinPackage is a Python Package that embeds the vocabulary of the DMII (https://bin.arnastofnun.is) and offers various lookups and queries of the data. The database, maintained by The Árni Magnússon Institute for Icelandic Studies, contains over 6.5 million entries, over 3.1 million unique word forms, and about 300,000 distinct lemmas.&#13;
The database has been encapsulated in an easy-to-install Python package, and compressed from 400+ megabyte CSV file to an ~80 megabyte indexed binary structure. More information at: https://github.com/mideind/BinPackage&#13;
&#13;
BinPackage er Python-pakki utan um BÍN, Beygingarlýsingu íslensks nútímamáls (https://bin.arnastofnun.is), sem inniheldur yfir 6,5 milljónir færslna, 3,1 milljón einstakra orðmynda og um 300.000 stakar lemmur. Stofnun Árna Magnússonar í íslenskum fræðum heldur utan um gagnagrunninn.&#13;
Gagnagrunninum, um 400 megabæta CSV-skrá, hefur verið pakkað í um 80 megabæta tvíundarbyggingu með vísum. Frekari upplýsingar á: https://github.com/mideind/BinPackage
</description>
<pubDate>Fri, 23 Sep 2022 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/373</guid>
<dc:date>2022-09-23T00:00:00Z</dc:date>
</item>
<item>
<title>Tokenizer for Icelandic text (3.5.5) (2025-12-09)</title>
<link>http://hdl.handle.net/20.500.12537/372</link>
<description>Tokenizer for Icelandic text (3.5.5) (2025-12-09)
Þorsteinsson, Vilhjálmur; Óladóttir, Hulda; Þórðarson, Sveinbjörn; Ragnarsson, Pétur Orri; Jónsson, Haukur Páll; Eyjólfsson, Logi
Tokenizer is a compact pure-Python 3 executable program and module for tokenizing Icelandic text. It converts input text to streams of tokens, where each token is a separate word, punctuation sign, number/amount, date, e-mail, URL/URI, etc. It also segments the token stream into sentences, considering corner cases such as abbreviations and dates in the middle of sentences. More information at: https://github.com/mideind/Tokenizer&#13;
 &#13;
Tokenizer er pakki fyrir Python 3, ásamt skipanalínutóli, sem sér um tilreiðslu íslensks texta. Pakkinn umbreytir inntakstexta í tókastraum. Hver tóki er stakt orð, greinarmerki, tala/upphæð, dags-/tímasetning, netfang, vefslóð o.s.frv. Tólið skiptir tókastraumnum einnig í setningar og tekur tillit til jaðartilvika eins og skammstafana og dagsetninga í miðjum setningum. Frekari upplýsingar á: https://github.com/mideind/Tokenizer
</description>
<pubDate>Thu, 15 Aug 2024 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/372</guid>
<dc:date>2024-08-15T00:00:00Z</dc:date>
</item>
<item>
<title>Tokenizer for Icelandic text (3.5.3) (2025-10-07)</title>
<link>http://hdl.handle.net/20.500.12537/371</link>
<description>Tokenizer for Icelandic text (3.5.3) (2025-10-07)
Þorsteinsson, Vilhjálmur; Óladóttir, Hulda; Þórðarson, Sveinbjörn; Ragnarsson, Pétur Orri; Jónsson, Haukur Páll; Eyjólfsson, Logi
Tokenizer is a compact pure-Python 3 executable program and module for tokenizing Icelandic text. It converts input text to streams of tokens, where each token is a separate word, punctuation sign, number/amount, date, e-mail, URL/URI, etc. It also segments the token stream into sentences, considering corner cases such as abbreviations and dates in the middle of sentences. More information at: https://github.com/mideind/Tokenizer&#13;
 &#13;
Tokenizer er pakki fyrir Python 3, ásamt skipanalínutóli, sem sér um tilreiðslu íslensks texta. Pakkinn umbreytir inntakstexta í tókastraum. Hver tóki er stakt orð, greinarmerki, tala/upphæð, dags-/tímasetning, netfang, vefslóð o.s.frv. Tólið skiptir tókastraumnum einnig í setningar og tekur tillit til jaðartilvika eins og skammstafana og dagsetninga í miðjum setningum. Frekari upplýsingar á: https://github.com/mideind/Tokenizer
</description>
<pubDate>Thu, 15 Aug 2024 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://hdl.handle.net/20.500.12537/371</guid>
<dc:date>2024-08-15T00:00:00Z</dc:date>
</item>
</channel>
</rss>
