Show simple item record

 
dc.contributor.author Ingason, Anton Karl
dc.contributor.author Stefánsdóttir, Lilja Björk
dc.contributor.author Sólmundsdóttir, Agnes
dc.date.accessioned 2020-09-28T14:52:47Z
dc.date.available 2020-09-28T14:52:47Z
dc.date.issued 2020-09-01
dc.identifier.uri http://hdl.handle.net/20.500.12537/64
dc.description A list of words in Icelandic that may in some way be considered inappropriate, taboo and/or loaded in use or meaning. These can be words such as; words that are biased against certain minorities (i.e. people of different races, abilities, genders or sexualities), words that are derogatory towards people, unnecessarily gendered, obsolete and so on. The list also includes words that are not very inappropriate but can be considered an unfortunate topic for children or politically loaded in any way. The words are grouped together in categories depending on either their meaning, form or use. Each word has then been marked with a short explanation (in Icelandic) on how they can be considered inappropriate and in what context. The words were collected through typical data collecting, but other similar lists from elsewhere were also used, i.e. a list of taboo words for children from Samrómur and a list of taboo words for children’s scrabble from Miðeind. This list does not contain actual information or data on the real opinion of the public towards these words. These words are merely thought to elicit a bad opinion. This list can therefore be a good set of data for this kind of sentiment survey. The list will be a part of the Icelandic Error Corpus which is in progress by the research team in language technology of the University of Iceland (Mál og tækni) as well as an upcoming Spell Checker based on said corpus. Listi af íslenskum orðum sem gætu talist óviðeigandi og/eða verið gildishlaðin á einhvern hátt. Það geta verið orð sem t.d. ýta undir mismunun gagnvart ákveðnum þjóðfélagshópum, teljast niðrandi þegar þau eru höfð um fólk, eru óþarflega kynjuð, teljast úrelt o.s.frv. Einnig eru orð á listanum sem teljast ekki beint óviðeigandi en gætu þótt óhentugt umræðuefni fyrir börn eða verið gildishlaðin á einhvern hátt. Á listanum eru orðin flokkuð í flokka ýmist eftir merkingu þeirra eða notkun og skráð hefur verið hvernig og í hvaða samhengi þau geta þótt óviðeigandi. Lista yfir flokkana og innihald þeirra má sjá hér fyrir neðan. Orðunum var safnað saman með hefðbundinni gagnasöfnun, en einnig var notast við svipaða lista annars staðar frá, þ.á.m. lista Samróms yfir orð sem þættu óæskilegt umræðuefni fyrir börn og listi Miðeindar yfir bannorð í netskrafli fyrir börn. Listinn er samansafn orða úr öllum áttum og er alls ekki tæmandi. Þessi listi inniheldur ekki upplýsingar eða gögn um raunverulegt viðhorf almennings til þessara orða. Orðin eru aðeins talin geta verið líkleg til að teljast óviðeigandi af almenningi. Listinn er því hentugt gagnasafn fyrir slíkar viðhorfskannanir. Listinn mun tilheyra villumálheild sem rannsóknarstofan Mál og tækni við Háskóla Íslands vinnur að, og verður jafnframt notaður til að auka nákvæmni væntanlegs villuleitarforrits sem byggir á henni.
dc.language.iso isl
dc.publisher University of Iceland
dc.rights Creative Commons - Attribution 4.0 International (CC BY 4.0)
dc.rights.uri https://creativecommons.org/licenses/by/4.0/
dc.rights.label PUB
dc.source.uri https://github.com/antonkarl/iceTaboo
dc.subject word list
dc.subject taboo words
dc.title Icelandic Taboo Database (iceTaboo) Version 1.0
dc.type corpus
metashare.ResourceInfo#ContentInfo.mediaType text
has.files yes
branding Clarin IS Repository
contact.person Anton Karl Ingason antoni@hi.is University of Iceland
sponsor Ministry of Education, Science and Culture Word lists and language models (L4) Language Technology for Icelandic 2019-2023 nationalFunds
size.info 2724 words
files.size 319491
files.count 1


 Files in this item

This item is
Publicly Available
and licensed under:
Creative Commons - Attribution 4.0 International (CC BY 4.0)
Icon
Name
iceTaboo-master.zip
Size
312 KB
Format
application/zip
Description
A zip file containing all relevant files
MD5
f88bb10b37d4473dfbf1e2795fe9746b
 Download file  Preview
 File Preview  
  • __MACOSX
    • ._iceTaboo-master-1 B
    • iceTaboo-master
      • others
        • ._önnur merking.tsv-1 B
        • ._Uppsetning flokka.tsv-1 B
        • ._Flokkun.tsv-1 B
      • ._Ovideigandi_ord_flokkar_excel-1 B
      • ._README.md-1 B
      • old
        • ._Ovideigandi_ord_flokkar_excel.xlsx-1 B
        • ._onnur_merking_orda.tsv-1 B
        • ._ovideigandi_listi.tsv-1 B
        • ._misovideigandi_ordalisti.tsv-1 B
      • ._FlokkarAll.tsv-1 B
      • ._cc-by-4-0.txt-1 B
      • ._old-1 B
      • ._others-1 B
      • Ovideigandi_ord_flokkar_excel
        • ._Ahersluforskeyti.tsv-1 B
        • ._Drykkju_dopord.tsv-1 B
        • ._(Kven)kynjuð_ord.tsv-1 B
        • ._(Karl)kynjud.tsv-1 B
        • ._Kynjud_ord.tsv-1 B
        • ._Ekki_ovideigandi.tsv-1 B
        • ._Blotsyrdi.tsv-1 B
        • ._Heilbrigdistengd.tsv-1 B
        • ._Thjodernisord.tsv-1 B
        • ._Ov._bornum.tsv-1 B
        • ._Politisk_ord.tsv-1 B
        • ._LGBTQIA+ord.tsv-1 B
        • ._Utlit.tsv-1 B
        • ._Fotlunarorð.tsv-1 B
        • ._Lysingarord_(ljot_um_folk).tsv-1 B
        • ._Kynlifstengd.tsv-1 B
        • ._Heimsku-ord.tsv-1 B
        • ._Nafnord_(ljot_um_folk).tsv-1 B
        • ._Sagnir.tsv-1 B
        • ._Fagheiti.tsv-1 B
        • ._Almennt_ovideigandi.tsv-1 B
        • ._Truarord.tsv-1 B
        • ._Kynfaeraord.tsv-1 B
  • iceTaboo-master
    • old
      • Ovideigandi_ord_flokkar_excel.xlsx-1 B
      • ovideigandi_listi.tsv-1 B
      • onnur_merking_orda.tsv-1 B
      • misovideigandi_ordalisti.tsv-1 B
    • README.md-1 B
    • cc-by-4-0.txt-1 B
    • FlokkarAll.tsv-1 B
    • others
      • Flokkun.tsv-1 B
      • Uppsetning flokka.tsv-1 B
      • önnur merking.tsv-1 B
    • Ovideigandi_ord_flokkar_excel
      • Blotsyrdi.tsv-1 B
      • Lysingarord_(ljot_um_folk).tsv-1 B
      • (Kven)kynjuð_ord.tsv-1 B
      • Almennt_ovideigandi.tsv-1 B
      • Ov._bornum.tsv-1 B
      • Heilbrigdistengd.tsv-1 B
      • Politisk_ord.tsv-1 B
      • Thjodernisord.tsv-1 B
      • Fotlunarorð.tsv-1 B
      • Nafnord_(ljot_um_folk).tsv-1 B
      • Heimsku-ord.tsv-1 B
      • Kynlifstengd.tsv-1 B
      • (Karl)kynjud.tsv-1 B
      • Kynfaeraord.tsv-1 B
      • Ekki_ovideigandi.tsv-1 B
      • Drykkju_dopord.tsv-1 B
      • Sagnir.tsv-1 B
      • Fagheiti.tsv-1 B
      • Ahersluforskeyti.tsv-1 B
      • Utlit.tsv-1 B
      • LGBTQIA+ord.tsv-1 B
      • Kynjud_ord.tsv-1 B
      • Truarord.tsv-1 B

Show simple item record