Markmið og stefna CLARIN-IS varðveislusafnsins



Markmið


Markmið CLARIN ERIC (sem CLARIN-IS er hluti af) er að efla rannsóknir í hug- og félagsvísindum með því að veita fræðimönnum aðgang að vettvangi sem sameinar gögn og verkfæri til rannsóknar á tungumálinu með einfaldri innskráningu. Markmiðinu skal náð með stofnun og rekstri á sameiginlegum dreifðum innviðum sem hafa það að markmiði að gera máltæknigögn, tækni- og sérfræðiþekkingu aðgengileg innan hug- og félagsvísinda og fræðasamfélagsins almennt. Sjá nánar Clarin IS.

Nánari upplýsingar um CLARIN ERIC á ensku: CLARIN-ShortGuide.pdf


Þjónustuskilmálar

Til að ná fram settum markmiðum eru sett fram grunnskilyrði í þjónustuskilmálum.

Gögn í CLARIN-IS varðveislusafninu eru aðgengileg í samræmi við leyfisskráningu þeirra. Í þeim tilvikum þar sem ekkert leyfi er tiltekið er frjálst aðgengi að gögnunum til prentunar, niðurhals og annars konar óhagnaðardrifinna rannsókna eða einkanota. Notendur þurfa í öllum útgáfum að tilgreina efnið sem fengið er úr varðveislusafninu með varanlegu auðkenni(sjá auðkenning gagna), upprunalegum höfundi/höfundum og útgefendum þar sem þeirra er getið. Efnið má ekki forvinna á vélrænan hátt nema til greiningar á efnisinnihaldi og tilvitnunum. Ekki er leyfilegt að þiggja greiðslu fyrir efni úr varðveislusafninu án leyfis viðkomandi rétthafa nema sérstaklega sé tekið fram að svo megi samkvæmt útgefnu leyfi.


Um varðveislusafnið

Því má líkja við bókasafn með mállegum gögnum og búnaði.

  • Hægt er að leita að gögnum og búnaði og hlaða niður á einfaldan hátt.
  • Leggja inn gögn og vera viss um að þau séu örugglega varðveitt, allir geti fundið þau, notað þau, og vísað í þau á réttan hátt (og getið þín)

Um CLARIN-IS

Ísland gerðist áheyrnaraðili að CLARIN ERIC í nóvember 2018. Mennta- og menningarmálaráðuneytið fól Stofnun Árna Magnússonar í íslenskum fræðum að vera leiðandi aðili í íslenskum landshópi. Í ársbyrjun 2019 var komið upp vefsíðu fyrir CLARIN-IS þar sem er að finna ýmsar upplýsingar um þátttöku Íslands í CLARIN ERIC. Undirbúningur að uppsetningu CLARIN-miðstöðvar hófst í apríl 2019 og í nóvember það ár var varðveislusafn CLARIN-IS komið upp. CLARIN-IS er C-miðstöð (C-Centre) en stefnt er að því að það verði B-mistöð í framtíðinni. Ísland fékk svo fulla aðild að CLARIN ERIC í febrúar 2020.


Leyfi og samningar

Sem stendur gerir CLARIN-IS ráð fyrir þrenns konar samningum.

  • Í sérhverri innlögn gagna felst staðlaður samningur við þann sem leggur inn, svokallað samkomulag um leyfi til dreifingar ("Distribution License Agreement"), þar sem við gerum grein fyrir réttindum okkar og skyldum og sá sem leggur gögnin inn staðfestir að hann hafi leyfi til þess og gefur okkur (varðveislusafninu) rétt til að dreifa gögnunum fyrir sína hönd.
  • Allir sem hlaða gögnunum niður eru bundnir af því leyfi sem fylgir þeim - til að hlaða niður vörðum gögnum þarf að auðkenna sig og skrifa undir leyfisskilmála á rafrænan hátt. Skrá um leyfi sem notuð eru í varðveislusafninu er hér.
  • Einnig er hægt að skilgreina sértæk leyfi fyrir tiltekin gögn þegar þau eru lögð inn.

Hugverkaréttur

Eins og nefnt er í kaflanum Leyfi og samningar er þess krafist að sá sem leggur inn gögn eða búnað skrifi undir leyfi til dreifingar ("Distribution License Agreement") sem staðfestir að hann hafi leyfi til að leggja gögnin inn og veitir okkur (varðveislusafninu) rétt til að dreifa þeim fyrir sína hönd. Þetta þýðir að þeir sem leggja inn gögn bera einir ábyrgð á að mál er varða hugverkarétt séu frágengin áður en gögn eða búnaður er birt með því að leggja þau inn hjá okkur.
Ef einhvern grunar að einhver gögn eða búnaður í varðveislusafninu brjóti gegn hugverkarétti einhvers skal umsvifalaust hafa samband við þjónustuborð okkar.


Persónuverndarstefna

Lesið persónuverndarstefnu okkar til að sjá hvernig við förum með persónugreinanlegar upplýsingar sem geymdar eru í CLARIN varðveislusafninu og þjónustum þess.


Lýsigögn

Innlögðum gögnum verða að fylgja fullnægjandi lýsigögn sem lýsa innihaldi þeirra, uppruna og sniði formats til stuðnings við varðveislu þeirra og dreifingu. Lýsigögnin eru aðgengileg öllum og er dreift á opnu svæði (með CC0 leyfi). Við ætlumst þó til að tilkynningar um notkun lýsigagna úr CLARIN varðveislusafninu í viðskiptalegum tilgangi og lýsing á notkuninni sé send þjónustuborðinu.


Varðveislustefna

CLARIN skuldbindur sig til langtíma umsjónar með efni sem lagt er inn í varðveislusafnið, að varðveita rannsóknargögn og aðstoða við að gera mögulegt að endurtaka rannsóknir og leggur sig fram um að vinna í samræmi við bestu aðferðir á hverjum tíma í stafrænni varðveislu - sjá stefnuyfirlýsinguna. Við vinnum í samræmi við gæðaleiðbeiningar, staðla og reglur sem CLARIN eða OAIS setja fram.

Til að halda stöðu okkar sem ábyggilegt og trúverðugt varðveislusafn undirgöngumst við reglulegt mat hjá CLARIN og CTS/DSA.

Til að standa við skuldbindingar sínar tryggir varðveislusafnið að tekið er við gögnum og þeim dreift í samræmi við leyfisskilmála þeirra (sjá samkomulag og samningar). Í sumum tilvikum (þegar um er að ræða leyfi sem fela ekki í sér opinn aðgang) þýðir þetta að aðeins notendur með aðgangsheimild geta komist í gögnin.

Innlagnarferlið eins og því er lýst í deposit og vinna ritstjóra okkar tryggir að gögnin séu finnanleg (með því að krefjast viðeigandi lýsigagna) með leitarvél okkar, utan frá gegnum OAI-PMH og í síðulýsigögnum fyrir ákveðna vefskriðla. Lýsigögnin eru aðgengileg öllum.

Ýmis sjálfvirk ferli s.s. stöðugleikaprófanir tryggja að innlögð gögn séu heildstæð og lýsigögn fullbúin. Við nýtum fjölbreyttar innri og ytri afritunaraðferðir og vélbúnaðarvöktun. Gögnin eru aðgengileg á netinu.

Við lítum á gögn og búnað sem grundvallarafurðir rannsókna, sérhver innlögn fær fast auðkenni (Persistent IDentifier) sem hægt er að vísa í og notendum er leiðbeint um notkun þeirra. Breytingar á gögnum sem hafa verið gefin út eru ekki leyfðar; þess í stað er nýrrar innlagnar krafist. Gamla og nýja innlögnin tengjast gegnum lýsigögn sín (sjá nánar í faq).

Starfsfólk varðveislusafnsins fær upplýsingar um nýjungar í tæknimálum og ný verkefni með reglulegri þátttöku í viðburðum CLARIN, Open Repositories og ýmsum öðrum fundum, námskeiðum og ráðstefnum.

Hinar fjölbreyttu útflutningsleiðir sem kerfi varðveislusafnsins (DSpace) býður upp á tryggja að gögn og lýsigögn þeirra séu ekki læst inni heldur séu flytjanleg í annað kerfi.

Varðveislusafnið hvetur til þass að notuð séu skráasnið sem CLARIN mælir með. Ef æskileg skráasnið breytast mun varðveislusafnið leitast við að færa gögn yfir á nýtt snið en einnig varðveita gögnin á upphaflegu sniði til að unnt sé að endurtaka rannsóknir (breytt gagnasafn verður að nýrri færslu í varðveislusafninu með tengingu við þá eldri). Leiðarhnoða við val á sniði eru: opnir staðlar eru æskilegri en sérsniðnir, snið eiga að vera vel skjöluð, sannreynanleg og sannprófuð, snið sem byggjast á texta eru tekin fram yfir tvíundarsnið ef kostur er, þegar hliðræn gögn eru gerð stafræn er mælt með samþjöppun án glötunar eiginleika eða engri samþjöppun.

Ef fjármögnun bregst verður innihald varðveislusafnsins flutt til annars CLARIN seturs. Meðan verið er að ganga frá lagalegum atriðum í sambandi við flutning gagna til annarrar stofnunar mun geymslustofnunin (CLARIN-IS) tryggja aðgang að gögnunum í a.m.k. 10 ár.