• Heim
  • Gagnasafn
  • Um CLARIN á Íslandi
  • CLARIN
  •  Login
  • English íslenska
  • CLARIN-IS gagnagrunnur
  • Skoða atriði
  •  
  •   What can you do?
  •   Skima  
    •    Allt varðveislusafnið  
      •   Útgáfudagur
      •   Höfundar
      •   Titlar
      •   Efni
      •   Útgefandi
      •   Tungumál
      •   Gerð
      •   Réttindamerki
  •   My Account  
    •    Login
  •   Statistics  
    •    StatisticsBETA
  •   General Information  
    •    Deposit
    •    Cite
    •    Submission Lifecycle
    •    FAQ
    •    About
    •    Help Desk
 
 

Talrómur 4 (26.04)

 
Clarin IS Repository
  Authors
Nikulásdóttir, Anna Björk and Schnell, Daniel
  Item identifier
http://hdl.handle.net/20.500.12537/383
 Date issued
2026-04-10
 Type
audio, corpus
 Size
4 hours
 Language(s)
Icelandic
 Description
ENGLISH: Talrómur 4 is a speech corpus containing recordings of children's voices. Three children at the age of 10, two girls and one boy, were recorded in four to five sessions each. The corpus consists of 2,881 audio clips of various length, from one word utterances up to paragraphs of 50 seconds. Texts accompany each recording. The audio is recorded at 48 kHz sample rate and 24 bit depth. Each audio file is stored in .flac format. In addition to the audio recordings, this corpus includes Voice Activity Detection (VAD) values for each utterance, obtained using OmniVAD. The data is available for research and development of children's TTS voices under a restrictive license from University of Iceland. Please get in touch with contact person for further information. ÍSLENSKA: Talrómur 4 er talgagnasafn með upptökum á barnaröddum. Þrjú tíu ára börn, tvær stúlkur og einn drengur, voru tekin upp í fjórum til fimm upptökulotum hvert. Gagnasafnið inniheldur 2.881 upptökur af mismunandi lengd, frá einu orði upp í lengri málsgreinar allt að 50 sekúndur að lengd. Texti fylgir hverri upptöku. Hljóðskrárnar voru teknar upp í 48 kHz og með 24 bita dýpt. Skrárnar eru geymdar á .flac sniði Auk hljóðskránna inniheldur þessi útgáfa raddvirknimerkingar (Voice Activity Detection values) fyrir hverja segð, fengnar með OmniVAD. Gagnasafnið er ekki opið en hægt er að fá aðgang að því til rannsókna og þróunar á barna-talgervilsröddum samkvæmt leyfi frá Háskóla Íslands. Vinsamlegast hafið samband við tengilið verkefnisins fyrir frekari upplýsingar.
 Publisher
Grammatek ehf
 
University of Iceland
 Acknowledgement

Ministry of Culture, Innovation and Higher Education

Project code: Recordings of Children's Voices for TTS

Project name: Language Technology for Icelandic II

 Subject(s)
TTS Speech Children
 Collection(s)
Clarin IS
Sýna fulla færslu atriðis
 
 

Samstarfsaðilar, stjórn og fjármögnun

  • Stofnun Árna Magnússonar í Íslenskum fræðum
  • Menningar- og viðskiptaráðuneytið

Gagnasafn

  • Aðalsíða
  • Hafa samband
  • Ferill gagnaskráningar
  • Algengar spurningar
  • Markmið og stefna

Meira

  • CLARIN
  • META-Net

CLARIN verkefnið á Íslandi er stutt af Mennta- og menningarmálaráðuneytinu

Copyright (c) 2023. Stofnun Árna Magnússonar í íslenskum fræðum. Allur réttur áskilinn.