Alvenir Wav2vec2

En word2vec2 model, som er trænet på omtrent 1300 timers dansk taledata fra podcasts og lydbøger. Modellen er trænet på 16kHz taledata, hvilket også er formatet, der skal anvendes ved brug af modellen. Det er Alvenir, som har skabt modellen og stillet den til rådighed for offentligheden. Modellen skal fin-tunes før den kan anfvendes til talegenkendelse.

Udgivet under en Apache 2.0 licens.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://huggingface.co/Alvenir/wav2vec2-base-da
Metadata sidst opdateret december 3, 2021, 11:47 (UTC)
Metadata oprettet december 3, 2021, 09:41 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail martin@danspeech.io
Kontaktnavn Martin Carsten Nielsen & Rasmus Arpe Fogh Egebæk
Sprog dansk
URI https://data.gov.dk/dataset/lang/4791e0c1-218e-4023-93df-065ae458ebd2
Udgivelsesdato 28-11-2021
Type https://data.gov.dk/concept/core/lang-resource-type/Tool
usage talesyntese, talegenkendelse og udvikling af sprogmodeller