Alvenir Wav2vec2

En word2vec2 model, som er trænet på omtrent 1300 timers dansk taledata fra podcasts og lydbøger. Modellen er trænet på 16kHz taledata, hvilket også er formatet, der skal anvendes ved brug af modellen. Det er Alvenir, som har skabt modellen og stillet den til rådighed for offentligheden. Modellen skal fin-tunes før den kan anfvendes til talegenkendelse.

Udgivet under en Apache 2.0 licens.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://huggingface.co/Alvenir/wav2vec2-base-da
Metadata sidst opdateret marts 15, 2023, 13:13 (UTC)
Metadata oprettet december 3, 2021, 09:41 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail martin@alvenir.ai
Kontaktnavn Alvenir
Sprog dansk
URI https://data.gov.dk/dataset/lang/4791e0c1-218e-4023-93df-065ae458ebd2
Udgivelsesdato 28-11-2021
type Værktøjer og teknologi
usage talesyntese, talegenkendelse og udvikling af sprogmodeller