FT-Speech

FT Speech er et dansk korpus med folketingets taler i lydformat og manuelt transskriberet tekst. Datasættet er blevet kureret af Andreas Kirkedal, Marija Stepanović og Barbara Plank som en del af deres videnskabelige artikel med samme navn, og derefter reorganiseret og uploadet af Dan Saattrup Nielsen fra Alexandra Instituttet.

Der er knap en million samples med 374 unikke talere i træningssættet og yderligere talere i validerings- og testsæt.

Datasættet er underlagt samme brugerdefinerede licens, som alt andet af Folketingets materiale.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://ftspeech.github.io/
Forfatter Andreas Kirkedal, Marija Stepanović, Barbara Plank
Metadata sidst opdateret april 26, 2024, 09:26 (UTC)
Metadata oprettet april 24, 2024, 12:37 (UTC)
Emne https://form-online.dk/opgavenoegle/10
Kontaktemail dan.nielsen@alexandra.dk
Kontaktnavn Dan Saattrup Nielsen
Opdateringsfrekvens aldrig
URI https://data.gov.dk/dataset/lang/1c4cd390-bddf-48fc-b5af-981b65b4e8b3
Udgivelsesdato 2020-14-09
Udgivernavn IT-Universitetet
Dokumentation
usage Talegenkendelse