NST Danish ASR Database (16 kHz) – reorganized

Denne database er udviklet af Nordisk språkteknologi AS som datagrundlag for talekendelse og diktering på dansk. I denne version er dataene strukturet på en ny måde, således at databasen lettere kommer til anvendelse. I den oprindelige version af materialet var filene organiseret i en bestemt mappestruktur hvor mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og der fandtes også tilfælde af filer med samme navn i forskellige mapper. Dette viste sig at være upraktisk, eftersom anvendere skulle bibeholde den oprindelige mappestruktur for at kunne benytte sig af dataene. Filene er derfor navngivet påny, således at filnavnene er unikke, meningsbærende og uafhængige af mappestrukturen. De oprindelige metadatafiler var i spl-format. Disse er konverteret til JSON-formatet. De konverterede metadatafiler er også anonymiseret, og tekstkodingen er nu UTF-8 istedet for ANSI, som det oprindelige materialet havde. Se dokumentationsfilen for en fuld beskrivelse af dataene og ændringerne som er foretaget.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-55/
Metadata sidst opdateret Oktober 28, 2020, 14:51 (UTC)
Metadata oprettet Oktober 28, 2020, 10:07 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Identifier sbr-55
Kontaktemail sprakbanken@nb.no
Kontaktnavn Språkbanken
Opdateret 2020-07-01
Udgivernavn Nationalbibliotektet i Norge
Type Korpora
Dokumentation