NST dansk ATG-database (16 kHz) - reorganisert

Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på dansk. I denne versjonen er dataene strukturert på nytt, slik at databasen enklere kommer til anvendelse.

I den opprinnelige versjonen av materialet var filene organisert i en bestemt mappestruktur der mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og det fantes også tilfeller av filer med samme navn i forskjellige mapper. Dette viste seg å være upraktisk, siden brukere måtte beholde den opprinnelige mappestrukturen for å kunne benytte seg av dataene. Filene er derfor navngitt på nytt, slik at filnavnene er unike og meningsbærende uavhengig av mappestrukturen. De opprinnelige metadatafilene var i spl-format. Disse er konvertert til JSON-format. De konverterte metadatafilene er anonymisert, og tekstkodingen er UTF-8 istedenfor ANSI, som det opprinnelige materialet hadde. Metadata og transkripsjoner foreligger også som CSV-filer.

Se dokumentasjonsfilen for en full beskrivelse av dataene og endringene som er gjort.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-55/
Metadata sidst opdateret april 28, 2022, 11:31 (UTC)
Metadata oprettet april 7, 2022, 12:51 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail sprakbanken@nb.no
Kontaktnavn Språkbanken
Opdateret 14-06-2021
Sprog dansk
URI https://data.gov.dk/dataset/lang/sbr-55
Udgivelsesdato 05-01-1998
Udgivernavn Nordisk Språkteknologi
Dokumentation
usage talegenkendelse