Denne database er udviklet af Nordisk språkteknologi AS som datagrundlag for talekendelse og diktering på dansk. I denne version er dataene strukturet på en ny måde, således at databasen lettere kommer til anvendelse. I den oprindelige version af materialet var filene organiseret i en bestemt mappestruktur hvor mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og der fandtes også tilfælde af filer med samme navn i forskellige mapper. Dette viste sig at være upraktisk, eftersom anvendere skulle bibeholde den oprindelige mappestruktur for at kunne benytte sig af dataene. Filene er derfor navngivet påny, således at filnavnene er unikke, meningsbærende og uafhængige af mappestrukturen. De oprindelige metadatafiler var i spl-format. Disse er konverteret til JSON-formatet. De konverterede metadatafiler er også anonymiseret, og tekstkodingen er nu UTF-8 istedet for ANSI, som det oprindelige materialet havde. Se dokumentationsfilen for en fuld beskrivelse af dataene og ændringerne som er foretaget.