DK-CLARIN Referencekorpus med dansk almensprog

DK-CLARIN Reference Corpus of General Danish has been collected as part of DK-CLARIN project, WP2.1, 2008 - 2011. All texts are in XML TEIP5 format (TEIP5DKCLARIN-format), with tokenisation, ePOS-tagging, sentence and paragraph segmentation, and lemmatisation. The corpus comprises 45,113,245 words.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://repository.clarin.dk/repository/xmlui/handle/20.500.12115/36#
Forfatter Jørg Asmussen
Metadata sidst opdateret april 10, 2024, 07:12 (UTC)
Metadata oprettet juni 16, 2020, 07:38 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID http://hdl.handle.net/20.500.12115/36
Identifier http://hdl.handle.net/20.500.12115/36
Kontaktemail korpus@dsl.dk
Kontaktnavn DSL
URI http://hdl.handle.net/20.500.12115/36
Udgivelsesdato 2011
Udgivernavn DSL
type Korpora
Dokumentation