Evalueringsdatasæt for 1000 danske talemåder og faste udtryk

Det Danske Sprog- og Litteraturselskab har udviklet et datasæt som indeholder samlet 1000 danske talemåder og faste udtryk med overførte betydninger (herefter omtalt som talemåder). Datasættet er baseret på Den Danske Ordbogs samling af faste udtryk med tilhørende definitioner.

Datasættet har tre kolonner:

udtryk_id: Id-nummer for talemåden. Med dette Id-nummer kan vi linke datasættet med Den Danske Ordbog

talemåde_udtryk: Selve talemåden. Ved varierende former (fx der er forår (øretæver, amoriner, ..) i luften) har vi valgt én form.

ddo_definition: Definition fra Den Danske Ordbog. Ved varierende former har vi tilpasset definitionen så den afspejler den valgte form.

Datasættet udgives med en CC-by licens, hvilket betyder at Det Danske Sprog- og Litteraturselskab skal krediteres ved brug.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://sprogteknologi.dk/dataset/1000-talemader-evalueringsdatasaet
Metadata sidst opdateret november 20, 2024, 08:13 (UTC)
Metadata oprettet november 13, 2024, 15:08 (UTC)
Kontaktemail nats@dsl.dk
Kontaktnavn Nathalie Hau Sørensen
Opdateret 2024-11-20
Opdateringsfrekvens aldrig
URI https://data.gov.dk/dataset/lang/36a5da6d-7787-4f0d-802b-c608dfddd1d5
Udgivelsesdato 2024-11-20
Udgivernavn Det Danske Sprog- og Litteraturselskaber og Digitaliseringsstyrelsen
type https://data.gov.dk/concept/core/lang-resource-type/corpus