Begrebsliste

Bemærk at denne begrebliste er under udarbejdelse, og at den efter færdiggørelse vil blive forelagt et forum relevant for emneområdet til godkendelse.

Metadata for "Begrebsliste: Begreber relevante ifm. sprogteknologi.dk"

Begrebsliste: Begreber relevante ifm. sprogteknologi.dk

  • Namespace: https.//data.gov.dk/concept/profile/sprogteknologi-dk (foreslået)
  • Modelnavn (label): Begreber relevante ifm. sprogteknologi.dk
  • Modelansvarlig (responsibleEnity): Digitaliseringsstyrelsen
  • Versionsnummer (versionInfo): 0.2.0
  • Seneste opdateringsdato (dateModified) 2020-06-16
  • Modelomfang (modelScope): application
  • Modelstatus (modelStatus): development
  • Godkendelsesstatus (approvalStatus): afventer godkendelse (af et forum relevant for emneområdet)
  • Forretningsområde (theme): https://form-online.dk/opgavenoegle/16/#16.05.07
  • Kommentar (comment): Begrebsmodel der indholder centrale begreber i forhold til portalen sprogteknologi.dk, som har personer med interesse for og nogen kendskab til sprogteknologi, men som ikke er fageksperter, som målgruppe
NB: Begrebslisten er oprettet i henhold til https://arkitektur.digst.dk/metoder/regler-begrebs-og-datamodellering. En del af modelleringsmetoden går ud på at genbruge eksisterende begreber og angive referencer til kilder, hvor definitionen er hentet eller udledt fra. Modelreglerne anviser også, hvorledes definitioner stuktureres i overensstemmelse med gældende standarder og best practices på området, herunder ISO 704, ISO 1087 og Terminologi 1 - principper og metoder af Bodil Nistrup Madsen.

akustisk model

statisk model over hyppigheder af sproglyde og deres sammensætninger på et givet sprog

En akustisk model bruges i taleteknologi til at repræsentere forholdet mellem lydsignaler og fonemer eller andre sproglige enheder der udgør tale.

https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse

Ja

acoustic model

algoritme

endelig liste af veldefinerede instruktioner for hvordan en given opgave skal løses

Et computerprogram udgøres fx af forbundne algoritme beskrevet i programmeringssprog.

http://www.informationsordbogen.dk/concept.php?cid=2832

Nej

algorithm

annotation

opmærkning; annotering

at forsyne ord og andre sprogelementer med metadata

Fx oplysninger om ordklasse eller udtale.

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

annotation

annoterede sprogdata

sprogdata der er forsynet med metadata på tekstniveau samt på ordniveau

Fx grammatisk opmærkning på ordniveau.

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

annotated language data

begrebsmodel

model der beskriver begreber inden for et bestemt emneområde eller anvendelseskontekst og disse begrebers indbyrdes relationer

https://arkitektur.digst.dk/metoder/regler-begrebs-og-datamodellering

Nej

concept model

blark

grundlæggende sprogressourcesamling

samling af grundlæggende sprogressourcer der er nødvendige for at udvikle sprogteknologi for et givet sprog

http://www.blark.org/

Ja

basic language resource kit

data statement

metadata om et datasæts oprindelse der har til formål at synliggøre bias i datasættet

Der er bl.a. tale om demografiske oplysninger om bidragsydere og dataindsamlere og om hvordan datasættet er indsamlet

https://www.aclweb.org/anthology/Q18-1041.pdf

Ja

data statement

datasæt

datasamling

samling af data, udgivet eller arrangeret af en enkelt kilde og som er til rådighed for adgang til eller download af i en eller flere repræsentationer

Kurateret dækker her over udvælgelse og organisering.

http://www.w3.org/ns/dcat#Dataset

Nej

dataset

digital assistent

virtuel personlig assistent

it-løsning som kan assistere og interagere med mennesker på en menneskelig måde

Fx chatbot

https://www.techopedia.com/definition/31383/intelligent-virtual-assistant

Ja

digital assistant

dyb læring

superviseret læring

maskinlæring som opnås gennem træning på annoterede data

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Nej

deep learning

emneklassifikation

opdeling af en given genstandsmængde i klasser ud fra deres emnemæssige tilhørsforhold.

Emnebaseret kategorisering af ressourcer, fx klassificering af borger/kundehenvendelser ift. hvilken afdeling der skal håndtere dem, inddelling af ressourcer ift. videnskabelig disciplin eller opmærkning af sager med typeinformation.

https://denstoredanske.lex.dk/klassifikation_-_ordning_i_klasser

Ja

subject classification

fonem

sproglyd med betydningsadskillende funktion

Alfabetet bygger i princippet på fonemer, således at hvert bogstav i princippet skulle repræsentere et fonem. Der er dog mange afvigelser fra det princip, fx udtrykkes a med forskellige fonemer i har og hat.

https://denstoredanske.lex.dk/fonem

Ja

phoneme

fonetik

læren om sprogets lydlige side

https://denstoredanske.lex.dk/fonetik

Ja

phonetics

glosar

ordbog der indeholder betegnelser fra et eller flere domæner eller emneområder sammen med oversættelser til et eller flere sprog

https://www.iso.org/obp/ui/#iso:std:iso:1087:ed-2:v1:en:term:3.7.6

Ja

glossary

korpus

samling af tekst eller tale

The META-SHARE Metadata Schema

Ja

corpus

kunstig intelligens

ai

algoritmer der ved at analysere og finde mønstre i data kan identificere den mest hensigtsmæssige løsning

https://www.regeringen.dk/media/6537/ai-strategi_web.pdf

Nej

artificial intelligence

leksikalsk ressource

sprogressource som repræsenterer leksikalsk eller begrebsmæssig viden

Fx ordbøger eller termdatabaser.

The META-SHARE Metadata Schema

Ja

lexical resource

maskinlæring

proces der bruger algortimer der muliggør læring fra eksisterende data for at forudsige fremtidige resultater

https://www.iso.org/obp/ui/#iso:std:iso-iec:38505:-1:ed-1:v1:en:term:3.7

Nej

machine learning

maskinoversættelse

oversættelse fra et sprog til et andet foretaget af en computer

http://denstoredanske.dk/Sprog,_religion_og_filosofi/Sprog/Datalingvistik_og_sprogteknologi/Maskinovers%C3%A6ttelse

Ja

machine translation

monolingval

vedrører, er skrevet på eller foregår på ét sprog

https://ordnet.dk/ddo/ordbog?query=monolingval

Ja

monolingual

natursprog

naturligt sprog

naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden

Modsat kunstige sprog, som fx esperanto eller programmeringssprog.

https://www.collinsdictionary.com/us/dictionary/english/natural-language

Ja

natural language

natursprogsbehandling

nlp

naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden

https://towardsdatascience.com/natural-language-processing-nlp-for-machine-learning-d44498845d5b

Ja

natural language processing

navnegenkendelse

ner

identifikation af navne i løbende tekst

Kan inkluderer klassifkation af typen af navn, fx person-, sted- eller organisationsnavn.

https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da

Ja

named entity recognition

nøgleordsanalyse

keywordanalyse

identifikation af de væsentligste indholdsord i en tekst ved statistisk analyse

https://www.moos-bjerre.dk/ydelser/noegleordsanalyse/

Ja

keyword detection

ontologi

formel beskrivelse af de begreber og sammenhænge inden for et bestent område

https://denstoredanske.lex.dk/vidensrepr%C3%A6sentation

Ja

ontology

ordbog

leksikalsk opslagsværk der indeholder oplysninger om ord og deres sproglige form og indhold, fx stavning, ordklasse, bøjning, udtale, betydning, brug, synonymer og historie i et sprog eller om ordenes oversættelse til et andet sprog

https://ordnet.dk/ddo/ordbog?query=ordbog

Ja

dictionary

overfladeorienteret læring

ikke-superviseret læring

maskinlæring som opnås gennem træning på rådata

Står i modsætning til dyb læring (supervised learning).

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Nej

unsupervised learning

overfladeorienteret læring

ikke-superviseret læring

maskinlæring som opnås gennem træning på rådata

Står i modsætning til dyb læring (supervised learning).

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Nej

unsupervised learning

oversættelseshukommelse

database hvor sætninger og deres oversættelse er lagret parvis

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

translation memory

parallelkorpus

korpus bestående af tekster på et sprog som sammenkobles med oversættelser til et andet sprog

http://www.ilc.cnr.it/EAGLES96/corpustyp/node20.html

Ja

parallel corpus

referencekorpus

korpus der udgør en antaget repræsentativ stikprøve af sproget

https://ja.dsl.dk/papers/CBS%202007/korpus-intro.pdf

Ja

reference corpus

rå sprogdata

sprogdata hvor den sproglige information ikke er bearbejdet, som ikke er grundigt strukturerede, og hvor det heller ikke er muligt at filtrere eller sammensætte teksterne efter bestemte kriterier

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

raw language data

semantisk søgning

søgning der forsøger at finde resultatet baseret på betydningen af forespørgslen fremfor at matche en eksakt søgestreng

https://en.wikipedia.org/wiki/Semantic_search

Ja

semantic search

spamfiltrering

automatisk frasortering af uønskede mails

Fx baseret på automatisk emneklassifikation.

http://www.informationsordbogen.dk/concept.php?cid=7099

Nej

spam filtering

spontantale

tale der ikke er planlagt eller nedskrevet på forhånd

https://medical-dictionary.thefreedictionary.com/spontaneous+speech

Ja

spontaneous speech

sprogdata

data bestående af lagret tekst eller tale

Fx avisartikler, sms'er, manualer, optagelser af samtaler, oplæste tekster.

sprogteknologi.dk

Ja

language data

sprogforståelse

uddragelse af betydning fra tekst eller tale i naturligt sprog

https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v1:en:term:2123786

Ja

natural language understanding

sprogmodel

statisk model over ord og ordsammensætningers hyppigheder på et givet sprog

https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse

Ja

language model

sprogressource

ressource som kan anvendes til at løse en sprogrelateret opgave

Dette er et bredt begreb der dækker alt fra ordbørger og grammatikker til sprogdatasæt og korpora til sprogmodeller og suppertværktøjer med mere. Alt hvad der katalogiseres på sprogteknolgi.dk er fx sprogressourcer.

sprogteknologi.dk

Ja

language resource

sprogteknologi

teknologi der anvendes til at få computere til at bearbejde tekster eller udsagn på almindeligt menneskeligt sprog

Dvs. teknologier der kan analysere, genkende eller producere naturligt sprog.

https://denstoredanske.lex.dk/sprogteknologi;https://ordnet.dk/ddo/ordbog?query=sprogteknologi

Ja

language technology

sprogteknologisk infrastrukturkomponent

sprogressource i form af en genbrugelig komponent med et bestemt sprogteknologisk anvendelsesformål

sprogteknologi.dk

Ja

language technology infrastructure component

sprogteknologisk softwareløsning

sprogressource i form af en endelig sprogløsning der er målrettet slutbrugeren

Fx en talegenkender eller en chatrobot.

sprogteknologi.dk

Ja

language software solution

sprogteknologisk supportværktøj

værktøj, der understøtter indsamling og forarbejdning af sprogdata

Fx anonymisering, opmærkning eller analyse af indsamlet data.

https://www.researchgate.net/publication/334773144_Language_Technology_for_Icelandic_2018-2022

Ja

language support tool

sprogteknologisk værktøj og teknologi

samlebegreb for sprogteknologiske supportværktøjer og infrastrukturkomponenter

The META-SHARE Metadata Schema

Ja

language technology tool and technology

stemningsanalyse

sentimentanalyse

analyse af det emotionelle indhold i tekst og tale

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

sentiment analysis

tale-til-tekst-løsning

talegenkendelses-løsning

løsning som er i stand til at registrere menneskelig tale og genkende de sagte ord

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

speech-to-text service

talegenkendelse

automatisk genkendelse og omsætning til maskinlæsbar skrift af sproglyde i sammenhængende tale

Man konverterer typisk tale til skreven tekst.

https://denstoredanske.lex.dk/talegenkendelse

Ja

speech recognition

talesyntese

frembringelse af kunstig tale vha. elektronisk og elektro-akustisk teknik

Man konverterer typisk skreven tekst til tale.

https://denstoredanske.lex.dk/talesyntese

Ja

speech synthesis

taleteknologi

teknologi der anvendes ved en computers bearbejdning af talesignaler og tekst med det formål automatisk dels at genkende og forstå tale, talegenkendelse, dels at danne computerskabt tale, talesyntese

http://denstoredanske.dk/It,_teknik_og_naturvidenskab/Elektronik,_teletrafik_og_kommunikation/Kommunikationsteori_og_teletrafikteori/taleteknologi

Ja

speech technology

tekst-til-tale-løsning

talesynteseløsning

løsning som sætter en computer i stand til at efterligne et talende menneske

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

text-to-speech service

tekstanalyse

analyse af tekst med henblik på at forstå dennes indhold

Formålet kan fx være at emneklassificere teksten, udtrække et resume eller stemningsanalyse.

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

text analysis

tekstforslag

tekstforudsigelse

funktion hvor et system giver forslag til, hvilket ord eller tekststykke brugeren ønsker at skrive

Anvendes fx i tastaturprogrammer til mobiltelefoner og i oversættelseshukommelser.

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

predictive text

tekstresumering

tekstsammenfatning

processen hvorved der skabes en kort oversigt over hovedtræk i fx en sag, noget sagt eller noget skrevet

https://ordnet.dk/ddo/ordbog?aselect=resum%C3%A9&query=resumering

Ja

text summarization

term

fagudtryk

ord eller udtryk med en fastlagt teknisk definition, brugt som betegnelse for et fagligt begreb

https://ordnet.dk/ddo/ordbog?query=term

Ja

term

termbase

termbank

database over fagord og deres betydning og anvendelse

https://sproget.dk/temaer/sprogteknologi/fagsprog-og-termbaser

Ja

term base

termekstraktion

termudtræk

identifikation og ekstraktion af termer fra løbende tekst

https://www.iso.org/obp/ui/#search

Ja

term extraction

tokeniser

tokeniseringsprogram; ordidentifikation

program der forbereder en tekst til videre behandling ved at identificere tegnsekvenser som ord

En token er en instans af en tegnsekvens i et bestemt dokument der sammenstillet kan behandles som en semantisk enhed - ofte betegnet ord eller termer.

https://nlp.stanford.edu/IR-book/html/htmledition/tokenization-1.html

Ja

tokenizer

transskription

tekstuel gengivelse af udtalte ord eller sammenhængende tale

Transskription kan i andre sammenhænge også bruges generelt om overførsel fra ét tegnsystem til et andet

https://denstoredanske.lex.dk/transskription_-_af_udtale_eller_tale

Ja

transcription

vidensmodellering

videnmodellering

udvikling af begrebsmodeller for et bestemt fagområde

https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse

Ja

knowlegde modeling

Foretrukken
dansk term
Accepteret 
dansk term
Definition Kommentarer og eksempler Kilde Tilhører
emne-område
Foretrukken engelsk term
akustisk model   statistisk model over hyppigheder af sproglyde og deres sammensætninger på et givet sprog En akustisk model bruges i taleteknologi til at repræsentere forholdet mellem lydsignaler og fonemer eller andre sproglige enheder, der udgør tale. https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse Ja acoustic model
algoritme   endelig liste af veldefinerede instruktioner for hvordan en given opgave skal løses Et computerprogram udgøres fx af forbundne algoritmer beskrevet i programmeringssprog. http://www.informationsordbogen.dk/concept.php?cid=2832 Nej algorithm
annotation opmærkning; annotering at forsyne ord og andre sprogelementer med metadata Fx oplysninger om ordklasse eller udtale https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja annotation
annoterede sprogdata   sprogdata der er forsynet med metadata på tekstniveau samt på ordniveau Fx grammatisk opmærkning på ordniveau https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja annotated language data
begrebsmodel   model der beskriver begreber inden for et bestemt emneområde eller anvendelseskontekst og disse begrebers indbyrdes relationer   https://arkitektur.digst.dk/metoder/regler-begrebs-og-datamodellering Nej concept model
BLARK grundlæggende sprogressource-samling samling af grundlæggende sprogressourcer der er nødvendige for at udvikle sprogteknologi for et givet sprog   http://www.blark.org/ Ja basic language resource kit
data statement   metadata om et datasæts oprindelse der har til formål at synliggøre bias i datasættet Der er bl.a. tale om demografiske oplysninger om bidragsydere og dataindsamlere og om hvordan, datasættet er indsamlet. https://www.aclweb.org/anthology/Q18-1041.pdf Ja data statement
datasæt datasamling samling af data, udgivet eller kurateret af en enkelt kilde og som er til råde for adgang til eller download af i en eller flere repræsentationer Kurateret dækker her over udvælgelse og organisering. http://www.w3.org/ns/dcat#Dataset Nej dataset
digital assistent virtuel personlig assistent it-løsning som kan assistere og interagere med mennesker på en menneskelig måde Fx chatbot https://www.techopedia.com/definition/31383/intelligent-virtual-assistant Ja digital assistant
dyb læring superviseret læring maskinlæring som opnås gennem træning på annoterede data   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Nej deep learning
emneklassifika-tion   opdeling af en given genstandsmængde i klasser ud fra deres emnemæssige tilhørsforhold. Emnebaseret kategorisering af ressourcer, fx klassificering af borger/kunde-henvendelser ift. hvilken afdeling der skal håndtere dem, inddeling af ressourcer ift. videnskabelig disciplin eller opmærkning af sager med typeinformation. https://denstoredanske.lex.dk/klassifikation_-_ordning_i_klasser Ja subject classification
fonem   sproglyd med betydningsadskillende funktion Alfabetet bygger i princippet på fonemer således, at hvert bogstav i princippet skulle repræsentere et fonem. Der er dog mange afvigelser fra det princip, fx udtrykkes a med forskellige fonemer i har og hat. https://denstoredanske.lex.dk/fonem Ja phoneme
fonetik   læren om sprogets lydlige side   https://denstoredanske.lex.dk/fonetik Ja phonetics
glosar   ordbog der indeholder betegnelser fra et eller flere domæner eller emneområder sammen med oversættelser til et eller flere sprog   https://www.iso.org/obp/ui/#iso:std:iso:1087:ed-2:v1:en:term:3.7.6 Ja glossary
korpus   samling af tekst eller tale   The META-SHARE Metadata Schema Ja corpus
kunstig intelligens AI algoritmer der ved at analysere og finde mønstre i data kan identificere den mest hensigtsmæssige løsning   https://www.regeringen.dk/media/6537/ai-strategi_web.pdf Nej artificial intelligence
leksikalsk ressource   sprogressource som repræsenterer leksikalsk eller begrebsmæssig viden Fx ordbøger eller termdatabaser The META-SHARE Metadata Schema Ja lexical resource
maskinlæring   proces der bruger algoritmer, der muliggør læring fra eksisterende data for at forudsige fremtidige resultater   https://www.iso.org/obp/ui/#iso:std:iso-iec:38505:-1:ed-1:v1:en:term:3.7 Nej machine learning
maskinoversæt-telse   oversættelse fra et sprog til et andet foretaget af en computer   http://denstoredanske.dk/Sprog,_religion_og_filosofi/Sprog/Datalingvistik_og_sprogteknologi/Maskinovers%C3%A6ttelse Ja machine translation
monolingval   vedrører, er skrevet på eller foregår på ét sprog   https://ordnet.dk/ddo/ordbog?query=monolingval Ja monolingual
natursprog naturligt sprog naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden Modsat kunstige sprog, som fx esperanto eller programmeringssprog https://www.collinsdictionary.com/us/dictionary/english/natural-language Ja natural language
natursprogs-behandling NLP automatisk datalogisk behandling af naturligt sprog   https://towardsdatascience.com/natural-language-processing-nlp-for-machine-learning-d44498845d5b Ja natural language processing
navnegenkendelse ner identifikation af navne i løbende tekst Kan inkludere klassifikation af typen af navn, fx person-, organisations- eller stednavn https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da Ja named entity recognition
nøgleordsanalyse keywordanalyse identifikation af de væsentligste indholdsord i en tekst ved statistisk analyse   https://www.moos-bjerre.dk/ydelser/noegleordsanalyse/ Ja keyword detection
ontologi   formel beskrivelse af begreber og sammenhænge inden for et bestemt område   https://denstoredanske.lex.dk/vidensrepr%C3%A6sentation Ja ontology
ordbog   leksikalsk opslagsværk der indeholder oplysninger om ord og deres sproglige form og indhold, fx stavning, ordklasse, bøjning, udtale, betydning, brug, synonymer og historie i et sprog eller om ordenes oversættelse til et andet sprog   https://ordnet.dk/ddo/ordbog?query=ordbog Ja dictionary
overfladeoriente-ret læring ikke-superviseret læring maskinlæring som opnås gennem træning på rådata Står i modsætning til dyb læring (supervised learning) https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Nej unsupervised learning
oversættelses-hukommelse   database hvor sætninger og deres oversættelse er lagret parvis   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja translation memory
parallelkorpus   korpus bestående af tekster på et sprog som sammenkobles med oversættelser til et andet sprog   http://www.ilc.cnr.it/EAGLES96/corpustyp/node20.html Ja parallel corpus
referencekorpus   korpus der udgør en antaget repræsentativ stikprøve af sproget   https://ja.dsl.dk/papers/CBS%202007/korpus-intro.pdf Ja reference corpus
rå sprogdata   sprogdata hvor den sproglige information ikke er bearbejdet, som ikke er grundigt strukturerede, og hvor det heller ikke er muligt at filtrere eller sammensætte teksterne efter bestemte kriterier   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja raw language data
semantisk søgning   søgning der forsøger at finde resultatet baseret på betydningen af forespørgslen fremfor at matche en eksakt søgestreng   https://en.wikipedia.org/wiki/Semantic_search Ja semantic search
spamfiltrering   automatisk frasortering af uønskede mails Fx baseret på automatisk emneklassifikation http://www.informationsordbogen.dk/concept.php?cid=7099 Nej spam filtering
spontantale   tale der ikke er planlagt eller nedskrevet på forhånd   https://medical-dictionary.thefreedictionary.com/spontaneous+speech Ja spontaneous speech
sprogdata   data bestående af lagret tekst eller tale Fx avisartikler, sms'er, manualer, optagelser af samtaler, oplæste tekster sprogteknologi.dk Ja language data
sprogforståelse   uddragelse af betydning fra tekst eller tale i naturligt sprog   https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v1:en:term:2123786 Ja natural language understanding
sprogmodel   statistisk model over ord og ordsammensætningers hyppigheder på et givet sprog   https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse Ja language model
sprogressource   ressource som kan anvendes til at løse en sprogrelateret opgave Dette er et bredt begreb der dækker alt fra ordbørger og grammatikker til sprogdatasæt og korpora til sprogmodeller og suppertværktøjer m.m. Alt hvad der katalogiseres på sprogteknolgi.dk er fx sprogressourcer. sprogteknolgi.dk Ja language resource
sprogteknologi   teknologi der anvendes til at få computere til at bearbejde tekster eller udsagn på almindeligt, menneskeligt sprog Dvs. teknologier, der kan analysere, genkende eller producere naturligt sprog. https://denstoredanske.lex.dk/sprogteknologi;https://ordnet.dk/ddo/ordbog?query=sprogteknologi Ja language technology
sprogteknologisk infrastrukturkom-ponent   sprogressource i form af en genbrugelig komponent med et bestemt sprogteknologisk anvendelsesformål   sprogteknologi.dk Ja language technology infrastructure component
sprogteknologisk softwareløsning   sprogressource i form af en endelig sprogløsning der er målrettet slutbrugeren Fx en talegenkender eller en chatrobot sprogteknologi.dk Ja language software solution
sprogteknologisk supportværktøj   værktøj, der understøtter indsamling og forarbejdning af sprogdata Fx anonymisering, opmærkning eller analyse af indsamlet data https://www.researchgate.net/publication/334773144_Language_Technology_for_Icelandic_2018-2022 Ja language support tool
sprogteknologisk værktøj og teknologi   samlebegreb for sprogteknologiske supportværktøjer og infrastrukturkomponenter   The META-SHARE Metadata Schema Ja language technology tool and technology
stemningsanalyse sentimentanalyse analyse af det emotionelle indhold i tekst og tale   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja sentiment analysis
tale-til-tekst-løsning talegenkendelses-løsning løsning som er i stand til at registrere menneskelig tale og genkende de sagte ord   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja speech-to-text service
talegenkendelse   automatisk genkendelse og omsætning til maskin-læsbar skrift af sproglyde i sammenhængende tale Man konverterer typisk tale til skreven tekst. https://denstoredanske.lex.dk/talegenkendelse Ja speech recognition
talesyntese   frembringelse af kunstig tale vha. elektronisk og elektro-akustisk teknik Man konverterer typisk skreven tekst til tale. https://denstoredanske.lex.dk/talesyntese Ja speech synthesis
taleteknologi   teknologi der anvendes ved en computers bearbejdning af talesignaler og tekst med det formål automatisk dels at genkende og forstå tale, talegenkendelse, dels at danne computerskabt tale, talesyntese   http://denstoredanske.dk/It,_teknik_og_naturvidenskab/Elektronik,_teletrafik_og_kommunikation/Kommunikationsteori_og_teletrafikteori/taleteknologi Ja speech technology
tekst-til-tale-løsning talesynteseløsning løsning som sætter en computer i stand til at efterligne et talende menneske   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja text-to-speech service
tekstanalyse   analyse af tekst med henblik på at forstå dennes indhold Formålet kan fx være at emneklassificere teksten, udtrække et resumé eller stemningsanalyse. https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja text analysis
tekstforslag tekstforudsigelse funktion hvor et system giver forslag til, hvilket ord eller tekststykke brugeren ønsker at skrive Anvendes fx i tastaturprogrammer til mobiltelefoner og i oversættelseshukommelser. https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja predictive text
tekstresumering tekstsammen-fatning processen hvorved der skabes en kort oversigt over hovedtræk i fx en sag, noget sagt eller noget skrevet   https://ordnet.dk/ddo/ordbog?aselect=resum%C3%A9&query=resumering Ja text summarization
term fagudtryk ord eller udtryk med en fastlagt teknisk definition, brugt som betegnelse for et fagligt begreb   https://ordnet.dk/ddo/ordbog?query=term Ja term
termbase termbank database over fagord og deres betydning og anvendelse   https://sproget.dk/temaer/sprogteknologi/fagsprog-og-termbaser Ja term base
termekstraktion termudtræk identifikation og ekstraktion af termer fra løbende tekst   https://www.iso.org/obp/ui/#search Ja term extraction
tokeniser tokeniserings-program; ordidentifikation program der forbereder en tekst til videre behandling ved at identificere tegnsekvenser som ord Et token er en instans af en tegnsekvens i et bestemt dokument, der sammenstillet kan behandles som en semantisk enhed - ofte betegnet ord eller termer. https://nlp.stanford.edu/IR-book/html/htmledition/tokenization-1.html Ja tokenizer
transskription   tekstuel gengivelse af udtalte ord eller sammenhængende tale Transskription kan i andre sammenhænge også bruges generelt om overførsel fra ét tegnsystem til et andet. https://denstoredanske.lex.dk/transskription_-_af_udtale_eller_tale Ja transcription
vidensmodel-lering videnmodellering udvikling af begrebsmodeller for et bestemt fagområde   https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse Ja knowlegde modeling