Baggrund

Hvad er sprogteknologi.dk?

På billedet ses en grafisk illustration af det mulige indhold af en fælles dansk sprogressource. Overordnet set skal en fælles dansk sprogressource forstås som en struktureret samling af digitale datasæt (lyd, tekst, ord) til fri afbenyttelse. Den indeholder det talte sprog i form af fx lydfiler, stemme- og lydoptagelser, dialekter og transskriberede lydoptagelser. Den indeholder også det skrevne sprog som fx tekster, tekstkorpus, grammatikker og annoteret tekst. Endelig indeholder den ord- og termbaser som fx ord, ordklasser, ordbøger og faglige termbaser.

Den digitale platform sprogteknologi.dk samler metadata om danske sprogressourcer ét sted. Det primære formål er at understøtte udviklingen af kunstig intelligens på dansk og dermed bidrage til at sikre, at det digitale sprog i Danmark er dansk.

Platformen sprogteknologi.dk indeholder bl.a. metadata om tale- og tekstkorpora, ordbøger, termbaser, sprogteknologiske supportværktøjer og infrastrukturkomponenter. Den digitale platform vil løbende blive udbygget med nye metadata om relevante, eksisterende sprogressourcer. På sigt vil der desuden blive udviklet og udstillet nye sprogressourcer, som kan mindske barriererne og styrke udviklingen af sprogteknologiske løsninger til understøttelse af kunstig intelligens på dansk af høj kvalitet.

Sprogteknologi som talegenkendelse, tekstanalyse, sprogforståelse, mv., er i mange sammenhænge helt centrale teknologier for udviklingen af kunstig intelligens. Sprogteknologi til understøttelse af kunstig intelligens på dansk er et fagligt komplekst område, der kræver en høj grad af specialistviden samtidig med, at det har en meget bred anvendelses- og interessentflade blandt både offentlige myndigheder, forskere og private virksomheder. Dertil er det et område i konstant udvikling. Derfor har Digitaliseringsstyrelsen valgt en agil tilgang til udviklingen af sprogteknologi.dk. Arbejdsprogrammer vil trinvist blive specificeret, hvilket giver rum for læring undervejs samt muliggør løbende brugerinddragelse, der kan være med til at kvalificere og specificere de konkrete indsatser. Denne tilgang skal være med til at sikre, at indsatserne bliver tilpasset til brugernes aktuelle behov samt den teknologiske udvikling.

Det politiske afsæt for sprogteknologi.dk og governance

Det politiske afsæt for sprogteknologi.dk findes i Digitaliseringspagten og Økonomiaftalerne for 2020 mellem Regeringen, KL og Danske Regioner, hvor det blev besluttet at igangsætte et fællesoffentligt samarbejde om udviklingen af en fælles digital dansk sprogressource. Arbejdet tager bl.a. udgangspunkt i nogle af de anbefalinger, som Sprogteknologiudvalget, nedsat af Dansk Sprognævn under Kulturministeriet, kom med i rapporten ’Dansk sprogteknologi i Verdensklasse’ i april 2019.

Den politiske forankring af sprogteknologi.dk er i ’Styregruppen for digital innovation og grøn omstilling’, der består af en række statslige myndigheder, KL og Danske Regioner. Digitaliseringsstyrelsen varetager formandskabet for styregruppen, ligesom Digitaliseringsstyrelsen er sekretariat for sprogteknologi.dk.