CoRal Models Platform

CoRal-Models er en kodebase, som gør det enkelt at finjustere prætrænede lydmodeller, såsom Wav2Vec 2.0 eller Whisper, på et eller flere datasæt med transskriberet lyddata. Både modelkonfigurationen samt datasætsammensætningen kan nemt konfigureres, som gør det muligt hurtigt at prøve flere kombinationer igennem for at opnå den mest optimale model. Kodebasen understøtter p.t. ASR (tale-til-tekst) modeller, men kommer også til at inkludere TTS (tekst-til-tale) modeller i fremtiden. Værktøjet kan anvendes til generel træning af lydmodeller.

Danish Conversational and Read-aloud Speech Dataset (CoRal) er et samarbejde mellem Alexandra Instituttet, Digitaliseringsstyrelsen, Datalogisk Institut, Københavns Universitet - DIKU, Alvenir. Projektet løber fra 2023-2025, hvor der vil blive indsamlet et taledatasæt med op til 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen.

Yderligere info test

Felt Værdi
Destinationsside https://github.com/alexandrainst/coral_models
Metadata sidst opdateret januar 31, 2024, 08:49 (UTC)
Metadata oprettet januar 22, 2024, 14:05 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID 334a9c1a-b1e5-4975-8e2f-44b909704e7d
Kontaktnavn Dan Saattrup Nielsen
Opdateret 2024-12-01
Opdateringsfrekvens ubekendt
Sprog dansk
URI https://data.gov.dk/dataset/lang/334a9c1a-b1e5-4975-8e2f-44b909704e7d
Udgivelsesdato 2023-04-24
Udgivernavn Alexandra Instituttet
contact_email dan.nielsen@alexandra.dk
Dokumentation