CoRal-Models er en kodebase, som gør det enkelt at finjustere prætrænede lydmodeller, såsom Wav2Vec 2.0 eller Whisper, på et eller flere datasæt med transskriberet lyddata. Både modelkonfigurationen samt datasætsammensætningen kan nemt konfigureres, som gør det muligt hurtigt at prøve flere kombinationer igennem for at opnå den mest optimale model. Kodebasen understøtter p.t. ASR (tale-til-tekst) modeller, men kommer også til at inkludere TTS (tekst-til-tale) modeller i fremtiden. Værktøjet kan anvendes til generel træning af lydmodeller.
Danish Conversational and Read-aloud Speech Dataset (CoRal) er et samarbejde mellem Alexandra Instituttet, Digitaliseringsstyrelsen, Datalogisk Institut, Københavns Universitet - DIKU, Alvenir. Projektet løber fra 2023-2025, hvor der vil blive indsamlet et taledatasæt med op til 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen.