ScandiQA

ScandiQA er et datasæt bestående af spørgsmål og svar på dansk, norsk og svensk. Alle samples kommer fra Natural Questions (NQ) datasættet, som er et stort datasæt med spørgsmål og svar fra Googlesøgninger. Det skandinaviske datasæt med spørgsmål og svar kommer fra MKQA-datasættet, hvor 10.000 NQ-samples er blevet manuelt oversat til blandt andet dansk, norsk og svensk.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://huggingface.co/datasets/alexandrainst/scandiqa
Metadata sidst opdateret december 12, 2022, 12:40 (UTC)
Metadata oprettet december 12, 2022, 12:35 (UTC)
Kontaktemail dan.nielsen@alexandra.dk
Kontaktnavn Dan Saattrup Nielsen
Opdateringsfrekvens aldrig
Sprog dansk svensk norsk
URI https://data.gov.dk/dataset/lang/23018089-c7b8-48d0-95bc-f138be887731
Udgivelsesdato 01-09-2022
Dokumentation
usage spørgsmål-svar