Context-Aware-Splits

Datasæt genereret vh.a. DanskGPT og brugt til at træne modellen Context-Aware-Splitter.

Context-aware-splitter er en model til retrieval augmented generation. Modellen er udviklet til at opdele tekster på den mest optimale måde givet en kontekst.

Opdeling af tekster er vigtigt ift. retrieval augmented generation, da de skal bruges til at finde de relevante stykker tekst frem.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://huggingface.co/datasets/mhenrichsen/context-aware-splits
Forfatter Mads Henrichsen
Metadata sidst opdateret januar 12, 2024, 12:54 (UTC)
Metadata oprettet januar 8, 2024, 15:02 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail mads.gade.henrichsen@live.dk
Opdateringsfrekvens ubekendt
Sprog dansk
URI https://data.gov.dk/dataset/lang/a57691fe-9645-40b7-9dae-fbb01cc5ea88
Udgivelsesdato 2023-09-17
Dokumentation