Kontakt
Zahra Al-Asfoor
IT-Arkitektur & Standarder
Telefon: +45 3370 3172
E-mail: zaha@kl.dk
Denne vejledning beskriver en metode til at angive oplysninger om datakvalitet i et givet udstillet datasæt med det formål at lette dialog mellem den dataansvarlige organisation og eksterne anvendere af datasættet og gøre det lettere at vurdere om et datasæt er egnet til en givet (ny) anvendelse.
Planlagt godkendelse på Arkitekturboardmøde i oktober 2023
Kontor for it-arkitektur og standarder i KL. Kontaktperson er Zahra Al-Asfoor (zaha@kl.dk)
Fælles sprog for datakvalitet - Vejledning til deklaration af datasæt med kernedimensioner vers. 1.0.0. Digitaliseringsstyrelsen, oktober 2020.
Vejledning
Færdig
Den primære målgruppe er dataansvarlige, it-arkitekter og terminologer. Vejledningen er desuden relevant for projektledere og leverandører, som anbefales at sætte sig grundigt ind i vejledningen og datakvalitetsdimensionerne.
Formålet med vejledningen ’Fælles sprog for datakvalitet’ er at etablere en fælles terminologi omkring datakvalitet og en fælles metode for at angive et datasæts datakvalitet. Metoden er beregnet til at facilitere en kvalificeret dialog om datakvalitet mellem dataejere og dataanvendere på tværs af sektorer og myndigheder ved at anvise et fælles, entydigt sprog om datakvalitet og forbedre muligheden for øget (ny) genanvendelse og –deling af data.Metoden i vejledningen er derfor ikke beregnet til forbedring af datakvalitet, men deklarationerne og den dialog med anvendere, der resulterer heraf, kan være et redskab til at identificere, hvilke forbedringsindsatser, der er behov for. Ligeledes understøtter vejledningen ikke, hvordan data kan anvendes, men metadata om nuværende anvendelse kan indgå som input under dialogen med dataanvendere.
Vejledningen ’Fælles sprog for datakvalitet’ fremstiller en metode til beskrivelse af datakvalitet. Metoden som helhed er beregnet til beskrivelse og bedømmelse af datasæt. Metoden anvendes til deklaration af udstillede datasæt, hvor vurderingen af datakvalitet foretages i forhold til de væsentligste forventede anvendelser.
Datakvalitet i metoden beskrives ud fra fire kvalitetsdimensioner, som repræsenterer kriterier, der er relevante for at vurdere datakvalitet og særligt væsentlige i forhold til at vurdere om, det er muligt at anvende datasæt til nye formål:
• Komplethed: i hvor høj grad indeholder datasættet de dataelementer, der er forventet i forhold til datasættets specifikation
• Korrekthed: i hvor høj grad er dataværdier i overensstemmelse med faktiske værdier
• Aktualitet: i hvor høj grad er data tidsmæssigt aktuelle i forhold til den virkelighed de repræsenterer
• Genbrugelighed: i hvor høj grad er data forståelige og uden vanskeligheder kan anvendes af andre
Vejledningen indeholder desuden en skabelon til deklaration af datakvalitet og en tjekliste til angivelse af metadata.
Den fællesoffentlige digitaliseringsstrategi 2016-2020 initiativ 8.1 Kommunal anvendelse og anbefaling. Vejledningen ’Fælles sprog for datakvalitet’ beskriver anbefalet praksis samt angiver en fælles begrebsramme og en fælles metode for angivelse af et datasæts datakvalitet. Dermed stiller vejledningen indirekte krav til kommunernes datasæt, hvis disse skal udstilles, deles eller genbruges i fællesoffentlig regi. Eftersom metoden i vejledningen ikke er beregnet til forbedring af datakvalitet eller i sig selv at afgøre, hvordan data kan anvendes i den offentlige forvaltning, kan der i kommunale projekter være behov for at udbygge de fire kvalitetsdimensioner med andre. Der kan fx være behov for beskrivelse af datas kvalitet ift. tilgængelighed og sikkerhed. Det anbefales derfor, at man i projekterne anvender de fire kvalitetsdimensioner og udvider med andre, der findes relevante. Anvendelsen af nye kvalitetsdimensioner skal begrundes og dokumenteres.
Desuden anbefales det, at man anvender standarder på området. Hertil skal man i kommunerne være opmærksomme på det organisatoriske setup omkring datakvalitet; hvilke processer skal oprettes for at forbedre og rette fejl i datakvalitet, og hvordan skal man organisere sig for at standardisere data for at
opnå bedre datakvalitet. Vejledningen er udarbejdet under det fællesoffentlige digitaliseringsprogram, hvilket betyder, at dens formelle gyldighed kun gælder og er et krav for fællesoffentlige projekter. Det anbefales dog, at fælleskommunale- og kommunale projekter, løsninger mfl. bør orientere og forholde sig til vejledningen, hvis det vurderes som relevant og inden for scope. Vejledningen bør derfor anvendes, hvor det findes
relevant. Eventuelle fravalg ift. at følge og anvende vejledningen, hvis den er relevant, bør begrundes og dokumenteres.
Der foreligger ingen roadmap for videreudvikling af version 1.0
• De fællesoffentlige regler for begrebs- og datamodellering
• Vejledning i genbrug af data i selvbetjeningsløsninger
Datakvalitetsdimensionerne i vejledningen har baggrund i ISO 25012 og Linked Data Quality Dimensions.
STATUS IFT. RAMMEARKITEKTUREN
IT-Arkitektur & Standarder
Telefon: +45 3370 3172
E-mail: zaha@kl.dk