Arbetssätt - Redovisa - Redovisa datakvalitet i metadata

Resultatet av kvalitetsuppföljningen ska redovisas i metadata.

Hur det ska redovisas beskrivs i SS-EN ISO 19157:2013-1 Geografisk information - Datakvalitet. Det finns tre möjliga sätt att ange resultatet för en utvärdering av en datakvalitetsegenskap: Kvantitativt resultat, överensstämmelse med ställda krav eller med en beskrivande text. Varje resultat ska också anges med tidpunkt för utvärderingen och den omfattning på datamängden som utvärderingen gäller.

Figur: De tre möjliga sätten att redovisa en utvärdering av datakvalitet

För varje datakvalitetsegenskap kan det finnas resultat för olika omfattningar av en datamängd. Om man har olika kvalitetskrav på olika geografiska områden, så är det möjligt att dela upp och redovisa område för område utan att upprepa uppgifter om mått och utvärderingsmetod.

Att enbart redovisa det kvantitativa resultatet av kvalitetsutvärderingen ger inte användarna någon större möjlighet att tolka om resultatet är bra eller dåligt. För att kunna göra detta behöver man kunna göra en jämförelse med de krav på produkten som har angivits, t.ex. i en dataproduktspecifikation. Att på så sätt redovisa överensstämmelse med ställda krav som ja eller nej mot angivna krav på data gör det enklare och snabbare att få en uppfattning om kvaliteten.

En kvantitativ utvärdering av en datakvalitetsegenskap ska beskrivas med det mått som har använts vid utvärderingen, metoden som använts och resultatet av kontrollen.

Figur: Delar i beskrivningen av resultatet av en datakvalitetsutvärdering för en datakvalitetsegenskap, för kvantitativa resultat.

Det är tillåtet att hänvisa till andra dokument som beskriver t.ex. måtten, med en hänvisning till ett visst id-nummer för ett mått i standarden. Uppgifter om utvärderingsmetod kan också ske med hänvisningar. Resultat från utredningen ska även innehålla uppgifter om när utvärderingen gjordes.

Möjligheten att i text beskriva resultatet av utvärderingen är väldigt användbart. Det kan vara svårt eller dyrt att genomföra utvärderingar av vissa datakvalitetsegenskaper, vilket medför att många därför ”hoppar över” att ställa krav på dessa datakvalitetsegenskaper och därmed inte heller redovisar ”läget”. Här är det bra att använda beskrivande text som tar upp vad producenten har för uppfattning om kvaliteten, och att det är en uppskattning. Det viktigaste är att vara tydlig med och försöka redovisa det som man som producent vet eller anar i form av brister i kvalitet. Möjligheten att beskriva resultatet textuellt kan också komplettera de andra sätten att redovisa för att förenkla tolkningen av resultatet för användarna.  Om endast ett beskrivande resultat redovisas behöver mått och utvärderingsmetod inte anges.

Det kan vara så att den kontinuerliga ajourhållningen av datamängden har en god överensstämmelse med ställda krav men att det också finns ett gammalt ”arv” som håller en sämre kvalitet. Det är då viktigt för trovärdigheten som producent att gentemot användarna vara transparent med detta och redogöra för sina ”långvariga” avvikelser och hur man planerar att åtgärda dem. Detta görs också enklast i form av textuella beskrivningar.