Eelmises peatükis uurisime teoreetilist raamistikku andmete kvaliteediga seotud argumentide liigitamiseks, mis annab põhilise arusaama eri vaatenurkadest selles arutelus. Selle laiema vaatenurga põhjal käsitleme nüüd andmete kvaliteedi praktilisi aspekte, keskendudes sellele, mis on kõige olulisem ja kuidas seda saavutada.
Empiiriline lähenemisviis
Richard Wang ja Diane Strong viisid 1990. aastatel läbi väga huvitava uuringu. Esimeses etapis palusid nad andmetarbijatel loetleda kõik omadused, mis neile andmete kvaliteedile mõeldes pähe tulevad. Teises etapis reastati need omadused tähtsuse järgi. Faktori analüüs koondas esialgsed 179 omadust väiksemateks andmekvaliteedi mõõtmeteks neljas põhikategoorias.
Sisemine andmete kvaliteet
Andmete sisemine kvaliteet hõlmab “täpsust” ja “objektiivsust”, mis tähendab, et andmed peavad olema korrektsed ja erapooletud. Isegi kui need kaks mõõdet tunduvad üsna iseenesestmõistetavad, siis näiteks “usutavus” ja “maine” ei ole nii ilmselged. On üsna huvitav, et need ei puuduta andmeid ennast, vaid viitavad andmete allikale, kas vastajatele või välitööde pakkujale: vastajad peavad olema tõelised ja autentsed, välitööde pakkuja aga usaldusväärne ja tõsiseltvõetav.
Kontekstiandmete kvaliteet
Kontekstipõhine andmekvaliteet tähendab, et mõningaid andmete kvaliteedi aspekte saab hinnata ainult vastava ülesande valguses. Kuna see kontekst võib olla väga erinev, ei ole kontekstiandme kõrge kvaliteedi saavutamine alati lihtne. Enamik kontekstuaalsetest mõõtmetest (lisandväärtus, asjakohasus, õigeaegsus, täielikkus, asjakohane andmehulk) nõuavad enne uuringu käivitamist ja läbiviimist põhjalikku planeerimist. Seevastu on väga raske parandada kontekstiandmete kvaliteeti, kui need on juba kogutud (nt meeldetuletused täielikkuse parandamiseks).
Andmete esitamise kvaliteet
Andmete esitamise kvaliteet viitab sellele, kuidas andmed on vormistatud (lühidalt ja järjepidevalt) ja mil määral saab neist tuletada tähendust (tõlgendatavus ja arusaadavus). Mõelge veebiküsitluse andmete valideerimise protseduuridele. Kui küsite näiteks vastajate vanust, siis veenduge, et kõik (järjekindlalt) sisestavad vanuse täis aastates (lühidalt) või kasvõi vanuserühmades, millest olete eriti huvitatud (arusaadavus). Igal juhul takistatakse sellisel juhul vastajat vigaste väärtuste esitamist (tõlgendatavus).
Andmete kättesaadavuse kvaliteet
Selle kategooria kaks mõõdet võivad olla vastandlikud ja nõuavad seetõttu head tasakaalu. Kättesaadavus tähendab seda, kui lihtsalt ja vaevata on andmeid võimalik kätte saada, samas kui juurdepääsuturve tähendab seda, kuidas juurdepääsu saab piirata ja kontrollida. Võrreldes varasemasega on nendele aspektidele hakatud pöörama üha enam tähelepanu – nt veebipõhised interaktiivsed graafikud (online dashboards) või andmelaod.