
Ankstesniame skyriuje nagrinėjome teorinę sistemą, pagal kurią skirstome su duomenų kokybe susijusius argumentus, taip suteikdami pagrindą suprasti įvairias šios diskusijos perspektyvas. Atsižvelgdami į šią platesnę perspektyvą, dabar panagrinėsime praktinius duomenų kokybės aspektus, sutelkdami dėmesį į tai, kas yra svarbiausia ir kaip galime to pasiekti.
Empirinis požiūris
Ričardas Vangas (Richard Wang) ir Dijanė Strong (Diane Strong) 1990-aisiais atliko labai įdomų tyrimą. Pirmajame etape jie paprašė duomenų vartotojų išvardyti visus požymius, kurie jiems ateina į galvą galvojant apie duomenų kokybę. Antrajame etape šie požymiai buvo suskirstyti pagal svarbą. Atlikus faktorinę analizę, pirminiai 179 požymiai buvo sujungti į mažesnį duomenų kokybės matmenų rinkinį, sudarytą iš keturių pagrindinių kategorijų.
Vidinė duomenų kokybė
Vidinė duomenų kokybė apima “tikslumą” ir “objektyvumą”, t. y. duomenys turi būti teisingi ir nešališki. Nors šios dvi dimensijos atrodo gana savaime suprantamos, “Tikimumas” ir “Reputacija” nėra tokios akivaizdžios. Įdomu tai, kad jie susiję ne su pačiais duomenimis, o su duomenų šaltiniu – respondentais arba lauko tyrimo paslaugų teikėju: respondentai turi būti tikri ir autentiški, o lauko tyrimo paslaugų teikėjas – patikimas ir rimtas.
Kontekstinių duomenų kokybė
Kontekstinė duomenų kokybė reiškia, kad kai kurie duomenų kokybės aspektai gali būti vertinami tik atsižvelgiant į atitinkamą užduotį. Kadangi šis kontekstas gali labai skirtis, pasiekti aukštą kontekstinių duomenų kokybę ne visada lengva. Dauguma kontekstinių dimensijų (pridėtinė vertė, aktualumas, savalaikiškumas, išsamumas, tinkamas duomenų kiekis) reikalauja kruopštaus planavimo prieš rengiant ir atliekant tyrimą. Ir atvirkščiai, labai sunku pagerinti kontekstinių duomenų kokybę, kai jie jau surinkti (pvz., priminimais, kad duomenys būtų išsamesni).
Reprezentacinių duomenų kokybė
Atvaizdavimo duomenų kokybė – tai duomenų formatas (glaustumas ir nuoseklumas) ir tai, kokią prasmę galima išgauti iš duomenų (aiškumas ir paprastumas suprasti). Tiesiog įsivaizduokite internetinės apklausos duomenų patvirtinimo procedūras. Pavyzdžiui, klausdami apie respondentų amžių, įsitikinkite, kad visi (nuosekliai) įrašo amžių ištisais metais (glaustai) arba net tose amžiaus grupėse, kurios jus ypač domina (kad būtų lengviau suprasti). Bet kuriuo atveju respondentui bus trukdoma pateikti klaidingas ar kraštutines reikšmes (aiškinamumas).
Prieinamumas Duomenų kokybė
Abu šios kategorijos matmenys gali būti priešingi, todėl juos reikia gerai subalansuoti. Prieinamumas reiškia, kaip lengvai ir lengvai galima gauti duomenis, o prieigos saugumas – kaip galima apriboti ir kontroliuoti prieigą. Pastaraisiais metais šiems aspektams buvo skiriama vis daugiau dėmesio, pavyzdžiui, internetinės informacinės lentelės arba duomenų saugyklos.