Gagnaskrá
Ganga skal frá gagnaskrá þannig að aðrir eigi auðvelt með að skilja og vinna með gögnin. Gagnaskrá ætti að vera merkt skilmerkilega og breytur ættu ekki að þarfnast frekari útskýringa. Eyða skal óþarfa breytum og gefa þeim lýsandi heiti sem auðvelda notendum að átta sig á þeim. Mælt er með því að stuðst sé við einhvers konar útgáfustýringu (version control) þegar gagnaskrá er hreinsuð þannig að allar breytingar sem gerðar eru á gögnunum séu skjalfestar og auðvelt sé að rekja sig til baka að eldri útgáfum gagnaskrár ef þörf krefur.
Gátlisti fyrir hreinsun gagnaskrár
Persónuauðkenni og rekjanleiki
|
|
Óþarfa breytur Er búið að fjarlægja allar breytur sem ekki eiga að vera í gagnaskrá þegar hún fer í opinn aðgang? |
|
Skýr og lýsandi heiti breyta
|
|
Stafsetningar- og innsláttarvillur Eru stafsetningar- eða innsláttarvillur í gagnaskrá, t.d. í lýsingum (labels) eða gildum (values) breyta? En í textabreytum/strengjabreytum (string variables)? |
|
Brottfallsgildi Eru brottfallsgildi (missing values) kóðuð rétt í gagnaskrá? Í SPSS er það t.d. gert með því að setja þau gildi sem eiga að flokkast sem brottfallsgildi í sérstakan reit sem nefnist „Missing" (er í „variable view" flipanum). |
|
Röð breyta Eru breytur í rökréttri röð? Stundum getur verið gagnlegt að flokka breytur í gagnaskrá saman eftir inntaki eða áherslum (variable groups), sérstaklega ef mjög margar breytur eru í gagnaskrá. |
|
Sennileiki (plausibility)
|
|
Vigtun gagna
|