Gagnaskrá

Ganga skal frá gagnaskrá þannig að aðrir eigi auðvelt með að skilja og vinna með gögnin. Gagnaskrá ætti að vera merkt skilmerkilega og breytur ættu ekki að þarfnast frekari útskýringa. Eyða skal óþarfa breytum og gefa þeim lýsandi heiti sem auðvelda notendum að átta sig á þeim. Mælt er með því að stuðst sé við einhvers konar útgáfustýringu (version control) þegar gagnaskrá er hreinsuð þannig að allar breytingar sem gerðar eru á gögnunum séu skjalfestar og auðvelt sé að rekja sig til baka að eldri útgáfum gagnaskrár ef þörf krefur. 

Gátlisti fyrir hreinsun gagnaskrár

Persónuauðkenni og rekjanleiki

 

Óþarfa breytur

Er búið að fjarlægja allar breytur sem ekki eiga að vera í gagnaskrá þegar hún fer í opinn aðgang?

 

Skýr og lýsandi heiti breyta

  • Er búið að gefa öllum breytum í gagnaskrá skýr og lýsandi heiti (t.d. Sp1, Sp2, o.s.frv.)?
  • Innihalda allar lýsingar á breytum (labels) í gagnaskrá viðeigandi upplýsingar (t.d. spurningu í heild sinni eða stutta lýsingu á inntaki spurningar)
  • Er búið að gefa öllum gildum (values) breyta skýr og lýsandi heiti (t.d. 1=Aldrei, 2=Stundum, 3=Oft, 4=Alltaf, 99=Vantar). 
 

Stafsetningar- og innsláttarvillur

Eru stafsetningar- eða innsláttarvillur í gagnaskrá, t.d. í lýsingum (labels) eða gildum (values) breyta? En í textabreytum/strengjabreytum (string variables)?     

 

Brottfallsgildi

Eru brottfallsgildi (missing values) kóðuð rétt í gagnaskrá? Í SPSS er það t.d. gert með því að setja þau gildi sem eiga að flokkast sem brottfallsgildi í sérstakan reit sem nefnist Missing" (er í variable view" flipanum).       

     

    Röð breyta

    Eru breytur í rökréttri röð?

    Stundum getur verið gagnlegt að flokka breytur í gagnaskrá saman eftir inntaki eða áherslum (variable groups), sérstaklega ef mjög margar breytur eru í gagnaskrá.  

           

          Sennileiki (plausibility)

          • Eru óvenju há/lág gildi í gögnunum sem eru ósennileg (t.d. of mörg „0“ í launatölu)?    
          • Er einhver endurtekning í gögnunum sem ekki á að vera (t.d. sumir þátttakendur koma oftar en einu sinni fyrir í gagnaskránni)? 
           

          Vigtun gagna

          • Eru gögnin vigtuð (er vigtarbreyta í gagnaskránni)?
          • Er lýsing (label) á vigtarbreytunni þar sem fram kemur á hvaða forsendum gögnin voru vigtuð?