FAIR viðmið um umsýslu vísindagagna

Samkvæmt FAIR viðmiðunum eiga rannsóknagögn sem safnað er með krafti almannafjár að vera aðgengileg öllum, bæði fræðafólki og almenningi, til að tryggja betri nýtingu og örugga langtímavarðveislu gagna.  

 
​Í FAIR viðmiðum um umsýslu vísindagagna (FAIR Guiding Principles for Scientific Data Management and Stewardship) sem birt voru árið 2016 er lögð áhersla á að rannsóknagögn sem safnað er með krafti almannafjár séu aðgengileg öllum til lengri tíma og uppsett þannig að ekki aðeins fólk geti fundið og skilið þau heldur einnig vélar. Er þar átt við að vélar geti fundið, lesið og greint gögn með engri eða takmarkaðri aðkomu fólks, en það er ein af lykilforsendum vélræns náms (machine learning). Gervigreind þessi gengur út á að nýta vinnslugetu tölva til að annast eða aðstoða við úrvinnslu gagna og þannig mæta aukinni þörf á sjálfvirkni í mati á flóknum og viðamiklum gögnum á netinu. Frá útgáfu FAIR viðmiðanna hafa Evrópusambandið og fjölmargir alþjóðlegir fjármögnunaraðilar og háskólar lýst yfir stuðningi við viðmiðin og tekið mið af þeim í stefnumótun sinni um opinn aðgang að vísindagögnum.

Samkvæmt FAIR viðmiðunum eiga vísindagögn að vera „eins opin og mögulegt er en eins lokuð og nauðsynlegt er“. Með þessu er gert ráð fyrir ákveðnum sveigjanleika þar sem setja má viðkvæm gögn í öruggan og læstan aðgang. Gögn geta þannig verið í takmörkuðu aðgengi en samt sem áður talist FAIR.

Hvað felst í FAIR viðmiðunum?

FAIR viðmiðin fela í sér 15 atriði sem lýsa á skýran og mælanlegan hátt hvernig stuðla má að endurnýtingu vísindagagna. Viðmiðin eru flokkuð í fjóra meginþætti sem vísa til þess að rannsóknagögn eiga að vera finnanleg (findable), aðgengileg (accessible), gagnvirk (interoperable) og endurnýtanleg (reusable). Upphafsstafir enskra heita þáttanna mynda skammstöfunina FAIR. Eins og áður sagði er mark­miðið með notkun þessara viðmiða að bæði vélar og fólk geti auð­veld­lega fundið og skilið gögn­in. 

Finnanleg (findable)

Mikilvægt er að bæði fólk og tölvur geti fundið gögnin með sem minnstri fyrirhöfn. Til þess er gögnum úthlutað varanlegu stafrænu auðkenni (Persistant Identifier; PID) sem vísa á gögnin, t.d. DOI númeri (Digital Object Identifier). 

Einnig er mikilvægt að vönduð lýsigögn (metadata) fylgi gögnunum þannig að gagnasafnið komi upp við leitir í alþjóðlegum gagnagáttum og leitarvélum. Lýsigögnin eiga ávallt að vera tiltæk, jafnvel þótt gögnin sjálf séu það ekki eða aðeins að hluta til.

Image

Aðgengileg (accessible)

Gögn og lýsigögn eiga að hafa skýrt notendaleyfi sem bæði fólk og tölvur geta skilið. Þar á að koma fram hvort gögnin eru opin öllum eða hvort einhverjar hömlur gilda um þau.

Ef um stýrðan aðgang er að ræða getur notandi þurft að óska sérstaklega eftir leyfi höfunda(r) til að fá aðgang að þeim, eða uppfylla ákveðin skilyrði. Þá er gagnsæi mikilvægt, að það liggi skýrt fyrir hvernig sækja má um aðgang að gögnunum og hvaða reglur gilda um notkun þeirra.   

Image

Gagnvirk (interoperable)

Gögn og lýsigögn eiga að nota þann orðaforða sem fræðasvið hefur sammælst um. Undir það fellur notkun viðurkenndra fræðahugtaka og staðlaðra orðaforða (standard vocabularies) sem auðvelda samþættingu gagnanna við önnur vísindagögn, hvort sem þau koma frá sama fræðasviði eða úr annarri átt.

Gögnin þurfa auk þess að vera á þannig sniði að viðurkennd forrit geti lesið þau og auðvelt sé að færa gögnin yfir á önnur snið í framtíðinni ef þörf er á.

Image

Endurnýtanleg (reusable)

Lýsigögn og fylgiskjöl eiga að innihalda gagnlegar og greinargóðar upplýsingar um gögnin og upprunalega rannsókn svo hægt sé að endurtaka rannsóknina og/eða nýta gögnin í öðru rannsóknarsamhengi.

Gögnin þurfa að vera vel skjalfest þar sem allar viðeigandi og nauðsynlegar upplýsingar koma fram sem hjálpa öðrum að setja gögnin í samhengi og gera upplýsta greiningu á þeim. Framsetning gagna á að vera í samræmi við staðla fræðasviðs.

Að auki verður að liggja skýrt fyrir hvernig nálgast má gögnin og endurnýta þau, helst með vísun í staðlað notendaleyfi sem tölvur skilja (machine-readable licence).  

Image