Namen predlaganega projekta je sistematično pregledati stanje baz podatkov, objavljenih na portalu Odprti Podatki Slovenije (OPSI), s poudarkom na uporabnosti in kakovosti podatkov ter dostopnosti dinamičnih skupin odprtih podatkov. Portal OPSI skladno z direktivo EU o ponovni uporabi javnih podatkov in zakonodajo o dostopu do informacij javnega značaja služi kot nacionalno spletno središče za objavo odprtih podatkov celotnega javnega sektorja. Deluje tudi kot osrednji katalog državnih evidenc in podatkovnih zbirk in kot enotno spletno mesto za objavo odprtih in strojno berljivih zbirk. Portal vključuje podatke državnih in lokalnih organov ter odprte podatke skupnosti.
Glavni cilj projekta je oblikovati metodologijo za ocenjevanje kakovosti objavljenih podatkovnih zbirk, ki bo temeljila na obstoječih odprtih standardih formatov in API dostopov ter raziskati možnosti za izboljšanje obstoječih podatkov z delno nadzorovanimi metodami oplemenitenja, standardizacije in uparjanja podatkov.
Metodologija bo vključevala naslednje korake evalvacije stanja podatkov:
i. merila za oceno kakovosti, vključno s popolnostjo, pravočasnostjo in pravilnostjo podatkov;
ii. ocena kakovosti podatkov z upoštevanjem kriterijev, kot so uparljivost, zanesljivost, dostopnost ter potreba po naknadnem urejanju in popravljanju;
iii. določitev standarda minimalne, zadostne in dobre kakovosti podatkov v zbirkah;
iv. določitev sprejemljivih minimalnih standardov za obstoječe in nove zbirke na portalu OPSI skladno s cilji Direktive 2019/1024.
Naslednji cilj je ustvariti pregled podatkovnih zbirk, objavljenih na portalu OPSI, in jih razvrstiti v predhodno opredeljene kakovostne razrede v skladu z razvito metodologijo. Tekom projekta bomo razvili mehke modele ter pristope zagotavljanja in izboljševanja kakovosti zbirk podatkov na portalu OPSI s strani zainteresiranih deležnikov. Razvili bomo tudi orodje za lažje potrjevanje objav zbirk na portalu OPSI in ustrezno razvrščanje podatkov s samodejnimi mehanizmi za preverjanje kakovosti podatkov. Prav tako bomo pregledali podatkovno shemo obstoječih objavljenih zbirk podatkov in njeno usklajenost s cilji Direktive o odprtih podatkih ter analizirali podatke glede popolnosti in uparjenosti v širši OPSI meta shemi zajetih podatkov. Preverili bomo skladnost z obstoječimi standardi, kot sta OGC in INSPIRE, ter ocenili posebne značilnosti podatkovne zbirke in njihovo kakovost, vključno s potrjevanjem podatkov v delovnih tokov ih. Del fokusa bomo v projektu namenili procesu odpravljanja obstoječih izzivov trenutno objavljenih zbirk, pri čemer bomo z mehkimi modeli za posamezno zbirko podali oceno morebitnega delno avtomatiziranega popravljanja podatkov ali izdelave nove zbirke s strani upravitelja zbirke, ki bo skladna z izdelano metodologijo v predlaganem projektu.