How to Make Open Data Discoverable
Da bi se javni podaci bolje koristili za razvoj društva potrebno je da budu dostupni i lako razumljivi kako ljudima, tako i i mašinama. Podaci dati u formi slike, PDF dokumenta ili DOC formatu su komplikovani za automatsku mašinsku obradu. Primer formi mašinski čitljivih podataka je CSV, XML ili RDF format uz odgovarajuće meta podatke.
ŠTA SU METAPODACI?
Metapodatak je termin koji se koristi za opisivanje karakteristika određenih podataka . Metapodaci su stoga " podaci o podacima ". Metapodaci o određenom dokumentu ili skupu podataka mogu, na primer, biti autor, datum kada je napisan dokument, izdavač, broj stranica i jezik teksta dokumenta . Prednost eksplicitnog opisivanja skupova otvorenih podataka metapodacima je taj da se podaci mogu lakše pratiti, pronaći i preuzeti. Na primer, u pretraživač koji koristi metapodatke, moguće je odmah tražiti dokumenta koja je napisao određeni autor. Ovo je teže s pretraživanjem kompletnog teksta, što znači bez korišćenja metapodataka, jer će pretraživač pronaći svaki dokument u kojem se pojavljuje ime autora. Ovo može uključivati mnogo više dokumenata od onih koje je zaista napisao taj autor.
Metapodaci se veoma često koriste za pretraživanje i (i pronalaženje) otvorenih podataka. Danas portali otvorenih podataka u Evropi koriste standardan skup metapodataka koji su ključ za prtetraživanje skupova otvorenih podataka na lokalnoj platformi (u Srbiji su to portal eUprava i data.gov.rs) ili preko portala Evropske Unije, videti European Data Portal.
KAKO NAPRAVITI METAPODATKE?
Stvaranje metapodataka za otvorene skupove podataka može s jedne strane biti podržan automatski, u okviru procesa publikovanja, na primer:
• Svojstva dokumenta se generišu u (Office) softveru za podršku , kao što je datum pravljenja
• Prostorne i vremenske informacije kao zabeležene od strane kamere , senzora , itd
• Podaci iz procesa rada, kao što je lokacija ili URL izvora
S druge strane, neke osobine zahtevaju ljudsku intervenciju i objašnjenje:
• O čemu su podaci (verovatno povezano sa stavkama ili izvorima informacija ) ?
• Kako se taj skup podataka koristi (na primer, vodi do modela licence) ?
• Gde se može naći više informacija o samom izvoru ( na primjer link ka web stranici ili drugim dokumentima) ?
• Atributi koji opisuju kvalietet informacija (kao nacrt, za prikaz, još nije validirano, privremeno).
Način održavanja metapodataka treba takođe da se uskladi sa objavljenim podacima. Ako se podaci ne menjaju često, metapodaci mogu da budu relativno stabilni ili da se podešavaju grupno u određenim periodima. Ako se podaci često menjaju (kao podaci senzora u realnom vremenu), metapodaci moraju da budu povezavi sa podacima procesa rada i promene moraju da budu istovremene.
Skupovii otvorenih podataka su deo okruženja koje se menja. Ove promene treba da se odraze i na metapodatke :
• Organizacije imaju tendenciju da se menjaju, spajaju ili da prenose odgovornost na drugu organizaciju ili organizaciji javnog sektora;
• Nove aplikacije mogu da povežu skupove otvorenih podataka međusobno i tako se mogu zahtevati dodatni metapodaci ili se javlja potreba za usklađivanje metapodataka preko različitih tela (doslednost metapodataka ) ;
• Evolucija metapodataka: trenutni zahtevi su minimalni i nastaviće da se razvijaju .
Ovo pokreće potrebu da se metapodaci stalno prate i da se prilagođavaju razvoju.
PREPORUKE u OKVIRU ISA PROGRAMA
Metapodaci su veoma važni zato što mogu tačno da identifikuju skupove podataka i da ih učine uočljivim na različitim platformama. Zbog toga predlažemo da svaka organizacija u javnom sektoru obezbedi minimalni skup metapodataka za svaki objavljeni skup podataka.
Državne agencije bi trebalo da sklope ugovore (npr. zasnovane na evropskim DCAT preporukama) da bi se primenila konzistentna politika kadgod je to moguće..
Pozitivan rezultat primene ove aplikacije je da gdegod se skup podataka objavi, lako i čak automatski se može pronaći i na drugim platformama. Dakle, preporuka je da svaka organizacija u javnom sektoru može da bira gde da objavi skup otvorenih podataka, ali ti skupovi podataka se mogu pronaći i na nekoj drugoj platformi u zemlji i inostranstvu. Na primer, u okviru Evropskog projekta LOD2, skupovi otvorenih podataka iz RZS-a i APR-a su bili automatski objavljeni na platformi “Srpski CKAN”, a zatim preuzeti na viši nivo na Evropskom portalu otvorenih podataka.
Mogućnost obezbeđivanja metapodataka zavisi od tipa platforme koja se koristi. CKAN softver, na primer, ima specifičan pristup metapodacima određujući veliki broj polja koja su obavezna i dopuštajući da se doda veliki broj slobodnih polja. Iako je obezbeđivanje metapodataka uslov koji je neophodan da bi se skupovi podataka pronalazili brzo i lako, sve i dalje zavisi od platforme koja se koristi tj. da li su polja metapodataka obavezna i kako se moraju ispuniti. CKAN ima sopstveni specifičan pristup, zbog čega mi možemo samo da preporučimo smernice za minimalan uobičajen skup obaveznih polja.
Preporuka : Da bi se omogućila nesmetana razmena opisa podataka, predlažemo da se koristi što više polja iz profila DCAT koji su ili će biti dogovoreni na nivou Srbije.