Minimalni uslovi

  • Posted on: 2 February 2016
  • By: valentina.janev

Pre objavljivanja skupova podataka na platformi otvorenih podataka, svi skupovi podataka ili tokovi otvorenih podataka moraju da ispune minimalne uslove u pogledu kvaliteta i doslednosti. U nastavku su date preporuke za izbor formata datoteka ili API za objavljivanje podataka. Na kraju je objašnjen model zrelosti za otvorene podatke (eng. Open Data Maturity Model).

U ovom poglavlju su dati minimalni uslovi za otvaranje izvornih podataka kao otvorenih podataka. Uslovi su formulisani na osnovu sledećih dimenzija:

  • Očuvanje kvaliteta otvorenih podataka: sve tehničke karakteristike koje tok otvorenih podataka mora da ispunjava;
  • Očuvanje doslednosti otvorenih podataka: obezbeđuje internu tehničku koherentnost objavljenih podataka.

U narednih nekoliko pasusa dati su praktični saveti za svaku dimenziju o tome kako se ovi predlozi mogu realizovati . Ovi saveti nisu obavezujući i ne treba da se čitaju po određenom redosledu.

Preporuka: Pogledati SHARE-PSI Best Practices

KVALITET

Da bi se zadržao tehnički kvalitet podataka u toku otvorenih podataka, potrebno je da svaki skup podataka zadovoljava određene kriterijume:

  • Svaki skup otvorenih podataka (eng. Open Dataset) mora da ima jedinstven naslovni red sa jednoobraznim opisom kolona , ili na srpskom ili na engleskom jeziku. Naslovni red mora da formira prvu liniju skupa podataka i ne bi trebalo da bude više od 1 linije . Naslov bi trebalo da bude jasan, kratak i bez razmaka . Treba da se koriste standardni rečnici za sastavljanje naslova.
  • Svaki tok otvorenih podataka (eng. Open Data stream) mora da sadrži odgovarajući opis metapodataka.
  • Svaki tok otvorenih podataka mora da bude povezan sa procesom za objavljivanje novih ili ažuriranih podataka (proces ažuriranja) u redovnim intervalima. Naravno, istorijski podaci ne treba da se menjaju. Ali, ti podaci mogu periodično da se dopunjuju,npr. mesečno ili godišnje.
  • Svaki tok otvorenih podataka mora da ima broj verzije tako da može da se jasno identifikuje i da mogu da se prate moguća podešavanja (npr. upravljanje verzijom).

KONZISTENTNOST

Svi otvoreni podaci koji se objavljuju moraju da budu u skladu sa usvojenim standardima organa vlasti. Ako to nije ostvarivo, onda treba da budu bar konzistentni na nivou same organizacije u javnom sektoru. Na primer, sve adrese moraju da budu dostupne svim korisnicima na isti način. U suprotnom, biće teško korisnicima ili preduzećima da formiraju konsolidovanu sliku o tome.

1/ Tokovi otvorenih podataka treba da budu transparentni:

  • Svi korisnici toka otvorenih podataka treba da prepoznaju poreklo podataka.
  • Status podataka treba da bude definisan (eng. draft, validated).
  • Meta opisi podataka koji već postoje u okviru organizacije u javnom sektoru mogu ponovo da se koriste.
  • Model podataka i metapodaci treba da se opišu na samom početku.

2/ Informacije o otvorenim podacima treba da budu tačne i potpune (u okviru konteksta):

  • Pravila validacije (eng. validation rules) treba da se definišu (ili ustanove) na osnovu samih podataka.
  • Osnovne provere treba da se izvrše i greške na izvoru treba da se isprave (npr. informacije o adresi).
  • Neispravna polja ili polja koja nedostaju treba da se identifikuju.
  • Optimizacija treba da bude cilj i treba izbegavati dupliranje podataka.

3/ Treba obezbediti upravljanje procesom objavljivanja otvorenih podataka:

  • Treba nadzirati proces od izvornog sistema do toka otvorenih podataka.
  • Izvršiti kontrolu kvaliteta svakog koraka u procesu.
  • Izvršiti proveru obima da bi se sprečilo da tokovi otvorenih podataka postanu suviše veliki. Otvoreni podaci treba da budu manji da bi mogli da se koriste u mobilnim aplikacijama. Ako tokovi postanu veliki (na primer za GIS podatke), onda to treba napomenuti u platformi otvorenih podataka ili u metapodacima.
  • Treba razdvojiti „online“ obradu od „batch processing“ obrade, tako da budete sigurni da otvaranje tokova otvorenih podataka neće opteretiti infrastrukturu organizacije u javnom sektoru.

4/ Informacije o otvorenim podacima treba da budu bezbedne:

  • Filtriranje poverljivih podataka.
  • Poštovanje zakona privatnosti.
  • Sabiranje podataka, ako je potrebno (granulacija).

Preporuka: Proveriti minimalne kriterijume u pogledu kvaliteta i doslednost pre objavljivanja skupa podataka na platformi otvorenih podataka .

PSI Topics: