Algoritam za ocjenjivanje otvorenih podataka

Pet zvjezdica za otvorene podatke

Tim Berners-Lee, izumitelj weba i inicijator povezanih podataka, predložio je a shemu implementacije s 5 zvjezdica za otvorene podatke. Ovdje ćemo dati primjer za svaku zvjezdicu i objasniti ćemo troškove i koristi koje dolaze s ovakvim načinom ocjenjivanja.

Jedna zvjezdica

Znači da su podaci dostupni na internetu u bilo kojem obliku pod otvorenom dozvolom.

Dvije zvjezdice

Znači da su dostupni strukturni podaci, kao na primjer Excel datoteka umjesto skenirane tablice.

Tri zvjezdice

Znači da su dostupni u neutralnom obliku, kao na primjer CSV umjesto Excel datoteke.

Četiri zvjezdice

Znači da otvoreni podaci koriste URI za označavanje stvari tako da drugi mogu pristupiti izravno tim podacima.

Pet zvjezdica

Znači da su ovi otvoreni podaci povezani s drugim podacima za pružanje konteksta.

Koji su koristi otvorenih podataka s jednom zvjezdicom?

Za korisnike podataka

  • Možete ih pogledati.
  • Možete ih ispisati.
  • Možete ih spremiti na vaše računalo.
  • Možete unijeti podatke u neki drugi sustav.
  • Možete promijeniti podatke kako želite.
  • Možete podijeliti podatke s kime želite.

Za nositelje podataka

  • Jednostavno ih je objaviti.
  • Ne trebate objašnjavati iznova drugima da mogu koristiti vaše podatke.

Lijepo je imati podatke dostupne na internetu s otvorenom dozvolom (poput PDDL, ODC-by ili CC0), ipak informacije su zaključane u dokumentu. Teško je izvući podatke iz dokumenta, osim ako napišete vlastitu skriptu za izvlačenje informacija.


Koji su koristi otvorenih podataka s dvije zvjezdice?

Za korisnike podataka

  • Isto što i s otvorenim podacima s jednom zvjezdicom, i dodatno:
  • Možete ih izravno obraditi u licenciranim aplikacijama za daljnju agregaciju, obavljati izračune, vizualizirati ih, itd.
  • Možete ih izvesti u druge (strukturirane) oblike.

Za nositelje podataka

  • Još uvijek ih je jednostavno objaviti.

Izvrsno! Podaci su dostupni na internetu u strukturiranom obliku (odnosno strojno čitljivom), ipak podaci su i dalje zaključani u dokumentu. Da bismo dobili ove podatke iz dokumenta, ovisimo o licenciranom softveru.


Koji su koristi otvorenih podataka s tri zvjezdice?

Za korisnike podataka

  • Isto što i s otvorenim podacima s dvije zvjezdice, i dodatno:
  • Možete manipulirati podacima na način na koji želite i istovremeno niste ograničeni mogućnostima određenog softvera.

Za nositelje podataka

  • Možda ćete trebati pretvarače ili dodatke da izvezete podatke iz zatvorenog oblika.
  • I dalje je jednostavno objaviti otvorene podatke.

Odlično! Podaci nisu samo dostupni na internetu već sada bilo tko može jednostavno koristiti podatke. U drugu ruku, to su podaci na internetu a ne podaci u internetu.


Koji su koristi otvorenih podataka s četiri zvjezdice?

Za korisnike podataka

  • Isto što i s otvorenim podacima s tri zvjezdice, i dodatno:
  • Možete pokazivati izravno na njih s nekog drugog internetskog mjesta.
  • Možete spremiti izravnu poveznicu na njih u vaše favorite.
  • Možete ponovno upotrijebiti dijelove podataka.
  • U mogućnosti ste da ponovno upotrijebite alate i dodatke čak i kada razumijete samo dio uzorka koji je nositelj podataka koristio.
  • Razumijevanje strukture RDF grafikona podataka može biti teže nego tabličnih (Excel/CSV) ili razgranatih (XML/JSON) podataka.
  • Možete vrlo jednostavno uparivati podatke s drugim podacima. URI je globalna shema te ukoliko ima isti URI onda je to namjerno, i tada su na dobrom putu da postanu podaci s 5 zvjezdica.

Za nositelje podataka

  • Imate kontrolu nad podacima te im možete optimizirati pristup (balasirati opterećenje, predmemoriranje, itd.).
  • Drugi nositelji podataka sada mogu povezati na vaše podatke, promičući ih na podatke s 5 zvijezdica.
  • Obično ulažete nešto vremena u razdvajanje vaših podataka.
  • Trebati ćete dodijeliti URI stavkama vaših podataka i razmisliti kako prikazati podatke.
  • Trebate naći postojeći uzorak koji ćete ponovno upotrijebiti ili ćete kreirati svoj vlastiti.

Divno! Sada su to podaci u interentu. One (najvažnije) stavke podataka imaju URI i mogu se dijeliti na internetu. Najprirodniji način predstavljanja podataka je korištenjem RDF, ipak i drugi oblici poput Atom mogu biti pretvoreni/mapirani za korištenje ukoliko je to potrebno.


Koji su koristi otvorenih podataka s pet zvjezdica?

Za korisnike podataka

  • Isto što i s otvorenim podacima s četiri zvjezdice, i dodatno:
  • Možete otkriti više (povezanih) podataka prilikom korištenja podatka.
  • Možete saznati o podatkovnoj shemi izravno na mjestu.
  • Sada ćete možda naići na loše interentske poveznice, poput 404 grešaka.
  • Predstavljanje podatka s proizvoljnom vezom je rizično jer omogućuje ljudima uključivanje sadržaja iz bilo koje web stranice na svojim stranicama. Oprez, povjerenje i zdrav razum su još uvijek potrebni.

Za nositelje podataka

  • Vaše podatke možete učiniti laganim za pronaći.
  • Povećavate vrijednost vaših podataka.
  • Vaša organizacija će dobiti iste koristi iz povezivanja kao i korisnik.
  • Trebati ćete uložiti u resurse za povezivanje vaših podataka s drugim podacima na interentu.
  • Trebati ćete popraviti loše ili netočne internetske poveznice.

Briljantno! To su sada podaci u internetu povezani s drugim podacima. I korisnici i nositelji podataka imaju koristi iz mrežnog efekta.

Ako imate otvorene podatke, možda biste željeli koristiti zvjezdice da označite razinu vaših podataka.
Internetski podatkovni portal Velike Britanije stranica data.gov.uk koristi ovakakv način ocjenjivanja otvorenih setova podataka.
Pročitajte data.gov.uk blog za više informacija o algoritmu za ocjene s pet zvjezdica.
Christopher Gutteridge ima brzi tečaj povezanih podataka za programere.
Open Data Institute vam pomaže da ceritificirate vaše otvorene podatke s certifikatom otvorenih podataka.