atvērto datu izmantošanas pieredze
TRANSCRIPT
Raimonds Simanovskis
Atvērto datu izmantošanas
pieredze
@rsim
Easy to useweb based
business intelligence application
Many data sources
Create reports with drag-and-drop
Many chart types
Powerful calculations
Problēma…
Tipiskas valsts un pašvaldību iestāžu
datu lapas
Tīmekļa lapas nevis dati
Vai nu atsevišķu ierakstu meklēšana vai
ļoti summāri rādītāji
Kas ir atvērtie dati?
•Pilnīgi Visiem publiskajiem datiem ir jābūt pieejamiem. Publiskie dati ir dati, uz ko neattiecas privātuma, drošības vai privilēģiju ierobežojumi.
•Primāri Dati tiek publicēti tādi, kā tie tiek oriģināli savākti ar lielāko iespējamo detalizācijas pakāpi, nevis apkopotā vai modificētā formā.
•Laicīgi Dati ir pieejami pēc iespējas ātrāk, lai nodrošinātu savlaicīgu datu vērtību.
•Pieejami Dati ir pieejami visiem iespējamajiem lietotājiem un visiem iespējamajiem nolūkiem.
http://opendata.lv/2011/08/05/kas-ir-open-data/
Kas ir atvērtie dati?
•Automātiski apstrādājami Dati ir saprātīgi strukturēti, lai nodrošinātu to automātisku apstrādi.
•Nediskriminējoša pieejaDati ir pieejami ikvienam bez nepieciešamības reģistrēties.
•Atvērts datu formātsDati ir pieejami brīvā datu formātā, pār kuru nevienam nav īpašas kontroles.
•Bez licencesUz datiem neattiecas autortiesību, patentu, preču zīmju vai komercnoslēpumu likumi. Saprātīgi privātuma, drošības un privilēģiju ierobežojumi var tikt atļauti, ja to nosaka citi likumi.
http://opendata.lv/2011/08/05/kas-ir-open-data/
Atvērtie dati Latvijā
•Pilnīgi
•Primāri
•Laicīgi
•Pieejami
•Automātiski apstrādājami
•Nediskriminējoša pieeja
•Atvērts datu formāts
•Bez licencesNEATBILST
Datu iegūšana no Latvijas valsts iestāžu tīmekļa lapām un
to analīze ar .
Garlaicīgas... Grūti redzēt sakarības... Grūti atkārtoti izmantot...
Iestāžu datu lapas
Bet attēlojot datus ar skaistu vizualizāciju
palīdzību...
Dati kļūst daudz interesantāki un
saprotamāki
Atvērto datu hakatoni
Saeimas vēlēšanu rezultāti Ziedojumi partijām Publiskie iepirkumi
Amatpersonu deklarācijas Meteoroloģiskie dati
Transporta līdzekļu statistika
Piemēri
Sadarbība ar žurnālistiem:
Būvnieki, partijas, iepirkumi
Kuru partiju ziedotāji ir saistīti ar būvniecības uzņēmumiem
Publisko iepirkumu
rezultātu HTML lapu apstrāde
<3% no būvniekiem ir “ziedotāji”
Iegūst >10% no līgumiem
Kas ir >30%
no kopējā apjoma
Hakatoni ar
žurnālistiem
Galvenās problēmas datu iegūšanā no
tīmekļa lapām
Strukturētu un korektu datu iegūšana no HTML lapām
Vai kāds šo datu korektību
pārbauda?
Tīmek"alapasTīmek"alapasTīmek"alapas
Datubāze 1
Tīmek"alapasTīmek"alapasTīmek"alapas
Datubāze 2
Tīmek"alapasTīmek"alapasTīmek"alapas
Datubāze 3
Datu analīze
Datu iegūšana notīmek$a lapām
Strukturēti dati 1
Datu iegūšana no
tīmek$a lapām
Strukturēti dati 2
Datu vizualizācija
Datu iegūšana
notīmek$a lapām
Strukturēti dati 3
Lietojumprogrammas
Label 2 Text Field
Label 1 Menu
Datubāze 3
Datu eksportsXML
Tīmek"alapasTīmek"alapasTīmek"alapas
Datubāze 1
Datu analīze Datu vizualizācija Lietojumprogrammas
Label 2 Text Field
Label 1 Menu
Datubāze 2
Datu eksportsCSV
Datu iegūšana notīmek$a lapām
Strukturēti dati CSV
Atvērtodatu kopudatubāze
data.opendata.lv
Pirmie datu portāli
Bet daudzās iestādēs atvērto datu
publicēšanai tikai vārdos un koncepcijās :(
@opendata_lv