政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3...

33
1 政府資料品質提升機制運作指引 國家發展委員會 106年4月7日

Upload: others

Post on 30-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

1

政府資料品質提升機制運作指引

國家發展委員會

106年4月7日

Page 2: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

簡報大綱

壹、目的、適用對象及適用範圍

貳、檢測指標介紹

參、檢測流程介紹

肆、各類資料類別參考範例

伍、資料品質管理重點

陸、規劃期程

2

Page 3: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

3

• 為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,

使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

資料品質概念、逐步提升政府資料之可用性。

目的

• 行政院及所屬各級機關(以下簡稱各機關)適用之;公營事業機構、公

立學校及行政法人,得準用;地方政府得參照。

適用對象

• 本運作指引以符合國際「開放定義」(Open Definition)之政府資料,

範圍含括各機關於職權範圍內取得或做成,且依法得公開之各類電子資

料,包含文字、數據、圖片、影像、聲音、詮釋資料(metadata)等。

適用範圍

壹、目的、適用對象及適用範圍

Page 4: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

4

貳、檢測指標介紹

檢測構面 檢測指標

資料可直接取得連結有效性

資料資源能否直接下載

資料易於被處理 結構化檔案類型

資料易於理解

詮釋資料編碼描述與資料相符

詮釋資料欄位描述與資料相符

資料更新時效性 (人工檢核)

民眾意見回饋民間回饋意見之回復效率(人工檢核)

Page 5: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

5

檢測構面 檢測指標計算

基礎判斷方式 判斷時點 輸出結果

資料可直接取得

連結有效性 全部資料資源 機器測試 定期 True/False

資料資源能否直接

下載全部資料資源 機器測試

資料資源

異動時

檔案載點(含

API回傳資料)

/ 網頁連結

資料易於被處理是否屬結構化檔案

類型全部資料資源

機器測試

非僅檢測副檔名

資料資源

異動時

結構化檔案 /

非結構化檔案

資料易於理解

詮釋資料編碼描述

與資料相符

結構化資料資

源機器測試

資料資源

異動時True/False

詮釋資料欄位描述

與資料相符

結構化資料資

源機器測試

資料資源

異動時True/False

貳、檢測指標介紹

Page 6: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

6

檢測構面 檢測指標計算

基礎判斷方式 判斷時點 輸出結果

資料易於理解 資料更新時效性 熱門資料集 人工檢核 定期無逾期/有逾

民眾意見回饋民間回饋意見之回

復效率全部資料集

人工檢核(是否

於7日內進行回復)

/民間評分低於

中間值者

定期

貳、檢測指標介紹

Page 7: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

7

貳、檢測指標介紹-示意圖

Page 8: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

8

参、檢測流程介紹

結構化資料:指經分析後可分解成多個互相關聯的組成部分,各組成部分間有明確的層次結構。

資料

非結構化資料

結構化資料

固定欄位結構

化資料

非固定欄位結

構化資料

Page 9: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

9

参、檢測流程介紹

資料

非結構化資料

結構化資料

固定欄位結構

化資料

非固定欄位結

構化資料

(1) 固定欄位結構化資料:單一列(Row)標題的表格式資料,每筆資料的欄位數均相同,且無合併儲存格、無公式、無空行、無小計等。

(2) 非固定欄位結構化資料:每筆資料欄位非固定之結構化資料,符合W3C之XML、JSON、JSON-LD標準等結構化資料。

結構化資料:指經分析後可分解成多個互相關聯的組成部分,各組成部分間有明確的層次結構。

Page 10: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(一)通則

1. 資料集詮釋資料注意事項1) 「資料集名稱」是資料資源集合的正式名稱,請以可一目瞭

然之名稱命名之,必要時可加上機關全銜。

2) 「資料集描述」為資料集簡明陳述,應避免與資料集名稱相同,讓使用者可進一步瞭解資料集內容。

3) 如有說明文件(readme*.*、schema*.*)、說明網頁連結,應放置於「資料集相關網址(landingPage)」欄位,或與資料資源一併置於壓縮檔內。

2. 資料資源注意事項1) 如有檔案壓縮之需求,應於資料集「領域別詮釋資料參考網

址 (metadataSourceOfData)」提供manifest表單,以利使用者理解壓縮檔內各檔案之關聯性,並應避免多層壓縮。

2) 檔案名稱建議以英數、連字號、底線、括號為限,避免使用中文檔名以免轉換時產生亂碼。

10

肆、各類資料類別參考範例

Page 11: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(一)通則

1. 資料集詮釋資料注意事項1) 「資料集名稱」是資料資源集合的正式名稱,請以可一目瞭

然之名稱命名之,必要時可加上機關全銜。

2) 「資料集描述」為資料集簡明陳述,應避免與資料集名稱相同,讓使用者可進一步瞭解資料集內容。

3) 如有說明文件(readme*.*、schema*.*)、說明網頁連結,應放置於「資料集相關網址(landingPage)」欄位,或與資料資源一併置於壓縮檔內。

2. 資料資源注意事項1) 如有檔案壓縮之需求,應於資料集「領域別詮釋資料參考網

址 (metadataSourceOfData)」提供manifest表單,以利使用者理解壓縮檔內各檔案之關聯性,並應避免多層壓縮。

2) 檔案名稱建議以英數、連字號、底線、括號為限,避免使用中文檔名以免轉換時產生亂碼。

11

肆、各類資料類別參考範例

Page 12: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(一)通則範例1. 說明文件

2. 壓縮檔案說明文件(manifest)置於“領域別詮釋資料參考網址 (metadataSourceOfData)”

12

肆、各類資料類別參考範例

Page 13: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(二)API

1. 適用資料類型:高更新頻率資料或已有系統可即時產製資料者。

2. 建議資料格式:JSON、XML格式。

3. 資料集詮釋資料注意事項:建議優先提供符合swagger / OAS3之說明文件。

4. 參考範例:1) 交通部公共運輸整合資訊流通平台

https://ptx.transportdata.tw/PTX/Service

2) 政府資料開放跨平臺介接規範http://data.gov.tw/政府資料開放跨平臺介接規範.yaml

13

肆、各類資料類別參考範例

Page 14: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(二)API範例✓ 透過swagger validator http://petstore.swagger.io/#/

14

肆、各類資料類別參考範例

Page 15: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(三) 固定欄位結構化資料1. 適用資料類型:定期產製且未經統計彙整之原始資料(RAW data)

、統計資料、地理圖資、已有系統可產製資料者。

2. 建議資料格式:CSV、JSON、XML、GeoJSON、KML、KMZ、SHP等格式。

3. 資料內容注意事項:

1) CSV內容請以半形逗號","作為資料區隔,欄位標題以一列為原則

2) 結構化資料內容無多表合併、無合併儲存格、無空行、無小計。

4. 資料集詮釋資料注意事項:主要欄位說明請依「資料集詮釋資料標準規範」填列,欄位區隔請一致採用全形頓號"、"。

5. 參考範例:1) 消費力統計-各分位載具消費張數金額-資料集

http://data.gov.tw/node/24831

2) iTaiwan中央行政機關室內公共區域免費無線上網熱點查詢服務http://data.gov.tw/node/5962

15

肆、各類資料類別參考範例

Page 16: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(三) 固定欄位結構化資料範例

16

肆、各類資料類別參考範例

Page 17: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)非固定欄位結構化資料

1. 適用資料類型:會議紀錄、法規函釋等。

2. 建議資料格式:建議以JSON格式優先,或以清單格式資料資源提供。

3. 參考範例:1) 行政院資料開放諮詢小組會議紀錄

http://data.gov.tw/node/16827

2) 法務部法規資料庫http://law.moj.gov.tw/PublicData/DevelopGuide.aspx

3) 民間整理組織法http://ronnywang.github.io/tw-gov-org/

17

肆、各類資料類別參考範例

Page 18: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)非固定欄位結構化資料範例

18

肆、各類資料類別參考範例

Page 19: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例1:社會發展類委託研究計畫清單http://data.gov.tw/node/14104

19

肆、各類資料類別參考範例

Page 20: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例1:社會發展類委託研究計畫清單(建議)使欄標題僅有一列,即為好的結構化資料資源

20

肆、各類資料類別參考範例

Page 21: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例2:行政院二級機關組織法http://data.gov.tw/node/14104

21

肆、各類資料類別參考範例

Page 22: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例2:行政院二級機關組織法清單(建議)以清單方式揭露,同時也能提供更多資料

22

肆、各類資料類別參考範例

Page 23: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告http://data.gov.tw/node/22923

23

肆、各類資料類別參考範例

Page 24: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告(建議)資料資源內容須於「資料資源描述」簡述清楚

24

肆、各類資料類別參考範例

舊年度報告

實際上是103年度報告

實際上是104年度報告

Page 25: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告(建議)報告內容若有統計資料,可將其取出成為新資料

25

肆、各類資料類別參考範例

Page 26: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告這樣的表格其實還不是很好用… 編排也很花功夫

26

肆、各類資料類別參考範例

Page 27: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告(建議)拆解為單列標題表格,並且存成CSV更好

27

肆、各類資料類別參考範例

單列表格無論是在排序、篩選、製表上都方便非常多!!

Page 28: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告(建議)以UTF-8編碼儲存,避免掉字

28

肆、各類資料類別參考範例

但MS Office沒那麼聰明…

Page 29: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

(四)例3:國營事業年度工作考成總報告(建議)如有大量說明文字,可另創readme*.*說明文件

放置於「資料集相關網址」欄位,或於「資料集描述」內說明。

29

肆、各類資料類別參考範例

Page 30: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

1. 以資料產製來源為系統者,優先配合於維運週期提供符合結構化資料定義之資料資源,避免由人工進行調整。

2. 對於非結構化但可轉為結構化之資料資源,應以資料使用者的角度思考其提供方式是否妥適,並安排期程改善。(如:具有合併儲存格之CSV、報表資料卻僅以PDF檔提供者)

3. 對於資料內容為非結構化格式者,應避免進行無意義的檔案格式轉換(如:以Word另存為XML格式)。

4. 政府資料開放平臺之資料集均應適用政府資料開放授權條款,各項資料之開放前均應確認其權利完整性(如:著作權等)。

5. 民眾回饋意見,機關應於7個日曆天內回復,如屬資料有誤,或重大事件相關之資料資源未能符合民間需求品質,由國家發展委員會協調資料提供機關改善。

30

伍、資料品質管理重點

Page 31: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

• 政府資料開放提供資料資源如提供相同內容之資料來源,請以相同檔名命名,檢測程式將會優先以結構化檔案(CSV>JSON>XML>其他結構化格式)擇一進行測試,其餘同名檔案則排除測試。

• 如有說明文件(readme*.*、schema*.*)、說明網頁連結,建議可放置於「資料集相關網址(landingPage)」欄位,或與資料資源一併置於壓縮檔內。

31

伍、資料品質管理重點-追加說明

Page 32: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

32

陸、規劃期程

初測階段預計於第二季產生各機關初測結果,並寄送各部會。

輔導改善階段各機關參考測試結果進行資料(集)修正。

複測階段預計於第4季進行資料品質複測,結果亦會寄送各部會。

106年第2季 106年第3季 106年第4季

107年~

規劃方向:1. 將於政府資料平臺後臺提供部會管理者隨時下載檢測結果報表。2. 規劃提供測試程式或線上測試環境供測試使用。

Page 33: 政府資料品質提升機制運作指引beta.join.gov.tw/attachments/6cd1161c-5b95-43a3-bf67-36a...3 •為提升政府資料開放內容之正確性、易用性、即時性及採適當格式開放,使政府資料開放邁向結構化,爰訂定本運作指引,以期協助各機關建立

謝謝!敬請指導!

33