• 沒有找到結果。

於步驟二,政府機關已產出應優先開放與具高價值之資料集列表,步 驟三即為針對此列表內之資料集各別擬定開放資料的初始實行計劃探討。在 此階段的輸入部份,可以從以下三個大面向協助政府機關作探討:

(一) 於步驟二所產出之優先開放與具高價值之資料集列表:

1、 針對列表內之各別資料集作初始實行計劃探討。

(二) 針對某一應優先開放與具高價值之資料集的評估與開放時程計劃:

1、 資料集描述(Data description and metadata):

(1) 解釋資料集的意義,其蒐集與產製的時間、方法、原由、與此資 料集的特性如更新頻率等,讓公眾可以了解此資料集。

(2) 個別資料欄位所代表的意義、其所表示的資料格式(日期、整 數、長整數、浮點數等)、此資料欄位所可能的值、使用的代碼 術語、或其範圍等為何,讓公眾在取得使用資料集時,可以正確 使用。

(3) 詮釋資料應該涵蓋解釋某些欄位的資料是如何從其它欄位所計算 衍生出來(Wonderlich, 2010)。

(4) 公眾可能對某些開放資料的格式操作使用陌生,詮釋資料應該協 助解釋開放資料的格式與其使用方式(New York City Council, 2012)。

2、 開放資料格式(Dataset format)

(1) 此資料集的現階段資料格式為何?

(2) 此資料集開放應該採用那些格式?資料開放上的格式應遵守 Tim Berners-Lee(Berners-Lee, 2006)的建議,以五星衡量作為開放資 料格式的發展評估:

a、一星:使用者可以透過網路取得開放資料,也就是將資料放 上網路,但是檔案格式可能為 PDF 或 JPEG 等格式,使用者 並無法直接取得結構化資料並加以應用。

b、二星:除達到一星模式之外,可以透過程式來讀取結構化資 料,例如透過 Microsoft Excel 軟體讀取 Excel 相關檔案,而非 直接讀取圖檔。

c、三星:除達到二星模式之外,開放資料是使用開放的格式,

也就是使用非所有權(Non-Proprietary)的格式(如 CSV、XML 等),讓使用者可以透過開放原始碼或自由軟體之程式或工具

來讀取開放資料。

d、四星:除達到三星模式之外,可使用開放標準規範如 World Wide Web Consortium(W3C)所建議的 URI(Uniform Resource Identifier)與 RDF(Resource Description Framework),讓開放 資料可以被其它相關資料指向鏈結。

e、五星:除達到四星模式之外,開放資料本身也可以鏈結到其 它資料,來做為相關內容的延伸,也就是鏈結開放資料(Linked Open Data)。

(3) 開放資料的內容格式需要達到能夠以機器自動讀取分析的目標,

例如圖片檔或 PDF 格式等即不適合機器作自動讀取(Wonderlich, 2010)。

(4) 開放資料的格式應該以達到三星作為基本短程目標。四星與五星 的資料格式為鏈結開放資料(Linked Open Data)的實作,因其涉 及較多技術與語義格式的定義使用,建議將其設定為中長程在開 放資料格式上所欲達成之目標。

(5) 採取開放式的(Non-Proprietary)軟體與檔案格式,讓公眾在此資 料集時,不需要再去支付額外的軟體使用授權費用等,以免增加 公眾在取得資料上的限制(New York City Council, 2012)。

(6) 縱使授權軟體與格式是此資料集所常用的解讀格式,但單使用需 授權軟體與格式作為此資料集開放的格式依然是不被建議的。在 此情況之下,縱使開放式軟體與格式的使用者為小眾市場,仍建 議使用多種不同的開放軟體與檔案格式作此開放資料,以期公眾 在取得這些資料的過程上能夠有較多選擇。

(7) 次級機關之同類型資料之開放格式確認與整合:若所欲開放的資 料集為一廣泛業務,也就是其它機關組織也有相同的業務,以至 於會開放同樣的資料集,然而是分屬於不同縣市或中央政府機關 等。在此情況之下,需要有一統籌單位來進行協調,以期在跨機 關與組織的開放資料上能夠使用相同的資料格式,與統一的資料

欄位等。

3、 若此資料集開放需要相關的技術基礎建設,如API的建置、相關資 訊系統與資料庫的調整等,所需要作的適當規劃。

4、 若此資料集開放有受到限制,諸如著作權限制、資料機敏性問題與 其它法令限制等,需作適當的規劃,將相關機敏性與個人隱私部份 移除之後才能開放

5、 此資料集的品質面向評估:

(1) 此資料集在內容上的正確性。

(2) 此資料集在內容上的完整性。除上述與國家安全議題和個人隱私 相關資料之外,資料集內的原始資料都應該儘量開放給與公眾,

顯示對某一領域或業務內所蒐集之資料的完整揭露(Wonderlich, 2010)。

(3) 此資料集內容建議為最初的原始資料形態,而非經過整合或修改 後的形式(New York City Council, 2012)。

(4) 此資料集在內容上的時效性。開放資料在時效性上需達到合理的 即時目標,以使資料集對於公眾的價值達到最大化(New York City Council, 2012; Wonderlich, 2010)。

(5) 根據此資料集的特性,在資料集開放之後,資料集的更新頻率需 要定期與持續,以確保此資料集的品質(New York City Council, 2012)。

(6) 此資料集在開後之後,其內容與格式需要能夠持續的保持一致性

(Minister of State for the Cabinet Office, 2012)。

(7) 此資料集在開後之後,後續維護營運上需要作適當的保存、建 檔、或相關版本維護,以使公眾往後在使用資料時,依然可以找 尋到適當的資料(Wonderlich, 2010)。

(8) 若此資料集有品質上的考量或已知缺陷,應對其在資料品質上的 限制與缺陷等提供說明或聲明,讓公眾可以了解此資料集的限

制。

(9) 在盡力更新與調整之下,政府機關需考量是否不保證所開放資料 集的品質完整無誤(data.gov, 2013; New York City Council, 2012)。也就是對所開放資料的精準性、正確性、可靠性、即時 性等資料品質與適用性,不作絕對無誤的保證。

6、 此資料集開放的計劃時程:

(1) 預計開始進行此資料集開放準備的起始日期。

(2) 預計開放此資料集的日期。

(3) 此資料集開放後之後續維護時程規劃,如資料的更新頻率與詮識 資料的更新等。

7、 此資料集開放的所需成本規劃:

(1) 此資料集之準備與開放過程所需的人力(人/小時)。

(2) 此資料集之準備與開放過程所需的費用。

(3) 此資料集開放後之後續維護所需的人力(每年)。

(4) 此資料集開放後之後續維護所需的費用(每年)。

(5) 此資料集開放之所需成本的經費來源。

(6) 此資料集開放是以免費提供與是否收費的探討。

(7) 此資料集開放給與公眾等再製使用是否會產生可能風險之探討。

(三) 此資料集開放的授權規範制定:

1、 針對政府開放資料,應採用簡單明瞭的授權使用機制,以期資料使 用者能容易瞭解遵行。

可 以 考 慮 參 考 國 際 上 常 用 的 開 放 授 權 方 式 如 創 用 標 準 ( Creative Commons),對於開放資料集可以提供簡潔的著作權與授權使用解釋,讓 使用者有清楚規範以使用政府開放資料。

2、 可以制定審核流程架構的標準作業原則,協助政府機關作適當的開 放資料授權決定。

如紐西蘭的NZGOAL規範(New Zealand Government Open Access and Licensing Framework)解決政府開放資料上對於著作權(Copyright)和授 權(Licensing)的顧慮,透過創用標準(Creative Commons)來簡化對資 料授權與使用的說明。紐西蘭政府針對NZGOAL架構實作了一線上資訊 系統,透過實際操作此線上互動系統,機關可以詳細檢驗其所欲執行的開 放資料業務是否有符合NZGOAL的規範,所應選擇的授權機制,而不僅 是透過靜態文字敘述的法令規章去了解。

綜合上述的三大面向與所列細項,政府機關可以針對某一具有高優先 權與高價值的資料集作初步開放資料的實行計劃。探討面向為資料集的定義 說明、資料集開放格式、所需之基礎建設、隱私與機密相關資料的移除、資 料的品質面向評估、開放資料的計劃時程與成本估計、和開放資料的相關授 權規範。在此階段的最終產出應為對所欲開放之資料集的初步實行計劃。