• 沒有找到結果。

第一章 緒論

1.2 研究動機與目的

Open Gov Data的盛行,帶動一波新的網頁、手機應用程式的興起。根據台北市政府資料開放平 台所公開的資訊,目前已經有多達323種資料來源,其中大部份是與市民相關的公共資訊以及交通相

藉由智慧型手機,我們可以掌握到使用者身處的時間、地點、甚至是狀態,配合其他服務,我們還可 以知道使用者未來的行程、對事物的喜好,當我們掌握這些訊息,配合Open Gov Data,我們可以提 供更貼近使用者生活的資料。

另外本研究也針對『資料本身』進行探討。台北市政府公開資料平台所提供的資料,不只格式眾 多,而且可讀性相當差,相當難做多項資料的整合分析或應用,所以本研究希望運用Lined Data的規 範,利用W3C所提供的協定描述台北市政府公開資料,一方面解決格式混亂的問題,一方面讓資料 與資料本身可以加以鍊結,強化資料的力量,進而從資料群集中,得到有用的資訊。

第 2 章 文獻探討

2.1 情境感知(Context Awareness)

情境感知(Context-Awareness)是指利用行動裝置偵測、統整使用者目前的位置資訊及狀態資訊,

進而可以自動地提供符合使用者目前需求的資訊、服務。在此前提之下,系統會給予符合使用者目前 所需、符合使用者目前情境的服務或資訊,進而減少多餘、不必要的資訊,服務也能夠貼近使用者。

情境感知最早是由Schilit與Theimer [7] [8]在1994年所提出的概念,主要是利用無線傳輸的技術,

將使用者所需要的、可利用的資訊,依據使用者所在的位置及情境,傳送至使用者。「情境(Context)」

 情境資訊:包括使用者資訊,例如年齡、性別、喜好…等等,以及其他環境資訊,例如時間、

 服務模式:依照David Kotz的定義,可以將情境模式分為主動服務模式(Active Context)及被 動服務模式(Passive Context)。主動服務模式是指系統會在接收到處理過的情境資訊之後,主

2.2 開放資料(Open Data)

容公開,以增加技術的交流,Science Commons 前執行長 John Wilbanks 提到:「許多科學家都曾經 指出,在這歷史的一刻,正當我們擁有技術能力將科學資料以全球性的層次來發佈和送出,加強彼此 之間的合作關係和加快加深新科技的發明時,很諷刺的看到我們忙著將資料封閉起來,並嚴禁使用更 先進的技術在這些知識上 [4]」。另一方面,也有人認為某些單位所掌握的各個資訊,是源自於一般 大眾所提供,但一般使用者卻無法使用這些資訊,故想藉由內容開放,將這些資料的使用權還給大眾。

內容開放運動的興起,使得學界、政府等都有 Open Data 運動。

依據 W3C eGov Interest Group [10]的定義,Open Data 必須要符合以下標準:

i. 格式未加工(Raw Format):資料本身不能經過多餘的加工。

ii. 機器可讀(Machine-readable):資料格式可以電腦或程式讀取並加以處理。

2.3 政府開放資料(Open Government Data)

顧名思義,政府公開資料即是由政府平台提供各種施政時所匯集的公開資料給全民使用。政府施 政透明是世界各國政府推動的趨勢,經由政府資料的公開化,除了促使跨機關資料流通,更能滿足民 眾需求,並強化民眾監督政府的力量。現在智慧型手機時代來臨,需多嶄新的網路、手機服務陸續推

出,政府公開資料搭上這個順風車,在有限的資料來源之下,善用民間的創意能量,開發出以往政府 難以達成、更加便民的服務內容,創造業者、民眾、政府三贏局面。

依據行政院第3322次院會決議指示 [11],政府開放資料(Open Data)可增進政府施政透明度、提 升民眾生活品質,滿足產業界需求,對於各級政府間或各部會間之決策品質均有助益可見其重要性,

各部會應自民眾的應用面發想,思考使用端之需求,在規劃時也要考慮到機器讀取介面的必要性。資 料開放的類型以便利及提升民眾生活品質為優先,例如食、醫、住、行、育樂、就業、文化、經濟發 展和生活品質等,期透過政府資料開放,促成跨機關與民間協同合作與服務創新,創造民眾、政府、

業界三贏局面。

依據W3C eGov Interest Group [10]的定義,政府公開資料必須要符合以下原則:

1. Complete:所以公開資料都可以被取用,不設任何加密或取用權限。

2. Primary:資料都是最原始的資料,不是整合、修改過的。

3. Timely:資料必須是即時有效的,不是過期的資訊。

4. Accessible:資料可以讓任何人、任何單位使用,且可以被拿來做任何可能的應用。

5. Machine processable:資料是以可以被電腦、程式理解的格式儲存,使得資料可以被自動化 的存取。

6. Non-discriminatory:資料可以被任何人取用,不會有任何取用的權限。

7. Non-proprietary:資料室可以同時重複使用,不會互斥存取。

8. License-free:資料沒有任何版權、商業法規的限制。但如因部分合理的隱私、機密或特權限 制,則可以有部分版權限制。

2.4 鏈結公開資料(Linked Open Data)

Tim Berners-Lee 針對 Linked Data,提出了四項標準 [12]:

1. 使用 URI 描述任何資源或事物

2. 使用 HTTP URIs 使得所有的資源可以藉由網路讓使用者存取

3. 對於每個 URI 資源提供有用的資訊,並且使用 RDF 或是 SPARQL 標準描述 4. 提供連結到其他相關的 URI

Linked Open Data 就是基於 Linked Data 的精神,希望政府、企業在開放資料時,能利用鏈結資料 的方式公開,藉由 Linked Data 的可讀性、易分享性,強化開放資料所帶來的效益。

為了鼓勵資料擁有者,尤其是政府,可以公開資料,Tim Berners-Lee 於 2010 發展了鏈結開放資 料的鑑定準則 [13]。此準則共有五個 Level,Level 越高表示資料越開放、越符合 Linked Open Data 的精神。

1. 不論格式,以開放授權的方式公開所有資料(此時僅可稱 Open Data)。

2. 所有資料是以機器可閱讀的結構化格式發表(例如使用 Excel 取代紙本圖表掃描的圖片)。

3. 符合層級二,且使用非授權的資料格式(例如使用 CSV 取代 excel) 。

4. 符合以上所有規範,並且使用 W3C 的標準格式(例如 RDF 及 SPARQL)來描述資料,使得人 們可以指向這些資料。

5. 符合以上所有規範,並且將資料連結至其他人提供的資料。

2.5 資源描述架構(RDF)

資源描述架構(Resource Description Framework)及 RDF Schema 是網際網路標準組織(W3C)為解 決資源描述問題的先導規範。RDF 在 2004 年 2 月成為 W3C 標準。 它允許使用者建立階層式的

RDF 是建構在 XML 之上,基本模型包含 Resource、Properties、以及 Statement。Resource 有兩 種形態:「URI Resource」以及「Literal Resource」。以圖 2-2 為例,有一個以 URI 描述的 Resource:

『t-shirt』;他有兩個 Properties,分別是『size』及『color』;Properties 的 Value 也算是一種 Resource(基 於 XML 的樹狀結構);『size』的 Value 是一個 Literal Resource:12;『color』的 Value 是另一個 URI Resource:『white』。

RDF 用來描述物件的基本單位即為 Statement。Statement 描述事情的有三個敘詞:Subject、

Predicate(Property)、以及 Object,通稱三體(triple)。描述方式是:「Subject has a Predicate, which is Object 」。以圖 2-3 的 RDF 為例:

 Subject:T-shirt (嚴謹一點應該是<http://www.linkeddatatools.com/clothes#t-shirt>)

 Predicate(property):是 Color (嚴謹一點應該是<feature:color>)

 Object:white (嚴謹一點應該是<http://www.linkeddatatools.com/colors#white>)

故我們可以用白話文這樣描述:

 『t-shirt』這個物件有個『size』屬性,其值為『12』

 『t-shirt』有個『color』屬性,其值為『白色』。

圖片 2-3 RDF 範例二 圖片 2-2 RDF 範例一

若以圖像表示,其意涵可用下圖表示;

2.6 SPARQL

SPARQL Protocol and RDF Query Language,是一種用於RDF上的查詢語言。SPARQL是基於以前 的RDF查詢語言,例如rdfDB、RDQL、SeRQL,發展而來。此語言師道HP公司語意往研究小組:Jena 開發團隊的支持,用來提供人進行語意網的相關研究和應用開發。2008年1月,SPARQL已經成為W3C 的推薦標準 [15]。

2.7 Google API

Google API,是由谷歌公司開發的應用程式介面。Google的網際網路應用軟體有著非常好的開放 性,針對使用者,Google提供了豐富的產品線;針對應用開發者,Google則為絕大多數產品提供了可 在協力廠商應用中使用整合的API介面 [16]。

Google目前開放的API已經超過60種,這些API的功能非常廣泛,幾乎每一個Google服務就有對應 的API可以呼叫。而這些API常和AJAX、JavaScript、XML或JSON等技術結合。不僅如此,為了讓更 多人使用Google的服務,Google公司也提供了一些不需撰寫程式,只要透過設定就能使用的API小工 具。

本研究主要會使用到以下兩個Google API:

圖片 2-4 RDF 關係描述圖

1. Location API:Location API 可以讓你在不需要專注在底層的位置辨別技術的前提下,簡單 的建立你的位置情境感知的應用。而且盡可能的減少對於手機硬體的需求,降低電源損耗。

2. Google Calendar API:Google Calendar API 可以讓你建立開發客戶端應用程式,並透過程式 創建、編輯、刪除、搜尋活動(event)。

圖片 3-3-1 系統規劃圖

第 3 章 系統規劃

本研究可分成兩部分,一部分是使用 RDF 描述台北市公開資料,建立鏈結資料,並提供一個可 以存取的平台;另一部分是利用該平台提供的資訊,實作一個 Context Awareness 的應用服務。

台北市提供各類的 Open Data,資料格式眾多,而且可讀性較差,於是本研究想建立一個 RDF Interface,將政府提供的 Open Data,藉由 Converter 統一轉成 RDF 格式的資料,並且整合不同資料集 的資料,建立起 Linked Open Data,以便達成格式統一的目的,可讀性也較佳,而且藉由鏈結資料的 連結,不同種類的資料彼此可以找到鏈結,方便進行比較、運用。RDF Interface 會提供一個 SPARQL 的 EndPoint,其他使用者可利用 SPARQL 查詢、運用這些資料,開發更多的服務讓一般的使用者使 用。本研究也會以此基礎,開發一個 Context Aware 的行動運用。

另一方面,本研究要實作的服務是『停車場資訊的查詢與推撥機制』,藉由這個服務,使用者可 以瀏覽台北市各個汽車停車場的資訊,特別是空位個數,服務中導入情境感知(Context Awareness)的 概念,可以依據使用者的情境,主動提供對應的停車場資訊,讓服務更貼近使用者。本服務的情境感 知會基於 3 種模式:Time-based、Location-based、以及 Event-based,會依據這 3 個資訊作為情境資訊 參考,提供適合的服務。

3.1 鏈結資料圖(Linked Data Diagram)

台北市政府公開資料,雖然已經提供了許多資料,但是因為資料格式不固定,使得一般使用者難 以進行運用,必須得先做一層分析、整理,才可以加以運用、開發服務。本研究希望能解決這個問題,

本研究採用的方式是:利用RDF,作為資料的儲存格式,取代原本雜亂、可讀性低的資料格式,進一 步可以建立台北市政府公開資料的鏈結資料(Linked Data),加強資料的擴充性。

Tim Berners-Lee於2009年Ted的演講 [17]提到,政府與企業應該鼓勵開放資料,並且鼓勵建立

Tim Berners-Lee於2009年Ted的演講 [17]提到,政府與企業應該鼓勵開放資料,並且鼓勵建立

相關文件