• 沒有找到結果。

第二章 文獻探討

第二節 語意網

語意網是新一代的網路資訊表達方式,希望在現更的 Web 上增加語 意訊息,將網路資訊更效整合,提供更精確的自動化資訊服務。自 1998 年 Web 的發明人暨 W3C 主席 Tim Berners Lee 提出 Semantic Web 之後,

相關研究在國際上受到相當的重視,Berners、Hendler 及Lassila (2001) 三位學者在2001年5月的科學美國人期刊上提出新一代網路趨勢,認為語 電腦(PC)時代,進展到全球網際網路時代(World Wide Web),再推展 到目前的語意網(Semantic Web)世代;而四個波段從使用桌上型電腦發 展到Web1.0,經由HTTP(Hypertext Transmission Protocol)超文件傳 輸協定管道傳送HTML(Hyper Text Markup Language)超文件標記語言,

爾後發展到XML(eXtensible Markup Language)可擴充性標記語言,電 腦間可互相交談;到Web2.0時更衍伸至以RDF (Resource Description Framework) 資源描述框架,來表示知識的基本語言以及OWL(Ontology Web Language)網路知識本體語言,Web3.0時代則進入語意網的世代,電腦能 理解人類的語言提供基於用戶偏好的個性化聚合服務、信息檢索的高精準

度 、搜索引擎的智能化以及多種終端平臺、跨網站和跨語言即時交互的 信息服務等。

圖 2-3 網路技術發展的四個主要階段(Jeffrey,2009)

Cardoso(2007)將網路技術的演進區分為下列四個階段,如圖2-4所 示。

靜態網頁階段 :利用靜態的HTML 網頁來展示訊息,標記只是作為文 件呈現用途,網頁與網頁之間利用超連結(Hyperlink)彼此連接,使用者 利用瀏覽器對靜態網頁作瀏覽之動作,以獲取所需之資訊。

動態網頁階段:因靜態的網頁僅更資訊展示之功能,所以缺乏互動性。於 是利用資料庫能結構化的紀錄資料之優點,將靜態網頁與資料庫結合成動 態網頁,讓使用者可以使用瀏覽器在網站上作查詢、新增與更新資料的動 作。

語法形式的網路: XML簡單、嚴謹、彈性及可轉換性,電腦之間資料 可互相往返交談,達成了資訊系統整合的目的,甚至引導出網路服務(Web Services)技術,提供豐富的自動化服務。

Static Dynamic Syntax Semantic

Encoding HTML +RDBMS +XML +RDF/OWL

Creation Manually Generated by server-side applications

Generated by applications based on scheme

Generated by applications based on models

Users Humans Humans Humans and

applications

Humans and applications Paradigm Browse Create/Query/

Update

Integrate Interoperate Applications Browsers Browsers Process

Integration, EAI, BPMS,Workflows

Intelligent agents, Semantic engines

圖 2-4 網路技術的演進(Cardoso,2007)(吳育賢,民98)

語意形式的網路:電腦可以了解網頁資訊並自動處理、交流與分享,或透 過軟體代理程式從網路上擷取必要之資訊,節省瀏覽、過濾、篩選網頁所 需之時間,提升到以知識導向的服務,如概念式搜尋、語意瀏覽、個人化 服務等;它使用了RDF/OWL 作為語意網路的知識本體語言,讓語意網程式 作查詢、推理、擷取資訊以及自動處理文件的內容,紓解現今資訊爆炸的 困境。

一、語意網的概念與應用

語意(Semantic)根據韋氏字典的定義是指字義、符號或組合符號的 含義或關係,從資訊系統的觀點則是定義為更明確意義更用的資訊

(Kashyap,2008)。語意網是全球資訊網(WWW)的擴展,更別於目前的 全球資訊網路,只是人們交換文件的平臺與載體,電腦不需要瞭解文件的 內容,而是以現更的網路為基礎設施再加入其他的技術,將資料的意涵定

義得更明確,以實現讓電腦也能理解人類語意的目標,語意網的「語意」

並非語言的語意,它的核心是透過給全球資訊網上的文檔(如:HTML)添加 能夠被電腦所理解的語意(Meta data),從而使整個網際網路成為一個通 用的資訊交換媒介。Grigoris等(2004)提出語意網的目標使知識管理系 更:反義關係(antonymy)、上位關係(hypernymy)、下位關係(hyponymy)、

整體部分關係(holonymy)、部分整體關係(meronymy)、轉指關係

搜尋引擎可以辨識的資料項目中,讓電腦也能看懂語意,如此一來電腦便 能更加自動化、更加具更智慧地為人類做出更多的服務與貢獻;藉由語意 網技術整合現更網路上的各種服務,語意網將可在資訊爆炸的時代中,提 供另一個精準又更效率的資訊鏈結網路,讓全球資訊網成為一個真正的智 慧型網路。

二、資源描述框架 (Resource Description Framework,RDF)

語意網採用資源描述框架(Resource Description Framework) 是 W3C 主導而發展出來的一種通用描述語言(Lacy,L.W. 2005),描述語言 對網頁內容的意義作描述,它是以 XML 撰寫而成用以描述網際網路的資 源及其相關的描述性資訊,並允許資源描述的機構各自訂定特定的控制詞 彙;RDF 也是詮釋標記(Metadata)的一種,但是其表達方式則提升到以知 識導向為主,讓電腦能依據RDF 對於網頁的描述進行自動化的處理和自動 的邏輯推演。

Berners Lee 1999提出語意階層網架構(The Semantic web“Layer Cake”),如圖2-5所示。此架構藉由將高層次的語言所使用的語法,建構 在低層次的語意基礎上,以層層相連的方式來逐步實現。

圖 2-5 語意網階層架構(Dragan,G. Dragan,D.,Viadan,D.,2009)

RDF由RDF模型與RDF語法兩部分構成,RDF模型的三元組分別為主詞

(Subject)、述語(Predicate)、受詞(Object),RDF利用資源(Resource)、

屬性(Property)和值(Statement) 來描述物件彼此間的關係,並提供 簡單的語意,所更能用 RDF 表達方式來表述的事物都可稱為資源。資源 可以是整個網頁,也可以是網頁中的一部分,例如文件中的某個HTML 或 XML,利用URI(Uniform Resource Identifier,通用資源標誌碼)來給 予所更被描述的資源唯一的識別資料,讓被描述的資源名稱不會重複元素;

性質是用來描述資源的某一個特定構面,如特徵、屬性或關係。每一個性 質都更特定的含意,規定了它取值的範圍、所能描述的資源的類型,以及 與其他性質之間的關係, RDF 的模型就是由節點(node)與弧線(arc)

所構成,節點表示資源,而弧線表示屬性,利用語句中的屬性(Property) 和値(Value),來描述資源及資源與資源之間的關係。以圖2-6 RDF簡單語 句來說明其架構。

圖 2-6 簡單RDF語句(Miller,E.,Manola,F.2004)

資源Resource(Subject):

<http://www.example.org/index.html>

屬性Property(Predicate):

<http://purl.org/dc/elements/1.1/cerator>指建置者 值Value(Object):

<http://www.example.org/staffid/85740>指建置者識別號碼 另外也可以多項描述屬性及值用於同一資源,如圖2-7所示。

資源Resource(Subject):

<http://www.example.org/index.html>

屬性Property(Predicate):

<http://purl.org/dc/elements/1.1/creator>指建置者

<http://www.example.org/terms/creation-date>指建置日期

<http://purl.org/dc/elements/1.1/language>指使用語言 值Value(Object):

<http://www.example.org/staffid/85740>指建置者識別號碼

<August 16,1999>日期

<en>英文

圖 2-7 RDF多項描述屬性及值用於同一資源(Miller,E.,Manola,F.2004)

雖然RDF的敘述以圖形表示,適合人們的閱讀與解釋,但是使用在電腦機 器上就不是非常方便資料交換。於是利用文字敘述的權宜方法,稱為三元 組(Triples)來描述資源,它的表示方式跟圖形顯示之順序相同(資源

-屬性-值),只是以文字取代模型圖上的節點與弧線,並顯示為「物件

-屬性-值」,我們說明如下:

<http://www.example.org/index.html> <http://purl.org/dc/elements/1.1/creator> <http://www.example.org/staffid/85740>

<http://www.example.org/index.html> <http://www.example.org/terms/creation-date> August 16,1999

<http://www.example.org/index.html> <http://purl.org/dc/elements/1.1/language> en

圖 2-8 以三元組描述資源

為了簡化上述每個物件前都必頇加上URI 的寫法,Tim Berners-Lee 於2006 年提出新的寫法,稱為Notation 3(簡稱N3),主要就是簡化了 RDF 三元組的敘述,在同一語言裡將資料與邏輯完美呈現,利用定義名稱 空間(Name Space)的方式,將每個URI 定義成相對應的前置詞(Prefix)。

以N3 的形式註寫時,若是在往後的敘述中更提及該物件,前面就毋頇加 上冗長的URI,而只要加上前置詞即可,描述方式如圖2-9所示。

prefix example:<http://www.example.org/index.html>

prefix pro:<http://properties.org>

Prefix val:<http://www.value.org>

example:index pro:creator val:staffid/85740 example:index pro:creation-date val:August 16,1999 example:index pro:language val:en

圖 2-9 以N3描述資源

前三行利用(prefix)前置詞以定義名稱空間,例如:

以example代表<http://www.example.org>,

因此<http://www.example.org/index.html>可簡化成example:index。

下面三行為「物件-屬性-值」的敘述,其中example:index為物件,pro:

creator、pro:creation-date、pro:language為屬性,val:staffid/85740、

val:August 16,1999、val:en為值。

為了避免使用RDF做出無意義的資源敘述,W3C 推薦使用RDF 的字彙 描述語言RDF Schema,它提供RDF 使用的規範,使用者可自訂一些詞彙來 描述資源,它可描述特定領域類別(Classes)與次類別(SubClasses)

之間的關係,如rdfs:Class “Vehicle” rdfs:subClassOf

“Sportscar”;指定類別所擁更的屬性如rdfs:Property“Power”

“NumberOfSeat”等(Maier,2009)。這樣的規範可以使RDF Schema 可 以進行推論、搜尋的工作,並且它允許使用者建立階層式的概念及屬性關 係,具更Ontology 的雛形。

三、網路知識本體語言(Web Ontology Language,OWL)

OWL是在2003年由W3C為使知識本體語言標準化、規格化所發展推薦使 用的知識本體描述語言,它具更明確詳述語意和關係的XML 表達能力,能 描述類別以及類別在網路文件應用上的繼承關係, RDFS僅使用領域

(Domain)與範圍(Range)來限制次類別階層與屬性階層,OWL則添加更 多對類別及屬性的描述詞彙,包括類別間的關係如分離(Disjointedness)、

基數如確切值(Exactly One)、相等、更多屬性的類型與特徵如對稱

(Symmetry)以及列舉類別的數目等(Alesso,2006),OWL可被用來明 確表示詞彙中屬性的涵義及屬性間的關係,如圖2-10 所示。

rdfs:Resource

rdfs:Class rdfs:Property

owl: Class owl: ObjectProperty owl: DatatypeProperty

圖 2-10 顯示OWL與RDFS次類別間的關係(Alesso,2006)。

OWL 並不是要取代RDFS,只是在加強RDFS 的語法功能,擴展出更多 類別與屬性的定義,提供新的原則來定義類別與屬性的特性與限制

(Breslin,2009),因此W3C 提出下列三種次語言(SubLanguages),

以作為應用層面上的區隔:

OWL Lite:RDFS的擴充,提供給僅需要簡單要求分類層次的使用者,是一 個表達能力最為精簡的OWL 語言,在複雜度最低的優點下,表達能力不夠 豐富也就是它的缺點,如基數值只能是0或1。

OWL DL(Description Logic):提供需要最大推理能力和確保推理能力 下最大的表達能力,亦即在提供最強推理力的前提下,擁更完整的OWL 語 言架構,但加入許多特定的規範限制,如類別(Class)不能同時是屬性

(Property)或實例(Individual)。

OWL Full:包括了所更OWL、RDFS的字彙,提供給使用者需要最大的表達 能力和完全自由的RDF 語法,但是沒更推理能力的保證。

四、查詢語言

W3C 於2007年推薦SPARQL(Simple Protocol and RDF Query Language)

作為對應於RDFS 的查詢語言。SPARQL 為W3C 語意網下DAWG(RDF Data Access Working Group)部門所發表,並且迅速被採用而於於2008年1月

作為對應於RDFS 的查詢語言。SPARQL 為W3C 語意網下DAWG(RDF Data Access Working Group)部門所發表,並且迅速被採用而於於2008年1月

相關文件