• 沒有找到結果。

粗糙集理論 粗糙集理論 粗糙集理論 粗糙集理論

GSM 結構圖

第三節 粗糙集理論 粗糙集理論 粗糙集理論 粗糙集理論

第三節 第三節 粗糙集理論 粗糙集理論 粗糙集理論 粗糙集理論

波蘭數學家 Pawlak 在 1982 年提出粗糙集理論,粗糙集又稱粗集合,它主要 是處理含糊性和不確定性問題的數學工具。粗糙集理論假設所分析的物件集合本 身即隱含著知識;而知識被認為是一種對於物件的分類能力。計算時採用邏輯方 式,用離散數值進行計算,逼近似值去定義上近似和下近似之間的關係(Pawlak,

1982, 1998, 2001, 2002a, 2002b, 2002c, 2002d; Yao, 2003)

粗糙集理論的主要目的在於從各物件(樣本)及其對應之屬性因子所組成的

IS 中,擷取出足以描述各物件在何種屬性條件下能夠被分類的規則組(Pawlak, 1982, 1998, 2001, 2002a, 2002b, 2002c, 2002d; Yao, 2003)

,因此,可以在不丟失任 何的資訊之下,可以得到與原決策系統相同的知識,但此時的狀態為最小條件的 屬性,並保持和原決策系統相同分類能力的最簡形式(溫坤禮、永井正武、張廷 政、溫惠筑,2008)。

粗糙集主要的優點在於可以從數據中隱藏的模式挖掘出所需要的知識,從具 有規則的數理結構,容易了解所得到的結果,可以得到簡明易懂的解釋。利用數 據約簡,不但可發現最小數據集合,更可進一步評估數據的價值,從數據中產生 最小決策規畫,適用於各方面的決策(溫坤禮等,2008)。更重要的是,相對於 機率統計、實證理論、模糊集等數學工具而言,粗糙集理論能找出其有的關連性,

又有其他理論不具有的優點。統計學需要機率分佈、實證理論需要基本信任度的 給予、模糊集需要隸屬函數的訂定,而粗糙集不需事先給定某些特徵或屬性的數 量描述或統計相關的機率分佈,不用服從任何假設(溫坤禮等,2008)。以下為 粗糙集理論的重要概念:

一一

一一、、、知識資訊系統、知識資訊系統知識資訊系統知識資訊系統((((Information System, IS)))

一般而言由研究對象所有資料與其自本身所包含的特徵所構成的資訊,可以

稱為一個知識資訊系統,亦可稱為近似空間(Approximation Space)。在形式上,

一個知識資訊系統是四元組,定義如式(2-17)所示:

IS = ( U , O , V , f )

,簡記為

IS = ( U , O )

(2-17)

其中,

U

:論域,為物件的非空有限集合,寫成

U = { x

1

, x

2

, L , x

n

}

O

:屬性的非空有限集合,寫成

O = { O

1

, O

2

, L , O

m

}

r

R r

V

V =

U ,寫成

V = { V

1

, V

2

, L , V

m

}

,其中

V

i是屬性

O

i的值域

f : U × OV

是一個資訊函數,對於

uU

oO

,有

f ( u , o ) ∈ V

r 如果屬性集合

O

可以進一步分解為條件屬性集合

C

和決策屬性集合

D

,並且 滿足

O = C

U

D

C I D = φ

D ≠ φ

時,知識資訊系統也可稱為決策系統或決策 表,如表 2-7 所示。若決策系統的決策屬性集合只包含一個屬性,這樣的決策系 統稱為單一決策,兩個屬性以上則是多決策。

表 2-7 決策系統

物件\分類 條件屬性C1,L,Ck 決策屬性D1,L,Dn

N M 1

N C N

C

C C

k k

v v

v v

L M O M

L

1 1

1 1

N D N

D

D D

n n

v v

v v

L M O M

L

1 1

1 1

資料來源:Sheu, Chen, Tsai, Tzeng, Deng et al. (2013)

二 二 二

二、、、、不可分辨關係不可分辨關係不可分辨關係不可分辨關係((((Indiscernibility Relation)))

不可分辨關係即為等價關係,又稱為不可區分關係、不分明關係,使用

ind ( X )

加以表示。主要是將U劃分為有限個等價集合,而每一個等價集合,對象間是不 可分辨的。用

ind ( X )

來建構基本集合,是粗糙集合中分類(classification)的首 要步驟,數學模型如式(2-18)所示:

)}

, ( ) , ( , ,

) , {(

)

( X x y U U a X f x a f y a

ind = ∈ × ∀ ∈ =

,其中

XU

X ≠ φ

(2-18)

三 三 三

三、、、上近似集、上近似集上近似集上近似集((((Upper Approximation)))和下近似集)和下近似集和下近似集和下近似集(((Lower Approximation)( )) 上近似集、下近似集與邊界的關係如圖 2-1 所示。

X

的上近似集 X

O 或負域

) ( X

neg

O 是那些根據

O

,U 中不能確定的一定屬於集合

X

的元素的集合,定義如 式(2-19)所示。

X

的下近似集

O X

或正域

pos

O

(X )

是那些根據 O ,U 中能完全

確定的歸入集合

X

的元素的集合,定義如式(2-20)所示。如果

O XO X

,則有 邊界

bn

O

(X )

,邊界為根據 O ,U 中可能劃分為屬於

X

的集合,此集合既不能肯 定歸入

X

,也不能肯定歸入

UX

的元素的集合,定義如式(2-21)所示。

} :

/ {

)

( X = O X = YU O Y X ≠ φ

neg

O

U I

(2-19)

} :

/ {

)

( X O X Y U O Y X

pos

O

= = U ∈ ⊆

(2-20)

X O X O X

bn

O

( ) = −

(2-21)

資料來源:Sheu, Chen, Tsai, Tzeng, Deng et al. (2013)

圖 2-1 上近似集、下近似集與邊界的關係

四 四 四

四、、、可省略性、可省略性可省略性可省略性((((Dispensable))))與獨立性與獨立性與獨立性(與獨立性(((Independent)

O

為等價關係中的某一集合,在

oO

中,如果

ind ( O ) = ind ( O − { o })

則稱

o

O

中為可省略的。反之

ind ( O ) ≠ ind ( O − { o })

,則稱

o

O

中為獨立的。

X O

) (X bnO

X

O

五 五 五

五、、、、屬性的依賴度屬性的依賴度屬性的依賴度屬性的依賴度((((Dependents))))與重要性與重要性與重要性與重要性((((Significant)

假設在決策系統中,決策屬性

D

在條件屬性

C

下的正域

pos

C

(D )

為根據 C 的 知識所進行的劃分,定義如式(2-22)所示。而屬性的依賴度

γ

C

(D )

則表示決策 屬性

D

對條件屬性

C

的依賴程度,定義如式(2-23)所示。

) ( )

(

/

X C D

pos

D U C X

=

U (2-22)

U D D pos

C

C

) ) (

( =

γ

(2-23)

)

C

(D

γ

介於 0-1 之間,有以下三種情形:

(一)當

γ

C

( D ) = 1

,稱D

C

完全可導的。

(二)當

0 < γ

C

( D ) < 1

,稱D

C

部分可導的。

(三)當

γ

C

( D ) = 0

,稱D

C

完全不可導的。

利用屬性的依賴度可以決定屬性的重要程度,通常的做法是將某一個屬性

C

i 從 C 中除去,看看它對 C 所產生的正域的影響程度,定義如式(2-24)所示。

) (

) 1 (

) (

) ( )

) (

(

{ } { }

) ,

(

D

D D

D C D

C C C

C C C C

i D C

i

i

γ

γ γ

γ

σ γ −

= −

=

(2-24)

六 六 六

六、、、、粗糙集的約簡粗糙集的約簡粗糙集的約簡粗糙集的約簡((((Reduct)))與核)與核與核與核((((Core)))

在給定的決策系統中,若

OC

為獨立,並且

ind ( O ) = ind ( C )

,則稱O 為 C 的一個約簡

red (C )

。一個屬性集合可能有多種的約簡方法,約簡集合的交集稱為

C 的核(Core)

,如式(2-25)所示。核可以解釋為知識最重要部份的集合,進行 知識約簡時不能夠刪除。

) ( )

( C red C

core = I

(2-25)

七 七 七

七、、、效率最佳之決策規則、效率最佳之決策規則效率最佳之決策規則效率最佳之決策規則

在決策系統完成約簡(Reduct)與核(Core)的計算後,我們可由約簡後的 決策系統中擷取出規則,規則的型式為「若句子約簡後的特徵值符合,則決策屬 性值為某分類」。這些規則表達了由原始數據集中擷取出的知識。

粗糙集理論近幾年發展快速,對於人工智慧與認知科學是一個重要的方法,

目前則常被運用於處理醫學領域與工業管理上面(葉振山、鄭景俗,2005;鄭景 俗、林鳳秀、葉燉烟、林敬偉,2009;Lo, Chang, & Lee, 2013)。粗糙集理論已在 不少領域上取得了豐碩的成果,特別是決策支援系統(賴家瑞、溫坤禮,2005;

Hossam, 2011; Li, Masuda, & Nagai, 2011; Wu & Lin, 2012)

、近似推理(Huang, 2011;

Sabzevari & Montazer, 2008)

、建立預測模型(Ke, Mingwu, Yong, & Xia, 2011)、

數學邏輯分析和約簡(Hsieh & Wei, 2008; Lee & Lien, 2011; You, Lee, & Liu, 2011)

等領域。本研究將近年來粗糙集理論與教育測量相關研究整理如表 2-9 所示。

本研究所提案之RSM與粗糙集理論的差異如表2-8所示。由表2-8可知,比較 粗糙集理論,RSM的優點在於不但可保留依照粗糙集理論計算所得到的規則,更 可針對多個概念群建立結構性的規則。

表2-8 RSM與粗糙集理論之比較

比較項目 RSM 粗糙集理論

概念群 多個概念群 單一概念群

規則 結構性的規則 離散的規則

呈現方式 條列式敘述、階層式結構圖 條列式敘述

表2-9 粗糙集理論與教育測量相關研究

研究者(年代) 論文主要內容

陳昭宏、李智民、陳佑全

(2009)

該研究以粗糙集理論建立學習障礙學生鑑定與診斷之基本模式,並根據魏 氏智力量表的施測結果,結合K-mean分群法,期望能提升學習障礙學生鑑 定與診斷之準確度。

鄭景俗、胡永欣(2009) 該研究以南投縣某國小高年級學童210人為對象,根據學生資料以單因子變 異數分析,配合粗糙集分類技術LEM2萃取影響800公尺跑走成績因素之分 類規則。

Qu & Wang(2009) 該研究透過約簡和屬性重要性的分析,挖掘學習者個人動態的知識,提供

遠程教學網站上,個性化教學策略的基礎。

Hsieh(2009) 該研究透過 GM(0,N)和粗糙集理論,分析影響 300m 男子個人溜冰競賽最重

要的因素,以提供教練員和運動員訓練時的參考。

Pai, Lee, Zhang, Wu, & Liao

(2008)

該研究開發了一個改良的粗糙集理論模型,針對臺灣的國中學生進行了學 業成就的分析,進而預測他們的學術成就,提供他們日後必要學習的技能。

Cheng, Zan, Gu, & Ge

(2010)

該研究利用粗糙集理論針對中國教科書「大學生軍事訓練」進行分析,以 教科書的整體素質和理論水平做為決策屬性,教科書的實用性和可讀性做 為條件屬性,做為日後編輯教科書的參考。

Lin, Yu, & Liao(2011) 該研究利用粗糙集理論和信賴區間提出了一個測量方法,解決在 Chinese to

Taiwanese text-to-speech(TTS)系統上的一詞多義性問題。

Narlı, Özgen, & Alkan

(2011)

該研究以 243 位數學教師為研究對象,透過填寫學習風格量表並結合粗糙 集理論分析,確定個人的多元智能領域和學習風格之間的關係。

Narli & Sinan(2011) 該研究使用粗糙集理論評估李克特式態度量表,隨機選取 60 名被生物技術

的態度量表的受試者,針對李克特式態度量表進行檢查,可獲得態度量表 中不可缺少的項目。

許天維、蔡清斌、曾建維、

陳姿良、姜秀傑、劉維玲、

永井正武(2012)

該研究以粗糙集理論結合 ISM,分析中部一個班級的國中學生的迷思,根 據測驗之分群結果,比對各分群所具備知識的粗糙度,界定迷思區所建構 的學習迷思點之重要程度,進而決定迷思序的結構。

Sheu, Tsai, Tzeng, Chen, Chiang, Liu, & Nagai(2012)

該研究透過比較迷思區的 GSM 結構圖和粗糙集分析法的約簡和核,可以清 楚的發現學生共同的迷思。研究中分析兩班學生在教師自編的二元一次方 程式數學測驗之作答反應,提供一個研究的實例。

Sheu, Tsai, Tzeng, Chen, &

Nagai(2012)

該研究根據粗糙集理論的約簡和核計算出學生共同的迷思,透過比較國中 兩個班級學生知識的粗糙度,並將迷思概念對應到 ISM 結構圖,決定迷思 次序的結構,做為教師進行補救教學的參考。

Sheu, Chen, Tzeng, Tsai, Chiang, Chang, & Nagai

(2013)

該研究提出迷思區分析法,此分析法結合 GSP 所建立的迷思區、ISM、GSM 以及粗糙集理論,不論樣本大小皆適用。研究中提供一個補救教學實例,

以 15 位小學四年級學生為研究對象,分析教師自編的前後測數學測驗,探 討補救教學成效。

Sheu, Chen, Tsai, Tzeng, Deng, & Nagai(2013)

該研究以粗糙集理論為基礎分析學生的迷思概念,研究中提供了三種方法 得到班級學生共同的迷思,並結合 ISM 進行兩班學生程度的比較。

Sheu, Chen, Tsai, Tzeng, &

Nagai(2013)

該研究提出 Rough-ISM 分析法,透過分析國小學生在數學測驗的作答反應

該研究提出 Rough-ISM 分析法,透過分析國小學生在數學測驗的作答反應