• 沒有找到結果。

第二年進度:建構線上即時模糊統計分析系統

計畫的第二年,則是整合第一年所建構的網路問卷系統與即時模糊統計分析系 統,將已發展的統計檢定方法(如模糊卡方檢定、模糊相關與迴歸),建構在系統中。

使未來使用模糊統計的研究學者,能更方便使用,目前計畫使用類似Minitab 的介面,

使用者可以用選單式的勾選模糊統計的方法,並由程式進行計算。這樣能夠省略複雜 數學符號與運算並容易的獲得模糊統計的數值。如此一來,也利於模糊統計在使用上 的推廣。

如同市面上統計軟體一般架構(參考軟體 Minitab),程式執行後會進入主畫面如 下圖:

紅色標示區域部分則是主要數據資料存放位置

(一) 開始使用

1. 從文字檔讀取資料

按下選單File->Import 就會看到熟悉的讀檔介面:

選取好.txt 檔之後按下開啟按鈕就會出現以下的選項。

再輸入框內輸入所想要的存放的數據位置(i.e.C10),結果如下:

放在C10 的 Index 1 的部分開始存放所載入的 txt 檔如下:

[0, 0, 0.5,0.5 ,0] [ 1, 0,0,0,0][0,0.6,0.4,0,0]

[0,0.7,0.3,0,0]

[0,0,0.4,0.3,0.3]

[0,0,0.8,0.2,0]

由中括號括起來的是同一列的資料,而每一行再由逗點分隔開來(跟換行無關只 看中括號跟逗點)。

2. 由使用者自行鍵入

也可以由使用者自行輸入。

3. 輸出資料

按下File->Export 之後就會出現如下畫面:

4. 褐色標示區域為行的部分,而他已經幫你打好 C 所以你只要鍵入要輸出的行就好。

紅色標示區域則為列的部分,鍵入要輸出的列(e.g.假設要輸出 C2~C4 的 1~5 列):

OK 之後會出現下面存檔的視窗:

然後打開Wu.txt 檔案就會發現:

[0,0.5,0.5]

[0,0,0]

[0.6,0.4,0]

[0.7,0.3,0]

[0,0.4,0.3]

(二) 指令運算

在介面上半部指令運算區(Session)提供簡易的直接運算….(1),以及表單的列運 算…(2)。

1. 直接運算:如下輸入 1+1,1+log(2),sin(3)…etc

2. 表單列運算:一般運算:c1+c2,c1+3,ln(c1)…etc

儲存運算:c3=3,c4=c1*2,c5=c1^2-c2

(三) 模糊統計分析:模糊運算

知道如何使用表格了之後,當然就是要做運算了。

模糊平均數、模糊中位數、模糊眾數,要算這三種基本運算先要有資料存在表格 裡,然後在選Fuzzy Statistics->Mean、Median、Mode,選取了之後就會看到以下的選 擇視窗:

最上面選項是選擇資料型態是離散型還是連續型,然後下面四個選項:

1. Data Location:資料起始位置(最左上的資料)。

2. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形

=3 梯形=4)。

3. Data Counts:模糊數的數量(如上例共有 6 組模糊數)。

4. Data Destination:算出的結果的資料起始位置。

如果將上列資料按OK 送出,就會得到下列的結果:

眾數:因為眾數是直接按語言順序印出Mode 字樣,所以建議放在同一行。

中位數:中位數的算法是反模糊化的數值,而 k 個語言變數預設值為 1,2,….,k,

如下例分別為1,2,3,4,5

區間型:(左端點跟右端點)

故意放在c1 12,連續型用法也是跟離散型一樣,Data Grades=2 意思就是區間型,

值得一提的是區間的眾數輸出:

輸出的意思有兩欄,前面是眾數的區間,而後面是眾數區間出現的次數。

(四) 模糊距離

Fuzzy_Distance->Distance, Fuzzy_Distance->Defuzzification

1. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形

=3 梯形=4)。

2. Data 1&Data 2:輸入要算距離的兩個模糊數的位置。

3. Data Destination:算出的結果位置。

e.g.

詳細定義公式算法見(六)定義方法。

(五) 模糊相關係數

Fuzzy_Correlation-> Correlation

1. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形

=3 梯形=4)。

2. Data Counts:模糊數的數量。

3. Data 1&Data 2:輸入要算相關係數的兩組資料的起始位置。

4. Data Destination:算出的結果位置。

e.g.

輸出結果:

(六) 定義方法

定義:模糊相關區間(取區間中心點與長度的方法)

c

xi ,

yi

c

為來自X ,Y 母體之模糊樣本區間中心點,

xi

l

,

yi

l 為區間長度。

r

中心點

相關係數,

為修正長度相關係數。則相關區間定義為:

r

0,

r

l  0, (r, min(1, r + ))

r

0,

r

l < 0, ( r -, r)

r

<0,

r

l  0, (r, r + )

r

<0,

r

l <0, (max(-1, r -), r) (七) 實證

某校為了解「影響數學成就因素」,調查10 位學生,利用傳統與模糊問卷的方式,

決定各指標的重要性,其中的研究問題為探討學生數學分數和上網時間的關係。以表 8 數據為例,使用軟體來計算出數學分數和上網時間的模糊相關係數,原表 8 數據為:

學生 數學分數xi 上網時間模糊區間

A [80,90] [1.0,1.5]

B [80,90] [6.5,7.0]

C [60,80] [4,5]

D [90,100] [1.5,2.5]

E [40,70] [16,17]

F [70,80] [15,16]

G [60,80] [15,17]

H [80,100] [1,3]

I [80,90] [0,3]

J [80,90] [4.5,5.5]

r=-0.79, rl=0.10, =0.05 區間模糊相關=(-0.79,-0.74)

經由公式,可知數學分數和上網時間的區間模糊相關為(-0.79, -0.74),此相關係數 呈現高度負相關的關係,也就是數學分數越高,上網時數越少,學生每週上網時數會 對數學學業成績產生負面的影響。

使用軟體分析計算結果如下,(C7,11)為模糊相關係數

由實證中我們可以看出傳統統計跟模糊統計分析的差別,多數時候我們無法確切 的用一個實數描述出來,而是一個模糊區間或模糊數。已經有很多的統計軟體能夠處 理傳統統計的數據,但至今仍沒有一個商業化的模糊統計軟體出現,模糊統計的研究 卻沒有因為這樣而停滯,論文有如雨後春筍般地一一出現,而模糊統計軟體是絕對有 這個需要,來計算模糊數的統計量,否則如果要一一用SPSS、SAS、Minitab 等軟體 把數據切割作運算實在是非常勞累又浪費時間。

實證中我們也可以發現模糊統計確實比較能夠真實地把許多「事情」描述出來,

而不是將一些模糊的概念強制轉型成一個實數做統計,而現在人們也發現模糊統計所 做出來的結果常常比傳統統計更為精確,也更符合人性。但對於統計量計算的部分,

這方面的軟體遠比傳統統計軟體缺乏,以至於無法輕鬆地計算模糊統計量,所以在模 糊數學部分還是常常以較理論的方式呈現,因為實證上比較有計算的困擾。

為了解決這方面的問題,當然模糊統計整體來講還是一個很新穎的數學,雖然近 年來不斷有人研究,如果有一個專為這門數學所寫成的軟體,相信它一定會發展得更 為快速,可以吸引更多人才投入它的研究,畢竟在很多地方已經可以看出它的分析比 一般傳統的分析更為準確。

由於此軟體仍然在測試階段,希望有興趣的人可以直接email 聯繫,無論是要索 取測試軟體,或是給些意見,非常歡迎與作者共同討論改進。

相關文件