計畫的第二年,則是整合第一年所建構的網路問卷系統與即時模糊統計分析系 統,將已發展的統計檢定方法(如模糊卡方檢定、模糊相關與迴歸),建構在系統中。
使未來使用模糊統計的研究學者,能更方便使用,目前計畫使用類似Minitab 的介面,
使用者可以用選單式的勾選模糊統計的方法,並由程式進行計算。這樣能夠省略複雜 數學符號與運算並容易的獲得模糊統計的數值。如此一來,也利於模糊統計在使用上 的推廣。
如同市面上統計軟體一般架構(參考軟體 Minitab),程式執行後會進入主畫面如 下圖:
紅色標示區域部分則是主要數據資料存放位置
(一) 開始使用
1. 從文字檔讀取資料
按下選單File->Import 就會看到熟悉的讀檔介面:
選取好.txt 檔之後按下開啟按鈕就會出現以下的選項。
再輸入框內輸入所想要的存放的數據位置(i.e.C10),結果如下:
放在C10 的 Index 1 的部分開始存放所載入的 txt 檔如下:
[0, 0, 0.5,0.5 ,0] [ 1, 0,0,0,0][0,0.6,0.4,0,0]
[0,0.7,0.3,0,0]
[0,0,0.4,0.3,0.3]
[0,0,0.8,0.2,0]
由中括號括起來的是同一列的資料,而每一行再由逗點分隔開來(跟換行無關只 看中括號跟逗點)。
2. 由使用者自行鍵入
也可以由使用者自行輸入。
3. 輸出資料
按下File->Export 之後就會出現如下畫面:
4. 褐色標示區域為行的部分,而他已經幫你打好 C 所以你只要鍵入要輸出的行就好。
紅色標示區域則為列的部分,鍵入要輸出的列(e.g.假設要輸出 C2~C4 的 1~5 列):
OK 之後會出現下面存檔的視窗:
然後打開Wu.txt 檔案就會發現:
[0,0.5,0.5]
[0,0,0]
[0.6,0.4,0]
[0.7,0.3,0]
[0,0.4,0.3]
(二) 指令運算
在介面上半部指令運算區(Session)提供簡易的直接運算….(1),以及表單的列運 算…(2)。
1. 直接運算:如下輸入 1+1,1+log(2),sin(3)…etc
2. 表單列運算:一般運算:c1+c2,c1+3,ln(c1)…etc
儲存運算:c3=3,c4=c1*2,c5=c1^2-c2
(三) 模糊統計分析:模糊運算
知道如何使用表格了之後,當然就是要做運算了。
模糊平均數、模糊中位數、模糊眾數,要算這三種基本運算先要有資料存在表格 裡,然後在選Fuzzy Statistics->Mean、Median、Mode,選取了之後就會看到以下的選 擇視窗:
最上面選項是選擇資料型態是離散型還是連續型,然後下面四個選項:
1. Data Location:資料起始位置(最左上的資料)。
2. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形
=3 梯形=4)。
3. Data Counts:模糊數的數量(如上例共有 6 組模糊數)。
4. Data Destination:算出的結果的資料起始位置。
如果將上列資料按OK 送出,就會得到下列的結果:
眾數:因為眾數是直接按語言順序印出Mode 字樣,所以建議放在同一行。
中位數:中位數的算法是反模糊化的數值,而 k 個語言變數預設值為 1,2,….,k,
如下例分別為1,2,3,4,5
區間型:(左端點跟右端點)
故意放在c1 12,連續型用法也是跟離散型一樣,Data Grades=2 意思就是區間型,
值得一提的是區間的眾數輸出:
輸出的意思有兩欄,前面是眾數的區間,而後面是眾數區間出現的次數。
(四) 模糊距離
Fuzzy_Distance->Distance, Fuzzy_Distance->Defuzzification
1. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形
=3 梯形=4)。
2. Data 1&Data 2:輸入要算距離的兩個模糊數的位置。
3. Data Destination:算出的結果位置。
e.g.
詳細定義公式算法見(六)定義方法。
(五) 模糊相關係數
Fuzzy_Correlation-> Correlation
1. Data Grades:資料等第值(離散:離散資料的等第數目;連續:區間型=2 三角形
=3 梯形=4)。
2. Data Counts:模糊數的數量。
3. Data 1&Data 2:輸入要算相關係數的兩組資料的起始位置。
4. Data Destination:算出的結果位置。
e.g.
輸出結果:
(六) 定義方法
定義:模糊相關區間(取區間中心點與長度的方法)
設
c
xi ,yi
c
為來自X ,Y 母體之模糊樣本區間中心點,xi
l
,yi
l 為區間長度。
r
中心點相關係數,
為修正長度相關係數。則相關區間定義為:r
0,r
l 0, (r, min(1, r + ))r
0,r
l < 0, ( r - , r)r
<0,r
l 0, (r, r + )r
<0,r
l <0, (max(-1, r - ), r) (七) 實證某校為了解「影響數學成就因素」,調查10 位學生,利用傳統與模糊問卷的方式,
決定各指標的重要性,其中的研究問題為探討學生數學分數和上網時間的關係。以表 8 數據為例,使用軟體來計算出數學分數和上網時間的模糊相關係數,原表 8 數據為:
學生 數學分數xi 上網時間模糊區間
A [80,90] [1.0,1.5]
B [80,90] [6.5,7.0]
C [60,80] [4,5]
D [90,100] [1.5,2.5]
E [40,70] [16,17]
F [70,80] [15,16]
G [60,80] [15,17]
H [80,100] [1,3]
I [80,90] [0,3]
J [80,90] [4.5,5.5]
r=-0.79, rl=0.10, =0.05 區間模糊相關=(-0.79,-0.74)
經由公式,可知數學分數和上網時間的區間模糊相關為(-0.79, -0.74),此相關係數 呈現高度負相關的關係,也就是數學分數越高,上網時數越少,學生每週上網時數會 對數學學業成績產生負面的影響。
使用軟體分析計算結果如下,(C7,11)為模糊相關係數
由實證中我們可以看出傳統統計跟模糊統計分析的差別,多數時候我們無法確切 的用一個實數描述出來,而是一個模糊區間或模糊數。已經有很多的統計軟體能夠處 理傳統統計的數據,但至今仍沒有一個商業化的模糊統計軟體出現,模糊統計的研究 卻沒有因為這樣而停滯,論文有如雨後春筍般地一一出現,而模糊統計軟體是絕對有 這個需要,來計算模糊數的統計量,否則如果要一一用SPSS、SAS、Minitab 等軟體 把數據切割作運算實在是非常勞累又浪費時間。
實證中我們也可以發現模糊統計確實比較能夠真實地把許多「事情」描述出來,
而不是將一些模糊的概念強制轉型成一個實數做統計,而現在人們也發現模糊統計所 做出來的結果常常比傳統統計更為精確,也更符合人性。但對於統計量計算的部分,
這方面的軟體遠比傳統統計軟體缺乏,以至於無法輕鬆地計算模糊統計量,所以在模 糊數學部分還是常常以較理論的方式呈現,因為實證上比較有計算的困擾。
為了解決這方面的問題,當然模糊統計整體來講還是一個很新穎的數學,雖然近 年來不斷有人研究,如果有一個專為這門數學所寫成的軟體,相信它一定會發展得更 為快速,可以吸引更多人才投入它的研究,畢竟在很多地方已經可以看出它的分析比 一般傳統的分析更為準確。
由於此軟體仍然在測試階段,希望有興趣的人可以直接email 聯繫,無論是要索 取測試軟體,或是給些意見,非常歡迎與作者共同討論改進。