• 沒有找到結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖3 數據模擬中人工數據的圖示

計算可得,按照上下端點做簡單線性回歸所得到的結果的模糊殘差平方和 FSSE1 為 5.643559。而該方法擬合的直觀效果見圖 4。

可以看出,擬合效果差強人意。接下來使用本文構造的模型進行擬合,繪出 擬合圖如圖5。直觀來看,擬合效果比圖 4 的擬合效果好很多。同樣也可以通過 計算得到新方法所得的模糊殘差平方和FSSE2 為 0.6708636。

FSSE1 與 FSSE2 有數量級上的差距,也即新方法的擬合效果的確要好得多。

接下來對模型進行一個簡單的靈敏度分析。我們按一定比例變動某個模糊因 變數的值,來觀察變動前后模型擬合效果的圖像有多大幅度的變化。

令第十個因變數的中心點變為原來的約三分之二,即從2.5975319 變為 1.73,此 時第十個樣本便顯得和其他樣本“格格不入”。如果它是一個異常值,那麼就應 該從樣本中剔除出去,這也是很多情況下對原始樣本做的預處理。但是,為了 體現“進入模型的每一個樣本帶來的信息都不能忽略”的觀念,以及在模擬數據 的情況下觀察新模型的性質,把改變之後的樣本代入模型進行運算,并畫出擬合 效果圖像如圖6。

可以看出,在上述情況下模型對某個樣本的變動並不非常敏感,具有一定的 穩定性。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖4 簡單按照區間上下端點做線性回歸的擬合效果示意圖

圖5 模糊數據的局部加權方法擬合效果示意圖

模糊回歸分析和經典回歸分析的最大不同之一就是,經典回歸模型里假定不 確定性來自一個獨立同分配(i.i.d.)的誤差,而模糊回歸模型則認為模型的不確 定性來自多重隸屬度。很直觀的一個理解就是在模糊回歸模型里,應變數都是模 糊數,這就是最好的體現。而自變數,在本文的模型里它是實數,實數類型的自 變數加上存在模糊情況的應變數,是最典型的模糊回歸的模型構成。當然,也有

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖6 添加一個異常值之後模糊數據的局部加權回歸方法擬合效果示意圖

自變數也是模糊數的情況,本文的構想仍然可以使用,只不過需要對模糊數與模 糊數間的距離有一個很好的定義。另一個方面,從擬合效果上看,本文所提倡的 局部加權方法要比普通最小平方法要好得多。但是,本文的方法也有其局限性。

比如,該方法需要資料相對的“密集”,否則擬合效果一般。另外,局部加權方 法容易造成過擬合的後果,直觀地說就是擬合曲線過於“彎曲”,以至於失去了 宏觀分析自變數與應變數之間的關係。所以,在使用本文模型的時候,要注意權 重函數不應選的過於“陡峭”。

Price DisplacementPotential Speed Acceleration Cost/km 0-100km/h Urban Extra

€ (cm3) HP (Km/h) (s) (Km/l) (Km/l) €

1 21330 1598 120 200 10.5 8.8 15.6 0.41

2 29864 1781 150 222 8.9 8.8 15.6 0.5

3 26830 1895 118 206 10.4 8.8 16.7 0.49

4 26004 1997 110 191 12.5 13.7 22.2 0.29

5 17613 1998 133 195 9 8.2 15.6 0.42

6 18120 1596 103 187 10.7 8.9 15.9 0.38

7 13170 1396 75 165 15.6 10.5 15.6 0.36

8 19290 1997 136 200 9.6 7.9 14.9 0.44

9 26100 1998 150 210 9.6 7.2 13.3 0.48

10 29128 1988 155 215 9.5 7.5 12.8 0.52

11 28715 1998 129 210 11 7.3 14.9 0.62

12 26494 1995 140 203 11.3 8.1 13.7 0.5

13 22931 1997 136 208 10.8 8.7 15.4 0.51

14 24248 1985 152 215 8.5 7.9 14.9 0.52

15 19898 1595 105 192 11.3 8.6 15.5 0.41

16 22200 1948 136 205 9.7 8.5 15.9 0.46

17 30320 1970 150 215 8.5 7.5 14.7 0.53

18 19095 1390 75 173 12 16.7 12.2 0.43

19 37390 2393 165 222 9.2 7.3 13.5 0.65

20 63812 2771 193 232 10.1 5.7 11.9 0.88

21 32656 1781 180 228 7.4 9.2 15.9 0.55

22 54021 2793 193 228 8.6 7.3 12.7 0.84

23 20199 1997 90 175 14.5 14.3 21.7 0.3

24 15250 1596 103 180 11.5 9.6 16.9 0.37

25 28379 1997 147 208 10 8.2 14.1 0.15

26 60942 3996 280 240 7.3 5.8 11.2 0.86

27 83666 3996 280 240 7.3 5.8 11.2 1.13

28 10750 1242 80 174 11.2 13.5 20 0.37

29 66623 4293 281 250 6.7 5.7 11.2 1.01

30 36772 1998 163 223 9.1 7.4 14.3 0.65

31 23235 1796 120 193 9 9.8 17.5 0.54

32 22176 1781 125 202 9.7 9.4 16.1 0.45

33 40852 2171 170 226 9.1 8.2 14.1 0.63

34 37701 2446 129 201 12.1 9.2 16.9 0.39

35 22125 1998 133 206 10.2 7.7 14.1 0.46

36 12100 1242 60 155 14.3 13.7 20.8 0.3

37 14530 1242 80 170 12.5 10.6 18.9 0.32

38 11078 1242 75 167 13.1 11.5 17.2 0.3

39 15597 1596 101 185 11 11 18.5 0.37

40 72562 3996 281 250 6.7 5.8 11.6 1

41 32030 1998 220 243 7.3 6.8 12.3 0.61

42 32660 1796 118 202 5.9 10.4 17.5 0.52

43 20193 1598 102 182 10.8 10.4 18.9 0.4

44 40619 2597 170 219 9.5 6.1 11.8 0.71

45 64764 3199 224 240 8.2 5.8 12.2 0.92

46 93117 4966 306 250 6.5 5.3 11.4 1.23

47 11104 1360 75 170 13.2 11.2 18.9 0.3

48 76132 3387 300 280 5.2 5.8 11.8 1.03

49 11336 1149 60 160 15 12.7 19.2 0.45

50 15423 1390 75 171 13.5 11.8 18.9 0.34 VH

VH

Fuel consumption Experts

decision

出的定義,可以算得模糊殘差平方和FSSE2 為 2.007249。同樣的,我們也可以 直接對梯形模糊因變數的四個端點做簡單線性回歸,根據定義我們也能得到一個 模糊殘差平方和FSSE1,算得其值為 582.5381。所以,從模糊殘差平方和的角度 來看,新模型的擬合效果的確不錯。

可以看出,樣本中因變數是梯形模糊數,模型擬合后得到的也是梯形模糊數。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

但是具體到我們的第一個目標,給出某車型的8 個參數,我們得到的擬合結果是 圖8 模糊數據的局部加權回歸對模糊因變數中心點的擬合效果

一個梯形模糊數,并不能直接用它來對該車型做出評價。我們需要將得到的擬合 結果反模糊化。假設我們得到的擬合結果是< 𝑐̂, 𝑟̂ , 𝑟1 ̂ , 𝑟2 ̂ , 𝑟3 ̂ >,容易得知,此時4 已經不一定有𝑟̂ + 𝑟1 ̂ + 𝑟2 ̂ + 𝑟3 ̂ = 0的結論,所以擬合結果的反模糊化值(也就是4 擬合出來的模糊數的中心點)為:

𝑐̂ = 𝑐̂ + 𝑟 ̂ + 𝑟1 ̂ + 𝑟2 ̂ + 𝑟3 ̂ 4

此時,我們選擇把𝑐̂ 作為最終的量化評判結果,通過對照表 3 或圖 7 進行判 斷。比如,若是擬合結果的中心點為 2.7,我們認為該車型的搭配屬於“差”的 隸屬程度為1,屬於“很差”的隸屬程度為 0.3;若是擬合結果的中心點為 7.5,

那麼認為該搭配屬於“好”的隸屬程度為1,屬於“中上”和“很好”的隸屬程 度都為0.5。

此外,值得注意的是,上文所做的實際上是解決了一個分類問題,即把一個 關於車型的參數搭配的輸入歸類到“平均”、“中上”等八類中去。並且,和普 通的分類方法(比如邏輯回歸方法)不同的是,我們得到的輸出是該輸入屬於各 個類別的隸屬度,而並非輸出某個具體的類或該輸入屬於某個類的幾率。具體地 說,某輸入屬於類 A 和類 B 的隸屬度為 0.1、0.15 的情況和隸屬度為 0.8、0.85

常數項 A11c A11r1 A11r2 A11r3 A11r4 … A501c A501r1 A501r2 A501r3 A501r4

… … … …

Cost/km A19c A19r1 A19r2 A19r3 A19r4 … A509c A509r1 A509r2 A509r3 A509r4 其中Aijc; i = 1, … ,50; j = 1, … 9表示對中心點做回歸時對第 j 個自變數在第 i 個樣本時的係數的值。Aijr1, Aijr2, Aijr3, Aijr4的含義以此類推。就以第 9 個自變 數Cost/km 來說,它對中心點的回歸的係數有 50 個,為了防止極端值對平均值 造成過大影響,採用這50 個係數的中位數Am9c來代表 Cost/km 這第 8 個自變數 對擬合結果中心點的影響大小。即:

Am9c = median{A19c, … , A509c}

同樣可以得到Cost/km 因素對四個半徑的擬合“影響大小”Am9r1, Am9r2, Am9r3, Am9r4。但是,上文已經提到,作者認為中心點作為“位置參數”,其

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

表5 各個因變數對最終評判的影響因子

j 1 2 3 4 5 6 7 8 9

Amjc

3.27 -3.16 0.54 -8.64 7.62 0.56 2.83 -0.71 2.41

Amjr1 -1.22

0.49 -0.30 1.00 -0.64 0.04 -0.19 0.13 -0.25

Amjr2 -0.26

0.20 -0.18 1.01 -0.55 0.13 0.07 0.02 -0.15

Amjr3

0.17 -0.51 0.57 -1.71 1.60 0.01 0.08 -0.07 0.41

Amjr4

1.33 -0.13 0.01 -0.59 0.13 -0.07 0.06 -0.06 0.10

IFj

3.82 2.88 0.78 7.91 8.17 0.62 2.91 0.64 2.62 由此可見,除去常數項之後,8 個因素裡面對最終評定的影響最大的两个是:

峰值速度和馬力大小;市區耗油量,價格以及每公里損耗折現值也有較大的影響 力;加速度,排氣量和市區外耗油對該車型搭配合理與否的最終評定的影響不 大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4.結語

模糊回歸分析一直是模糊統計領域的熱門研究方向。由實證分析可以看出,

本文構造的新模型運用在實際問題中是比較靈活的,尤其是把中心點和半徑分開 討論的思路,可以在實際使用中根據需求做出調整;并且,它首次將局部加權的 思想融入到模糊回歸分析領域,它有很顯著的優點,比如擬合效果好,在數據量 大、密集的情況下效果尤佳,這與當今“大數據”的時代背景剛好吻合;也有它 非常獨特的地方,比如回歸係數的估計不是一個確定值,而是一個關於關注點位 置的函數,關注點有所移動,得到的係數的估計就有所不同;另外,也有一些不 足之處,那就是模型需要的計算量略顯偏大,不過這在當今電腦計算能力大大提 升的背景下,並不是一個難以解決的問題。總之,本文從一個新的著手點,為模 糊回歸領域的研究提供了一條新的思路。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y 參考文獻:

[1] L.A. Zadeh, Fuzzy sets, Information and Control, Volume 8, Issue 3, June 1965, pp.338–353

[2] H. Tanaka, S. Uejima, K. Asai,Linear regression analysis with fuzzy model,

IEEE Trans. Sys., Man. Cyber., 12 (1982), pp. 903–907.

[5] William S. Cleveland, Robust Locally Weighted Regression and Smoothing Scatterplots, Journal of the American Statistical Association, Vol. 74,No. 368.(Dec., 1979),pp. 829-836.

[6]Phil Diamond, Fuzzy Least Squares, Information Sciences 46(3), 1988, pp.141 -157

[7] Pierpaolo D'Urso, Linear regression analysis for fuzzy/crisp input and fuzzy/crisp

output data ,Computational Statistics & Data Analysis, Volume 42, Issues 1–2, (2003), pp.47–72.

[8] P. Anand Raj, D. Nagesh Kumar, Ranking alternatives with fuzzy weights using maximizing set and minimizing set ,Fuzzy Sets and Systems,1999,pp365-375

[3]吳柏林,模糊統計導論第二版(2015),五南出版社(台北),p153.

[4]陳孝煒、吳柏林,區間回歸與模糊樣本分析,管理科學與統計決策, 4(1), 2007

相關文件