第五章 案例分析
5.3 線性迴歸模式
5.3.1 三項因子變數(數據訓練部分取前 25 筆)
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.1 水溫、酸鹼度、電導度(前25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.2 水溫、鈣離子、鈉離子(前25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.3 酸鹼度、鈣離子、鈉離子(前25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.4 電導度、鈣離子、鈉離子(前25)之散佈圖
取前25 筆數據作為訓練部分,設三項因子之 SAR 實際值與推估之預測值比較圖 如圖5.1 至 5.4 所示,其為三項主要因子水溫(T)、酸鹼度(pH)、電導度(EC)及一一各 自搭配鈉離子(Na+)、鈣離子(Ca2+)再與鈉吸著率(SAR)之實際測量值進行迴歸分析,
再將各因子的每個測量數值代入方程式求出預測值。散佈圖所顯示意義為越接近 45 度線,其值越符合實際值,由圖5.1 可以看出主要三項因子本身的相關性其實並不大,
絕大部份的預測值都無位於45 度線上,但是再由圖 5.2 至由圖 5.4 來看,將主要因子 各自與鈉離子(Na+)、鈣離子(Ca2+)搭配測試後,很明顯預測值大幅的向 45 度線集中,
而且CC 值也有明顯的提高,再將 CC 值比較之後,當中又由電導度(EC)最為優良,
與最先擬想之研究方向有符合趨勢。
5.3.2 三項因子(數據訓練部分取中 25 筆)
第二組為三項因子數據,訓練部分(中 25),各方程式如(3.5)、(3.6)、(3.7)、(3.8) 所示:
1.水溫、酸鹼度、電導度,線性相關係數 CC 值=0.4572 35.5494 0.4716 7.3208 0.0023
SAR= − − T + pH + EC...………...(5.5) 2.水溫、鈣、鈉,線性相關係數 CC 值=0.9276
9.0084 0.057 0.26 2 0.0434
SAR= − T− Ca ++ Na+……….…(5.6) 3.酸鹼、鈣、鈉,線性相關係數 CC 值=0.9333
16.2705 3.1418 0.2488 2 0.0432
SAR= − + pH − Ca ++ Na+…………...……….(5.7) 4.電導度、鈣、鈉,線性相關係數 CC 值=0.9429
10.3708 0.0032 0.2447 2 0.05
SAR= − EC− Ca ++ Na+………...(5.8) 以下為取數據中25 筆當訓練部分,採用三項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.5、圖 5.6、圖 5.7、圖 5.8 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.5 水溫、酸鹼度、電導度(中25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.6 水溫、鈣離子、鈉離子(中25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.7 酸鹼度、鈣離子、鈉離子(中25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.8 電導度、鈣離子、鈉離子(中25)之散佈圖
5.3.3 三項因子(數據訓練部分取後 25 筆)
第三組為三項因子數據,訓練部分(後 25),各方程式如(5.9)、(5.10)、(5.11)、(5.12) 所示:
1.水溫、酸鹼度、電導度,線性相關係數 CC 值=0.5510 34.5916 0.583 7.6171 0.0017
SAR= − − T + pH + EC……….………...(5.9) 2.水溫、鈣、鈉,線性相關係數 CC 值=0.9198
6.1897 0.0213 0.2552 2 0.0472
SAR= − T− Ca ++ Na+………...………..(5.10) 3.酸鹼、鈣、鈉,線性相關係數 CC 值=0.9352
28.3177 4.59 0.2267 2 0.0466
SAR= − + pH− Ca ++ Na+………...……..………….(5.11) 4.電導度、鈣、鈉,線性相關係數 CC 值=0.9257
…...………...(5.12) 8.3409 0.0024 0.2299 2 0.0513
SAR= − EC− Ca ++ Na+
以下為取數據後25 筆當訓練部分,採用三項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.9、圖 5.10、圖 5.11、圖 5.12 所示:
Actual Value
0 5 10 15 20 25 30
Predicted Value
0 5 10 15 20 25 30
training testing
圖5.9 水溫、酸鹼度、電導度(後25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.10 水溫、鈣離子、鈉離子(後25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.11 酸鹼度、鈣離子、鈉離子之(後25)散佈圖
Actual Value
0 5 10 15 20 25 30
Predicted Value
0 5 10 15 20 25 30
training testing
圖5.12 電導度、鈣離子、鈉離子(後25)之散佈圖
第二組及第三組之 45 度線散佈皆有比第一組集中,而第三組則更優秀一點,由 表 5.2 看出第三組在CC 值及 RMSE 有二項為最優,,第二組則是在測試部分 CC 值 之最高值佔大多數,以下為分類三組三項因子之迴歸線性相關係數結果,如表 5.2 所示:
表5.2 三項因子之迴歸線性相關係數結果 三項因子變數
CC RMSE 前25 訓練 後 13 測試
training testing training testing 水溫(T)、酸鹼度(pH)、電導度(EC) 0.2637 0.5617 5.3626 4.4686
水溫(T) 、Ca2+、Na+ 0.9272 0.8018 2.0827 3.3051 酸鹼度(pH) 、Ca2+、Na+ 0.9264 0.8004 2.0928 3.1744 電導度(EC) 、Ca2+、Na+ 0.9441 0.7556 1.8325 3.0992
CC RMSE 中25 訓練 前 7 後 6 測試
training testing training testing 水溫(T)、酸鹼度(pH)、電導度(EC) 0.4572 0.5120 4.0208 6.5251
水溫(T)、Ca2+、Na+ 0.9276 0.9108 1.6889 2.8559 酸鹼度(pH)、Ca2+、Na+ 0.9333 0.8947 1.6234 2.9699 電導度(EC)、Ca2+、Na+ 0.9429 0.9248 1.5064 2.9606
CC RMSE 後25 訓練 前 13 測試
training testing training testing 水溫(T)、酸鹼度(pH)、電導度(EC) 0.551 0.2131 3.7175 7.2886 水溫(T) 、Ca2+、Na+ 0.9198 0.8896 1.7479 2.7412 酸鹼度(pH) 、Ca2+、Na+ 0.9352 0.8387 1.5778 3.1665 電導度(EC) 、Ca2+、Na+ 0.9257 0.9101 1.6847 2.7750
5.3.4 四項因子(數據訓練部分取前 25 筆)
第一組為四項因子數據,訓練部分(前 25),各方程式如(5.13)、(5.14)所示:
1.水溫、酸鹼度、電導度、鈣,線性相關係數 CC 值=0.7047 28.1319 0.3514 0.9793 0.0061 0.42701 2
SAR= + T+ pH+ EC+ Ca +..………...….(5.13) 2.水溫、酸鹼度、電導度、鈉,線性相關係數 CC 值=0.7726
19.4588 0.1727 3.5965 0.0087 0.0634
SAR= + T+ pH+ EC+ Na+..………....(5.14) 以下為取數據前25 筆當訓練部分,採用四項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.13、圖 5.14 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.13 水溫、酸鹼度、電導度、鈣離子(前25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.14 水溫、酸鹼度、電導度、鈉離子(前25)之散佈圖
6.8164 0.1904 2.9555 0.004 0.2224 2
SAR T pH EC Ca
取四項因子之 SAR 實際值與推估之預測值比較圖如圖 5.13 及 5.14 所示,其為三 項主要因子水溫(T)、酸鹼度(pH)、電導度(EC)及搭配鈉離子(Na+)、鈣離子(Ca2+)共四 項,再與鈉吸著率(SAR)之實際測量值進行迴歸分析,再將各因子的每個測量數值代 入方程式求出預測值。由圖5.13 及 5.14 顯示,數值散佈在 45 度線上的情況並不高,
所得之CC 值也沒有比三項因子好,四項因子的預測結果反而沒有三項分開各自搭配 鈉離子(Na+)、鈣離子(Ca2+)來的優秀,加上圖 5.1 的結果來看,原本三項因子本身的 相關性確實很低微,而鈉離子(Na+)、鈣離子(Ca2+)的確有著很高的影響度。
5.3.5 四項因子(數據訓練部分取中 25 筆)
第二組為四項因子數據,訓練部分(中 25),各方程式如(5.15)、(5.16)所示:
1.水溫、酸鹼度、電導度、鈣,線性相關係數 CC 值=0.6499
+..………...….(5.15)
= − − + + −
2.水溫、酸鹼度、電導度、鈉,線性相關係數 CC 值=0.8245 50.1321 0.2056 8.356 0.0054 0.0501
SAR= − − T+ pH − EC+ Na+..………....(5.16) 以下為取數據中 25 筆當訓練部分,採用四項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.15、圖 5.16 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.15 水溫、酸鹼度、電導度、鈣離子(中25)之散佈圖
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Valueata
0 5 10 15 20 25 30
圖5.16 水溫、酸鹼度、電導度、鈉離子(中25)之散佈圖
5.3.6 四項因子(數據訓練部分取後 25 筆)
第三組為四項因子數據,訓練部分(後 25),各方程式如(5.17)、(5.18)所示:
1.水溫、酸鹼度、電導度、鈣,線性相關係數 CC 值=0.6789 24.1781 0.0998 4.8024 0.005 0.2241 2
SAR= − − T + pH + EC− Ca +..………..…….(5.17) 2.水溫、酸鹼度、電導度、鈉,線性相關係數 CC 值=0.8686
38.2471 0.4136 7.3822 0.0059 0.0528
SAR= − − T+ pH − EC+ Na+.…………...……....(5.18) 以下為取數據後 25 筆當訓練部分,採用四項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.17、圖 5.18 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.17 水溫、酸鹼度、電導度、鈣離子(後25)之散佈圖
Actual Value
0 5 10 15 20 25 30
Predicted Value
0 5 10 15 20 25 30
training testing
圖5.18 水溫、酸鹼度、電導度、鈉離子(後25)之散佈圖
原本的水溫、酸鹼度、電導度之結果是屬於低微,加入鈉離子(Na+)、鈣離子(Ca2+) 明顯的提高不少,因此可以推估鈉離子(Na+)、鈣離子(Ca2+)有著很高的影響力。分組 結果方面,第三組為最優,鈉離子中的線性相關係數CC 值及 RMSE 在訓練部份都是 最高值0.8686 及最小值 2.2077。以下為分類三組四項因子之迴歸線性相關係數結果,
如表 5.3 所示:
表5.3 四項因子之迴歸線性相關係數結果
水溫、酸鹼度、電導度、Ca2+及水溫、酸鹼度、電導度、Na+
CC RMSE 前25 訓練 後 13 測試
training testing training testing 水溫、酸鹼度、電導度、Na+ 0.7726 0.6389 3.5294 5.0679 水溫、酸鹼度、電導度、Ca2+ 0.7047 0.6369 3.9446 4.3670
CC RMSE 中25 訓練 前 7 後 6 測試
training testing training testing 水溫、酸鹼度、電導度、Na+ 0.8245 0.6996 2.5585 5.1587
水溫、酸鹼度、電導度、Ca2+ 0.6499 0.8030 3.4362 4.5025
CC RMSE 後25 訓練 前 13 測試
training testing training testing 水溫、酸鹼度、電導度、Na+ 0.8686 0.5817 2.2077 5.9069 水溫、酸鹼度、電導度、Ca2+ 0.6789 0.6598 3.2706 4.5781
5.3.7 五項因子(數據訓練部分取前 25 筆)
第一組為五項因子數據,訓練部分(前 25),各方程式如(5.19)所示:
水溫、酸鹼度、電導度、鈣、鈉,線性相關係數CC 值=0.9461 22.6721 0.0734 1.4174 0.0048 0.3613 2 0.0558
SAR= + T− pH− EC− Ca ++ Na+.…...(5.19) 以下為取數據前 25 筆當訓練部分,採用五項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.19 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.19 水溫、酸鹼度、電導度、鈣離子、鈉離子(前25)之散佈圖
取五項因子之 SAR 實際值與推估之預測值比較圖如圖 5.19 所示,其為全部五項
因子水溫(T)、酸鹼度(pH)、電導度(EC)、鈉離子(Na+)、鈣離子(Ca2+),與鈉吸著率(SAR) 之實際測量值進行迴歸分析,再將各因子的每個測量數值代入方程式求出預測值。由 圖5.19 顯示,其數值比較結果在 45 度線上的散佈情況算的上優良程度,CC 值也高 達0.9461,由前面得知在取樣水體中原本三項因子並沒有太大相關性,但是在加入鈉 離子(Na+)、鈣離子(Ca2+)後數值變化明顯的上昇,推測出此兩離子對於水中的影響度 確實有著很大的關連性。
5.3.8 五項因子(數據訓練部分取中 25 筆)
第二組為五項因子數據,訓練部分(中 25),各方程式如(5.20)所示:
水溫、酸鹼度、電導度、鈣、鈉,線性相關係數CC 值=0.9522 20.699 0.0885 3.867 0.0038 0.2295 2 0.0508
SAR= − + T+ pH − EC− Ca ++ Na+.……....(5.20) 以下為取數據中 25 筆當訓練部分,採用五項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.20 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.20 水溫、酸鹼度、電導度、鈣離子、鈉離子(中25)之散佈圖
5.3.9 五項因子(數據訓練部分取後 25 筆)
第三組為五項因子數據,訓練部分(後 25),各方程式如(5.21)所示:
水溫、酸鹼度、電導度、鈣、鈉,線性相關係數CC 值= 0.9424 28.5446 0.028 4.7908 0.0026 0.2068 2 0.0514
SAR= − + T + pH− EC− Ca ++ Na+.…...(5.21) 以下為取數據後 25 筆當訓練部分,採用五項不同因子搭配組合之實際值與預測 值之比較散佈圖,如圖5.21 所示:
0 5 10 15 20 25 30
Actual Value training
testing
Predicted Value
0 5 10 15 20 25 30
圖5.21 水溫、酸鹼度、電導度、鈣離子、鈉離子(後25)之散佈圖
加入鈉離子(Na+)、鈣離子(Ca2+)其預測結果,在分組中果然為最優秀,散佈圖 45 度線的集中及線性相關係數CC 值及 RMSE 都皆為最高值 0.9522 及最小值 1.3808,
分組結果卻與前二分組結果不同,則是第二組為最優秀,而且在因子搭配中含有電導 度及鈉離子的預測值雖然不是每次最高,但範圍值為0.7726~0.9522,皆有在中上程 度。以下為分類三組五項因子之迴歸線性相關係數結果,如表 5.4 所示: