資料的處理和類神經網路模型建構

第五章案例說明

5.3 資料的處理和類神經網路模型建構

在LCD- TFT 的產品中，會將最終的產品區分為不同的等級，將測試品質和良率高的產品劃歸為A 級品，其次為 B 級品和 C 級品。A 公司的策略是品質高的賣較高的價格，品質較低的賣較低的價格，這樣所有的產品都可以依據客戶在經濟和功能上需求，

賣出所有的產品，不致因小瑕疵而報費。分類的規則如表5.1 所示。

表5.1 TFT-LCD 產品分類標準

類別

AT2 良率

訓練樣本數測試樣本數

A ≥95.50% 31 15

B 90.00% ≤ AT2 < 95.50% 44 13

C < 90.00% 12 2

合計 87 30

1.完整模式之建立

由原始的資料中做篩選並去除一些離異值，保留可用筆數和可用屬性來建構完整的類神經網路模型。在訓練和測試的樣本時必需選取在原始資料中良率分類為A、B、C 的類別內資料以避免所建構模型的偏差。以下說明詳細的步驟和訓練結果。

原始資料：

z 資料筆數：123 筆

z 屬性（x）：102 項（包含同一欄位所有資料皆為 0 的 49 項）

z 輸出結果（y）：1 項（測試良率 AT2，單位%）

資料處理：

z 可用筆數：117 筆（No.1,15,42,75,115 五筆離群值、No.20”Rgl”屬性有問題）

z 可用屬性：53 項（去除皆為 0 的屬性），可用屬性如表 5.2 所示。

資料分類

z 訓練樣本：測試樣本＝87：30（約為 75%：25%）

z 測試樣本選取法則：由於資料是依照時間順序得到之檢測結果，因此從117 筆資料中選取後面的30 筆作為測試樣本。（No.93-No.123）

模型參數

z 輸入層結點個數：53

z 輸出層結點個數：1

z 隱藏層數：1

z Epoch 數：100（iteration＝11,700）

z 決定Learning rate（η）、Momentum（α）：

一般隱藏層的結點個數無法確定，採用try-and-error 找出最佳個數，而通常隱藏層結點個數會介在「輸入層結點數和輸出層個數之和的一半」與「兩倍輸入層結點個數」之間。因此在此採用53-27-1 之模型，其結果如表 5.3。

由表5.3 可發現 α 值越高，其訓練樣本之 RMSE 會隨之降低且相關性會隨之增加。但當α 值設定為 0.99 時，雖然 RMSE 值更低，但會發生過度訓練或是震盪的狀況發生，因此將α 設為 0.95。 η 值在[0.01,0.05]，隨著 η 值越高，訓練樣本之 RMSE 會隨之降低且其相關性會隨之漸增。然而，當設定 α = 0.95 且 η=

0.05 時，雖然訓練樣本之 RMSE 降低，但測試樣本之 RMSE 卻提高，因此將 η 設定為0.04 即可。

z 決定隱藏層結點個數：

在α = 0.95、η = 0.04 下，決定隱藏層結個數，其結果如表 5.4 所示。由表中可發現隱藏層結點個數在 5-30 之間結果皆差不多，個數在 3 的時候訓練樣本和測試樣本的RMSE 皆較高，個數在 35 時會有過度訓練的問題發生，因此不與考慮。若依經驗，一般建議隱藏層結的最小個數為 27 個，因此在結果差不多的情況下，選用53-27-1 之模式來做分析。

訓練結果

本研究使用軟體Q-net v.2000 trail 進行分析，採用 53-27-1、α = 0.95、η = 0.04、重複100 個 epoch 來建立模式。訓練與測試結果的 RMSE 與 Correlation 如圖 5.1 至圖 5.4 所示。此外，目標值與輸出值則如圖5.5 所示，圖 5.6 則根據資料順序描繪各資料對應之輸出值與目標值。從這些圖看出，訓練樣本之輸出值與目標值幾乎完全吻合，而測試樣本雖然無完全吻合，但基本上趨勢有呈現出來。各輸入結點的貢獻度如表5.6 所示。

若以產品的分類等級來看，訓練標本之正確分類率為 100%，而測試樣本之正確分類率為83.33%，分別如表 5.6 與 5.7 所示。

表5.2 可用屬性的測試項目表

表5.3 完整模型中η和α的對照表

RMSE correlation RMSE correlation 35 0.0008 99.997% 0.0433 88.21%

30 0.0023 99.98% 0.0406 90.54%

圖5.1 訓練樣本之 RMSE 變化 (Full Model)

圖5.2 訓練樣本之 correlation 變化 (Full Model)

圖5.3 測試樣本之 RMSE 變化 (Full Model)

圖5.4 測試樣本之 correlation (Full Model)

圖5.5 目標值與輸出值標準化後之散佈圖 (Full Model)

圖5.6 根據資料順序各資料對應之輸出值與目標值(Full Model)

表5.5 各輸入結點的貢獻度 (Full Model)

21 5.1984 1.5619% 77.7304%

2.簡化模式Ι之建立

本研究使用前述完整模式中貢獻度較大的前27 個變數（即表 5.5 之前 1/2 變數）來建立簡化的模式。使用與前面相同的方法，選用 η =0.15，α=0.95，執行結果如表 5.8 所示。由表中可發現，當隱藏層結點個數在12 和 14 個的時候，其測試樣本之 RMSE 明顯較小且correlation 百分比較高，但隱藏層結點在 12 個時會發生震盪，因此選用 27-14-1 之模式。從產品分類等級來看，訓練標本之正確分類率為100%如表 5.9，而測試標本之正確分類率為80%如表 5.10。

表5.8 不同隱藏層結點之訓練結果(Reduced Model-I)

訓練樣本測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation 12（會震盪） 0.0029 99.97% 0.0372 93.31%

13 0.0009 99.997% 0.4911 89.10%

14 0.0020 99.99% 0.0369 92.31%

15 0.0013 99.99% 0.0455 89.01%

16 0.0009 99.997% 0.0481 88.39%

17 不收斂 X X

3.簡化模式Ⅱ之建立

3 SS_SHORT 4 SG_SHORT 11 2 連續(重)(>0)

RMSE correlation RMSE correlation 15（會震盪） 0.0050 99.91% 0.0461 89.84%

16 0.0045 99.92% 0.0442 90.72%

17 0.0088 99.72% 0.0386 92.16%

18 0.0056 99.89% 0.0405 91.91%

19（會震盪） 0.0047 99.92% 0.0491 90.08%

20（不收斂） X X X X

表5.14 測試樣本的分類結果(Reduced Model-II)

表5.15 不同隱藏層結點之訓練結果(Reduced Model-III)

訓練樣本測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation 5 0.0362 95.08% 0.0475 87.40%

表5.16 訓練樣本的分類結果(Reduced Model-III) 輸出類別

表5.17 測試樣本的分類結果(Reduced Model-III) 輸出類別

A B C A 14 1 0 B 2 10 1

目標類別

C 0 1 1

5.簡化模式Ⅳ之建立

本研究進一步使用上述模式III 之 17 個輸入變數，另再依工程知識判斷，多加考慮 6 個較重要的變數（如表 5.18 所示）來建立簡化模式Ⅳ。使用與前面相同的方法，選用 η=0.001，α=0.9，執行結果如表 5.19 所示。由表中可發現，當隱藏層結點個數設定為 30 時，其測試樣本之 RMSE 值最低且 correlation 值最高。因此採用 23-30-1 之模式。從產品分類等級來看，訓練標本之正確分類率為 85.06%如表 5.20，而測試標本之正確分類率為86.67%如表 5.21。

表5.18 工程知識判斷所穫得之重要變數(Reduced Model-IV) 完整模型的輸入結點編號名稱

3 SS_SHORT 4 SG_SHORT 11 2 連續(重)(>0)

28 LOW_VG 45 Id1

49 Rcl

表5.19 不同隱藏層結點之訓練結果(Reduced Model-IV)

訓練樣本測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation

10 0.0307 96.48% 0.0470 87.48%

在文檔中應用類神經網路減少TFT-LCD產品測試項目之研究 (頁 38-53)

第五章 案例說明

5.3 資料的處理和類神經網路模型建構

類別

訓練樣本數 測試樣本數

A ≥95.50% 31 15

B 90.00% ≤ AT2 < 95.50% 44 13

C < 90.00% 12 2

合計 87 30

1.完整模式之建立

2.簡化模式Ι之建立

訓練樣本 測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation 12（會震盪） 0.0029 99.97% 0.0372 93.31%

13 0.0009 99.997% 0.4911 89.10%

14 0.0020 99.99% 0.0369 92.31%

15 0.0013 99.99% 0.0455 89.01%

16 0.0009 99.997% 0.0481 88.39%

17 不收斂 X X

3.簡化模式Ⅱ之建立

訓練樣本 測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation 5 0.0362 95.08% 0.0475 87.40%

5.簡化模式Ⅳ之建立

訓練樣本 測試樣本

隱藏層結點個數

RMSE correlation RMSE correlation

10 0.0307 96.48% 0.0470 87.48%

第五章案例說明

訓練樣本數測試樣本數

訓練樣本測試樣本

訓練樣本測試樣本

訓練樣本測試樣本