分群結果顯著性分析

第四章資料分類與駕駛員分群判別

4.4 分群結果顯著性分析

將資料點進行標準化且分群之後，為了解分群結果是否良好，描述集群之間的差異程度，需對分群結果進行顯著性分析。

根據吳姿瑤[22]，使用 k-means 分群法求得兩群集，且兩群集皆服從常態分配時，

可以使用獨立樣本 t 檢定、Mann-Whitney U 檢定等檢定方法檢視兩集群之平均數是否有顯著差異。使用 t 檢定之先決條件為當兩集群皆服從常態分配，若是兩集群不服從常態分配則是使用 Mann-Whitney U 檢定。

分群結果之資料點為各駕駛員之行車型態。如 4.2 節所述，行車型態為該駕駛員負責班次所得之各項指標平均值，根據大數法則以及中央極限定理，行車型態之分配為常態分配，符合獨立樣本 t 檢定資料點須符合常態分配的前提。因此，本研究將各駕駛之行車型態進行分群之後，選擇以獨立樣本 t 檢定進行分群結果顯著性分析，顯著水準為 0.05。

將表 5 之分群範例進行獨立樣本 t 檢定後得到如下表 6 之結果。由表 6 可以得知，

集群 1 與集群 2 兩者除平均轉速差指標並無顯著差異外，各檔位之使用比例皆有顯著差異，即集群 1 之一檔使用比例與二檔使用比例明顯高於集群 2，三檔使用比例以及四檔使用比例明顯低於集群 2。

表 6 資料點 Z 分數標準化分群範例

平均數相等的 t 檢定(顯著水準 = 0.05)

t 值顯著性(雙尾) 結果

平均轉速差 -1.364 .231 平均數無顯著差異

一檔使用比例 7.606 .001 平均數有顯著差異

二檔使用比例 19.449 .000 平均數有顯著差異

三檔使用比例 -5.916 .002 平均數有顯著差異

四檔使用比例 -22.807 .000 平均數有顯著差異

4.5 小結小結小結小結

本章旨在介紹如何將蒐集得到之行車紀錄器資料點進行分類，進而進行指標運算得到特定路線之駕駛員行車型態加以分群。

資料點可分為三類，換檔點、怠速點以及行駛檔位點。換檔點的分類主要依據為車 速與轉速資料之比值(R)以及相鄰兩秒之比值差絕對值(R_diff)，怠速點的分類則是以夾 雜於車輛靜止狀態時的資料點中，車速非零之資料點之車速最大值。

在本研究中，將欲分群之所有駕駛員之駕駛行為模式各項指標值求得後，考量分群 法所需成本以及效率，採用 k-means 分群法進行分群。然而，為了消弭單位間不同所造 成的差距影響結果，本研究進一步將各項行車型態進行正規化，則可得到各項指標值之 Z 分數，接著再進行分群法，則可得到更為精確的分群結果。

為了解分群結果是否良好，描述集群之間的差異程度，需對分群結果進行顯著性分析。行車型態之分配為常態分配，符合獨立樣本 t 檢定資料點須符合常態分配的前提。

因此，本研究將各駕駛之行車型態進行分群之後，選擇以獨立樣本 t 檢定進行分群結果顯著性分析，找出集群間有顯著差異的指標。

上述之資料處理流程如下圖 6 所示：

特定路線所有駕駛員於非尖峰時段行駛班次之

記錄器資料行車記錄器資料

選取每位駕駛員至少30 趟班次進行指標運算

將每位駕駛員所得之駕駛行為模式樣本取平均值，求得每位駕駛員之

駕駛行為模式

將各駕駛員之駕駛行為模式進行Z-分數標準化

以k-means分群法進行駕駛員分群

集群顯著性差異分析

圖 6 資料處理流程圖

在文檔中以數位式行車記錄器資料分析公路客運駕駛行為之研究 (頁 28-31)

第四章 資料分類與駕駛員分群判別

4.4 分群結果顯著性分析

4.5 小結 小結 小結 小結

第四章資料分類與駕駛員分群判別

4.5 小結小結小結小結