• 沒有找到結果。

第四章 資料分類與駕駛員分群判別

4.4 分群結果顯著性分析

將資料點進行標準化且分群之後,為了解分群結果是否良好,描述集群之間的差異 程度,需對分群結果進行顯著性分析。

根據吳姿瑤[22],使用 k-means 分群法求得兩群集,且兩群集皆服從常態分配時,

可以使用獨立樣本 t 檢定、Mann-Whitney U 檢定等檢定方法檢視兩集群之平均數是否有 顯著差異。使用 t 檢定之先決條件為當兩集群皆服從常態分配,若是兩集群不服從常態 分配則是使用 Mann-Whitney U 檢定。

分群結果之資料點為各駕駛員之行車型態。如 4.2 節所述,行車型態為該駕駛員負 責班次所得之各項指標平均值,根據大數法則以及中央極限定理,行車型態之分配為常 態分配,符合獨立樣本 t 檢定資料點須符合常態分配的前提。因此,本研究將各駕駛之 行車型態進行分群之後,選擇以獨立樣本 t 檢定進行分群結果顯著性分析,顯著水準為 0.05。

將表 5 之分群範例進行獨立樣本 t 檢定後得到如下表 6 之結果。由表 6 可以得知,

集群 1 與集群 2 兩者除平均轉速差指標並無顯著差異外,各檔位之使用比例皆有顯著差 異,即集群 1 之一檔使用比例與二檔使用比例明顯高於集群 2,三檔使用比例以及四檔 使用比例明顯低於集群 2。

表 6 資料點 Z 分數標準化分群範例

平均數相等的 t 檢定(顯著水準 = 0.05)

t 值 顯著性(雙尾) 結果

平均轉速差 -1.364 .231 平均數無顯著差異

一檔使用比例 7.606 .001 平均數有顯著差異

二檔使用比例 19.449 .000 平均數有顯著差異

三檔使用比例 -5.916 .002 平均數有顯著差異

四檔使用比例 -22.807 .000 平均數有顯著差異

4.5 小結 小結 小結 小結

本章旨在介紹如何將蒐集得到之行車紀錄器資料點進行分類,進而進行指標運算得 到特定路線之駕駛員行車型態加以分群。

資料點可分為三類,換檔點、怠速點以及行駛檔位點。換檔點的分類主要依據為車 速與轉速資料之比值(R)以及相鄰兩秒之比值差絕對值(R_diff),怠速點的分類則是以夾 雜於車輛靜止狀態時的資料點中,車速非零之資料點之車速最大值。

在本研究中,將欲分群之所有駕駛員之駕駛行為模式各項指標值求得後,考量分群 法所需成本以及效率,採用 k-means 分群法進行分群。然而,為了消弭單位間不同所造 成的差距影響結果,本研究進一步將各項行車型態進行正規化,則可得到各項指標值之 Z 分數,接著再進行分群法,則可得到更為精確的分群結果。

為了解分群結果是否良好,描述集群之間的差異程度,需對分群結果進行顯著性分 析。行車型態之分配為常態分配,符合獨立樣本 t 檢定資料點須符合常態分配的前提。

因此,本研究將各駕駛之行車型態進行分群之後,選擇以獨立樣本 t 檢定進行分群結果 顯著性分析,找出集群間有顯著差異的指標。

上述之資料處理流程如下圖 6 所示:

特定路線所有駕駛員於 非尖峰時段行駛班次之

記錄器資料 行車記錄器資料

選取每位駕駛員至少30 趟班次進行指標運算

將每位駕駛員所得之駕 駛行為模式樣本取平均 值,求得每位駕駛員之

駕駛行為模式

將各駕駛員之駕駛行為 模式進行Z-分數標準化

以k-means分群法進行 駕駛員分群

集群顯著性差異分析

圖 6 資料處理流程圖

相關文件