第三章 資料蒐集與分析
3.1 資料蒐集處理
3.1.1 定檢資料蒐集
汽車定檢資料的來源包括:臺北市政府監理處、高雄市政府監理處,以及公 路總局臺北區、新竹區、臺中區、嘉義區及高雄區等五區監理所。機車定檢資料 則由環保署提供。其中,高雄市監理處定檢資料經多次聯繫,仍未能取得,而高 雄區監理所則因所提供之資料僅有檢驗線之資料,尚缺乏完整之定檢資料。其他 各區提供之資料筆數、資料期間及變數欄位彙整如表3.1 所示。其中,臺北區監 理所與臺北市監理處之定檢資料庫屬同一家資訊廠商承作,故此兩單位之定檢資 料欄位與格式均相同。而此兩單位之定檢資料庫所包含的變數項目相當豐富,資 料也較為齊全,表3.1 僅列出部分重要解釋變數。另外,臺中區監理所提供的資 料中,車重與汽缸數變數欄位內之資料內容均為空白。新竹區及嘉義區監理所之 定檢資料中,排氣量、車重、汽缸數,此三類重要解釋變數欄位之資料內容亦均 為空白,且在 HC 方面,其檢測值為 400ppm 之資料佔大多數(50%以上),呈現 不合理的現象。因此,在汽車方面,相較之下,臺北市監理處定檢資料之缺漏性 較不嚴重,且重要解釋變數之蒐集也較為完整;在機車方面,則以環保署所提供 資料為主,其機車定檢資料內容較為一致且完整。以下僅以此兩資料庫之資料分 別進行汽、機車污染排放關鍵影響因素之分析。
表3.1 各區監理單位提供之定檢資料欄位
2,280,122 90.07.02
|
1,396,274 92.04.22
|
6,334,819 95.01.01
| 95.12.31
9 9 9 9 9 9 9 9
定檢資料庫(如臺北市監理處)中包含許多變數,要從中挑選出潛在影響污染 排放之變數亦不容易。因此,為了能快速且有效地找出可能會影響污染排放之關
鍵因素,本研究透過定檢資料之文獻回顧,參考其納入分析且顯著的變數,以利 從汽、機車定檢資料庫中將重要變數擷取出來。關於汽、機車定檢資料相關文獻 中考慮變數之彙整參考表2.4 與表 2.5,並各別討論如下。
1. 汽車定檢資料變數選擇
以汽車污染排放模式而言,參考表2.4 相關文獻所考量之變數,並配合監理 處所定檢資料庫所能取得之資料項目,本研究乃以兩種移動污染源(HC、CO)作 為因變數,進行模式建構。雖然資料庫內尚包含 CO2 排放數值,但根據檢測法 令規定,係以CO2為作為HC、CO 量測時間點之判斷基準。當 CO2數值大於6%
時,便進行該時間點之 HC、CO 排放數值之採樣,並同時停止 CO2之量測。故 其排放數值未必能反應怠速狀態下 CO2 之實際排放狀況,因此,本研究之污染 排放關聯模式將不納入此一污染源之分析。至於解釋變數則選擇車齡(由檢驗日 期與出廠年月加以推算而得)、廠牌、排氣量、燃油類型、汽缸數、車重,以及 行駛里程等7 個變數。其中,廠牌之類別變數,則依據臺灣市場之汽車市佔率進 一步加以分類,分別為TOYOTA、FORD、NISSAN、HONDA、MITSUBISHI,
以及 MAZDA 等 6 大廠牌,其市佔率共高達 80%,其餘廠牌則歸為其他類別。
因此,本研究將汽車廠牌共分為7 大類,以 6 個虛擬變數表之。
2. 機車定檢資料變數選擇
至於機車污染排放關聯模式,則參考表2.5 相關文獻所考量之變數,並配合 環保署機車定檢資料庫所能取得之資料項目,將因變數定為:HC 及 CO,解釋 變數則包括車齡、排氣量及二/四行程,共 3 個變數。
由於國內機動車輛數量龐大,而檢驗單位又分為監理處(所)與代檢站;且有 些檢測資料在輸入時需以人工鍵入,難免會出現錯誤或偏差。鑒於此因素,為確 保數據的合理性及確保未來分析結果的準確性,向臺北市監理處檢驗人員確認各 變數之合理範圍。以下為小汽車定檢資料中各變數數值之合理範圍。
1. HC:0~20000ppm;
2. CO:0~15%;
3. 排氣量:599cc.以上;
4. 能源類型:汽油、柴油、電能、液化石油、汽油/液化石油、汽油/電能;
5. 車重:小客車 500 公斤以上,35000 公斤以下;
6. 汽缸數:10 個以下。
另外,在資料的篩選與過濾上,主要可以分為三個階段:(1)第一階段:解 釋變數(如車齡、廠牌、排氣量、燃油類型、汽缸數、車重、行駛里程)或被解釋 變數(HC、CO)只要有一欄位為空白者(即缺漏值),該筆資料則予以刪除;(2)第 二階段:以臺北市監理處詢問而得之數值範圍為依據,刪除不合理之檢驗數值;
此外,在檢驗資料中,數值有缺漏之樣本數量非常龐大,且涵蓋許多車種,這些 都必須予以剔除,並僅保留自用小客車車輛;(2)第三階段:為了避免資料鍵檔 錯誤之樣本納入模式分析,則依據一般統計用於判斷離散值(outlier)之方法,以 該變數 4 倍標準差為範圍進行資料篩選。因此,資料數值落在平均值 4 倍標準 差之外者,則均予以刪除。