• 沒有找到結果。

第四章 基隆市肇事模式之構建

4.1 模式構建

本研究採用一般化的線性模式(Generalized Linear Model,以下 簡稱 GLM)的卜瓦松迴歸模式及負二項迴歸模式來構建基隆市路口 路段的肇事分析模式。在構建模式之前,首先將路口及路段之要因變 數以因子分析來加以整合後,再以整合後之主要因子來構建模式。

4.1.1 因子分析

因子分析的目的在於以簡潔、精確的方法來描述眾多變項之間的 交互關係,以協助研究者對這些變項概念化,因子分析可以使用較少 的向度來表示原來的資料結構,而且還能保有原來資料所能提供的大 部分訊息。因子分析是一種潛在結構分析法,其理論大都假定每個指 標(觀察值)均由兩個部份所構成,其一是共同因素,另一是唯一因 素。共同因素比指標數(原始變項數)還少,而每個指標或原始變項 皆有一個唯一因素。並假設唯一因素與共同因素彼此沒有相關,與其 他變項的唯一因素間也沒有相關。至於所有共同因素間彼此的關係,

可能有相關或可能皆沒有相關。在直交轉軸狀態下,所有的共同因素 間彼此沒有相關;在斜交轉軸情況下,所有的共同因素間彼此就有相 關。因子分析最常用的理論模式如下:

Zj =aj1F1 +aj2 F2 + aj3 F3+…+ aji Fi +...+ ajm Fm + Uj

其中 Zj為第 j 個變項的標準化分數,Fi為共同因素,m 為所有變 項共同因素的數目,Uj為變項 Zj的唯一因素,aji為因子負荷量。

因子分析的理想情況,在於個別因子負荷量 aji不是很大就是很 小,如此每個變項才能與較少的共同因素產生密切關聯。所謂因子負 荷量為因素結構中,原始變項與因子分析時抽取出共同因素的相關 性。在因子分析中有二個重要指標,一為「共同性」、二為「特徵值」

(eigenvalue)。所謂共同性即每個變項在每個共同因素之負荷量的平 方總和,也就是個別變項可以被共同因素解釋的變異量百分比,此值 為個別變項與共同因素間多元相關的平方。從共同性的大小可以判定 此原始變項與共同因素間之關係程度。

至於特徵值是每個變項在某一共同因素之因子負荷量的平方總 和,特徵值最大的共同因素最先被抽取,其次是次大者,最後抽取的 共同因素之特徵值最小。將每個共同因素的特徵值除以原始變項為此 共同因素可以解釋的變異量,因此抽取的因素愈少愈好,但抽取因素 之累積解釋的變異量則愈大愈好。

因子抽取的方法有主成分分析法、主軸法、一般化最小平方法、

未加權最小平方法、最大概似法、Alpha 因素抽取法與映象因素抽取 法等。以主成分分析法最為普遍,本研究採用此方法估計因子負荷 量,主成分分析法是不考慮各變項的唯一因素,只考慮其共同因素。

因子分析中,其轉軸方法可分「直交轉軸」(orthogonal rotations)

及「斜交轉軸」(oblique rotations)二類,屬直交轉軸有最大變異法

( Varimax )、 四 次 方 最 大 值 法 ( Quartimax )、 相 等 最 大 值 法

(Equamax),屬斜交轉軸有直接斜交轉軸法(Direct Oblimin)、Promax 轉軸法。在直交轉軸法中,因素與因素間沒有相關,亦其相關為零,

因素軸間的夾角等於 90 度;而斜交轉軸法,則表示因素與因素間彼 此有某種程度相關,因素軸間的夾角不是 90 度。其中最大變異法是 讓所有變項在同一因子負荷量平方的變異達到最大,如此可簡化對因 子的解釋,各因子間的相關為零時,變項與共同因素之間的相關等於 該變項在因子上的因子負荷量,故本研究乃採用直交轉軸法中的最大 變異法來進行因子分析。

因子數目考量與挑選標準一般常以學者 Kaiser 所提之準則標 準:選取特徵值大於一的因素,Kaiser 準則判斷應用時,因子分析之 原始變項最好不要超過 30,其平均共同性最好在 0.7 以上,若樣本數 大於 250 者,則平均共同性應在 0.6 以上(Stevens 1992)。當 Kaiser-Meyer-Olkin 的取樣適當性量數(即 KMO)值愈大時,表示變 項間的共同因素愈多,愈適合進行因子分析。根據學者 Kaiser(1974)

觀點,如果 KMO 值小於 0.5 時,較不宜進行因素分析。KMO 即為

4.1.2 一般化線性迴歸模式

i

二、線性因子(Linear Factor)為變數之線性組合。其線性因子可 令為

三、連結函數(Link Function)

連結函數為因變數的平均數

μ

i與線性因子(LF)間的關係函數。

理論上,對不同觀察值而言,其連結函數均有不同,即每一

i

值均對 應一個連結函數,但實際操作上通常將其視為相同。

表 4.1 指數家族之分配特性

Y

i:路段

i

的肇事次數

(一)基本假設

參數βj 外,尚有過度離散參數α,若經檢定發現過度離散參數α顯 著,則表示在顯著水準下有過度離散情形存在,此時將不適用卜瓦松 迴歸模式,而須改採負二項迴歸模式;反之,若過度離散參數α不顯 著,則表示在顯著水準下未有過度離散情形存在,此時卜瓦松迴歸模 式仍適用。

若欲檢查模式之配合度或比較不同模式之優劣,可由模式之 AIC

(Akaike's Information Criterion)值來判斷其適合度。AIC 值 係由 Akaike(1971)提出,其定義為

k ML AIC =−2 +2

其中 k 為自由度參數之數目,ML 為對數最大概似值。AIC 值愈小 則表示模式愈好,其適合度愈佳,故進行最佳模式選擇時應選擇 AIC 值最低者。

4.1.4 模式配適度檢定

為了解模式值μ對實際值 y 之配適程度,以及模式是否可以接 受,可用皮爾森卡方( Pearson χ2 Statistic)檢定,其檢定方法 為

HO :模式值與實際值配適良好

若χ2n-r2 ,則拒絕 HO,即模式之適合度不佳 χ2 <χn-r2 ,則接受 HO,模式值與實際值配適良好

4.1.5 參數顯著性檢定

一、個別參數之檢定

檢定個別參數之顯著性,可利用漸近 t 檢定,顯著水準以 0.05 為準。

HO :βj= 0

t*j / Sβj 其中βj為參數之估計值

Sβj為參數估計之標準誤

若 t* >tn ,則拒絕 HO,表示參數顯著 t* ≦tn ,則接受 HO,表示參數不顯著

二、離散參數之檢定

檢定離散參數之顯著性,可利用漸近 t 檢定,顯著水準以 0.05 為準。

HO :肇事資料未呈現過度離散

若 t* >tn-r ,則拒絕 HO,表示參數顯著,即資料呈現過度離散 t* ≦tn-r ,則接受 HO,表示參數不顯著,即資料未呈現過度離散