所謂次數分配(Frequency Distribution)是將資料依數量大小或類別種類而分
基本資料
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
成若干組,並根據各組所發生的次數或各組所發生(含觀測值)的個數,進行計數 且再以次數分配圖或表處理方式表示。至於次數表(Frequency Table)又稱次數分 配表,一般可區分為簡單次數分配表和分組次數分配表,並將次數分配表製作程 序概述如下:
(一) 簡單次數分配表之步驟:
步驟 1:排序(Sorting);
步驟 2:劃記;
步驟 3:計算次數;
步驟 4:總計。
(二) 分組次數分配表:按資料編成分組次數分配表時,有兩個非常重要的基本假 設,一則為集中分配,即各組觀測值都等於組中點;另一則為均勻分配,即 各組觀測值都是以均勻分佈在組內。而其製作程序步驟如下:
步驟 1:排序;
步驟 2:求全距(range),全距=最大值-最小值;
步驟 3:決定組數(Class Number)。
本問卷之單選題皆以「次數分配與百分比」,描述受訪者對各題的意見分布 情形,同時以交叉次數分配表,分析不同背景變項有何差異。統計量包含:次數、
百分比。
二、 變異數分析
變異數分析是將兩母體平均數的比較擴充到 K 個母體平均數的比較之統計 方法,步驟是將樣本的中的總變異分解為各種處理所引起的平方和,然後將各平 方和處以自由度,化成變異數,在取成 F 統計量,再根據 F 統計量以檢定各處 理間是否有顯著性之差異,此統計方法名義上為變異數分析,但此為檢定兩個或 三個以上母體平均數是否相等的方法。
一般我們在考慮 k 個獨立的常態分配具有未知平均數分別為
1, ,
k,但未‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
斯迴歸模型定義為
logit(𝜋(𝐱𝑖)) = log (1−𝜋(𝐱𝜋(𝐱𝑖)
𝑖)) = α + 𝛽1𝑥𝑖1+𝛽2𝑥𝑖2+ ⋯ +𝛽𝑝𝑥𝑖𝑝,𝑖 = 1, . . . , 𝑛 經過運算可得
𝜋(𝐱𝑖) = exp(α+∑ 𝛽𝑗𝑥𝑖𝑗
𝑝𝑗=1 )
1+exp(α+∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗),0 ≤ 𝜋(𝐱𝑖) ≤ 1
(二) 參數估計
最大概似估計法(Maximum Likelihood Estimation,MLE)為統計分析中常用 的參數估計方法,因為𝑌𝑖服從獨立的伯努力分配,i=1,...,n,因此聯合機率密度函 數為各別的機率分配相乘,可得概似函數(Likelihood Function)為
L(α, 𝜷) = ∏𝑛𝑖=1𝜋(𝐱𝑖)𝑌𝑖(1 − 𝜋(𝐱𝑖))1−𝑌𝑖
其中𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝)′,由於ln(L(α, 𝜷))為L(α, 𝜷)之單調函數,所以使得 ln(L(α, 𝜷))為最大的最大概似估計同樣也會使L(α, 𝜷)有最大值。因此對概似函數 取對數以方便求得最大概似估計值。其對數概似函數為
ln(L(α, 𝜷)) = ln [∏𝑛𝑖=1𝜋(𝐱𝑖)𝑌𝑖(1 − 𝜋(𝐱𝑖))1−𝑌𝑖]
= ∑𝑛𝑖=1𝑌𝑖ln[𝜋(𝐱𝑖)]+ ∑𝑛𝑖=1(1 − 𝑌𝑖)ln[1 − 𝜋(𝐱𝑖)]
= ∑𝑛𝑖=1[𝑌𝑖(α + ∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)]− ∑𝑛𝑖=1ln[1 + exp(α + ∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)]
令ln(L(α, 𝜷))對(α, 𝜷)微分之偏導數為 0 以求最大概似估計值,但使得對數概似 函數有最大值的(α̂, 𝜷̂)封閉解(Closed-Form)不存在,因此需利用電腦以數值分析 的方法求得近似值,常用的方法有牛頓遞迴法(Newton-Raphson Method)。
(三) 參數檢定
假設羅吉斯迴歸係數估計值為β̂𝑗,j=1,...,p,檢定H0:β𝑗 = 0 一般常使用的
方法為 Wald 統計檢定,其檢定統計量為W = (SEβ̂𝑗
β̂𝑗
)
2
,其中SEβ̂𝑗為β̂𝑗的漸近標準
誤,當虛無假設成立時,根據 MLE 的大樣本性質,β̂𝑗會近似服從常態分配,因
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
此 W 具有自由度為 1 的漸近卡方分配,在顯著水準 下,其拒絕域為 C={W >
𝜒𝛼,12 }。
(四) 勝算比與迴歸係數
當某事件成功機率為𝜋,失敗機率為 1-𝜋,則成功的勝算(Odds)定義為 odds = 𝜋
1 − 𝜋
表示該事件成功的機率除以失敗的機率。勝算比(Odds Ratio)為兩個勝算的比 值,
θ =odds1 odds2 =
𝜋1 1 − 𝜋1
𝜋2 1 − 𝜋2
其中𝜋1表示第 1 個事件成功的機率,𝜋2表示第 2 個事件成功的機率,而odds1表 示第 1 個事件成功的勝算,odds2表示第 2 個事件成功的勝算。勝算比大於 1 表 示事件 1 成功的勝算比事件 2 成功的勝算高,即事件 1 成功的可能性高於事件 2;
勝算比小於 1 表示事件 1 成功的勝算比事件 2 成功的勝算低,即事件 1 成功的可 能性低於事件 2。
β𝑗為羅吉斯迴歸模型之參數,表示在控制其他變數之後,𝑋𝑗對 Y=1 的對數 勝算效應,而其對應之勝算比為𝑒β𝑗,表示𝑋𝑗增加一個單位對勝算的相乘效效應。
當β𝑗 > 0時,𝑒β𝑗 > 1,表示𝑋𝑗增加一個單位時,反應變數 Y=1 的勝算相對增加,
當β𝑗 = 0時,𝑒β𝑗 = 1,表示𝑋𝑗增加或減少一個單位時,反應變數 Y=1 的勝算都不
改變,當β𝑗 < 0時,𝑒β𝑗 < 1,表示𝑋𝑗增加一個單位時,反應變數 Y=1 的勝算相對 減少。勝算比的解釋又可分為連續變數與類別變數,以下依解釋變數的型態,解 釋其對反應變數的影響。
1. 連續型解釋變數
當其它解釋變數固定下,𝑋𝑗每增加一個單位時,反應變數 Y=1 的勝算增加𝑒β𝑗 倍。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2. 二類別解釋變數
若解釋變數𝑋𝑗為二類別屬質變數,假設其水準記為(0,1),則𝑒β𝑗為描述解 釋變數𝑋𝑗與反應變數 Y 之條件勝算比,表示當其他解釋變數不變的條件下,𝑋𝑗 = 1時成功的勝算為𝑋𝑗 = 0時的𝑒β𝑗倍。當β𝑗 > 0時,𝑒β𝑗 > 1表示 𝑋𝑗 = 1比𝑋𝑗 = 0成 功的勝算高𝑒β𝑗倍;當β𝑗 < 0時,𝑒βj < 1表示 𝑋𝑗 = 1比𝑋𝑗 = 0成功的勝算低𝑒β𝑗倍。
3. 多類別變解釋變數
當解釋變數水準超過二個類別時,需建立一組虛擬變數(Dummy Variable)代 表其分類情形。當一個解釋變數有 I 個水準時則需要 I-1 個虛擬變數,從所有水 準中挑選一類別作為參照類別(Reference Category),進而解釋各類別與參照類別 的勝算比。