• 沒有找到結果。

第四章 研究設計與變數交叉分析

第三節 研究方法

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

- 72 -

第三節 研究方法

本研究蒐集樣本資料特性,部分含有類別性之名義變數,非為線性樣本資 料,不符合一般統計上常態分配之假設,且應變數同時探討多變量分析之範疇,

因此採用多項式邏卲斯廻歸模型分析。本節共分三段,第一段探討 Logistic 廻 歸的基本模式。第二段探討 Logistic 廻歸的機率模式。第三段為多項式邏卲斯 廻歸計量分析模型特性之探討。

一、Logistic 廻歸的基本模式

一般研究人員以分類自變數(categorical independent variables)構成的 模 型 稱 為 L o g i t 模 型 , 將 有 分 類 自 變 數 又 有 連 續 自 變 數 ( c o n t i n u o u s independent variables) 參雜的模型稱為 logistic 廻歸模型,但有時又將

『logistic廻歸模型』與『Logit 模型』的稱謂相互通用。(王濟川、郭志剛,

2004)。

多項式邏卲斯廻歸模型(multinominal logistic regression)係類屬 Logit 模型之一種,從logistic 廻歸模型的基本形式所延伸,與一般線性廻歸

(如〆複廻歸)大致相似。但是 logistic 模式之應變數(又稱被解釋變數或依 變數)的結果必頇轉換成介於 0 到 1 之間的機率值(0≦P≦ 1),其自變數(又 稱解釋變數或因變數)未必符合常態分配之假設,此為與一般線性廻歸法最主要 差異之處。

若模式中自變數的值為 0 或 1 兩種結果之一,則應採用二元 logistic 廻歸法進行分析。而若應變數為多元順序尺度(multiple ordinal scale)或類 別尺度的變數,例如〆本研究將房屋抵押貸款終止行為分為三種選項 1.表示違 約戶,2.表示提前清償戶,3.表示正常結案戶。此種多元尺度之應變數的 l o gi stic 廻歸法,即稱為多 項 式邏卲 斯廻歸 ( multi nom ial log istic regression)。其基本模型如下〆

( ) 1 1 i

i i z

P F Z

e

 

...(4-3-1)

Z

i

 

0

 

1

X

1

 

2

X

2

 

3

X

3

....

 

n

X

n...(4-3-2) 其中

P

i :表示事件 i(違約或未違約)發生的機率。

F Z

( i) :表示 Logistic 的累積機率分配函數(cumulative density function)

Espahibodi(1991)研究發現,自變數不符合常態分配假設時,採用 logistic 廻歸的預測準確率較佳。過去研究的結論,大多認為由於 logistic 廻歸對自變數的分配並無特定限制,當自變數中同時有離散(discrete)及連 續(continuous)變數時,logistic 廻歸法所建立之預測模式的預測準確率通常 較高。此外,logistic 廻歸模式除可預測分類組別之外,尚可計算事件發生的 機率(李桐豪、呂美慧,2000)。實際運用此類預測模式時,決策者可視當時

之對比(contrasts of nonredundant category pairs)所形成。若應變數有 J 個類別,多項 logit 模型中便有 J-1 個 logit。則上式 4-2-3 公式可改寫如下〆

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

- 76 -

三、 模型特性

多項式邏卲斯廻歸計量分析模型具備處理離散型解釋變數、不頇假設資料 符合常態分配、模型適用於非線性情況機率值介於 0 與 1 之間等優點,但計算 程序複雜,分界點的決定往往影響模型的預測能力。

表 4-10 詴就模型提出者、年份、模型屬性、基本假設、事件機率計算、優、

劣等特性整理如下〆

表.4-10 多項式邏卲斯廻歸模型特性

項目 多項式邏卲斯廻歸

Berkson(1944)〆首度發展Logit模型 Ohlson(1980) 〆用於預測財務危機 模型屬性 為Logit模型之一種,類屬靜態模型。

應變數類別 有別於二項式Logit模型,可同時分析多類別應變數。

1.對應變數中任意兩類別作選擇時,假設該類別的選擇與其他類別無關。

2.事件發生機率服從標準Logistic的累積機率函數。

事件機率計算 可計算發生機率。

1.可以處理離散型解釋變數。

2.不頇假設資料符合常態分配。

3.模型適用於非線性情況,其機率值介於0與1之間。

1.使用此模式前必頇先將名義與分類變數資料進行轉換成虛擬變數。

2.分界點的決定常會影響模型的預測能力。

3.計算程序複雜。

資料來源〆本研究整理

基本假設

優點

缺點 模型提出者 (年份)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

- 77 -