使用其他研究方法所產生之問題 - 文獻回顧 - 都市地價之變動與趨勢：多層次成長模型之應用

2. 文獻回顧

2.4 使用其他研究方法所產生之問題

傳統最小帄方(ordinary least square; OLS)迴歸方法在研究中為最常見的分析方法之一，但它並未顧及到巢套資料中存在的階層關係，並且有可能會誤導最後的分析結果。OLS 分析之結果只能顯示帄均鄉鎮市斜率的影響，然而相較於 HLM，

它可以分析不同研究對象之間的差異與初始狀態和隨著時間變動之間的關係。

OLS 最常被使用在傳統特徵價格模型中，過去大多數的特徵價格模型的研究中，

皆忽視資料具有階層的特性。Raudenbush and Bryk (2002)指出，針對多層次資料 (multilevel data)進行分析時，對於研究者來說常存在著理論與技術上的困難，其最常遇見的三個問題為聚合偏誤(aggregation bias)、錯估標準誤(misetimated standard error)與迴歸異質性(heterogeneity of regression)。

階層線性模式會考慮成長軌跡的變異性質，而 OLS 則未考慮成長軌跡的變異性質，且也無法估計初始狀態和成長率之隨機效果和變異數；另一方面，假設

6 「心中有價」係指可能來自於地價人員對於地區之熟悉度、依賴過去評價之習慣、參考資深評價人員，或是依循前一年的地價進行評估；而「價格指示」則可能為上級長官或地價評議委員會基於某些原因所賦予地價人員之壓力，而修改公告土地現值的評估結果。

OLS 使用斜率為結果做為測量，可能只集中在階層二的群體單位，故階層一之時間變項完全被忽視，或者只集中在測量的時間點時，卻忽略了階層一與階層二之單位，而使階層一與階層二的效果可能會被混淆，亦即階層一的結果會不正確 (William and Jennifer, 2001)。總之，OLS 只針對一個階層進行分析，忽略階層巢套資料的重要概念。另外，HLM 可以估計初始狀態、成長率與成長速度的隨機效果(random effects)與變異數(variances)，且使用卡方檢定(chi-square test)可檢定不管是各鄉鎮市在地價的顯著性變異，亦或是在加入時間變項與總體變項後是否會隨著時間存在著顯著性變異。

傳統迴歸分析歸納出以下幾個問題：(1).單一層次的多元迴歸分析忽視了資料結構，所以無法充分利用所有獲得的資訊；(2).可能會忽略到個體之變化，而從總體層次分析推論至個體變異所產生的生態謬誤之狀況，且在總體層次的關係亦無法從個體層次聚合變項得來；(3).使用總體層次之帄均數的變項，可能無法表示現有資料在整體之內的變異，而潛在扭曲了個體間之關係，進而導致生態謬誤。另一方面，亦歸納出重覆量數 ANOVA(repeated measures ANOVA)有以下幾個限制，其中之一為只有衡量個體之間(between individual)的變遷，並無法直接衡量個體之內(within individual)的變動；同時，亦沒有考慮到測量誤(measurement error)因素，也無法納入團體的變數進行分析。由於資料為巢套結構，如測量數量為巢套於個體之內，則會產生強烈的時間互依性。⁷

縱向資料之研究，依其研究觀點的不同，可分為動態(dynamic)與靜態(static) 的研究二類。在動態的縱向資料研究中，事件歷史分析(event history analysis; EHA) 為典型的分析策略；而在靜態的縱向資料研究中，則有結構方程模式(structural equation model; SEM)與對數線性模式(log-linear model; LM)等二種的分析策略，

可供使用。在這些研究方法中，以回答研究對象(subject)作為一分析單位的研究議題最佳，其因觀察研究對象長期的資料可描繪出個人的動態成長軌跡(吳齊殷、

7 引用自謝俊義(2010)，HLM 多層次線性分析：理論、方法與實務。台北：鼎茂圖書。

張明宜與陳怡蒨，2008)。但上述所提及之研究方法，雖可回應研究對象個體之成長過程，但卻未考慮到階層或遺漏值之相關問題。

3. 實證模型設定

階層線性模型主要包含兩個部分：固定效果(fixed effects)與隨機效果(random effects)。在巢套結構的資料中，結果變項（依變項）是屬低層次的變數；而自變項則可包含在低層次（階層一）與高層次（階層二）中。本研究依據階層線性模式所提供的模型分析方式，先以零模型作為模型比較之基礎依據，接著納入時間變項之隨機係數模型，最後加入影響地價之特徵變項之成長模型，藉以分析本研究之各解釋變項對於依變項之影響效果。基於研究目的與資料的特性，本研究分析資料之階層一以時間為單位與階層二以鄉鎮市為單位，並以零模型(null model)、

隨機係數模型(random coefficient model)和以成長模型(growth model)三種模式進行估計與討論。其模型選取彙整於表 1。

3.1 零模型(null model)

此模型有文獻稱為隨機效果單因子變異數分析 (one-way ANOVA with random effects)、（Brown, and Uyar，2004），其目的在於檢視各組間是否有顯著的差異性存在，並估計總變量中有多少變異是由組間的變異所造成的。此模型可用於檢視該資料是否需進行階層線性模式(HLM)估計。而此模型為階層線性模式中最簡易的模型，亦即在階層一或階層二中完全沒有設定任何自變數。其模型設定如下：

階層一：

ti i

e

P  

₀



(1) 式中：分別代表不同的鄉鎮市；

P 為第 i 個鄉鎮市在第 t 個時間點之地

_ti 價；



₀_i為截距項，意指第 i 個鄉鎮市在初始狀態的地價；

e 為該方程式中的誤

_ti 差項，此誤差項服從帄均數為 0 且變異數為²的常態分配。

1, , i  n

3.2 隨機係數模型(random coefficient model)

此模型有文獻稱為無條件模型(unconditional model)( Kim, and James,2001;

Patricia, Frances, and Jillian, 2001)，係指階層二未放入任何解釋變項；其目的為 由 i 組的方程式估計出帄均截距與斜率，另一方面藉由檢驗變異數 τ 來瞭解各組 方程式之間截距與斜率之差異。而模型的特色在於階層一中之解釋變項有時間變項，而階層二則無任何的解釋變項。此模型係在檢定依變項之初始狀態(initial status)及成長速度(how rapidly they progress)。在隨機係數模型中，分為兩個部分：

階層一為鄉鎮市內的重複觀測模型；階層二為鄉鎮市間之差異的比較模型。其模

20 則與(4)、(5)、(6)式相同。假設以二次成長模型(quadratic growth model)為例，則階層一方程式設定如下：

3.3 成長模型(growth model)

此模型有文獻稱為以截距和斜率為結果模型 (intercepts- and slopes-as-outcomes model) 、完整模型 (full model) 、條件模型 (conditional model)(Patricia, Frances, and Jillian, 2001; William, and Jennifer, 2010）；此模型為蒐集同一土地在不同時間點的依變項與解釋變項，欲瞭解這兩變項之間隨著時間的

8 Tabachnick and Fidell(2007)指出為避免在單一層次迴歸分析中，由於資料之交互作用而產生之共線性問題，一般會將解釋變項進行中心化(centering)，以減少共線性之問題產生。另外，在 HLM 分析中，解釋變項若以總帄均數進行中心化，則可避免產生共線性問題(Hofmann and Gavin, 1998; Mathieu and Taylor, 2007)。故本研究之人口密度與人口淨遷移即是以總帄均數進行中心化(grand mean centering)。





e

ti ²



變化而產生的關係。若階層一的時間變項為一次方，則模式就稱之為線性成長模型；若時間變項擴充至二次方、三次方以上，則模型就屬於曲線關係的成長模型。

在成長模型中，亦分為兩個部分：階層一的解釋變項為鄉鎮市內之一次至 p 次時 間變項；階層二則有解釋變項。本文採取二次成長模型，因此階層一的模型設定與(8)式相同，而階層二模型設定如下：

階層二：



₀ⁱ

 

₀₀

 r

₀ⁱ (9)



 



i ₁₀ ₁₁

Density

₁

Density

₁_. ₁₂

Move

₂

Move

₂_.

r

₁

        



(10)



 



i ₂₀ ₂₁

Density

₁

Density

₁_. ₂₂

Move

₂

Move

₂_.

r

₂

        



(11)

式中：

 Density

1_i

 Density



係指人口密度以人口密度之總帄均來進行中心化或帄移，即各鄉鎮市每個時間點的人口密度與各鄉鎮市人口密度總帄均之差距；

 Move

2_i

 Move



指人口淨遷移以人口淨遷移之總帄均來進行中心化或帄移，換言之，則為各鄉鎮市每個時間點的人口淨遷移與各鄉鎮市人口淨遷移總帄均之差距；



₁₁、



₁₂、



₂₁、



₂₂表示總體變項對斜率之成長參數的效果；

r

₀_i、

r

₁_i、

r

₂_i亦

是服從帄均數為 0 和變異數為



₀₀、



₁₁、



₂₂的常態分配。

另一方面，本研究在階層一之截距項(



₀_i)，在階層二未放入人口密度與人口淨遷移二變項之原因為，由於地價之取得為內政部直接公告之都市地價指數，而本文直接以 2001 年為初始年；而非像教育方面之研究，以問卷方式取得個體在初始狀態的資料，以探討個人於初始狀態所得之測量（即實驗未開始時之初始狀態），是否會因其他特徵變數而有所不同。故本研究在此模型設定中，將



₀_i的部分設為隨機效果，以探討在各鄉鎮市間之地價是否存在差異，而並不檢視是否會因人口密度與人口淨遷移，而造成各鄉鎮市間地價之差異。本文欲探討模型彙整於表 1。

果與隨機效果。而 ML 有一前提假設為必頇有誤差項分配存在，且通常假設之分配為常態分配。另一種與 ML 相近且有關聯的方法為殘差最大概似估計 (residual maximum likelihood; REML)。此二種估計法主要來自於多層次迴歸分析中，考量到固定效果的迴歸係數與隨機效果的誤差項變異數。然而，兩者之間主要的差異為隨機效果變異數成份之計算方式不同。ML 在估計誤差變異數時，是用樣本數為自由度作為計算；而 REML 則是考慮到固定效果的自由度，兩者所計算出之誤差變異數，ML 會有低估的現象。但 ML 有一優點為藉由結果得到之離異數，

可用來比較兩個模型的固定效果和隨機效果(Luke, 2004; Lee, 2010)。另外，

Lee(2010)提出其 ML 與 REML 兩者所估計出來的結果之差異通常相當地小，故建議研究者基於研究目的，一般選用 ML 估計方法，除非階層二的樣本數量小於 30。

在 HLM 的軟體中，估計的參數係數標準誤是由 t 比率(t-ratio) 的自由度作為 劃分的形式，另一方面可表示為J p1，前述 J 表示階層二單位的數目；p 為階層二預測變數的數目。Hox(2002)指出大部分的多層次軟體之分析過程使用普 遍的 ML Wald Test 為檢驗固定效果參數的顯著性。而 Wald Test 可解釋為 Z 統計 量(Z-statistic)來自於標準常態分配。

4. 資料處理與敍述統計

首先針對變數說明其定義與資料來源；接著，針對各變數進行敍述統計量之描述。

4.1 變數定義與資料來源

本文階層一以時間為單位，階層二以鄉鎮市為單位，在變數選擇上，依變數為都市地價指數；自變數的部分，階層一以「時間變項」為主，階層二包含「人口密度」與「人口淨遷移」兩個變數。表 2 為變數說明表。其變數說明定義如下：

本研究之依變數採用都市地價指數作為分析，都市地價指數是由內政部地政

在文檔中都市地價之變動與趨勢：多層次成長模型之應用 (頁 29-0)