• 沒有找到結果。

第三章 資料說明與研究設計

第三節 實證分析設計與步驟

立 政 治 大 學

Na tiona

l Ch engchi University

第三節 實證分析設計與步驟

由前述文獻整理、敘述統計及樣本結構差異檢定等分析可知,這些被 DFFITS 法判斷為異常點的樣本,可能屬於模型遺漏重要的自變數或變數觀 察尺度選擇不當等「模型因素」,亦可能屬於異常點的住宅特徵異於大部份 樣本、樣本資料登載錯誤或不實等「樣本因素」。為更深入了解這些異常個 案的成因與特色,進一步探討是否有影響房價的重要變數被忽略,可能使 預測結果偏離實際情況,並驗證以量化統計方法搜尋疑似申報不實案件的 可行性,本節首先根據研究目的,提出研究方法與模型應用,再說明實證分 析步驟。

一、 研究方法與模型應用 (一) 集群分析

依據前節檢定結果,異常樣本具有特徵觀察值顯著異於正常樣本的 特色,本研究應用集群分析主要是為進一步探討異常樣本間是否存在同 質性,若依樣本特徵間的相近與相異程度予以區隔成不同的群組,或許 得了解相同群組的異常點是否具有相類似的成因與特色。

集群分析有多種方法,可分為階層法(Hierarchical)、非階層法 (Nonhierarchical)及二階段法(two-stage method) 等三大類。本研究參考 謝博明(2015)實證建議採用二階段法,首先在第一階段應用階層法之華 德法(Ward’s method),衡量樣本特徵變數群內與群間的變異數和,計算 同一群內觀察值的變異數和最小,不同群間觀察值的變異數和最大的分 群情況,求出最適分群數,作為第二階段分群數使用。華德法的公式定 義如下(林震岩,2007):

= ∙ ‖ ̅ − ̿‖ + ∙ ̅ − ̿ 其中, 為誤差平方和;

與 為i 與 j 群的樣本數;

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

̅ 與 ̅ 為 i 與 j 群內的平均數;

̿為 i 與 j 群間的平均數。

第二階段再應用非階層法之 K 平均數法(k-means),計算各筆樣本 特徵變數到各群組中心值的歐基里得距離(euclidean distance)進行分群,

求出分群結果。歐基里得距離的公式定義如下(林震岩,2007):

= ( − ) 其中, 為樣本i 與 j 的歐基里得距離;

為在第i 個群組的第 k 個特徵變數;

為在第j 個群組的第 k 個特徵變數;

為特徵變數的個數。

(二) 特徵價格模型

本研究採用Rosen (1974)的特徵價格模型作為實證模型,並依文獻 建議選定以半對數模式建置住宅價格模型。模型定義公式如下:

( ) = + +

其中, 為第i 筆資料的成交總價,i=1~n;

為截距項;

為特徵變數的迴歸係數;

為第i 筆資料的第 k 個特徵變數;

為殘差項;

為特徵變數的個數;

為樣本數。

實證模型所選取之變數,主要參考楊宗憲等人(2016)進行 104 年度

「編制住宅價格指數並定期發布(IV)」計畫所採用變數,該變數亦皆屬 於實價登錄資料庫所揭露之特徵,同前述表3-1。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

二、 實證分析步驟

本研究欲以下列研究步驟搭配前述研究方法與模型,篩選異常樣本中 迴歸模型預測值與實際值差異較大的樣本,作為個案分析之用,再以個別 估價觀點進一步探索其特色。探討這些個案預測值與實際值差異較大的原 因,是否存在哪些重要的變數對於房價有顯著影響,但因實價登錄資料庫 未揭露,使該變數無法提供模型反映預測值變化?抑或是存在資料登載錯 誤、資料申報不實等因素?

步驟1:集群分析

應用前節集群分析之二階段法,並歸納前述敘述統計及樣本 結構差異檢定結果,以區位、建物類型、建物結構、土地坪數、

建物坪數及屋齡等,對於形成異常點有較高程度影響的變數,

作為集群特徵。首先以第一階段階層法之華德法,分別衡量 2015 年第 2 季、2016 年第 2 季異常樣本特徵變數群內與群間 的變異數和,以決定最適分群數。再以第二階段非階層法之K 平均數法,分別對2015 年第 2 季、2016 年第 2 季異常樣本與 正常樣本進行分群,求出分群結果。

步驟2:分組配對

對各樣本分群結果進行描述性統計,計算各群組成交總價、土 地坪數、建物坪數及屋齡等連續變數之平均數,再將該平均數 轉換為Z 分數(Z score)15予以加總,對當季異常樣本與正常樣 本總分相近之群組予以配對。

步驟3:特徵價格模型分析

對分組後的正常樣本分別進行特徵價格模型預測,求取房價 預測的迴歸式,再以該迴歸式計算配對群組的異常樣本模型

15 Z 分數是指原始分數減去其平均數,再除以標準差後所得到的新分數。係具有相同單 位與相同集中點,得以互相比較之標準化分數。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

預測值。

步驟4:個案篩選

比較各異常樣本模型預測值與實際值的差異,再以各配對群 組正常樣本成交總價的標準差,作為差異程度的衡量標準,進 一步篩選出各組差異程度最大的樣本。

步驟5:個案分析

將這些篩選出的樣本作為個案分析之案例,以個別估價觀點 詳細調查其個案背景與特色,探討這些個案預測值與實際值 差異較大的原因,並驗證以量化統計方法搜尋疑似申報不實 案件的可行性。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University