實證分析設計與步驟

第三章資料說明與研究設計

第三節實證分析設計與步驟

國

立政治大學

‧

Na tiona

l Ch engchi University

第三節實證分析設計與步驟

由前述文獻整理、敘述統計及樣本結構差異檢定等分析可知，這些被 DFFITS 法判斷為異常點的樣本，可能屬於模型遺漏重要的自變數或變數觀察尺度選擇不當等「模型因素」，亦可能屬於異常點的住宅特徵異於大部份樣本、樣本資料登載錯誤或不實等「樣本因素」。為更深入了解這些異常個案的成因與特色，進一步探討是否有影響房價的重要變數被忽略，可能使預測結果偏離實際情況，並驗證以量化統計方法搜尋疑似申報不實案件的可行性，本節首先根據研究目的，提出研究方法與模型應用，再說明實證分析步驟。

一、研究方法與模型應用 (一) 集群分析

依據前節檢定結果，異常樣本具有特徵觀察值顯著異於正常樣本的特色，本研究應用集群分析主要是為進一步探討異常樣本間是否存在同質性，若依樣本特徵間的相近與相異程度予以區隔成不同的群組，或許得了解相同群組的異常點是否具有相類似的成因與特色。

集群分析有多種方法，可分為階層法(Hierarchical)、非階層法 (Nonhierarchical)及二階段法(two-stage method) 等三大類。本研究參考謝博明(2015)實證建議採用二階段法，首先在第一階段應用階層法之華德法(Ward’s method)，衡量樣本特徵變數群內與群間的變異數和，計算同一群內觀察值的變異數和最小，不同群間觀察值的變異數和最大的分群情況，求出最適分群數，作為第二階段分群數使用。華德法的公式定義如下(林震岩，2007)：

= ∙ ‖ ̅ − ̿‖ + ∙ ̅ − ̿ 其中，為誤差平方和；

與為i 與 j 群的樣本數；

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

̅ 與 ̅ 為 i 與 j 群內的平均數；

̿為 i 與 j 群間的平均數。

第二階段再應用非階層法之 K 平均數法(k-means)，計算各筆樣本特徵變數到各群組中心值的歐基里得距離(euclidean distance)進行分群，

求出分群結果。歐基里得距離的公式定義如下(林震岩，2007)：

= ( − ) 其中，為樣本i 與 j 的歐基里得距離；

為在第i 個群組的第 k 個特徵變數；

為在第j 個群組的第 k 個特徵變數；

為特徵變數的個數。

(二) 特徵價格模型

本研究採用Rosen (1974)的特徵價格模型作為實證模型，並依文獻建議選定以半對數模式建置住宅價格模型。模型定義公式如下：

( ) = + +

其中，為第i 筆資料的成交總價，i=1~n；

為截距項；

為特徵變數的迴歸係數；

為第i 筆資料的第 k 個特徵變數；

為殘差項；

為特徵變數的個數；

為樣本數。

實證模型所選取之變數，主要參考楊宗憲等人(2016)進行 104 年度

「編制住宅價格指數並定期發布(IV)」計畫所採用變數，該變數亦皆屬於實價登錄資料庫所揭露之特徵，同前述表3-1。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

二、實證分析步驟

本研究欲以下列研究步驟搭配前述研究方法與模型，篩選異常樣本中迴歸模型預測值與實際值差異較大的樣本，作為個案分析之用，再以個別估價觀點進一步探索其特色。探討這些個案預測值與實際值差異較大的原因，是否存在哪些重要的變數對於房價有顯著影響，但因實價登錄資料庫未揭露，使該變數無法提供模型反映預測值變化？抑或是存在資料登載錯誤、資料申報不實等因素？

步驟1：集群分析

應用前節集群分析之二階段法，並歸納前述敘述統計及樣本結構差異檢定結果，以區位、建物類型、建物結構、土地坪數、

建物坪數及屋齡等，對於形成異常點有較高程度影響的變數，

作為集群特徵。首先以第一階段階層法之華德法，分別衡量 2015 年第 2 季、2016 年第 2 季異常樣本特徵變數群內與群間的變異數和，以決定最適分群數。再以第二階段非階層法之K 平均數法，分別對2015 年第 2 季、2016 年第 2 季異常樣本與正常樣本進行分群，求出分群結果。

步驟2：分組配對

對各樣本分群結果進行描述性統計，計算各群組成交總價、土地坪數、建物坪數及屋齡等連續變數之平均數，再將該平均數轉換為Z 分數(Z score)¹⁵予以加總，對當季異常樣本與正常樣本總分相近之群組予以配對。

步驟3：特徵價格模型分析

對分組後的正常樣本分別進行特徵價格模型預測，求取房價預測的迴歸式，再以該迴歸式計算配對群組的異常樣本模型

15 Z 分數是指原始分數減去其平均數，再除以標準差後所得到的新分數。係具有相同單位與相同集中點，得以互相比較之標準化分數。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

預測值。

步驟4：個案篩選

比較各異常樣本模型預測值與實際值的差異，再以各配對群組正常樣本成交總價的標準差，作為差異程度的衡量標準，進一步篩選出各組差異程度最大的樣本。

步驟5：個案分析

將這些篩選出的樣本作為個案分析之案例，以個別估價觀點詳細調查其個案背景與特色，探討這些個案預測值與實際值差異較大的原因，並驗證以量化統計方法搜尋疑似申報不實案件的可行性。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

在文檔中異常住宅價格檢測與處理之研究－以個別估價觀點分析 - 政大學術集成 (頁 46-50)

第三章 資料說明與研究設計

第三節 實證分析設計與步驟

國

立 政 治 大 學

‧

第三節 實證分析設計與步驟

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

第三章資料說明與研究設計

第三節實證分析設計與步驟

立政治大學

第三節實證分析設計與步驟

立政治大學

立政治大學

立政治大學

立政治大學