• 沒有找到結果。

異常住宅價格檢測與處理之研究-以個別估價觀點分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "異常住宅價格檢測與處理之研究-以個別估價觀點分析 - 政大學術集成"

Copied!
97
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學地政學系碩士在職專班論文. 政 治 大. 學. —以個別估價觀點分析. ‧. ‧ 國. 立 異常住宅價格檢測與處理之研究. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 研 究 生:高裕政 指導教授:林沛靜博士 江穎慧博士. 中 華. 民. 國. 一 ○ 六. 年. 六. 月.

(2) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v.

(3) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v.

(4) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 謝誌 回首這三年的求學過程,要同時兼顧工作、家庭及學業並不容易,所幸 有許多人的幫忙與協助,本論文才得以順利完成。首先,要感謝指導教授林 沛靜老師與江穎慧老師的教導及幫助,從論文的題目選定、資料取得、文獻 蒐集、研究方法及流程架構等,都不厭其煩的耐心指導,並適時的協助我渡 過寫作瓶頸,很慶幸自己能夠遇到這麼好的老師,在此致上無限的感激。 此外,感謝口試委員彭建文老師與楊宗憲老師,期初和期末報告時林 子欽主任、蔡育新老師、丁秀吟老師、袁淑湄學姐,費心審閱論文指出矛盾. 政 治 大 能夠更臻完善。同時,也感謝明現、高震、文勇、金田、聖東、庭華、少佑 立. 與錯誤之處,並給予許多寶貴的建議,讓我得以修補論文的缺陷,使本論文. ‧ 國. 學. 及思宏等兄弟,不藏私的跟我分享論文寫作經驗,且不時鼓勵、督促我早日 完成論文,更感謝你們常約我聚餐喝酒聊天,讓我可以短暫忘卻寫論文的. ‧. 煩悶。. sit. y. Nat. 最後,要將這個成果與喜悅獻給無時無刻都一直支持、照顧、關心、包. al. er. io. 容我的摯愛老婆純伶,以及可愛的寶貝女兒沛妮和婕語,因為有妳們,我才. n. 能夠堅持到論文完成的一刻。. Ch. engchi. I. i n U. v. 裕政 謹誌 于蘆洲家中 中華民國 106 年 6 月 30 日.

(5) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 摘要 國內近年來有許多文獻在進行特徵價格模型預測時,避免樣本中存在 異常點會造成模型估計值產生偏差,會使用統計軟體進行異常點檢測,但 皆是直接將檢測出的異常點刪除,未加以著墨探究這些異常點的特徵結構、 成因及特色等。因此,本研究透過統計檢定方法,探討刪除異常點前後整體 樣本的特徵結構變化,並以個別估價觀點加以探討住宅交易樣本異常點的 成因與特色,藉此歸納出實價登錄資料未揭露的重要特徵,以及迴歸模型 搜尋疑似申報不實案件之可行性。. 政 治 大 對原始樣本與正常樣本較大,且經過刪除異常點的正常樣本特徵結構差異 立 透過敘述統計及樣本結構差異檢定結果發現,異常樣本的離散程度相. ‧ 國. 學. 程度縮小;異常點的形成可能受到區位變數無法反映實際情況及樣本群聚 程度影響,也可能因模型未納入某些重要的特徵變數,而使隱含該變數的. ‧. 樣本被判斷為異常點;異常樣本與正常樣本的成交總價、土地坪數、建物坪. sit. y. Nat. 數、總樓層、所在樓層及屋齡等變數平均數、變異數及中位數有顯著差異。. al. er. io. 藉由個案分析結果歸納,可能因異常個案的住宅屬性存在整幢大樓住. v. n. 商混合使用、特殊鄰居、附屬建物占比過高、高總價豪宅產品、都更效益、. Ch. engchi. i n U. 增建效益、裝潢效益、約定專用空間效益、樓層高度挑高、獨特視野景觀或 特殊區位條件;外部環境存在鄰近嫌惡設施或迎毗設施;交易情況存在買 方身分特殊之影響,但受限於實價登錄未要求登載並揭露這些特徵,故模 型未考量這些因素對價格的影響,使得模型可能將隱含這些特徵的樣本判 斷為異常點,並進而影響模型預測結果。另外也發現,實價登錄資料存在登 載錯誤及價格申報不實的情況,且可能被模型判斷為異常點。. 關鍵詞:異常點、特徵價格模型、個別估價、實價登錄、不動產資訊透明、 住宅價格申報不實。. II.

(6) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. ABSTRACT Many literatures use statistics-way to detect outliers in preventing any extreme deviation in hedonic price model prediction. Nevertheless, deleting the outliers instead of investigation into the structures, causes and features. Hence, this thesis studies the feature structures variation of the sample before and after deleting the outliers and with the valuations by appraisers’ perspective to inquire into the factors and features of the outliers in residential transactions. Thereby to summarize the significant features that are not disclosed by real price registration and feasibility in searching the possible false declaration of price by regression. Through descriptive statistics and sample structural difference parametric and nonparametric test shows the discreteness level of singular (outliers only) samples is greater than the primary (outliers including) and normal (outliers deleting) samples and the feature structure variation lessened after deleting the outliers in normal samples. The formation of outliers may be influenced by location variable not able to reflect actual circumstances and level of clustering in samples. Maybe some significant variables are not subsumed into the model, which leads to the judgement of samples with this variable to be outliers. The mean, variance and median in total traded price, land size, building size, total floors, exact floor and house age of singular samples are notably different with normal ones.. 立. 政 治 大. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. With the analysis of cases, the possible reasons may be residential and commercial mixed-use in building, peculiar neighbors, high proportion of accessory building, luxury houses, urban renewal benefits, building addition benefits, interior decoration benefits, agreed space benefits, high-ceiling benefits, unique view or location, YIMBY and NIMBY property in environment and special relationship between the buyer and seller. Nevertheless, due to the nondisclosure of these features in real price registration that the model does not take these into consideration. That leads to the judgement of samples with these features as outliers and affects the model prediction. Also the registration error and false declaration in price may also be judged as outliers.. Ch. engchi. i n U. v. Keywords:Outliers, Hedonic Price Model, Appraiser, Real Price Registration, Transparency of Real Estate Information, False Declaration of House Price.. III.

(7) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 目錄 第一章 緒論.................................................................................................. - 1 第一節. 研究動機與問題.......................................................................... - 1 -. 第二節. 研究目的與方法.......................................................................... - 4 -. 第三節. 資料來源與研究範圍.................................................................. - 6 -. 第四節. 研究架構與流程.......................................................................... - 7 -. 第二章 文獻回顧與整理.............................................................................. - 9 第一節. 異常點定義.................................................................................. - 9 -. 第二節. 異常點檢測方法........................................................................ - 12 -. 第三節. 異常點處理方式........................................................................ - 15 -. 小結............................................................................................ - 22 -. 學. 第五節. ‧ 國. 第四節. 政 治 大 個別估價與大量估價之連結.................................................... - 20 立. 第三章 資料說明與研究設計.................................................................... - 23 資料內容與敘述統計................................................................ - 23 -. 第二節. 樣本結構差異檢定.................................................................... - 33 -. 第三節. 實證分析設計與步驟................................................................ - 37 -. ‧. 第一節. sit. y. Nat. n. al. er. io. 第四章 實證分析........................................................................................ - 41 -. i n U. v. 第一節. 集群分析與分組配對................................................................ - 41 -. 第二節. 特徵價格模型分析.................................................................... - 49 -. 第三節. 個案篩選與分析........................................................................ - 54 -. Ch. engchi. 第五章 結論與建議.................................................................................... - 75 第一節. 結論............................................................................................ - 75 -. 第二節. 建議............................................................................................ - 78 -. 參考文獻........................................................................................................ - 80 附錄. 問題與回應........................................................................................ - 83 -. 一、. 論文期末報告之建議與回應........................................................ - 83 -. 二、. 論文口試委員之建議與回應........................................................ - 86 -. IV.

(8) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 圖目錄 研究流程圖 ...................................................................................- 8 有影響力的異常點(模型擬合與預測異常點)說明圖 ...............- 11 迴歸分析中有影響力的異常點處理流程圖 .............................- 16 2015 年第 2 季異常樣本與正常樣本分布圖 ............................- 29 2016 年第 2 季異常樣本與正常樣本分布圖 ............................- 30 -. 圖 1-1 圖 2-1 圖 2-2 圖 3-1 圖 3-2. 表目錄 異常點定義整理表 .....................................................................- 10 異常點檢測方法整理表 .............................................................- 14 異常點處理方式整理表 .............................................................- 15 國內應用特徵價格模型文獻整理表 .........................................- 18 複迴歸模型變數說明表 ............................................................ - 24 原始樣本描述性統計表 ............................................................ - 25 異常樣本描述性統計表 ............................................................ - 26 正常樣本描述性統計表 ............................................................ - 26 行政區次數分配表 .................................................................... - 28 建物類型次數分配表 ................................................................ - 31 建物構造次數分配表 ................................................................ - 31 是否臨街次數分配表 ................................................................ - 32 2015 年第 2 季異常樣本與正常樣本 T 檢定表 ....................... - 33 2016 年第 2 季異常樣本與正常樣本 T 檢定表 ..................... - 34 2015 年第 2 季及 2016 年第 2 季異常樣本 T 檢定表 ........... - 34 2015 年第 2 季及 2016 年第 2 季正常樣本 T 檢定表 ........... - 35 2015 年第 2 季異常樣本與正常樣本無母數檢定表 ............. - 35 2016 年第 2 季異常樣本與正常樣本無母數檢定表 ............. - 36 2015 年第 2 季異常樣本分組後描述性統計表 ....................... - 43 2015 年第 2 季正常樣本分組後描述性統計表 ....................... - 44 2016 年第 2 季異常樣本分組後描述性統計表 ....................... - 45 2016 年第 2 季正常樣本分組後描述性統計表 ....................... - 45 2015 年第 2 季異常樣本分組後 Z 分數評分表 ....................... - 46 2015 年第 2 季正常樣本分組後 Z 分數評分表 ....................... - 47 2016 年第 2 季異常樣本分組後 Z 分數評分表 ....................... - 47 2016 年第 2 季正常樣本分組後 Z 分數評分表 ....................... - 48 2015 年第 2 季正常樣本分組迴歸模型結果表 ....................... - 51 2016 年第 2 季正常樣本分組迴歸模型結果表 ..................... - 53 -. 立. 政 治 大. ‧. ‧ 國. 學. 表 2-1 表 2-2 表 2-3 表 2-4 表 3-1 表 3-2 表 3-3 表 3-4 表 3-5 表 3-6 表 3-7 表 3-8 表 3-9 表 3-10 表 3-11 表 3-12 表 3-13 表 3-14 表 4-1 表 4-2 表 4-3 表 4-4 表 4-5 表 4-6 表 4-7 表 4-8 表 4-9 表 4-10. n. er. io. sit. y. Nat. al. Ch. engchi. V. i n U. v.

(9) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 2015 年第 2 季異常樣本預測值與實際值差異統計表 .......... - 55 2016 年第 2 季異常樣本預測值與實際值差異統計表 .......... - 55 2015 年第 2 季異常樣本篩選個案整理表 .............................. - 57 2016 年第 2 季異常樣本篩選個案整理表 .............................. - 65 異常個案特色與價格差異原因整理表 ................................... - 72 -. 立. 政 治 大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 表 4-11 表 4-12 表 4-13 表 4-14 表 4-15. Ch. engchi. VI. i n U. v.

(10) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第一章. 緒論. 本章共分四節,第一節為研究動機與問題,說明為何進行本研究,並提 出問題;第二節為研究目的與方法,根據研究問題,歸納目的及簡述方法; 第三節為資料來源與研究範圍;第四節為研究架構與流程。. 第一節. 研究動機與問題. 一、 研究動機 自從 Rosen (1974)根據 Lancaster (1966)新效用理論(New Utility Theory) 提出特徵價格理論(Hedonic Price Theory)以來,國內外已有不少研究是應用. 政 治 大. 特徵價格理論結合不動產估價及複迴歸分析,以不動產交易樣本建構特徵. 立. 價格函數,分析影響不動產價格之變數或進行大量估價。. ‧ 國. 學. 據 Hampel, Ronchetti, Rousseeuw & Stahel (1986)估計,在一般樣本中可 能存在約有 1-10%(或以上)異常點(Outliers)1。回顧國內近年來以特徵價格. ‧. 模型作為研究工具的文獻研究相當多,如林秋瑾、楊宗憲、張金鶚(1996);. y. Nat. sit. 林祖嘉、馬毓駿(2007);張金鶚、楊宗憲、洪御仁(2008);張怡文、江穎慧、. n. al. er. io. 張金鶚(2009);楊宗憲、蘇倖慧(2011)等,在進行特徵價格模型預測時,為. i n U. v. 了適切反應市場實際交易情況及可信度,所取得研究樣本多半是來自市場. Ch. engchi. 上的公開交易資訊,且避免研究樣本中存在異常點會造成模型估計值產生 偏差,會使用統計軟體進行異常點檢測2,並以 Belsley, Kuh & Welsch (1980) 提出的 DFFITS 法3作為異常點判斷準則。 經整理前述國內文獻所檢測出的異常點約佔研究樣本 1%~12%,但皆. 1 2. 3. 異常點係指資料本身之值與平均值之間差異甚多的點,無論是小樣本或大樣本的資料 研究上,異常點的存在都足以影響整體統計資料的解釋能力(林秋瑾,1996)。 檢測異常點的方法有許多種,可以分為以圖形或數據分析等判斷,又因為異常點不一 定會對模型預測結果有影響力,所以近年來許多統計學家發展了幾種檢測方法,以移除 樣本中的某一筆資料,對迴歸模型解釋能力、殘差、預測值或迴歸係數等的影響,並以 影響程度判斷該筆資料是否為異常點,這些對模型預測結果有影響力的異常點,又稱為 影響點(Influential Point)(薄喬萍,2008)。因此,異常點會隨著應用不同的檢測方法,而 形成不同的檢測結果,也會因所設定的臨界值不同,而有所差異。 DFFITS 法是檢測移除樣本中的某一筆資料,對整體模型預測值的影響程度,如果影響 程度超過該方法設定的臨界值,就代表該筆資料為異常點。經林秋瑾(1996)實證指出應 用 DFFITS 法檢測異常點具有較佳的效果。 -1-.

(11) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 未就所檢測出的異常點加以著墨探究,而是直接將異常點刪除,雖然將異 常點直接刪除是最簡易的研究處理,但這樣簡易的作法,並無法了解整體 樣本特性與蘊含訊息。王彤、何大衛(2002)指出產生異常點的可能原因有許 多種4,且不動產具有高度異質性(Heteroscedasticity),形成不動產價格的因 素眾多,如果沒有進一步探討所檢測出的異常點結構、成因及特色等,從中 發掘出是否有被漠視的重要訊息,並說明刪除異常點前後整體樣本的特徵 結構變化,是否合乎檢測異常點的目的?則很難說服他人刪除異常點的合 理性。此為引發本文的研究動機之一。. 政 治 大 重要的特徵變數,導致預測結果偏離真實情況。自從我國實施「不動產交易 立 其次,研究者可能受限於不動產交易樣本所揭露的訊息不足,而遺漏. 實價登錄制度」後,每一筆不動產交易受法律強制申報登錄,並設有相關管. ‧ 國. 學. 制措施與違法罰則,相較其他民間資料更具有公信力及參考性,因此,近年. ‧. 來政府部門所編製的「住宅價格指數」 、不動產學術研究、許多購屋者在進. y. Nat. 行購屋決策及不動產估價師在進行個別估價等,皆仰賴實價登錄資料,如. er. io. sit. 果有影響不動產價格的重要因素,而實價登錄未揭露,除了個別估價具有 實地勘查及調查個案資訊的特性外,可能影響研究者的預測結果與購屋者. al. n. v i n 的購屋決策。由於文獻指出產生異常點的可能原因有「模型遺漏重要的自 Ch engchi U. 變數」 ,如果對統計軟體所檢測出的異常點,以個別估價觀點加以探討其成 因與特色,是否能藉此歸納出實價登錄資料未揭露的重要特徵?此為引發 本文的研究動機之二。 此外,實價登錄的成交資料可能包含申報人刻意申報不實價格的情形, 嚴重影響不動產課稅公平性及交易秩序。根據我國於 2016 年 1 月 1 日起開 始實施的「房地合一實價課稅5」及於 2016 年 3 月 8 日發生震撼金融業的. 4 5. 包括模型選擇錯誤、誤差分佈的總體標準差不相等、遺漏重要的自變數、變數的觀察 尺度選擇不當、抽樣誤差過大、樣本數過少、數據輸入錯誤及其他過失誤差等。 房地合一實價課稅係指以房屋及土地合併的實際成交價額,扣除原始取得成本、相關 費用及土地漲價總數額後,以實際獲利課徵交易所得稅。 -2-.

(12) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 「華南超貸案6」說明,申報人可能會為了逃漏所得稅或取得高額貸款,而 對實價登錄資料做不實的登載。雖然稽徵機關為查核申報人所申報的實際 成交資料是否確實,在「房地合一課徵所得稅申報作業要點」規定, 「未依 實際成交價額申報或未提供實際成交價額之證明文件者,除稽徵機關已查 得交易時之實際成交價額外,應參酌時價資料7認定其成交價額」 ;金融機構 在進行不動產放款時,會由內部估價人員對擔保品進行估價。 但是對於查核不動產申報交易價格的真偽,稽徵機關只藉由「時價資 料」判讀,不但缺乏查核效率,且可能因各稽徵機關的主觀認定差異,而無. 政 治 大 力或上級壓力,而產生「代理問題」 ,未確實查證成交價格,違反不動產估 立. 法確實掌握時價,致課稅公平性遭受質疑;金融機構放款時,可能因業務壓. 價的中立性及合理性。若能運用異常點檢測的概念,將申報不實案件視為. ‧ 國. 學. 大量申報樣本中的部分異常點,是否能以科學化的迴歸統計方法,搜尋實. y. Nat. 化認定?此為引發本文的研究動機之三。. ‧. 價登錄資料中疑似為申報不實的案件,以提升查核效率,並兼具客觀標準. 根據本文研究動機所引發的研究問題如下:. al. er. io. sit. 二、 研究問題. n. v i n (一) 住宅交易樣本異常點的特徵結構、成因與特色為何?是否具有非典 Ch engchi U. 型性(Atypicality)8?刪除異常點前後整體樣本的特徵結構變化為何?. (二) 以個別估價觀點加以探討住宅交易樣本異常點的成因與特色,是否 能藉此歸納出實價登錄資料未揭露的重要特徵? (三) 運用異常點檢測的概念,以迴歸模型搜尋疑似申報不實案件的效果 為何?. 6 7. 8. 中央通訊社, 「華南銀行遭超貸 5.2 億炒房 被罰 300 萬」,網址: http://www.cna.com.tw/news/firstnews/201603080457-1.aspx,取用日期:2016 年 6 月。 時價資料:金融機構貸款評定之價格、不動產估價師之估價資料、大型仲介公司買賣 資料扣除佣金加成估算之售價、法院拍賣或國有財產署等出售公有房屋及土地之價格、 報章雜誌所載市場價格、其他具參考性之時價資料。 Haurin (1988)提出非典型性的概念,將各種住宅特徵的平均值所組成的住宅定義為典型 住宅,而任何住宅特徵偏離典型住宅者,稱為非典型住宅(例如高總價豪宅或低總價套 房等),並提出測量公式來衡量非典型程度。 -3-.

(13) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第二節. 研究目的與方法. 一、 研究目的 由本文研究問題中,可歸納研究目的如下: (一) 探討住宅交易樣本以 DFFITS 法進行異常點檢測後,整體樣本特徵 屬性的差異、變化及特性等,提供研究者或金融機構進行模型預測 或大量估價參考。 (二) 藉由分析異常個案的過程,探討住宅交易樣本異常點的成因與特色, 並歸納實價登錄資料未揭露的重要變數,提供地政機關新增登錄揭. 政 治 大 (三) 運用異常點檢測的概念,探討以統計模型搜尋疑似申報不實案件之 立 露資訊參考。. ‧. ‧ 國. 二、 研究方法. 學. 可行性,提供稽徵機關建立稅捐查核工具參考。. (一) 文獻回顧與整理. sit. y. Nat. 蒐集整理關於異常點定義與類型、檢測方法、處理方式及個別估價. al. er. io. 與大量估價之連結等相關文獻,分析歸納異常點的成因與類型、檢測方. v. n. 法的內涵與特色、處理方式的種類與建議,並了解過去個別估價與大量. Ch. engchi. i n U. 估價相關研究成果與建議,作為進行實證分析的參考與基礎。 (二) 敘述統計與樣本結構差異檢定 運用 SPSS 及 SAS 統計軟體,整理研究樣本,以 DFFITS 法進行異 常點檢測,並將整體樣本劃分為尚未檢測異常點的「原始樣本」 、異常 點所組成的「異常樣本」及刪除異常點後的「正常樣本」 ,進行描述性 統計、次數分配、獨立樣本 T 檢定及無母數統計檢定(Nonparametric Statistics)等分析,探討整體樣本的特性與變化,並了解異常樣本與正常 樣本的特徵結構是否有顯著差異,進一步歸納形成異常點的重要影響 因子。. -4-.

(14) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. (三) 實證分析 1. 集群分析(Cluster Analysis) 應用多變量統計的集群分析,以形成異常點的重要影響因子作 為集群特徵,對異常樣本與正常樣本進行分組,作為下一階段特徵價 格模型分析使用,並得於個案分析階段,進一步探討異常樣本間是否 存在同質性,了解相同群組的異常點是否具有相類似的成因與特色。 2. 特徵價格模型分析 對分組後的正常樣本分別進行特徵價格模型預測,求取房價預. 政 治 大 本模型預測值與實際值的差異,篩選差異程度較大的異常樣本,作為 立 測的迴歸式,再以該迴歸式計算異常樣本模型預測值,比較各異常樣. 下一階段個案分析使用。. ‧ 國. 學. 3. 個案分析. ‧. 以個別估價觀點詳細調查這些個案背景與特色,探討這些個案. y. Nat. 預測值與實際值差異較大的原因,歸納實價登錄資料未揭露的重要. n. al. er. io. sit. 特徵,並驗證以量化統計方法搜尋疑似申報不實案件的可行性。. Ch. engchi. -5-. i n U. v.

(15) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第三節. 資料來源與研究範圍. 一、 資料來源 本研究資料來源為內政部不動產交易實價查詢服務網資料庫(實價登 錄),其中並包含各筆不動產交易資料的特徵屬性,作為本研究實證分析時 所用。 二、 研究範圍 (一) 研究對象 楊宗憲(2003)研究指出因為成熟都市呈現高發展密度與高地價,使. 政 治 大 點的成因及特色,盡量減少樣本的個別條件差異,選擇以台北市集合住 立 得產品規劃彈性較小,產品定位較接近,所以本研究為了有效掌握異常. ‧ 國. 學. 宅9做為研究對象。 (二) 資料時間. ‧. 為了解不同年度成交樣本的異常點是否有不同組成結構,採用. n. al. er. io. sit. y. Nat. 2015 年第 2 季與 2016 年第 2 季資料作為研究樣本期間。. 9. Ch. engchi. i n U. v. 根據建築技術規則建築設計施工編第 1 條定義集合住宅為;「具有共同基地及共同空 間或設備。並有三個住宅單位以上之建築物」,即公寓、華廈及住宅大樓等皆屬之。 -6-.

(16) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第四節. 研究架構與流程. 一、 研究架構 本文共分五章,第一章為緒論,主要在說明本論文之研究動機與問題、 研究目的與方法、資料來源與研究範圍、研究架構與流程;第二章為文獻回 顧與整理,本章主要分析歸納異常點的成因與類型、檢測方法的內涵與特 色、處理方式的種類與建議,並了解過去個別估價與大量估價相關研究成 果與建議;第三章為資料說明與研究設計,本章主要應用統計軟體,對整體 樣本進行描述性統計、次數分配、獨立樣本 T 檢定及無母數統計檢定等分. 政 治 大 分組配對、特徵價格模型分析及個案篩選與分析;最後第五章為結論與建 立. 析,並說明實證分析研究內容與步驟;第四章為實證分析,包括集群分析與. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 議。. Ch. engchi. -7-. i n U. v.

(17) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 二、 研究流程 研究動機與問題. 研究目的與方法. 資料來源與研究範圍. 文獻回顧與整理. 異常點 檢測方法. 異常點 定義. 立. 政 治 異常點 大 處理方式. 個別估價與大 量估價之連結. ‧ 國. 學 資料說明與研究設計. n 集群分析與分組配對. sit. io. al. 實證分析設計與步驟. er. 樣本結構差異檢定. y. ‧. Nat. 資料內容與敘述統計. C h實證分析 engchi 特徵價格模型分析. 結論與建議. 圖 1-1 研究流程圖. -8-. i n U. v. 個案篩選與分析.

(18) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第二章. 文獻回顧與整理. 本章共分三節,第一節為異常點定義,歸納異常點的成因與類型;第二 節為異常點檢測方法,分析不同檢測方法的內涵與特色;第三節為異常點 處理方式,整理處理方式的種類與建議;第四節為個別估價與大量估價之 連結,了解過去個別估價與大量估價相關研究成果與建議;第五節為小結, 對文獻內容進行歸納總結。. 第一節. 異常點定義. Hadi & Simonoff (1993)指出迴歸模型通常用於分析來自許多不同領域. 政 治 大. 的數據,這些數據通常包含異常點。異常點又稱為離群點或偏離點,若異常. 立. 點的存在會對模型預測結果產生影響,該點又可稱為影響點(薄喬萍,2008)。. ‧ 國. 學. Hawkins (1980)指出異常點與其他觀察值有很大的不同,從而引起懷疑它是 由不同的機制產生的,更具體的說,異常點是指那些偏離樣本平均值(林秋. ‧. 瑾,1996)或不服從模型分布(王彤、何大衛,2002)的觀察值。. y. Nat. sit. Aguinis, Gottfredson & Joo (2013)透過文獻分析法,蒐集 46 篇以解決異. n. al. er. io. 常點為主題的文獻,以及 232 篇組織科學領域中提到有關異常點問題的文. i n U. v. 獻,以迴歸分析、變異數分析(ANOVA)、結構方程模式(Structural Equation. Ch. engchi. Modeling, SEM)、多層次模式(Multilevel Modeling, MLM)及其他統計分析 (如薈萃分析、集群分析或時間序列分析)等作為背景,整理了 14 種異常點 的定義如表 2-1,並將異常點型態歸納為錯誤的、有趣的及有影響力的等三 大類。 Aguinis et al. (2013)針對有影響力的模型擬合與預測異常點,以圖 2-1 模擬說明其存在對迴歸分析結果的影響。模型擬合異常點被定義為其存在 影響模型的解釋能力(例如 R2),但模型擬合異常點通常也伴隨著影響模型 參數估計(即斜率與截距係數);而預測異常點被定義為僅影響模型的參數估 計。如圖 2-1 所示,當個案 1、2 及 3 從分析中排除時,該情況模型的 R2 -9-.

(19) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 為 0.73,當個案 1、2 或 3 分別存在分析中時,該情況模型的 R2 分別改變 為 0.11、0.95 或 0.17,此外,存在個案 1 或 3 的情況模型,除了模型 R2 減 少外,還連帶影響參數估計,相反的,由於個案 2 沿著迴歸線的位置,僅 影響模型的解釋能力。因此,預測異常點可能是具有大殘差值(如個案 1)或 具有大殘差值與極端值(如個案 3),相反的,雖具有極端值,但是殘差值較 小(如個案 2),並不會被判斷為預測異常點,但這種情況可能是模型擬合異 常點。 表 2-1 異常點定義整理表 定義 單一構造異常點. ‧ 國. 學. 錯誤異常點. 說明 治 政 觀察值與相同結構的其他值相比,異常大或異常小, 大 通常分布於極端值 立 觀察值屬於可能的值範圍外,發生原因包括觀測錯 誤、記錄錯誤、計算錯誤、編碼錯誤或操作錯誤等. 位於其他觀察值一定距離的正確(即非錯誤)觀察值, 並且可能包含有價值或意外的知識. 差異異常點. 具有較大殘差的觀察值,可能對模型預測或參數估計 有很大的影響. ‧. 有趣的異常點. y. Nat. al. er. sit. 一個有影響力的異常點,其存在影響模型的解釋能力 (例如 R2). io. 模型擬合異常點. v. 一個有影響力的異常點,其存在影響模型的參數估計 (例如β值). n. 預測異常點. Ch. engchi. i n U. 其他定義:存在於其他統計分析中的異常點,例如薈萃分析、集群分析或 時間序列分析等 資料來源:Aguinis et al. (2013) 王彤、何大衛(2002)研究有關醫學領域數據,指出產生異常點的可能原 因有模型選擇錯誤、誤差分佈的總體標準差不相等、遺漏重要的自變數、變 數的觀察尺度選擇不當、抽樣誤差過大、樣本數過少、數據輸入錯誤及其他 過失誤差等。 由於異常點屬於沒有一定規則的非常態資料,且可能因為使用不同模 型或檢測方法,而有不同的認定結果,所以無法以單一且絕對的答案來定 義。然不動產具有高度異質性,形成不動產價格的因素眾多,且不動產交易 - 10 -.

(20) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 樣本也可能包含資料輸入錯誤、資料申報不實、特殊交易情況及特殊物件 等資料,因此,採用的模型、考量的影響因子、樣本的特性及檢測的方法 等,都可能影響異常點的形成原因與檢測結果。 Y 個案 1 個案 2. 立. 政 治 大 非異常個案. 個案 3. ‧. ‧ 國. 學. X. n. er. io. sit. y. Nat. al. v i n Ch et U e n g c h i資料來源:Aguinis. al. (2013) 圖 2-1 有影響力的異常點(模型擬合與預測異常點)說明圖. - 11 -.

(21) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第二節. 異常點檢測方法. 近年來,統計學家陸續發展出多種異常點的檢測方法,可以分為以圖 形或數據分析等判斷(薄喬萍,2008)。Aguinis et al. (2013)透過文獻分析法, 整理了 39 種異常點的檢測方法,並依檢測方法的特性區分為單構造技術(以 觀察值的相對位置判斷)、多重構造技術(以觀察值的殘差或距離判斷)及影 響技術(以觀察值對模型估計值的影響程度判斷)等三大類。 林秋瑾(1996)透過統計軟體 SAS 系統內建的 6 種異常點檢測方法如表 2-2,探討建立特徵價格模型檢測異常點的重要性,並比較各種檢測方法對. 政 治 大 研究將這 6 種檢測方法整理說明如下: 立. 整體模型解釋能力的影響,實證結果指出 DFFITS 具有較佳的檢測效果。本. ‧ 國. 學. 一、 HAT DIAG. H.. Hoaglin & Welsch (1978)提出以 HAT DIAG. H.公式檢測,其定義公式. ‧. (. ). sit. Nat. ℎ =. y. 如下:. al. er. io. ℎ 是檢測第 i 筆觀察值自變數與所有觀察值自變數平均數的距離,因. v. n. 此,ℎ 越大表示第 i 筆觀察值離所有觀察值平均數越遠。Hoaglin & Welsch (1978)建議若ℎ >. Ch. engchi. i n U. (p 表示自變數個數;n 表示樣本數),就代表第 i 筆資. 料為異常點。 二、 RSTUDENT Belsley et al. (1980)提出以 RSTUDENT 公式檢測,其定義公式如下: ∗. =. −. =. (). 1−ℎ. 表示”有”第 i 筆觀察值時,第 i 筆資料的殘差; 表示第 i. 筆觀察值的實際值; 表示”有”第 i 筆觀察值時,第 i 筆資料的預測值;. (). 表示”沒有”第 i 筆觀察值時的標準差估計值。Belsley et al. (1980)建議若 | ∗ | > 2,就代表第 i 筆資料為異常點。 - 12 -.

(22) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 三、 DFFITS Belsley et al. (1980)提出以 DFFITS 公式檢測,其定義公式如下:. (). (). −. =. (). ℎ. 表示”沒有”第 i 筆觀察值時,第 i 筆資料的預測值。Belsley et al. |>2. (1980)建議若|. ,就代表第 i 筆資料為異常點。. 四、 COVRATIO Belsley et al. (1980)提出以 COVRATIO 公式檢測,其定義公式如下: =. (). ) ( (. (). (). ). ) 政 治 大 表示移除第 i 筆觀察值後的自變數矩陣。Belsley et al. (1980)建議若 立 − 1| > 3 ,就代表第 i 筆資料為異常點。. ‧ 國. 學. |. (). (. 五、 DFBETAS. ‧. Belsley et al. (1980)提出以 DFBETAS 公式檢測,其定義公式如下:. y. ( ′ ). n. er. io. al. (). (). sit. Nat. =. −. v ni. 表示”有”第 i 筆觀察值時的”個別”迴歸係數估計值;. Ch. engchi U. (). 表示”沒有”. 第 i 筆觀察值時的”個別”迴歸係數估計值。Belsley et al. (1980)建議若 |. |>. √. ,就代表第 i 筆資料為異常點。. 六、 COOK’S Cook (1977)提出以 COOK’S 公式檢測,其定義公式如下: =. ( −. (). )′ ′ ( −. (). ). 表示”有”第 i 筆觀察值時的”全部”迴歸係數估計值;. (). 表示”沒有”第. i 筆觀察值時的”全部”迴歸係數估計值; 表示”有”第 i 筆觀察值時的標準 差估計值。Cook (1977)建議若. > 1,就代表第 i 筆資料為異常點。. - 13 -.

(23) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 2-2 異常點檢測方法整理表 作者. 檢測方法. Hoaglin & Welsch (1978). HAT DIAG. H.. Belsley et al. (1980). RSTUDENT. Belsley et al. (1980). DFFITS. Belsley et al. (1980). COVRATIO. Belsley et al. (1980). DFBETAS. Cook (1977). COOK’S. 立. 定義公式 ℎ = ∗. =. (. ). (). =. | ∗| > 2. (). ℎ. ) ( (. (). | (). ( −. (). |. |>2 − 1| > 3. (). |. ( ′ ). 政 治 大 =. ). ). − (). 2. (). −. (). (. ℎ >. 1−ℎ. =. =. 判斷標準. )′ ′ ( −. (). ). |>. ‧ 國. 學. ‧. 是以不同的角度判斷異常點。HAT DIAG. H.是檢測某一個觀察值與平均觀. sit. y. Nat. 察值的自變數偏離情形;RSTUDENT 是檢測某一個觀察值對於模型殘差的. io. er. 影響;DFFITS 是檢測某一個觀察值對於模型預測值的影響;COVRATIO 是 檢測某一個觀察值對於模型迴歸係數估計變異數的影響;DFBETAS 是檢測. n. v i n Ch 某一個觀察值對於模型迴歸係數的影響;COOK’S e n g c h i U是檢測某一個觀察值對 於迴歸係數線性組合的影響。 Belsley et al. (1980)指出根據這些觀察值影響力的檢測,可以排序出各 觀察值對模型的影響力。由於各檢測方法對異常點的認定並不相同,進而 產生不同的模型估計結果,因此,檢測方法的適用時機,應根據研究的主要. - 14 -. √. 資料來源:林秋瑾(1996). 點,通常不會得到完全一致的檢測結果,因為這些檢測方法各有特色,分別. 目標、樣本組成結構的變化或模型的解釋能力等而定。. 2. >1. 謝雨生、鄭宜仲(1998)指出使用不同方法來檢測迴歸分析資料中的異常. al. p.

(24) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第三節. 異常點處理方式. Aguinis et al. (2013)透過文獻分析法,整理了 20 種異常點的處理方式 如表 2-3,除了採用其他的統計方法分析外,包括更正、刪除、詳細研究異 常點、維持、報告有無異常點的結果、極值調整、截斷、轉型及修改等一般 性的處理方式。可以視異常點的型態是屬於錯誤的、有趣的或有影響力的 等,而採用適合的處理方式。 表 2-3 異常點處理方式整理表 處理方式. 說明. 更正. 將觀察值更正為其正確的值. 刪除. 從分析中刪除觀察值. 詳細研究異常點. 立. 確認異常點的存在,但在分析前不對異常點進行 任何操作. 學. ‧ 國. 維持. 治 政 大 將異常點作為獨特的有趣現象進行研究 分別對有無異常點的樣本進行模型預測,並解釋 實際結果的差異. 極值調整. 將樣本中某百分位數以上或以下的極端值轉換, 使其與正常分布的最大值與最小值相同. ‧. 報告有無異常點的結果. y. Nat. io. n. al. 轉型 修改. er. sit. 將觀察值設置在可信範圍內,並從樣本中消除其 他值. 截斷. 將觀察值轉換為數學函數(如 log 函數,ln 函數), 不僅可以保持觀察值之間的相對排名,還可以減 少觀察值的誤差和離差. Ch. engchi. i n U. v. 手動將異常點改為另一個值,使其不那麼極端. 其他處理方式:採用其他統計分析方法,例如最小絕對離差、截尾最小平 方、M 估計、貝葉斯統計等 資料來源:Aguinis et al. (2013) Aguinis et al. (2013)並建議在進行迴歸分析時,可以應用圖 2-2 的流程 來處理有影響力的異常點。由於模型擬合異常點與其他觀察值有明顯偏離, 故建議第一步先應用多種構造技術(以觀察值的殘差或距離判斷)檢測明顯 偏離的觀察值,並確定其不是錯誤或有趣的異常點,該觀察值就可能是模 型擬合異常點,第二步再檢查它們是否對模型的解釋能力有影響。其次,建 議以 DFFITS、COOK'S 及 DFBETAS 等方法檢測每一筆觀察值對模型參數 - 15 -.

(25) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 估計的影響,再根據研究樣本數與自變數個數定義臨界值,判斷該觀察值 是否為預測異常點。最後,處理模型擬合與預測異常點的方法是一樣的,建 議以重新定義模型(新增變數、變數附加平方項或積項等)、刪除異常點或採 用其他穩健統計方法(例如最小絕對離差、截尾最小平方、M 估計、貝葉斯 統計等)處理,並應說明這些處理方式對分析結果所造成的影響。. 模型擬合 異常點. 步驟 1:透過多重構造技 術(以殘差或距離判斷)檢 測,但不屬於錯誤或有趣 的異常點的觀察值,是潛 在的模型擬合異常點. 立. 步驟 2:檢查 異常點對模型 解釋能力(例如 R2)的影響. 政 治 大. -計算 DFFITS、Cook's D 和 DFBETAS 值 -根據研究樣本數與自變數個數定義臨界值. 透過下列任一種方 法處理,並說明對 分析結果的影響: -重新定義模型 -刪除異常點 -穩健方法(如最小 絕對離差、截尾最 小平方、M 估計、 貝葉斯統計等). 學. ‧ 國. 預測 異常點. 處理. 檢測. 定義. 資料來源:Aguinis et al. (2013). ‧. 圖 2-2 迴歸分析中有影響力的異常點處理流程圖. sit. y. Nat. Stevens (1984)指出迴歸分析的結果可能會受到錯誤點的嚴重影響,研. al. er. io. 究人員必須分離這些點。錯誤點的第一個來源是記錄錯誤,可以透過列出. v. n. 數據來檢測,這些異常點不一定是具有影響力的,需要透過檢測方法仔細. Ch. engchi. i n U. 檢查標記哪些異常點有影響力,以確定是否應該從分析中刪除。如果有理 由相信這些案例是由其他不同機制產生的,例如測量儀器故障,電源故障 或發生異常事件,則應刪除這些資料。如果沒有理由,就應該報告這些異常 資料,並強調這些異常點對分析結果的影響。 Hadi & Simonoff (1993)提到如果一個樣本只有一個異常點,從分析和 計算的角度來看,要檢測該觀察值是否為異常點是相當容易的;但如果一 個樣本包含多個異常點,則可能因為傳統的檢測方法是一次檢測一筆資料 是否為異常點,會存在遮蔽效應(Masking Effect) 10 和淹沒效應(Swamping. 10. 遮蔽效應係指一個異常點因為受到周圍其他觀察值的影響而沒有被檢測出來。 - 16 -.

(26) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. Effect)11的影響,所以要做出正確的檢測就變得相對困難。因此,近年來有 許多研究是探討應用新發展的穩健迴歸(Robust Regression)來處理多個異常 點,例如呂秀英(2000)應用最小中量平方(Least Median of Squares, LMS); Turkan, Cetin & Toktamis (2012)應用 M 估計(M-estimation);袁淑湄(2016)應 用最小消去平方法(Least Trimmed Squares, LTS)等。Cook & Weisberg (1982) 提到雖然這些新發展的方法在某些方面似乎更具有競爭力,但只要傳統迴 歸分析的最小平方法(Ordinary Least Squares, OLS)繼續被廣泛使用,其相對 應的異常點檢測方法仍然存在應用價值。. 政 治 大 本進行異常點檢測的研究相當多如表 2-4,回顧其研究主題、採用特徵變數、 立. 整理國內近年來以特徵價格模型作為研究工具,並使用統計軟體對樣. 樣本來源及實證結果等各有特色,如林秋瑾、楊宗憲、張金鶚(1996)以仲介. ‧ 國. 學. 公司的成交資料,將異質性的住宅予以標準化,建立住宅價格指數;林祖. ‧. 嘉、馬毓駿(2007)以某商業銀行的授信資料,建立特徵價格模型進行大量估. y. Nat. 價;陳相甫、張金鶚、江穎慧(2011)以市場上新成屋與預售屋的個案調查資. er. io. sit. 料,探討住宅特徵發生變化對房價的影響;楊宗憲、蘇倖慧(2011)以臺灣不 動產成交行情公報,探討迎毗與鄰避設施對房價的影響範圍與程度等。經. al. n. v i n 整理這些文獻發現一些共通點,皆是應用特徵價格法半對數模型 Ch engchi U. 12. 作為研究. 模型,且皆以 DFFITS 法作為異常點判斷準則,但未就所檢測出的異常點加. 以著墨探究,僅是以直接刪除方式處理異常點。 雖然將異常點直接刪除是最簡易的研究處理,但這樣簡易的作法,並 無法了解整體樣本特性與蘊含訊息。因此,在檢測出異常點後,應探究這些 異常點的結構與成因,從中進一步發掘出是否有被漠視的重要訊息,並根 據研究目的、資料的性質或實務上的應用等來決定處理方式。. 11. 淹沒效應係指一個正常值因為受到其他觀察值的影響而被誤判為異常點。 特徵價格模型具有容易操作及易於解釋的優點,但不動產價格資料普遍有違反常態分 配假設的問題,採半對數模型與實際狀況較吻合(江穎慧,2009)。. 12. - 17 -.

(27) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 2-4 國內應用特徵價格模型文獻整理表. 4,328. 未說明 未說明. 學. ‧. 陳奉瑤、 個別估價與 楊依蓁 大量估價之 (2007) 準確性分析. 異常點 異常點 異常點 異常點處 樣本數 檢測方 佔樣本 數 理方式 法 數比例. 成交資料 建物面積、路寬、屋齡、所在樓 層、總樓層數、車位、嫌惡設施、 公告現值、土地面積、公共設施比 某商業銀行於民 率、主要用途、結構、土地使用分 國 91 年 2 月~93 18,637 未說明 未說明 區、縣市人口數、縣市核發建築執 年 5 月期間之授 照數、房價指數、房價建築業生產 信資料 指數、房貸利率、加權指數、領先 特徵價格法 DFFITS 直接刪除 指標、所得成長率 半對數模型 臺灣不動產成交 臨路街位置、臨巷關係、總樓層 行情公報於民國 數、所在樓層、建物面積、房間 93 年~94 年第 2 3,240 108 3.33% 數、衛浴數、屋齡、行政區、時間 季期間台北市之 住宅成交資料. y. al. n. 客觀標準化 不動產估價 之可行性分 析-市場比 較法應用於 大量估價. 治太平洋房屋於民 政 大 登記總面積、所在樓層、衛浴設備 國 77 年~82 年期 套數、屋齡、總樓層數、區位、等 立 間台北市之住宅 候交易時間. io. 龔永香、 江穎慧、 張金鶚 (2007). 樣本來源. Nat. 特徵方程式 林祖嘉、 大量估價法 馬毓駿 在台灣不動 (2007) 產市場之應 用. 選用特徵變數. sit. 林秋瑾、 住宅價格指 楊宗憲、 數之研究張金鶚 以台北市為 (1996) 例. 應用理論. er. 研究主題. ‧ 國. 作者. Ch. engchi. i n U. v. 區位、路寬、臨街關係、宗地形 房地產交易價格 狀、建物種類、屋齡、總樓層數、 簡訊於民國 94 年 移轉樓層、土地面積、建物面積、 1,367 期間台北市之成 國內生產毛額、營造業員工平均薪 交資料 資、貨幣供給量. - 18 -. 65. 4.75%.

(28) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 中古屋及預 售屋房價指 數之建立、 評估與整合 —台北市之 實證分析. 所在樓層、登記總面積、屋齡、總 樓層數、建物種類、車位、區位. 分量迴歸在 張怡文、 大量估價模 江穎慧、 型之應用張金鶚 非典型住宅 (2009) 估價之改進. 建物面積、房間數、衛浴數、屋 齡、所在樓層、車位、區位、時間. 立. 政 治 大. 學. 7,414 未說明 8%~11% 7,400. 3,707. 437. 11.79%. 1,534. 115. 7.50%. 1,453. 132. 9.08%. 12,266. 174. 1.42%. ‧. ‧ 國. sit. y. Nat 總樓層數、主力坪數、推案戶數、 區位、時間. 迎毗設施與 楊宗憲、 鄰避設施對 蘇倖慧 住宅價格影 (2011) 響之研究. 建物面積、所在樓層、總樓層數、 屋齡、建物類型、車位、各迎毗設 施及鄰避設施距離. io. 住宅品質變 陳相甫、 化對房價影 張金鶚、 響之研究江穎慧 以台北都會 (2011) 區新推個案 為例. n. al. Ch. engchi. - 19 -. er. 張金鶚、 楊宗憲、 洪御仁 (2008). 房地產交易價格 簡訊於民國 88 年 第 4 季~95 年第 2 季期間台北市之 住宅成交資料 臺灣不動產成交 行情公報於民國 93 年~94 年第 2 季期間台北市之 住宅成交資料 臺灣不動產成交 行情公報於民國 93 年~94 年第 2 季期間台北市之 住宅成交資料 政大房地產研究 中心與國泰建設 於民國 89 年~98 年期間台北市之 預售屋與新成屋 調查個案 政大房地產研究 中心與國泰建設 於民國 89 年~98 年期間新北市之 預售屋與新成屋 調查個案 臺灣不動產成交 行情公報於民國 95 年期間台北市 之成交資料. i n U. v.

(29) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第四節. 個別估價與大量估價之連結. 過去對於個別估價與大量估價的相關研究眾多,且大多著重在比較兩 者之間的差異性、穩定性、準確性及優缺點,或是探討大量估價系統改善或 取代個別估價的可行性等。 Detweiler & Radigan (1999)認為建立大量估價系統需要高品質的資料 庫(包括成交日期、屋齡、設施及區位等價格影響因子),且指出大量估價系 統會因為不同地區使用不同的資料庫格式,而導致有不同的價格影響因子 與模型預測結果;彭建文、楊宗憲(2007)指出大量估價系統之估價結果不足. 政 治 大. 以反映不動產的所有特徵,必須有足夠且品質好的成交資料庫才能建立模. 立. 型。. ‧ 國. 學. Fisher (2002)指出大量估價系統存在著系統風險,由於模型是使用過去 與有限的資料進行預測,當這些資料無法反映市場真實情況時,會有偏離. ‧. 市場價值的風險;Dell (2004)認為大量估價系統雖然具有市場需求,但不動. sit. al. er. io. 的變化進行判斷。. y. Nat. 產市場仍須藉助估價人員真實的眼力及聽力,進行實地勘查,並針對市場. v. n. 龔永香、江穎慧、張金鶚(2007)透過特徵價格模型搭配迴歸係數與明科. Ch. engchi. i n U. 斯基距離,實證將個別估價中的市場比較法,在選取、調整及權重等三個階 段予以客觀標準量化,研究結果顯示具有可行性,可改善個別估價主觀調 整缺乏客觀性的問題。 陳奉瑤、楊依蓁(2007)透過命中率(hit-ratio)、評估比值(AS-ratio)、平均 絕對百分比(MAPE)及對偶檢定(paired t-test)等統計分析,比較大量估價與 個別估價的準確性,實證發現兩者無明顯差異,但個別估價的分配情況較 集中且偏誤較小,顯示個別估價相對具有較高的穩定性與準確性。 江穎慧(2009)實證發現大量估價系統所在案例選取與權重調整階段,相 較個別估價更具客觀性與一致性,但比較兩著最終估價結果,顯示大量估. - 20 -.

(30) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 價系統的預測結果與個別估價差異甚大,進一步分析兩者差異值大的案例, 指出大量估價系統對於面積過大和過小的類型,因缺乏成交資料估計較不 準確,且在樣本較少的地區預測結果也有明顯差異。對於特殊估價業務或 成交樣本較缺乏的地區,大量估價系統僅能做為輔助工具,個別估價具有 實地勘查及個別調整的特性,使得估值比大量估價系統更為準確。 綜合本節文獻可發現,雖然可以透過大量估價系統增進估價效率,並 改善個別估價缺乏一致性或客觀性的缺點,但建立模型必須有足夠且高品 質的成交資料庫,且對於具有非典型性的特殊產品或成交樣本較缺乏的地. 政 治 大 勘查及個別調整的特性。因此,個別估價可以輔助大量估價系統更加真實; 立. 區,可能存在無法反映真實情況的預測偏誤,仍須藉助個別估價進行實地. 而大量估價可以協助個別估價更加客觀(陳奉瑤、楊依蓁,2007),兩者應是. ‧ 國. 學. 相輔相成的。本研究欲應用這個觀點,對住宅價格異常點的成因與特色進. ‧. 行探討,進一步歸納實價登錄資料未揭露的重要特徵,並了解住宅價格異. n. al. er. io. sit. y. Nat. 常點是否含有疑似申報不實案件。. Ch. engchi. - 21 -. i n U. v.

(31) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第五節. 小結. 整理以上國內外文獻後發現,異常點可能因為採用的模型、考量的影 響因子、樣本的特性及檢測的方法等不同,而有不同的認定結果,所以無法 以單一且絕對的答案來定義。 在異常點檢測方法方面,可以分為以圖形或數據分析,並可以依檢測 方法的特性區分為以觀察值的相對位置、殘差、距離或模型估計值的影響 程度等不同角度判斷,而檢測方法的適用,應視研究的主要目標、樣本組成 結構的變化或模型的解釋能力等而定。. 政 治 大 究異常點、維持、報告有無異常點的結果、極值調整、截斷、轉型及修改等 立 在異常點處理方式方面,過去已有文獻整理了包括更正、刪除、詳細研. ‧ 國. 學. 一般性的處理方式,或採用其他的統計方法分析,並可以視異常點的型態 是屬於錯誤的、有趣的或有影響力的等,而決定適合的處理方式。整理國內. ‧. 近年來以特徵價格模型作為研究工具,並使用統計軟體對樣本進行異常點. sit. y. Nat. 檢測的文獻,發現皆以 DFFITS 做為檢測方法,且皆以直接刪除的方式處理. al. er. io. 異常點,未就這些異常點加以著墨探究。因此,本研究欲探討這些被 DFFITS. v. n. 判斷為異常點的住宅交易樣本,其特徵結構、成因與特色等,並了解異常點. Ch. engchi. i n U. 刪除前後整體樣本特徵屬性的差異與變化,是否合乎異常點檢測目的。 過去有許多文獻針對個別估價與大量估價的穩定性、準確性及優缺點 進行比較,或是探討大量估價系統改善或取代個別估價的可行性等,這些 文獻指出建立模型必須有足夠且高品質的成交資料庫,且對於具有非典型 性的特殊產品或成交樣本較缺乏的地區,仍須藉助個別估價進行實地勘查 及個別調整的特性。又因為異常點的成因包括模型遺漏重要的自變數或數 據輸入錯誤等,所以本研究欲應用個別估價觀點,對住宅價格模型中的異 常點進行探討,了解這些異常點的成因與特色,並歸納實價登錄資料是否 有重要特徵未揭露,以及是否含有疑似申報不實案件。. - 22 -.

(32) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第三章. 資料說明與研究設計. 本章共分三節,第一節為資料內容與敘述統計,說明資料內容與結構, 並進行描述性統計及次數分配,以了解整體樣本特性與蘊含訊息;第二節 為樣本結構差異檢定,對異常樣本與正常樣本進行統計檢定,以了解變數 結構是否有顯著差異?異常樣本是否具有非典型性?並歸納形成異常點的 重要影響因子;第三節為實證分析設計與步驟,主要說明實證分析所採用 的研究方法與模型,以及實證分析的流程與步驟。. 第一節 一、 資料來源與範圍. 立. 資料內容與敘述統計. 政 治 大. 本研究資料來源為內政部不動產交易實價查詢服務網資料庫(實價登. ‧ 國. 學. 錄),其中包含各筆不動產交易資訊,包括區間門牌、成交總價、行政區、 土地坪數、建物坪數、建物類型、建物構造、所在樓層數、總樓層數、屋齡、. ‧. 座標等資料。研究對象為台北市集合住宅,資料時間為 2015 年第 2 季及. y. Nat. sit. 2016 年第 2 季。. n. al. er. io. 二、 資料處理說明. i n U. v. 本研究參考楊宗憲、林沛靜、江穎慧(2016)進行 104 年度「編制住宅價. Ch. engchi. 格指數並定期發布(IV)」計畫的標準作業流程,對本研究樣本進行下列資料 處理。資料處理後的原始樣本數 2015 年第 2 季為 2,084 筆;2016 年第 2 季 為 1,890 筆,其中包含異常樣本數 2015 年第 2 季為 119 筆;2016 年第 2 季 為 90 筆,刪除異常樣本後的正常樣本數 2015 年第 2 季為 1,965 筆;2016 年第 2 季為 1,800 筆。 (一) 刪除非住宅、一樓及透天厝產品、備註欄有特殊註記、屋齡 0.5 年 以下 60 年以上、有缺失值等資料,並將樣本車位面積及價格剔除。 (二) 以行政區為基礎,刪除總價大於 99%及小於 1%的極端資料。 (三) 以表 3-1 變數建構複迴歸模型,並應用 DFFITS 法進行異常點檢測。 - 23 -.

(33) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-1 複迴歸模型變數說明表 變數型態. 變數名稱. 單位. 應變數. 成交總價. 萬元. 建物面積. 坪. 自變數. 2. 建物面積平方. 坪. 所在樓層. 層. 所在樓層平方. 層2. 地上總樓層數. 層. 屋齡. 立. 是否臨街. 變數說明 採用總價並取自然對數 預期符號為正 由於坪數可能存在報酬遞減現 象,故加入平方項,預期符號為 負 因所在樓層對於房價為二次曲線 影響,有先遞減在遞增的效果, 故所在樓層預期符號為負;所在 樓層平方項預期符號為正 因地上樓層越高代表造價越高, 故預期符號為正. 政年 治 預期符號為負 大. 虛擬變數 臨巷弄=0;臨街路=1. ‧ 國. 是否地坪大於 10 坪 虛擬變數. 地坪未大於 10 坪=0;地坪大於 10 坪=1. 虛擬變數 其他=0;RC、SRC、SC=1. 行政區. 虛擬變數 萬華區=0;其他行政區=1. ‧. 建物構造. sit. y. Nat. 三、 敘述統計. 學. 是否為大樓或套房 虛擬變數 公寓=0;大樓或套房=1. n. al. er. io. 本小節將資料區分為原始樣本、異常樣本及正常樣本,並依照變數類. i n U. v. 型區分,分別就成交總價、土地坪數、建物坪數、總樓層、所在樓層及屋齡. Ch. engchi. 等連續變數列出平均數、中位數、標準差、最小值及最大值進行描述性統 計;就行政區、建物類型、建物構造及是否臨街等虛擬變數進行次數分配。 以了解整體樣本特性與蘊含訊息。資料描述性統計及次數分配結果如下:. - 24 -.

(34) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. (一) 描述性統計 由表 3-2~3-4 可發現,因異常點性質屬非常態資料,與整體樣本平 均值差異較大,故異常樣本各變數的標準差皆相對較大,顯示離散程度 較大;正常樣本各變數的平均數與中位數間距相對原始樣本較小,顯示 刪除異常點後的正常樣本較為集中,樣本差異程度縮小;比較正常樣本 與原始樣本的最小值與最大值,仍有些變數相同,顯示極端值並不一定 會被檢測為異常點。 表 3-2 原始樣本描述性統計表 平均數. 中位數. 9.59 5.73 22.62. 9.00 5.00 25.58. 最小值. 最大值. 216 0.11 4.27 2.00 2.00 0.58. 11,630 45.14 106.12 29.00 24.00 49.58. 4.47 3.48 13.08. ‧. 總樓層(樓) 所在樓層(樓) 屋齡(年). 2,084. 樣本數 1,689. 1,380. 1,162. 185. 14,680. 土地坪數(坪). 6.33. 5.83. 4.45. 0.15. 35.34. 建物坪數(坪). 28.55. 27.26. 15.28. 5.35. 164.45. 4.54 v i n C h 5.69 5.00 U 3.45 所在樓層(樓) engchi. 2.00. 33.00. 2.00. 25.00. 0.58. 52.33. 屋齡(年). 9.50. 22.72. 9.00. 24.46. sit. er. n. al. 總樓層(樓). y. 成交總價(萬元). io. Nat. 2016 年 第2季. 標準差. 治1,528 1,235 成交總價(萬元) 政 1,827 大 4.66 土地坪數(坪) 6.37 5.86 立 28.83 27.24 15.28 建物坪數(坪). 學. 2015 年 第2季. 變數(單位). ‧ 國. 年度季別. 13.50. 1,890. 樣本數. - 25 -.

(35) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-3 異常樣本描述性統計表 平均數. 中位數. 標準差. 最小值. 最大值. 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). 2,399 8.62 37.12 10.01 6.79 24.45. 1,708 8.00 30.62 8.00 5.00 24.17. 2,290 6.48 23.90 6.15 4.95 14.46. 216 0.12 6.52 3.00 2.00 0.67. 11,630 45.14 106.12 27.00 21.00 48.08. 119. 樣本數 1,924. 1,427. 2,256. 185. 14,680. 土地坪數(坪). 7.55. 6.74. 5.89. 0.37. 26.35. 建物坪數(坪). 32.65. 27.29. 26.49. 164.45. 總樓層(層). 10.32. 2.00. 33.00. 所在樓層(層). 政 9.00治 6.24 大 5.86 4.00 4.34. 5.35 2.00. 25.00. 屋齡(年). 立 26.88. 32.29. 0.92. 50.50. 15.51 90. 樣本數. 表 3-4 正常樣本描述性統計表 平均數. 中位數. 標準差. 最小值. 最大值. 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). 1,792 6.24 28.33 9.56 5.67 22.51. 1,512 5.73 27.09 9.00 5.00 25.75. 1,132 4.49 14.46 4.35 3.36 12.99. 286 0.11 4.27 2.00 2.00 0.58. 9,250 44.00 86.35 29.00 24.00 49.58. io. n. al. Ch. engchi. i n U. v. 1,965. 樣本數. 2016 年 第2季. y. 變數(單位). Nat. 2015 年 第2季. ‧. 年度季別. 學. ‧ 國. 2016 年 第2季. 成交總價(萬元). sit. 2015 年 第2季. 變數(單位). er. 年度季別. 成交總價(萬元). 1,677. 1,380. 1,079. 290. 9,325. 土地坪數(坪). 6.27. 5.79. 4.36. 0.15. 35.34. 建物坪數(坪). 28.34. 27.26. 14.48. 6.38. 95.92. 總樓層(層). 9.46. 9.00. 4.43. 2.00. 33.00. 所在樓層(層). 5.68. 5.00. 3.40. 2.00. 24.00. 屋齡(年). 22.52. 24.25. 13.37. 0.58. 52.33. 1,800. 樣本數. - 26 -.

(36) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. (二) 次數分配 1. 行政區 由表 3-5 可發現,異常點數量約佔原始樣本數量的 4%~6%,與 文獻異常點的比例 1%~12%差異不大;士林、大同、中正、北投、信 義、南港及萬華等行政區,有異常樣本占原始樣本百分比大於平均百 分比的現象,且加以檢視門牌座落位置,並應用地理資訊系統 (Quantum GIS)以座標輸出分布情形如圖 3-1~3-2,大多屬於同一行政 區內生活機能及交通運輸等條件差異較大的區域,又高於均價異常. 政 治 大 由於本模型是以行政區作為區位變數,如以個別估價觀點說明, 立. 樣本集中於市中心,低於均價異常樣本集中於外圍郊區。. 等同於模型是將同一行政區的樣本都視為近鄰地區,不會像個別估. ‧ 國. 學. 價以商圈或生活圈範圍細分近鄰地區,進行區域因素調整,例如天母. ‧. 及社子雖然都屬於士林區的範圍,但在生活機能及交通運輸等條件. y. Nat. 差異極大,導致住宅價格水準有一定程度的差異,假設原始樣本內為. er. io. sit. 多數天母樣本及少數社子樣本情況下,社子樣本就可能會被判定為 低於均價的異常點。. n. al. Ch. engchi. - 27 -. i n U. v.

(37) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-5 行政區次數分配表13 原始樣 異常樣 正常樣 異常樣本 異常樣 異常樣 原始樣 異常樣 正常樣 年度季別 行政區 本百分 本百分 本百分 占原始樣 本低於 本高於 本數 本數 本數 比 比 比 本百分比 均價數 均價數 7.68%. 12. 10.08%. 148. 7.53%. 7.50%. 7. 5. 大同區. 94. 4.51%. 4. 3.36%. 90. 4.58%. 4.26%. 1. 3. 大安區. 179. 8.59%. 7. 5.88%. 172. 8.75%. 3.91%. 1. 6. 中山區. 364. 17.47%. 10. 8.40%. 354. 18.02%. 2.75%. 1. 9. 中正區. 114. 5.47%. 17. 14.29%. 97. 4.94%. 14.91%. 9. 8. 內湖區. 293. 14.06%. 4. 3.36%. 289. 14.71%. 1.37%. 3. 1. 文山區. 186. 8.93%. 9. 7.56%. 177. 9.01%. 4.84%. 6. 3. 北投區. 203. 9.74%. 20. 16.81%. 183. 9.31%. 9.85%. 9. 11. 松山區. 158. 7.58%. 4. 2.53%. 3. 1. 信義區. 128. 6.14%. 10.16%. 8. 5. 南港區. 75. 3.60%. 立13. 13.33%. 8. 2. 萬華區. 130. 合計. 8.40%. 65. 3.31%. 6.24%. 9. 7.56%. 121. 6.16%. 6.92%. 7. 2. 2,084. 100%. 119. 100%. 1,965. 100%. 5.71%. 63. 56. 士林區. 173. 9.15%. 4. 4.44%. 169. 9.39%. 2.31%. 3. 1. 大同區. 95. 5.03%. 5. 5.56%. 90. 5.00%. 5.26%. 3. 2. 大安區. 129. 6.83%. 4. 4.44%. 125. 6.94%. 3.10%. y. 3. 1. 中山區. 293. 15.50%. 8. 8.89%. 285. 15.83%. 2.73%. 4. 4. 中正區. 93. 4.92%. io. 9. 10.00%. 84. 4.67%. 9.68%. 5. 4. 內湖區. 260. 0.38%. 0. 1. 文山區. 189. 3.17%. 3. 3. 北投區. 179. 松山區. 學. 10. sit. 治154 7.84% 政 3.36% 大 10.92% 115 5.85%. Nat. er. ‧. a l 1 1.11% 259 14.39% v i n C 6.67% 183 U10.17% 10.00% 6 he ngchi n. 2016 年 第2季. 160. ‧ 國. 2015 年 第2季. 士林區. 13.76% 9.47%. 18. 20.00%. 161. 8.94%. 10.06%. 11. 7. 136. 7.20%. 3. 3.33%. 133. 7.39%. 2.21%. 0. 3. 信義區. 118. 6.24%. 7. 7.78%. 111. 6.17%. 5.93%. 3. 4. 南港區. 96. 5.08%. 10. 11.11%. 86. 4.78%. 10.42%. 9. 1. 萬華區. 129. 6.83%. 15. 16.67%. 114. 6.33%. 11.63%. 14. 1. 合計. 1,890. 100%. 90. 100%. 1,800. 100%. 4.76%. 58. 32. 13. 異常樣本低於或高於均價係以該筆資料的 判斷。 - 28 -. 值,對預測值的影響為負值或正值.

(38) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-1 2015 年第 2 季異常樣本與正常樣本分布圖. - 29 -.

(39) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-2 2016 年第 2 季異常樣本與正常樣本分布圖. - 30 -.

(40) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 2. 建物類型 由表 3-6 可發現,公寓有異常樣本占原始樣本百分比大於平均 百分比的現象;套房的異常點判定低於均價較多。初步檢視異常樣本 資料發現,有幾筆高於均價的公寓,所在樓層係位於頂樓,可能有頂 樓加蓋或隔套房出租的情況;大部分低於均價的套房,建物面積僅 10 坪以下,在使用效益或市場需求上,屬於條件較差的產品;有幾 筆高於均價的套房,查詢該使用執照所載,係屬樓高挑高 3.6 公尺以 上的產品;有幾筆高於均價的大樓,查詢該社區,屬於高總價豪宅產. 政 治 大 表 3-6 建物類型次數分配表 立 原始樣 異常樣 正常樣 異常樣本 異常樣. 品。. 公寓. 508. ‧ 國. 24.38%. 41. 34.45%. 467. 23.77%. 8.07%. 20. 21. 套房. 431. 20.68%. 19. 15.97%. 412. 20.97%. y. 4.41%. 14. 5. 合計. 2,084. 100%. 119. 100%. 1,965. 100%. 5.71%. 63. 56. 大樓. 995. 52.65%. 43. 47.78%. 952. 52.89%. 4.32%. 25. 18. 公寓. 479. n. 24. 26.67%. 455. v25.28%. 5.01%. 10. 14. 套房. 416. 22.01%. 21.83%. 5.53%. 23. 0. 合計. 1,890. 100%. 100%. 4.76%. 58. 32. 49.58% 1,086 55.27%. 5.15%. 29. 30. C h23 25.56% engchi 90. 100%. sit. io. al. 25.34%. 59. er. Nat. 2016 年 第2季. 1,145 54.94%. ‧. 大樓 2015 年 第2季. 學. 異常樣 建物類 原始樣 異常樣 正常樣 本百分 本百分 本百分 占原始樣 本低於 本高於 年度季別 型 本數 本數 本數 比 比 比 本百分比 均價數 均價數. i n 393 U 1,800. 3. 建物構造 由表 3-7 可發現,除了 RC 以外的其他建物構造,皆有異常樣本 占原始樣本百分比大於平均百分比的現象。初步檢視異常樣本資料 發現,SRC 及 SC 構造樣本多數為屋齡小於 10 年的大樓產品,其他 構造樣本多數為屋齡大於 40 年的公寓產品,與前述描述性統計原始 樣本總樓層、屋齡的平均數、中位數相比較,皆屬於偏離平均值的樣 本。. - 31 -.

(41) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-7 建物構造次數分配表 原始樣 異常樣 正常樣 異常樣本 異常樣 異常樣 原始樣 異常樣 正常樣 年度季別 建物構造 本百分 本百分 本百分 占原始樣 本低於 本高於 本數 本數 本數 比 比 比 本百分比 均價數 均價數 RC. 1,993 95.63%. 2015 年 SRC、SC 第2季 其他 合計 RC. 合計. 79.83%. 1,898 96.59%. 4.77%. 52. 43. 28. 1.34%. 4. 3.36%. 24. 1.22%. 14.29%. 1. 3. 63. 3.02%. 20. 16.81%. 43. 2.19%. 31.75%. 10. 10. 2,084. 100%. 119. 100%. 1,965. 100%. 5.71%. 63. 56. 69. 76.67%. 3.84%. 48. 21. 1,798 95.13%. 2016 年 SRC、SC 第2季 其他. 95. 1,729 96.06%. 27. 1.43%. 3. 3.33%. 24. 1.33%. 11.11%. 1. 2. 65. 3.44%. 18. 20.00%. 47. 2.61%. 27.69%. 9. 9. 1,890. 100%. 90. 100%. 1,800. 100%. 4.76%. 58. 32. 4. 是否臨街. 立. 政 治 大. 本資料,未發現有與是否臨街相關的特殊訊息。. 學. ‧ 國. 由表 3-8 可發現,是否臨街無明顯集中趨勢,且加以檢視異常樣. 表 3-8 是否臨街次數分配表. ‧. 1,034 49.62%. y. 47.90%. 993. sit. 臨街路. 57. 50.53%. 5.43%. 29. 28. 6.00%. 34. 28. 5.71%. 63. 56. 5.33%. 21. 16. er. 1,050 50.38%. 合計. 2,084. 臨巷弄. 994. a l 62 52.10% 972 49.47% v i n C h 100% 1,965 U100% 100% 119 e n g c 941 h i 52.28% 52.59% 53 58.89%. 臨街路. 896. 47.41%. 37. 41.11%. 859. 47.72%. 4.13%. 37. 16. 合計. 1,890. 100%. 90. 100%. 1,800. 100%. 4.76%. 58. 32. n. 2016 年 第2季. 臨巷弄. io. 2015 年 第2季. Nat. 原始樣 異常樣 正常樣 異常樣本 異常樣 異常樣 是否臨 原始樣 異常樣 正常樣 本百分 本百分 本百分 占原始樣 本低於 本高於 年度季別 街 本數 本數 本數 比 比 比 本百分比 均價數 均價數. (三) 小結 綜合以上統計結果,異常樣本各特徵變數的離散程度相對較大,且 經過刪除異常點的正常樣本特徵結構差異程度縮小,合乎進行異常點 檢測的目的。異常點的形成可能受到區位變數無法反映實際情況及樣 本群聚程度影響,而使同一行政區內,區位條件相對差異較大的少數樣 本被判斷為異常點;有某些不動產特徵變數對預測值會產生重大影響, 但因模型未納入該變數,而使隱含該變數的樣本可能被判斷為異常點。 - 32 -.

(42) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 第二節. 樣本結構差異檢定. 本小節針對異常樣本及正常樣本,進行獨立樣本 T 檢定,又因異常樣 本可能屬於非常態或未知母體,且變異數可能不同質,故並以無母數統計 檢定加以驗證。以了解異常樣本與正常樣本的各變數結構是否有顯著差異, 歸納形成異常點的重要影響因子。獨立樣本 T 檢定及無母數統計檢定結果 如下: 一、 獨立樣本 T 檢定 由表 3-9~3-10 可發現,將同一年度季別的異常樣本與正常樣本相比較,. 政 治 大 本與正常樣本的離散情形有顯著差異。對應變異數異質的平均數檢定(T 值) 立. 由變異數同質性的 Levene 檢定顯示,所有變數皆達顯著水準,表示異常樣. ‧ 國. 學. 與顯著性(P 值)的星星效應顯示,2015 年第 2 季的成交總價、土地坪數、建 物坪數、所在樓層、2016 年第 2 季的土地坪數及屋齡等變數平均數有顯著. ‧. 差異,且異常樣本各變數的平均數與標準差皆大於正常樣本。. y. T值. n. al. T 檢定 df. er. F值. sit. Levene 檢定. io. 變數(單位). Nat. 表 3-9 2015 年第 2 季異常樣本與正常樣本 T 檢定表. i n U. v. 平均差異. 標準誤差. 70.57 *** 2.87 *** 122 607.15 211.42 3.96 *** 125 2.39 0.60 13.84 *** 3.97 *** 123 8.79 2.22 61.96 *** 0.78 125 0.45 0.57 39.51 *** 2.44 ** 125 1.12 0.46 46.18 *** 3.25 * 1.43 130 1.94 1.36 註:異常樣本為 119 筆、正常樣本為 1,965 筆;*、**、***分別表示在 10%、 5%與 1%顯著水準下顯著。 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). Ch. engchi. - 33 -.

(43) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-10 2016 年第 2 季異常樣本與正常樣本 T 檢定表 變數(單位). Levene 檢定. T 檢定. F值. T值. df. 平均差異. 標準誤差. 41.96 *** 1.03 91 246.59 239.18 16.08 *** 2.03 ** 94 1.28 0.63 55.73 *** 1.53 92 4.31 2.81 20.87 *** 1.30 94 0.87 0.67 8.65 *** 0.38 95 0.18 0.46 8.37 *** 2.62 *** 96 4.36 1.67 註:異常樣本為 90 筆、正常樣本為 1,800 筆;*、**、***分別表示在 10%、 5%與 1%顯著水準下顯著。 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). 由表 3-11~3-12 可發現,將不同年度季別的異常樣本相比較,及不同年. 政 治 大. 度季別的正常樣本相比較,由變異數同質性的 Levene 檢定顯示,大部分變. 立. 數未達顯著水準,僅異常樣本的所在樓層、正常樣本的成交總價及屋齡達. ‧ 國. 學. 顯著水準,且對應變異數同質的平均數檢定(T 值)、變異數異質的平均數檢 定(T 值)與顯著性(P 值)的星星效應顯示,大部分變數未達顯著水準,僅正. ‧. 常樣本的成交總價達顯著水準,表示同性質樣本雖時間不同,但離散情形. y. Nat. sit. 與平均數並無顯著差異。此外,為了解成交總價的差異,檢視 2015 年第 2. n. al. er. io. 季正常樣本的成交總價平均數大於(建物坪數平均數小於)2016 年第 2 季,. i n U. 換算為建坪單價解讀,顯示樣本期間行情有下跌趨勢。. Ch. engchi. v. 表 3-11 2015 年第 2 季及 2016 年第 2 季異常樣本 T 檢定表 變數(單位). Levene 檢定 F值. T 檢定 T值. df. 平均差異. 標準誤差. 0.39 1.50 207 475.19 317.83 1.24 207 1.08 0.87 0.03 1.28 207 4.47 3.50 0.10 -0.36 207 -0.31 0.87 0.09 1.45 203 0.93 0.64 2.84 * -1.17 207 -2.43 2.08 1.65 註:2015 年第 2 季異常樣本為 119 筆、2016 年第 2 季異常樣本為 90 筆;*、 **、***分別表示在 10%、5%與 1%顯著水準下顯著。 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). - 34 -.

(44) 異常住宅價格檢測與處理之研究-以個別估價觀點分析. 表 3-12 2015 年第 2 季及 2016 年第 2 季正常樣本 T 檢定表 Levene 檢定. 變數(單位). F值. T 檢定 T值. df. 平均差異. 標準誤差. 8.01 *** 3.18 *** 3757 114.63 36.03 0.16 -0.24 3763 -0.04 0.14 0.44 -0.02 3763 -0.01 0.47 0.38 0.74 3763 0.11 0.14 0.01 -0.08 3763 -0.01 0.11 4.22 ** -0.02 3713 -0.01 0.43 註:2015 年第 2 季正常樣本為 1,965 筆、2016 年第 2 季正常樣本為 1,800 筆; *、**、***分別表示在 10%、5%與 1%顯著水準下顯著。 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). 二、 無母數統計檢定. 政 治 大. 由於兩組獨立樣本的無母數統計檢定方法有數種,考量本次檢定目的. 立. 係為了解異常樣本與正常樣本的結構是否有顯著差異,並重複驗證前小節. ‧ 國. 學. T 檢定結果,故以 Kolmogorov-Smirnov Z 法14就同一年度季別的異常樣本 與正常樣本進行檢定。. ‧. 由表 3-13~3-14 可發現,將同一年度季別的異常樣本與正常樣本相比. y. Nat. sit. 較,無母數統計檢定顯著性顯示,2015 年第 2 季的成交總價、土地坪數、. n. al. er. io. 建物坪數、總樓層、所在樓層、屋齡、2016 年第 2 季的成交總價、土地坪 數、建物坪數及屋齡等變數有顯著差異。. Ch. engchi. i n U. v. 表 3-13 2015 年第 2 季異常樣本與正常樣本無母數檢定表 變數(單位). Kolmogorov-Smirnov Z 檢定 Z值. 1.47 ** 2.17 *** 1.72 *** 1.36 ** 1.34 * 1.56 ** 註:異常樣本為 119 筆、正常樣本為 1,965 筆;*、**、 ***分別表示在 10%、5%與 1%顯著水準下顯著。 成交總價(萬元) 土地坪數(坪) 建物坪數(坪) 總樓層(層) 所在樓層(層) 屋齡(年). 14. 檢定兩組樣本的實際分布情形,以中位數、分散情形及偏態等判斷兩組樣本的母體分 布是否一致,兩母體是否具有相同的比例結構。 - 35 -.

參考文獻

相關文件

18   狐狸說:「假如你馴服我,我的生活將如充滿了陽光般。我

[r]

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

我低着頭做算術習題,心裏卻翻騰得厲害,耳朵裏只聽見永瑛洗衣

演講辭格式 稱謂 稱謂:對在場人士的6. 稱呼。要注意稱謂的

[r]

部首位置 在左 在右 在上 在下 在內