第二章 文獻回顧
第二節 支撐向量機於住宅價格預測之文獻
SVM 除廣泛應用於語音辨識、影像辨識、生物科技之分類及時間序列之預測 外,應用於住宅價格預測之研究亦與日俱增。而住宅價格之預測亦有許多方法,近 期相關 SVM 於住宅價格預測之研究中,不單只運用 SVM 預測住宅價格,更與其他 不同種類之方法進行比較。SVM 有兩種預測方式,一為分類預測模型(support vector classification,SVC),另一種為迴歸預測模型(support vector regression,SVR),此兩 種方法普遍應用於現今研究。而本文文獻回顧中,住宅價格預測之研究皆偏向以迴 歸方式處理,故本研究亦採 SVR 建立住宅價格預測模型。
Xie and Hu (2007)以自迴歸平均移動(auto-regression integrated moving average,
ARIMA) 模型、類神經網路(neural networks,NN)及 SVM 三種方法預測上海住宅價 格指數,該住宅價格指數整合辦公市場、工業市場、零售市場、租屋市場、中古屋 (secondary housing)市場所產生。為比較三種不同之預測方法,採均方誤差(mean square error,MSE)及最大誤差(maximum error,ME)衡量模型預測正確率。就短期預 測而言,SVM 及 NN 較優於 ARIMA,就長期預測而言,SVM 則明顯有著較好的預 測結果。
Zhong et al. (2009)以支撐向量迴歸(support vector regression,SVR)預測住宅價 格,並與放射性基底函數類神經網路(radial basis function neural network)比較。採用 之變數為城鎮平均犯罪率、住宅規劃用地超過 25000 平方英尺之比例、非零售業土 地之比例、是否鄰河川、氮氧濃度、建蔽率、波士頓就業中心之加權距離、放射型 公路、財產稅率、城鎮師生比例、城鎮黑人比例、地位較低之人口比例、住宅中位 數價格。實證結果顯示,放射性基底函數類神經網路之預測誤差較大,表示支撐向 量迴歸之預測正確率高於放射性基底函數類神經網路,而均方誤差(mean square deviation)方面,支撐向量迴歸之均方誤差亦小於放射性基底函數類神經網路。
由 Xie and Hu (2007);Zhong, et al. (2009)之研究結果顯示,顯見 SVM 不但預測 正確率高於自迴歸平均移動模型及類神經網路,預測誤差亦小於其他兩者。
Liu and Liu (2010) 以 SVM 建立房地產市場的風險預警模型,並與類神經網路 比較其預測績效。採用之變數包含房地產投資佔 GDP 比率之增加 (increased ratio of real estate investment to GDP)、房地產總投資所比率之增加(increased ratio of total investment of real estate)、住宅總投資比率之增加(increased ratio of the total investment
of house)、住宅建築面積比率之增加(increased ratio of house construction area)、住宅 支配所得比率之增加(increased ratio of dominate income of resident)及消費物價指數比 率之增加(increased ratio of consumption price index)。實證結果指出以 SVM 及類神經 網路建立預測模型是合理且可靠的。因 SVM 有著傑出的搜尋及資料處理能力,所 以對於房地產預警分析,SVM 可作為一項新的預測途徑。但由於建立 SVM 模型之 過程中,參數估計結果是極需要被探討的。而 SVM 參數之搜尋有著很大的盲點,
因其無法保證搜尋之參數為優越(superior)之參數。顯見參數之搜尋及選取對於 SVM 之預測結果極為重要。
Jozef et al. (2011)比較多種迴歸及人工智慧(artificial intelligence,AI)方法於大量 估價。包含四種迴歸方法,如傳統多元迴歸(traditional multiple regression analysis,
MRA)及三種非傳統迴歸方法(non-traditional regression-based methods),如 M5P 迴歸 樹(M5P trees)、SVM-SMO(SVM using sequential minimal optimization)及 additive regression,與另外三種 AI 方法,如類神經網絡(neural networks,NNs)、放射型基底 函 數 類 神 經 網 路 (radial basis function neural network , RBFNN) 及 記 憶 基 礎 推 理 (memory-based reasoning,MBR)等七種方法,配合五種模擬方案做為分析依據,並 比較各個方法於大量估價作業的預測績效。實證分析顯示,於各種模擬方案中,非 傳統迴歸(M5P trees、SVM-SMO 及 additive regression)皆比人工智慧(NNs、RBFNN 及 MBR)有較好的結果,特別是模擬方案大多屬同質性資料時,而 SVM-SMO 之預 測績效亦優於 MRA。
Vilius and Antanas (2011)運用普通最小平方法(ordinary least square,OLS)、多層 感知機(multilayer perceptron,MLP)及 SVM 進行房地產之大量估價。採用之變數包 含區位、面積、建造年份、運河類型、暖氣系統類型、建築材料類型、戶外類型 (type of the outside finishing)、樓層數、住宅類型(連棟或獨棟)。實證結果為 SVM 於 平均絕對百分比誤差(mean absolute percentage error,MAPE)、平均絕對誤差(mean absolute error,MAE)及未接受之估價(unacceptable valuation,UV)三種評估標準中。
顯示 SVM 誤差估計值皆小於 OLS 及 MLP,表示 SVM 評估績效皆優於 OLS 及 MLP。此外 Vilius and Antanas (2011)認為非線性的模型是需要的,而 SVM 有能力作 為非線性的模型,且適用於成本函數研究,因其可找到總體最小化的成本函數。
Gu et al. (2011)運用基因演算法(genetic algorithm,GA)結合 SVM 之 G-SVM 預 測住宅價格,並與網格演算法(grid algorithm method,GM)比較其預測績效。實證結
果顯示,就價格預測,GM 大幅偏離實際住宅價格,而 G-SVM 則較貼近於實際住宅 價格,就誤差估計,GM 之估計誤差亦大於 G-SVM,表示以 G-SVM 預測住宅價格 較 GM 精確。而相較於網格演算法,基因演算法耗費較少時間且績效亦相對較好,
因此作者將 GA 運用於 SVM,以便得到較好的最適參數,實證結果不論於價格預測 及誤差估計中,G-SVM 的績效皆相對優於 GM。
透過 Jozef et al. (2011);Vilius and Antanas (2011);Gu et al. (2011)等研究指出,
SVM 於住宅價格之研究,皆有著卓越之預測結果,如相較許多人工智慧方法的應用 中 SVM 亦有著較良好的預測績效,其次相較於其它迴歸方法,SVM 亦略勝一籌。
另外將 SVM 結合其他方法進行預測亦有出色的表現,表示 SVM 不論單獨與結合其 它方法進行預測皆為可行的。
蔡爾逸(2012)以特徵價格理論為基礎,應用 SVM 預測台北市之住宅價格,選取 之屬性分為內部特徵及外部特徵,經逐步迴歸分析法篩選後之內部特徵包含:住宅 類別、土地、屋齡、房間、客廳、衛浴;外部特徵包含:距市區(火車站)之最近距 離、距河堤之最近距離、800 公尺內之捷運數、快速道路數、大學數、圖書館數、
量販店數、藝文中心數、百貨公司數、超市數、醫院數、警局數及消防局數等 19 項 環境特徵變數,再經參數調整後,其價格預測模型於誤差 20%情況下之準確率約為 72.2%,表示此預測模型可解釋 72.2%的台北住宅資料,換言之,若每坪單價為 20 萬之住宅,於本預測模型會分類至 16 至 24 萬之間。另外本預測模型用於台北市南 港區及內湖區案例分析中,因區位條件相同且兩區住宅亦屬新住宅之故,於誤差 20%情況下之準確率約為 81.8%。