chapter 1 研究簡介
1.4 預期貢獻
chapter 1 研究簡介
本研究主要在收集多源的房地產買賣資訊,除實價登錄資料外,還有其他房 仲網的待售房屋資料。用視覺化的方式呈現在網頁上,並利用實價登錄資料來建 立房價模型。本章節主要介紹研究動機、主題、方法及貢獻。1.1 研究動機是在 新聞中看到實價登錄的相關報導,在質疑資料的正確性,如買低報高的情況。1.2 研究主題是以線性迴歸的方式建立房價模型,希望能藉此更了解台灣房地產買賣 的模式,更能掌握房市走向。1.3 研究說明是在說明研究方法,從資料的收集、
整理到呈現的工作流程。1.4 預期貢獻列了本論文的主要貢獻,包括房價推估及 多源房地產買賣資訊收集的機制。最後,1.5 為章節介紹。
1.1 研究動機
1.1.1 實價登錄
台灣政府行政院於 2012 年 8 月 1 日公布實施「不動產成交案件實際資訊申 報登錄制度」,簡稱實價登錄,做為建置房地產交易開放資料平台的法源依據,
期望透過透明的交易資訊平抑飆漲的房價,並為未來可能施行的實價課稅預作準 備。所謂實價登錄制度是指不動產交易買賣雙方必須依據政府所指定的表格填寫 交易相關資料,包含房屋住址、房地交易總價、建物格局…等,當中的不動產交 易係指買賣,而繼承、贈與雖有轉移但無金錢流動,故無須申報。其目的是為了 讓房地產交易符合所謂的「公平、公正、公開」三公原則,提供房市交易價格資 訊給一般民眾,有助於改善單一購屋人與廣大房市中「資訊不對等」的情況。
然而,政府的一番好意並未如其所望。實價登錄固然提供民眾一個公開且具 有一定公信力的管道了解房市,但因政策不夠健全完整又缺乏具約束力罰則,造 成有虛報的情況。尚因相關的例外情況,未能完整及正確的呈現房市資訊,甚至 讓有心人士主導房市走向助漲房價。政府好意的實價登錄也因而有了嘲諷意味濃 厚的新名稱─虛價登錄。
2
1.1.2 實價登錄中的角色
在實價登錄申報過程當中,主要參與人有買賣雙方、房屋仲介以及地政士。
賣方將資產轉移給買方獲得金錢者,而買方則是付出金錢獲得資產的人。仲介的 工作是夾在買賣雙方中間提供雙方相關的交易資訊、提供一些看房、介紹服務,
成交後提供履約保證,依各家房仲行情抽取傭金。地政士也就是俗稱的土地代書,
扮演著將買賣雙方提供的資料上傳登記的重要角色。民國 90 年通過的地政士法 正式將土地代書正名為地政士,必須通過國家考試才能開業。
實價登錄相關的流程可參考 Figure 1 中所示之情境示意圖,主要分為交易 端、資料管理儲存端及資料分享端。
交易端也就是在房地產交易過程的部分,若有經房屋仲介或有請地政士代簽 契約的話,應由房屋仲介或地政士在交易完成後向地政事務所登記轉移,一併申 報實價登錄。若未經仲介或地政士,則移轉確定後,應由承買人會同出賣人向不 動產所在地地政事務辦理所有權移轉登記及申報實價登錄,但已建置完成的不動 產成交案件,30 天內須實際至資訊申報登錄系統網站,一般民眾可透過自然人 憑證登錄,公司行號(地政士、不動產經紀業者)則可透過工商憑證登錄。在交 易資料登錄前,需確定各欄位資料的正確性,不單單只有交易價格,還有土地面 積、建物面積、房屋格局等等各式各樣的資料。
資料管理儲存端負責資料的彙整、儲存及公開,主要分為內政部的時價登錄 資料及一般民間房仲交易資料。實價登錄資料登錄至內政部實價登錄系統資料庫 後,公部門會對資料進行處理,主要有兩個部分:第一,將交易價格最高與最低 各 5%去除,去除極端值的目的是為了防止炒作。第二,將地址區段化,其目的 為保護個人隱私。內政部將處理為的資料已 open data 的方式釋出,提供一般民 眾下載。房仲交易資料則由各房仲業者管理及應用,為不公開的資料。
資料分享端是將各式資料以視覺化或是原始檔案的方式提供給一般民眾瀏 覽、下載或使用。實價登錄方面除了內政部本身的不動產交易實價查詢服務網外
3
其他相關網站,如迪歐地圖[1]就是以實價登錄公開的資料為基礎建立的房價地 圖。一般房仲網站也會將實價登錄的交易資料做簡單的呈現,提供想購屋的民眾 一些參考的依據。
1.1.3 資料的失真
樂屋網的文章【樂屋講座】揭露放大鏡下的「實價登錄」[2]提到目前「實 價登錄」政策的漏洞,如:建設公司自建自售不用登錄、不透過仲介之租賃案件 不登錄、代銷公司登錄時間落差大,部分代銷公司為了逃避登錄會將契約終止期 延長,會將代銷契約拉長以回避申報登錄等等。
再者,政府課稅方案非以買賣價格來課,而是以公告現值張課稅基礎。好房 News「實價登錄真能反應房子價值?」[3]中提到實價登錄是還原真實房價的過 渡手段,未來的實價課稅如何落實是一大關鍵。
Figure 1 實價登錄架構圖
4
以上兩則新聞提到了幾個造成實價登錄資料不完整的原因,而什麼叫做資料 的不完整呢?資料的不完整意旨原始資料無法忠實呈現當時的交易狀況。以下列 出可能造成資料不完整的幾個原因:
1. 內政部公部門在公開資料前將交易價格最高與最低各 5%去除。
2. 同筆交易中含兩個或兩個以上標的,在登錄時只登錄第一個標的地址,其 餘不需登錄。
3. 作業疏失,如買方不熟悉房地契約內容而申報有誤或地政士或仲介未確實 查證賣方所提供資料的正確性。
4. 買賣雙方刻意提高或壓低價格,使交易不具市場代表性。
前三點為法規或是少數疏失,較難改變及避免,而針對第四點則可深入探討 造成買賣雙方刻意提高或壓低價格的原因。
1.1.3.1 低報交易價格
與不動產相關的稅收項目有房屋稅、地價稅、房屋財產所得稅、奢侈稅、空 地稅、增值稅等等,雖然政府並沒有明確的針對實價登錄進行課稅,但實價登錄 無疑是讓政府能更精準的課稅。因此,買方為逃避納稅可能串通賣方將交易價格 低報。
1.1.3.2 高報交易價格
高報交易價格的理由除了外,還可以向銀行貸到比較高的貸款。在 Mobile01 論壇中也有人討論高雄的橋頭建案,討論串中提到同一建案在實價登錄中卻明顯 呈現三種不同價位且價差高達 600 萬元。其中可能的原因是建商在建案初期為 了續建的資金問題以自己已超出行情的價購買並登記在實價登錄中,一方面能夠 提供銀行貸款的依據,另一方面也能在實價登錄中提高自己建案的行情,讓不知 情的民眾買貴。
1.2 研究主題 –房價模型建構
5
有了大量的房價交易資料後,我們除了可以做視覺化呈現,讓一般民眾更輕 易的了解房市資訊外,我們對資料還有一些不一樣的期待。既然我們有了這些歷 史資料,鑑往知來,我們可以預測未來的房價。
為了達到預測房價的目的,我們以實價登錄資料為基礎以線性迴歸的方式建 立了房價模型。用了交易資料中許多屬性,如交易坪數、房屋格局、建物樓層等 做為預測依據。在建構模型的過程中會對使用的實價登錄資料稍做篩選,如對各 欄位剔除前後共 5%的極端值,使模型能預測得更加準確。
建立房價模型不但能夠用來預測房價,還能用預測的方式,先預估相同條件 的房子價格,找出大量資料中的價格異常的資料。房價模型也能提供政府另一個 瞭解房市的方法,也能當作之後課稅的參考。因此,房價模型的建立的很重要的。
1.3 研究方法
拿到實價登錄資料第一件事是要對資料做分析、統計、視覺化的呈現。由於 實價登錄是長期累積的資料,因此對於資料的維護和追蹤也是很重要的。對資料 有初步的認識後,房價的推估是下一步,利用分群及線性規劃等技巧推算房價。
1.3.1 異源資料收集
除了內政部釋出的實價登錄資料以外,我們還蒐集其他房仲網站等公開的市 場資訊,讓參考的資料更全面。其他會影響房價的因素也是重要的參考依據,主 要可以分成三大類:交通方面有捷運站位置;嫌惡設施方面有公墓、靈骨塔、殯 儀館、火化場、焚化廠及垃圾掩埋場;還有其他像是中小學學區、醫院、郵局 ATM 等。工作重點包含資料收集、前處理及資料庫建置。
資料收集:異源資料的收集與維護可分成前中後三期,分別為資料的獲得、
資料庫的建置以及自動化的維護流程。前期資料的獲得除了一些開源資料外,其 他需以網路爬蟲將網頁內容擷取下來,如房仲網的資料即為非開源但公開的資料。
中期為建立資料庫,大部分網頁資訊為半結構化資料,對資料的遺失或空缺需加 以處理。後期的目的為建立長期資料收集的作業流程,由於政府提供了我們長期
6
穩定的資料來源,而好的資料維護、追蹤及更新才能將資料呈現出長期的趨勢,
因此需要一套自動化的流程來定期更新維護資料庫。
資料前處理:擁有可運用的資料後下一步是將資料呈現出來,但在呈現資料 前還需要一些前置處理,如錯誤資料修正、資料型態整理、異常資料排除等。完 成前置處理後呈現的資料較具參考價值。
資料庫建置:為了方便日後大量資料的存取及維護,資料庫的建立是必要的。
由於資料來源不同,特性也有一定的差異,因此我們將經過前處理的資料依來源
由於資料來源不同,特性也有一定的差異,因此我們將經過前處理的資料依來源