分析方法

第三章研究方法

第四節分析方法

為驗證本研究之研究假說，需要擬定分析架構，並透過統計檢定進行假說的驗證，瞭解真實的建成環境與公共自行車的影響關係為何。本研究會首先進行資料的蒐集和整理，透過探索式分析的方式瞭解資料的分佈形態，而後透過多元線性回歸和自回歸的方式瞭解建成環境與使用量之間的關係並進行檢定，而後根據對比調整

R²的值，選取解釋能力更好的模型作為分析的結果。最後回應研究假說得到結論。

其中本研究所選擇之自變數是上文所列舉之六大類型之各自的自變數，而因變數選擇當年該站點的公共自行車租借量的自然對數(Maurer, 2011; Rixey , 2013)。

一、敘述統計分析

在對資料進行蒐集合整理之後，會得到本研究所研究之建成環境因素(自變數)和租借車數量(應變數)的資料，在進行統計分析之前，本研究會透過最小值、第一四分位數、平均值、第三四分位數、最大值和標準差指標的計算掌握資料的分佈形態，

以方便對資料進行標準化處理以及統計分析的計算。

二、多元線性回歸模型

在統計回歸中，可採用線性模型預測一系列連續型或類別型自變數的影響程度，

但在有些情況下，當自變數的個數超過 1 個的時候，需要使用到多元回歸(Multiple Regression Analysis)來替代簡單回歸分析。假設有 k 個自變數，那麼分析公式可以寫

三、逐步回歸模型

逐步回歸透過觀察統計值，如判定係數，t 值和最小資訊篩選變數。基於特定的標準加入或移出變數來擬合回歸模型。而逐步回歸又可分為兩種，一種是前進法，

即開始與最顯著的變數而在模型中逐漸增加顯著變數；另一種是後退法，即開始計算是包含所有變數而後逐步減少不顯著的變數。

即開始與最顯著的變數而在模型中逐漸增加顯著變數；另一種是後退法，即開始計算是包含所有變數而

後逐步減少不顯著的變數，其以赤池信息量準則(Akaike information criterion, AIC)為準則，透過選擇最小的 AIC 資訊統計量，來達到刪除或增加變數的目的。故此方法也是努力降低變數的個數，選取最重要的變數，增大模型預測的準確度。所以從這個角度上來看，逐步回歸法也是一種降維的技術。

在統計學中，可以透過為自變數 Xn 與應變數 y 構建回歸方程的方式，找到二者之間的關係，得到自變數中集合中各個自變數對於應變數的影響關係強弱。而回歸方程有許多種，如何選擇合適的回歸模型會是本研究在回歸分析之前先做的工作。

本研究會透過對前人文章中所提及的變數，使用不同的回歸方程進行回歸，而後透過對回歸模型的均方誤差(MSE)，誤差均方根(RMSE)，平均絕對誤差(MAE)，平均絕對百分誤差(MAPE)的檢驗，選擇最適合的回歸模型，然後再對這些自變數進行回歸分析。本文會使用多元線性回歸和逐步回歸進行統計建模和對比分析：

表

在統計回歸建模後，本研究會使用統計最小二乘法 (Ordinary Least Squares, OLS) 對回歸進行診斷，判斷線性回歸模型是否正確。其中使用到了線性、正態性和同方差性作為診斷依據，而獨立性透過所收集的資料中進行驗證。以下介紹個特性的檢驗方式以及本研究的診斷結果：

線性，其在殘差擬合圖(Residuals vs Fitted)中代表著擬合的方程和實際資料點，

其體現依變數與自變數線性特徵，殘差值與預測值沒有任何系統關聯，即除了白噪聲意外模型中應該包含資料中所有的系統方差。

正態性(Normal Q-Q Graph)，當預測變數的值為固定時，依變數也成正態分佈，

即殘差值應當是一個均值為 0 的分佈。其中正態 Q-Q 圖實在正態分佈對應的情況下標準化殘差的概率圖。

同方差性，若滿足不變方差的假設，在尺度位置圖(Scale-Location Graph)中水準線周圍的點應該是隨機分佈，該圖滿足了此假設。殘差與槓桿圖 (Residuals vs

在文檔中城市公共自行車使用量與建成環境的關係分析 (頁 58-61)

第三章 研究方法

第四節 分析方法

一、敘述統計分析

二、多元線性回歸模型

三、逐步回歸模型

第三章研究方法

第四節分析方法