• 沒有找到結果。

階段四:疏散,調度策略總結

第四章 實作分析

4.4 階段四:疏散,調度策略總結

第四章 實作分析

本研究主張應用機器學習聚類分析於單車流量預測與調度。在應用程式的開 發上,本研究採用 R 語言、並使用”RStudio”軟體作為編寫 R 語言程式的整合 開發環境。而機器學習的聚類分析(cluster analysis)則採行三種方法以進行 測試、與比較分析。三種方法分別是:K-平均演算分群法(K-means)、密度分群 法、以及 DBSCAN 分群法(Density-based spatial clustering of applications with noise)。

4.1 階段一:調取並處理數據

其任務為尋找公開的 共用單車流量開放數據,以及用 R 處理,錯誤的、丟 失的、超過範圍的數據。截至 2016.8,上海市預計投放使用的摩拜單車使用數 量達到 223,000 輛左右(Soda Open data, 2018),中國每一輛摩拜單車平均每天 被 5.4 個人騎行 (北京清華同衡規劃設計研究院,2017),可以粗略得出 2016.8 上海市的摩拜單車每個月有約 36,000,000 筆出行記錄。根據上海市城區的經緯 度位置以及每個經緯度間隔 111,000m 的常識,加上城市最適步行距離範圍值為 700m,即格子對角線長為 550m,估計得出經緯度 550m*550m 的格子範圍內單車 的平均分佈量為約 2857 輛(不減去淘汰、折損、返修的車)。若在市率 50%計算,

12:00 借出,12:00 至 18:00 借出,18:00 至 24:00 借出分佈漸漸增多且覆蓋範 圍有些許的增加,範圍上沒有明顯的變化。

圖 4-1 上海市 2016 年 8 月 1 日(禮拜一)00:00 至 24:00 取車點示意圖

圖 4-2 上海市 2016 年 8 月 1 日(禮拜一)00:00 至 06:00 取車點示意圖

圖 4-3 上海市 2016 年 8 月 1 日(禮拜一)06:00 至 12:00 取車點示意圖

圖 4-4 上海市 2016 年 8 月 1 日(禮拜一)12:00 至 18:00 取車點示意圖

圖 4-5 上海市 2016 年 8 月 1 日(禮拜一)18:00 至 24:00 取車點示意圖

如下圖,在禮拜四、五,同樣時間段,於週末的關係,分佈點的數量和範圍 明顯變大了。

圖 4-6 上海市 2016 年 8 月 4.5 日(禮拜四、五)取車點示意圖

圖 4-7 上海市 2016 年 8 月 6.7 日(禮拜六、日)06:00 至 12:00 取車點示意圖 根據下圖對於點位的熱力分析結果,可以更明顯察覺到範圍的擴大。

圖 4-8 上海市 2016 年 8 月 4.5 日(禮拜四、五)00:06 至 00:12 取車點熱力示 意圖

圖 4-9 上海市 2016 年 8 月 6.7 日(禮拜六、日)00:06 至 00:12 取車點熱力示 意圖

4.2 階段二:探究變量對於預測系統的影響

其任務為考量數據精確度對於研究結果的影響。本節通過對紐約市計程車上 客點的視覺化分析,考量對於位於不同尺度下的數據資料,應採取的聚類分析的 方法。

4.2.1 計程車上客點位分析

針對紐約市計程車2015.7.23的上客地點做統計與視覺化,對於計程車,點 位的分佈可以跨越很大的距離,因為計程車在地圖上的移動距離不向單車一樣受 到人力的限制。

4.2.2 單車數據資料精確度

經過對上海開放資料創新應用大賽(Soda Open data, 2018) 2016年8月的 101843筆騎行資料的分析,得出圖示結果:

圖 4-12 上海摩拜單車還車點分佈圖 a

圖 4-13 上海摩拜單車還車點分佈圖 b

圖 4-14 上海摩拜單車還車點分佈圖 c

圖 4-15 上海摩拜單車還車點分佈圖 d

圖 4-16 上海摩拜單車還車密度曲線分佈圖 a

圖 4-17 上海摩拜單車還車密度曲線分佈圖 b

圖 4-18 上海摩拜單車還車密度曲線分佈圖 c

圖 4-19 上海摩拜單車還車密度曲線分佈圖 d

圖 4-20 上海摩拜單車還車密度曲線分佈圖

圖 4-21 上海摩拜單車取車密度曲線分佈圖

圖 4-22 上海楊浦區摩拜單車還車密度曲線分佈圖

圖 4-23 上海楊浦區摩拜單車取車密度曲線分佈圖

圖 4-24 上海五角場摩拜單車還車密度曲線分佈圖

圖 4-25 上海五角場摩拜單車取車密度曲線分佈圖

圖 4-26 上海五角場地鐵站摩拜單車還車密度曲線分佈圖

圖 4-27 上海五角場地鐵站摩拜單車取車密度曲線分佈圖

圖 4-28 上海靜安寺摩拜單車還車密度曲線分佈圖

圖 4-29 上海靜安寺摩拜單車取車密度曲線分佈圖

經緯度方向550m 方格內摩拜單車平均存量約為1428輛。根據數據精確度只 到經緯度千分位,即每100m 有一個點位,放大到550m*550m 方格內有25個點位,

每一個點位上存在很多點的重合。根據上文採用的每個550m*550m 方格內單車平 均存量為1428輛,25點位,每一點位平均存在57.12輛,此時用格子法劃分很難 體現趨勢。

圖 4-30所示,顏色的深淺代表點位上單車輛數密度,越深色的表示密度越 高,此時運用格子法劃分難以區分不同密度的點位元元:

圖 4-30 550m *550m 範圍點位示意圖

在街道小尺度的情形下,本文建議運用密度分群法,根據每個點位上存在的 實際單車量數,來作為分組,如圖 4-31。根據每個點位平均值57輛(對應 550m*550m 方格內總數為平均存量1428輛)的數據,系統會給予合適的分群指標,

比如每個點位上,存有範圍10-30個輛的點為一組,存有範圍30-50個點的分為一 組,存有範圍50-70個點的分為一組等類似的分群方式。同時系統會忽略一些使 得最終分群結果邊緣不連續的點位,來保證分群結果為較為圓滑的曲線。

圖 4-31 根據點位元上存在的點密度分群示意圖

4.3 階段三:分群方法的探究及其實際運用

同的集群,圖 4-32為從1級到7級,圖 4-33為從1級到9級。在計算獎勵時採用分 開計算各自獎勵的方式,最後相加得到最終的獎勵額。

I. 對於還車密度分區

建立獨立獎勵機制(圖 4-32),根據某輛單車取車點所在的取車區域,以 及還車點所在的還車區域:

若取車區域實行取車獎勵,還車區域實行還車獎勵,則把兩項獎勵的和作為

圖 4-32 上海靜安寺 2016.8 還車密度分區

圖 4-33 上海靜安寺 2016.8 取車密度分區

▲Ⅰ對於還車密度分區舉例

11=9.09%,轉換為數字為 2300×9.09%=210輛。每個級數分區的閾值如表4-1:

表 4-1 還車分區各級數區域閾值 3100-2891=209的獎勵額度。第一輛取車的車獲得209/21 =104.5的獎勵額度。

7級區域的還車密度值為1600,低於最低閾值1636,則觸發“還車”獎勵,

則該月的第二天上午6時至12時之間,2級區域上的點位上還車的車獲得總共 1636-1600=36的獎勵額度。第一輛還車的車獲得36/21 =18的獎勵額度。

即對於這輛單車來講,在還車密度分區獲得的獎勵為 A=104.5+18=122.5。

圖 4-34 單車於還車分區獎勵示意圖

12=8.3%,轉換為數字為 2700×8.3%=225輛。每個級數分區的閾值如表4-2:

表 4-2 取車分區各級數區域閾值

取車分區 3150-3000=150的獎勵額度。第一輛取車的車獲得150/21 =75的獎勵額度。

9級區域的還車密度值為1500,低於最低閾值1575,則觸發“取車”獎勵,

4.3.2 應用 DBSCAN 分群法,處理較大的城市尺度,以上海四 環及其內部為例

出於數據完整度的考量,本節對於紐約市計程車上客點位置的資料

(Citibike,2017),分別運用 K-平均演算分群法與 DBSCAN 分群法,進行分群,

通過比較分群的結果,考量兩種分群法的優劣。

圖 4-36 K-平均演算分群法對於紐約計程車上客點位分析

圖 4-37 K-平均演算分群法對於紐約計程車上客點位地圖

圖 4-38 參數設定相同 K-平均演算分群法對於紐約計程車上客點位地圖 圖 4-39是對於同一筆資料,運用 DBSCAN 分群法,取掃描半徑0.5,最少點 數2000做分群,劃分得到8個彩色群組,都滿足掃描範圍內最少點數大於基礎值 的要求,剩餘黑色點未達要求,為噪點。驗證了其兩個優點:(一)由於最少點 數參數,單一連接現象(single-link effect,不同聚類以一點或極幼的線相連 而被當成一個聚類)能有效地被避免。(二)能夠分辨噪點。可見 DBSCAN 分群 法適用於對大尺度、數據分佈較為複雜的交通資料作密度分群。

圖 4-39 DBSCAN 分群法對於紐約計程車上客點位分析

圖 4-40 DBSCAN 分群法對於紐約計程車上客點位地圖

所以處理較大的城市尺度,以上海四環(121.75°E-121.125°E,30.95°

N-31.45°N)為例,本研究採用 DBSCAN 分群法:

根據在中心點位,使用者在尋找到可用單車前,步行距離應以不超過最適步 行距離為限,即取步行半徑為700m 的圓形範圍。

如圖 4-41所示,標識出圓形範圍與550m*550m 格子之間的關係。設定掃描

每個點位上存在的點個數平均值57輛(對應550m*550m 方格內平均存量1428 輛)。以及根據靜安寺2016.8還車分區1級區域的最高閾值3100輛,計算出的此 區域內每個點位上存在點的個數約為3100÷25=124輛。同樣根據同分區11級區域 的最低閾值800輛,計算出的此區域內每個點位上存在點的個數約為800÷25=32 輛。區域內最少點數以平均每個點位32,57,124為基礎計算,對應的值乘上點位 數176,即:

設定最少點數值 a=32×176=5632,且同時176個點位中有88個點位存在點的

個數≥32;結果如圖 4-42。

設定最少點數值 b=57×176=10032,且同時176個點位中有88個點位存在點的

個數≥57;結果如圖 4-43。

設定最少點數值 c=124×176=21824,且同時176個點位中有88個點位存在點

的個數≥124;結果如圖 4-44。

圖 4-42 還車點位,每個點位上有大於 32 個點單位元元面積的密度標示

圖 4-43 還車點位,每個點位上有大於 57 個點單位元元面積的密度標示

圖 4-44 還車點位,每個點位上有大於 124 個點單位元元面積的密度標示

可見在城市尺度上,DBSCAN 分群法能夠讓決策者及時掌控哪些區域出現了 單車囤積的現象,提前安排公司的運輸卡車到達這些區域,及時進行強制調度。

此法用於預防集中式的單車囤積困境,抉擇者可以根據現有運營的單車密度分 佈,設定不同的最少點數值,以此比較單車在不同密度值下呈現的分佈狀態。以 此做參考,來決定下一階段新投入運營單車的數量和投放地點。

4.4 階段四:疏散,調度策略總結

街道尺度實施使用者獎勵機制,根據還車密度分區、取車密度分區,各自建 立獨立的獎勵系統,在計算獎勵時採用分開計算各自獎勵的方式,最終相加得到 最終的獎勵額度。決策者根據某一時段內所有的數據知曉獎勵額度的總和,計算 每一輛單車得到總獎勵的百分比數額。再根據節省下的原本人力運輸調度的費 用,得出每輛單車得到的具體獎勵元數。

城市尺度由決策者調度,通過隨時設定最少點數,觀察區域性囤積的現象,

做出及時的卡車運輸調度策略和新的運營、投放單車策略。

相關文件