• 沒有找到結果。

自建儲存環境與混合式方案下之雲端儲存成本分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "自建儲存環境與混合式方案下之雲端儲存成本分析 - 政大學術集成"

Copied!
34
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊管理學研究所 碩士學位論文. 自建儲存環境與混合式方案下之雲端儲存成本分析 Cost Analysis of Cloud Storage under In-House and Hybrid Options. 指導教授:莊皓鈞 博士 周彥君 博士 研究生:陳祐嘉 撰. 中 華 民 國 一零六年 七月. 1.

(2) 摘要 雲端運算的應用在現今已經被許多企業所採納,而其中的雲端儲存服務也是近期 企業考量的重點之一,現今雲端儲存相關文獻所探討的方案大都圍繞在全部自建儲存 環境,或全部採用租賃第三方雲端儲存服務這兩種方案去做成本的比較與分析,但考 量到實際營運上有些資料仍需要留在企業內部管理,企業較不可能採用將資料完全搬 上雲端的方式,因此本研究著重在分析全部自建或混合這兩種方案,考慮許多儲存成 本相關的隨機因子後,建立一隨機成本模型,並將利用 R 語言撰寫程式進行模擬分 析,研究結果期望能提供企業做雲端儲存相關決策時參考。 關鍵詞:雲端運算、雲端儲存、混合、自建、模擬分析. Abstract Cloud computing is adopted by many enterprises nowadays, and cloud storage is also one of the most important topics pertaining to cloud services. Almost all prior studies on enterprise migration to cloud storage focus on full in-house (make) versus full outsourcing (buy) options. However, the full outsourcing is not realistic, as firms typically have some data that are not feasible for cloud storage and need to stay in-house. In this paper, we incorporate relevant cost factors of in-house and cloud storage into a hybrid stochastic cost model of data storage. The hybrid model subsumes both full in-house and full outsourcing options. We will perform a comprehensive simulation analysis using R, in order to identify critical cost factors and understand their effects on cost performance of different storage options. Our modeling effort aims to facilitate managerial decisions regarding cloud storage. Keywords: cloud computing, cloud storage, hybrid, in-house, simulation analysis.. 2.

(3) 目. 次. 第一章 緒論................................................................................................................ 6 第二章 文獻探討........................................................................................................ 8 第三章 模型建構...................................................................................................... 11 第四章 實驗設計與結果分析.................................................................................. 17 第一節 實驗設計 .......................................................................................................... 17 第二節. 結果分析 .......................................................................................................... 19. 第五章 結論與未來發展.......................................................................................... 28 參考文獻...................................................................................................................... 32. 3.

(4) 表次 表 1 Dropbox, Carbonite 與 Amazon 的固定與邊際成本 ......................................... 14 表 2 參數總表............................................................................................................. 15 表 3 實驗設計表......................................................................................................... 18 表 4 ANOVA Table ....................................................................................................... 19 表 5 關鍵參數交互關係趨勢表 ..................................................................................... 29 表 6 定價結構與參數交互關係趨勢表 .......................................................................... 30. 4.

(5) 圖次 圖 1 主作用................................................................................................................. 22 圖 2 ϕ與其他參數的交互作用 ..................................................................................... 23 圖 3 P0 與μ對於其他參數的交互作用 ........................................................................... 24 圖 4 T 與其他參數的交互作用 ...................................................................................... 25 圖 5 f and v 與其他參數的交互作用 .............................................................................. 26. 5.

(6) 第一章. 緒論. 「雲端運算」近年來廣泛地被企業所使用,利用其隨需、隨選的特性,可以有利 於既有企業開發新的服務,也能幫助新創的小企業有較低的門檻可以快速上線。而在 雲端運算的服務中,美國國家標準與技術研究院(NIST)提出三種主要的服務模式, 分別是 IaaS (Infrastructure as a service)、PaaS(Platform as a service)及 SaaS (Software as a service),而本篇論文探討的是在於底層 IaaS 中的「雲端儲存」服務。 「雲端儲存」是雲端運算架構中的一部分,屬於底層 IaaS 的功能,近年來也廣泛 被企業所運用,例如之前 Mazda 使用雲端儲存來備份其資料,相較於傳統的備份方法 減少了 95%的裝置存放成本,也為其工程人員節省了 20%的時間,使資料保存更加完 整,取用也更加快速。又如金石堂網路書店在因應「賣衝」時採用的對策,所謂「賣 衝」即因為一些熱門書的出版,帶來瞬間倍增的流量和作業負擔,而這樣的現象卻不 是長期存在的,因此其採用雲端方案讓賣衝現象出現時能快速回應,同時也有在賣衝 結束時能回到原本規模的彈性。因應這樣雲端採用的趨勢,雲端儲存成本的相關研究 也成為近年來相當重要的主題。 目前市場上提供雲端儲存服務的公司有 Dropbox、Amazon、Carbonite、Google 等 眾多廠商,其提供服務的方式大都分為個人版與企業版兩種,兩種版本中又能根據使 用者自身需求去做擴充,隨著需求提升,雲端儲存服務市場將隨之擴大。在其未來發 展方面,魏伊伶(2016)指出根據 IDC 及 IBM UK 的研究顯示,企業未來五年將面臨 IT 系統老舊汰換問題,又目前三分之二以上企業在處理大數據問題時已逐漸從批量資 料處理走向 Real-time 資料處理,故企業的儲存設備有走向「儲存系統快速擴充」、「高 彈性儲存架構」以及「高儲存/高傳輸率」的三大趨勢。 縱觀現有的雲端儲存成本分析,大都圍繞著兩種方案,一種為資料全部上雲端, 另一種為全部留在自建的儲存環境中。但全部上雲端的做法不太實際,因為公司內部 總有一些必須留在內部保管,或無法輕易做轉移的資料,所以較符合實際的做法應為 一部分的資料上雲,而另一部分則留在內部,或全部採用自建的方式,而這種混合式 6.

(7) 的架構在成本上的表現,本研究透過一個指標,即「混合方案總成本相對於自建方案 總成本的比例」來分析混合與自建在不同資料量下何種方案較符合成本效益。會採用 這樣的指標原因在於,目前現有的一些公司本身已經自建了自有的儲存環境,但卻不 知道如果將部分比例的資料搬上雲端,是否有助於成本的節省。因此以混合成本與現 有自建成本的比較,較能夠看出其差異,也期望透過分析這樣的指標,進一步協助公 司做出是否採用混合方案的評斷。 雲端儲存成本的計算方面,在自建時要考量的成本包含儲存容量的需求與磁碟購 買的價錢、有可能淘汰掉的磁碟成本與折舊、自行購買磁碟的管理與能源費用、存放 磁碟的場地費用等;若選擇外部的雲端儲存,則需考慮其基本費用、每單位的資料儲 存與傳輸成本等。其中會影響儲存成本的因素很多,包含起始的容量需求、每年預估 的成長率、多少比例的混合方案、使用時間的長短、磁碟損壞的機率,以及不同提供 雲端儲存服務的公司定價等。綜合以上各點,可以知道雲端儲存的分析是具有一定複 雜度的問題。 因此在本篇論文中,我們建立一個混合租賃雲端儲存與自建儲存的成本模型,之 後透過 R 語言來進行模型的實作與模擬分析,且採用全因子實驗設計的方式來檢視不 同因素,例如:儲存需求、磁碟的淘汰率、不同資料比例等對成本指標的影響,以及 分析在不同情境之下混合與全自建方案的成本表現,期望能做為企業考量儲存方案時 的依據。. 7.

(8) 第二章. 文獻探討. 近年來不乏有關於雲端運算的探討與研究,Marston et al. (2011)詳述了雲端運算的 特質及優劣勢,雲端運算帶來較關鍵的優勢在於可以降低小公司進入市場的成本、提 供即時的取用,讓企業可以更快速地貼近市場,或減低企業合作的前置成本,降低 IT 創新障礙,或是使公司更容易根據客戶需求擴展服務等,但同時也存在著一些威脅與 困境,例如對於放上雲端的資料失去了實體的掌控能力、第三方雲端供應商無法提供 品質與價格上的保障等等。 另外 Marston et al. (2011)也提到雲端運算在其組成方面,強調的不只是第三方供 應的服務,另外還有其他七個重要的面向。包括:(1)資源應用(Resource utilization)、(2)虛擬化實體資源(Virtualized physical resources)、(3)抽象式建構 (Architecture abstraction)、(4)資源的動態可擴展性(Dynamic scalability of resources)、(5)資源的彈性和自動配置(Elastic and automated self-provisioning of resources)、(6)無所不在的(Ubiquity)、(7)具有營運費用模型(The operational expense model)。在最後 Marston et al. (2011)也提出了目前有關雲端研究的相關議題主要有四 大類,分別是雲端運算的成本效益研究、雲端運算的策略議題、雲端運算與資安政策 及技術的採用與實施等,而本研究主要和其中的雲端運算的成本效益研究有關。 關於採用雲端運算方案綜合成本的考量,Tak et al.(2011)針對不同的情境來做討 論,其情境包含 IaaS 與 SaaS 的採用,並綜合水平分割及垂直分割兩種模式,組合出 的五種情境。其中垂直分割是把應用軟體分成兩個子集,一部分放在內部,另一部分 則搬上雲端,水平分割是將部分或整個應用程式依照適當的工作量分配機制複製上雲 端。另外考量雲端儲存、軟體授權及處理效能等面向,來討論五種情境下的優劣。其 結論為完全遷移到現今的雲端服務只對小企業有吸引力,並且在垂直分割的情況下, 會因為資料傳輸的成本過大而使費用居高不下,而水平分割較適用於自建儲存環境的 方案,或應用於滿足某些雲端部門的特定需求。 如果將範圍縮小至雲端儲存方案上,Walker et al. (2010)嘗試建立 buy-or-lease 的決 8.

(9) 策模型來討論單一使用者、中型企業與大型企業適合甚麼樣的方案,透過自建儲存環 境與租賃第三方雲端儲存空間方案的 Net Present Value (NPV)之差來進行比較,其最後 的結論在單一使用者與大型企業的部分皆是在一定期間年數內適合採用租賃方案,之 後則以自建方案較優,但單一使用者的期間年數相對於大型企業較短,而中型企業則 是不管時間長度為何,皆採用租賃方案較佳。 同樣是將雲端區分為私有及公有雲來分析其成本的尚有 Laatikainen et al. (2014), 他們首先定義了公有與私有雲的成本差,再以不同的儲存需求成長模型與不同的採購 間隔去看兩者的成本關係,並且發現如果以儲存需求的成長模型來看,成長較快的情 況較適合採用公有雲,反之如果成長較慢則以私有雲較優,又從採購間隔去看,如果 對儲存空間的需求是明確且穩定的,則以私有雲的方案較佳,若該公司正在開發一個 新的服務,對於自己的需求尚不明確,則可以採用公有雲的方案。 在實際成本的計算方面, Naldi and Mastroeni (2014)提供了大部分雲端儲存方案 的可能產生成本與其計算方式,其中提到的成本有磁碟的購買、能源與人力、磁碟汰 換所得的殘值、儲存空間的租賃費用、資料傳輸及管理費用,及磁碟存放場地費用 等,是相關研究中考慮面向相當完整的論文。透過以上成本的詳細定義,作者進一步 分析其 DNPV(Difference between the NPV),所謂 DNPV 即全自建方案與全租賃方案的 NPV 之差,藉由觀察該值可以得出何種方案較具有成本優勢,其主要結論為起始所需 的儲存空間愈大,愈有利於自建方案,再由上述三項指標來看可能錯判的機率與損失 為多少。但其中不免有一些成本,如租借費用以及人事成本的定義方式太過簡化。相 較於前篇的租賃費用訂定方式,另一篇論文的定價方式更貼近現實,Naldi and Mastroeni (2013)研究了市場上較具代表性的雲端儲存提供廠商,分析其計價模式,再 將每家的計價模式換算為「固定成本加上每單位儲存量的邊際成本乘上儲存需求量」, 以此代表其總成本,並計算出各家廠商的固定成本與單位邊際成本各為多少。 雲端儲存成本及該領域的相關研究是近期的熱門主題之一,近年來許多研究大部 分都圍繞在自建儲存環境與租賃第三方雲端儲存服務兩種方案的比較,或單就租賃方 案研究不同廠商的定價與其成本,而這些研究的目的都是為了找到最便宜有效的儲存 9.

(10) 方案。不論研究的情境與定價的方案為何,許多研究都採用 NPV 的分析來看自建與租 賃的方案哪一項對於公司最有利,而研究得到的結論大都傾向於時間短採用租賃方 案,時間拉長則採用自建方案的方式。 本研究和 Naldi and Mastroeni (2013 2014)兩者相關度較高,不同的地方主要在於 本研究合併了 Naldi 全自建儲存環境與全租賃第三方雲端服務這兩種成本模型,定出 混合式的儲存成本模型,並由不同的資料上雲比例(∅)來看混合與自建方案之成本差 異,而此成本模型仍然保留了全部上雲的可能性,另外後續將針對模型參數進行全面 的敏感度分析,來確認有哪些關鍵因素會影響到總成本比例及方案選擇。. 10.

(11) 第三章 模型建構 在成本模型建立之前,首先我們必須先確立企業每期的儲存需求量、磁碟的儲存 量及其成長,以下的成本皆是以美金($)計價。隨著時間的推移,大數據的發展日漸興 盛,企業對於資料儲存空間的需求也日益增長,根據 Naldi et al. (2014)提及在連續時 間內對企業資料儲存量的需求為一指數的成長趨勢。 𝑀𝑡 = 𝑀0 (1 + 𝑔𝑚 )𝑡. (1). 其中 t 為現在時間開始後的第 t 期,𝑀𝑡 為每期所需的儲存空間,𝑀0 為起始所需的 儲存空間,其單位為 GB,𝑔𝑚 為儲存需求成長的指數參數。 除了儲存的需求量增加之外,磁碟的儲存空間也因為技術進步而增加,其成長趨 勢亦為指數成長。 Ω𝑡 = Ω0 (1 + 𝑔𝑐 )𝑡. (2). 其中Ω𝑡 為每期每顆磁碟的儲存量,Ω0 為起始的磁碟儲存空間,其單位為 GB,𝑔𝑐 為磁碟儲存量成長的指數參數。 在確立需求之後,接下來討論儲存成本的部分,首先會先分別介紹「自建儲存環 境」與「租賃第三方雲端儲存服務」時所產生的成本,與兩種方案同時存在的管理成 本,最後再介紹總成本模型與本篇分析用的指標,因為過去相關研究皆是以一年為一 期的方式進行,故本篇研究亦採用此方式來做以下討論。. 一、 自建儲存環境 在自建儲存環境的部分我們參考 Naldi et al.(2014)與 Walker et al.(2010)列出以下幾 項主要成本,分別為磁碟購買成本、能源成本、磁碟放置空間成本與殘值。 在磁碟購買的部分,我們主要以每顆磁碟的價格乘上每期需求的磁碟數來計算該 期的磁碟購買成本。首先在磁碟價格的估計部分,我們用 Naldi et al.(2011)預估未來價 格可以以幾何布朗運動的隨機過程來解釋,並計算出其期望值為 𝐸[𝑃𝑡 ] = 𝑃0 𝑒 𝜇𝑡. (3). 其中𝑃𝑡 為第 t 期每顆磁碟的價錢,t 為現在時間開始後的第 t 期,𝑃0 為磁碟的起始 11.

(12) 價格,𝜇為指數參數,該期望值又與 Walker et al.(2010)利用觀察連續五年每週 SATA 硬 碟的價格,所估計出的迴歸模型相符合,又其推算當𝑃0 = 0.3及𝜇 = −0.438的時候, 最能代表磁碟價格。 有了磁碟價格之後,另外需要決定的是該期的磁碟需求量,在此令𝐷𝑡 為每期初自 有的磁碟數,而每期的磁碟需求量(∆𝐷𝑡 )為該期需求儲存量的需求(𝑀𝑡 )減去原本所有的 儲存空間(𝑀𝑡−1),算出額外需求的量,再除以該期的磁碟儲存大小(Ω𝑡 )。 然而這樣的計算忽略了磁碟本身有可能損壞的狀況,因此在現有儲存量的部分, 額外估算了每顆磁碟壞掉的可能。其估算方法為,假設使用時間經過一年以上的磁 碟,壞掉的機率為一年以內磁碟的 k 倍,故將磁碟分為兩組,一組使用時間為一年以 內(𝑥𝑦 ),另一組使用時間為一年以上(𝑥𝑜 ),並給定𝑥𝑦 為𝑢𝑛𝑖𝑓𝑜𝑟𝑚(0, 𝑏)、𝑥𝑜 為𝑢𝑛𝑖𝑓𝑜𝑟𝑚(0, 𝑘𝑏),其代表的意義為兩組磁碟上限為 b 的 uniform 隨機亂數,並且使用 時間為一年以上的隨機亂數範圍為一年以內之 k 倍,給定之後再將兩組磁碟依其被賦 予的亂數降冪排序。 另外由一個 Annual Replacement Rate(ARR)參數代表每期被汰換掉的磁碟比例,利 用 binomial 分配算出每期磁碟的淘汰數量𝑥𝑡 (如公式(4)所列),再從前段提到的 uniform 亂數排序完成的磁碟中去除掉前 x 顆磁碟後,將剩下的磁碟容量相加後得到該期結束 後所有的儲存空間。 𝑥𝑡 ~𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝐷𝑡 , 𝐴𝑅𝑅). (4). 故假設每期企業額外的記憶體需求為𝐵𝑡 ,又𝐹𝑡 為每期企業淘汰掉的磁碟數所換算 出的記憶體容量,則𝐵𝑡 的計算方式如下: 𝐵𝑡 = 𝑀𝑡 − 𝑀𝑡−1 + 𝐹𝑡. (5). 因此,每期所要購入的磁碟數(∆𝐷𝑡 )為: 𝐵. ∆𝐷𝑡 = ⌈Ω𝑡 ⌉ 𝑡. (6). 綜合以上考量,可得磁碟購入的總成本為: 𝐶𝑑𝑖𝑠𝑘 (𝑡) = ∆𝐷𝑡 × 𝑃𝑡 12. (7).

(13) 討論完磁碟購買成本,接下來討論的是能源成本的部分,能源成本η主要為每期每 顆磁碟運作所需的電力總成本,其計算方式為每單位電力所需的成本δ($/kWh)乘上每 顆磁碟每小時所需的電力 E(kWh)再乘以一期的時間。 𝜂 = 365 × 24 × δ × E. (8). 因此,每期磁碟的能源成本如下: 𝐶𝑝𝑜𝑤𝑒𝑟 (𝑡) = 𝜂 × (𝐷𝑡 + ∆𝐷𝑡 ). (9). 自建的磁碟需另外考量磁碟的存放空間,因需要額外的放置空間所以有些公司選 擇另外租一個地方來擺放,而這些場地費也成了自建的成本,然而即使磁碟自建需要 花費額外的存放成本,汰換掉的磁碟可以透過售予二手市場獲得收入,即所謂的殘 值,本篇探討時,考慮到兩者的成本可能抵銷,故不列於最終的成本模型中。 由上述幾項成本的計算,可得最終自建儲存環境的總成本為: 𝐶𝑏𝑢𝑦 (𝑡) = 𝐶𝑝𝑜𝑤𝑒𝑟 (𝑡) + 𝐶𝑑𝑖𝑠𝑘 (𝑡). (10). 二、 租賃第三方雲端儲存服務 在租賃的部分我們參考了 Naldi et al.(2013)的做法,把成本分成固定成本與邊際成 本兩部分來計算一個月的成本,若將其改為以一年為一期來看,其計算方式則為: 𝐶𝑙𝑒𝑎𝑠𝑖𝑛𝑔 (𝑡) = (𝑓 + 𝑣𝑀𝑡 ) × 12. (11). 其中𝑓為選擇租賃的固定成本,𝑣為每單位儲存量(GB)的邊際成本,𝑀𝑡 為儲存空間 的需求量(GB)。Naldi 計算了幾家較具代表性的雲端儲存空間租賃公司的固定成本與邊 際成本,在本篇的模擬中我們挑選其中三家較具代表性的公司,分別為 Dropbox, Carbonite 與 Amazon,其中 Dropbox 代表了高固定成本與低邊際成本,Carbonite 代表 中固定與邊際成本,Amazon 則代表低固定成本與高邊際成本,其個別的固定與邊際 成本如表 1:. 13.

(14) 表 1. Dropbox, Carbonite 與 Amazon 的固定與邊際成本 Pricing Plan. 固定成本(𝑓). 邊際成本(𝑣). Dropbox. 61.6837. 0.02509. Carbonite. 19.799. 0.0494. Amazon. 5.2104. 0.06773. 管理成本 無論是自建或混合,皆存在著管理儲存空間的人力成本,但自建所需的人力明顯 高於混合的人力需求,本篇因為該管理成本難以公平的量化,故並未將其列入計算, 而管理成本的不列入將造成自建成本的低估,因此模型的成本假設上將較有利於自 建,倘若最終的模擬分析結果仍偏向於混合的話,便有高度的信心認為該情境下混合 為較佳的選擇方案。. 總成本 在本篇論文的討論中,一般公司會採用的雲端儲存方案較多數為自建儲存環境與 租賃並用或全部自建的模式,因為企業內部可能有某些由於轉換太過複雜,或考慮到 儲存的安全性,而不採用外部租賃方案儲存的資料,所以不太可能採用全部租賃第三 方雲端儲存服務的方案,故以下的總成本模型將以自建與租賃兩種方案去做合併,並 定義𝜙為使用租賃雲端儲存服務的資料比例,而剩下的部分,即1 − 𝜙則採用自建的方 式。 綜合以上各項成本,我們可以得出總成本的計算如下方算式: 𝐶𝑡 = 𝐶𝑏𝑢𝑦 (𝑡) + 𝐶𝑙𝑒𝑎𝑠𝑖𝑛𝑔 (𝑡) = (𝑓 + 𝑣𝑀𝑡 𝜙) × 12 + ∆𝐷𝑡 𝑃𝑡 + 𝜂 × (𝐷𝑡 + ∆𝐷𝑡 ). (12). 又可改寫成: 𝐶𝑡 = (𝑓 + 𝑣𝑀𝑡 𝜙) × 12 + ⌈ ⌈. (𝑀𝑡 −𝑀𝑡−1 )(1−𝜙)+𝐹𝑡 Ω𝑡. (𝑀𝑡 −𝑀𝑡−1 )(1−𝜙)+𝐹𝑡 Ω𝑡. ⌉ × 𝑃𝑡 + 𝜂 × (𝐷0 + ∑𝑡−1 𝑛=1 ⌈. ⌉). (𝑀𝑛 −𝑀𝑛−1 )(1−𝜙)+𝐹𝑛 Ω𝑛. ⌉+. (13). 總成本𝐶𝑡 為租賃方案成本與自建方案成本的總和,其中以𝑀𝑡 𝜙代表該期使用租賃 14.

(15) 方案儲存的資料量,𝑀𝑡 (1 − 𝜙)為使用自建方案儲存的資料量,並且會體現在∆𝐷𝑡 及𝐷𝑡 的計算中,如(13)中所示。. 三、 指標 本章採用的指標 r 是以混合方案(𝜙 > 0)的成本除以全部留在內部儲存方案(𝜙 = 0) 的成本,來進行分析。 ∑𝑇. 𝐶 (𝜙>0). 𝑡 𝑟 = ∑𝑡=1 ,T 為欲分析之期間長度 𝑇 𝐶 (𝜙=0) 𝑡=1 𝑡. (14). 會採用這樣的指標主要是希望能看出不同情境中兩種方案的成本比較,如果 r 小 於 1 且越小則代表混合的方案能省下的成本越多,反之則越少,又因為上面所提到的 管理成本問題,所以該指標的分母∑𝑇𝑡=1 𝐶𝑡 (∅ = 0)會被低估,故指標若指出企業適合使 用混合方案,則有較高的可信度說明該方案應被採用。 本模型參數總表如下: 表 2. 參數總表 參數. 代表意義. 𝐶𝑡. 為第 t 期的總成本($). 𝑓. 租賃方案的固定成本($). 𝑣. 租賃方案的邊際成本($). 𝜙. 採用租賃方案儲存的資料比例,故採用自建方案的資料比例為1 − 𝜙. 𝐷0. 為第一次購入磁碟的數量. ∆𝐷𝑡. 為第 t 期購入的磁碟數量. 𝐷𝑡. 為第 t 期初所擁有的磁碟數量. 𝑃𝑡. 第 t 期每顆磁碟的價錢($). 𝑃0. 磁碟的起始價格($). 𝜇. 磁碟價格模擬的指數參數. 𝜂. 每期每顆磁碟運作所需的電力總成本($). 𝛿. 每單位電力所需的成本($/kWh) 15.

(16) 𝐸. 每顆磁碟每小時所需的電力(kWh). 𝑀𝑡. 每期所需的儲存空間(GB). 𝑀0. 起始所需的儲存空間(GB). 𝑔𝑚. 儲存需求量成長的指數參數. 𝛺𝑡. 每期每顆磁碟的儲存量(GB). 𝛺0. 起始的磁碟儲存空間(GB). 𝑔𝑐. 磁碟儲存空間成長的指數參數. 𝐴𝑅𝑅. 每期每顆磁碟的汰換率. 𝑘. 使用一年以上的磁碟與一年以內的磁碟損壞比例. 𝑏. uniform 隨機亂數之上限. 𝑥𝑦. 使用時間為一年以內之磁碟. 𝑥𝑜. 使用時間為一年以上之磁碟. 𝑥𝑡. 每期磁碟的淘汰數量,為一 binomial 隨機變數. 𝐵𝑡. 每期企業額外的儲存需求量. 𝐹𝑡. 每期企業淘汰掉的磁碟數所換算出的儲存容量. T. 欲分析之期間長度. 16.

(17) 第四章. 實驗設計與結果分析 第一節 實驗設計. 本研究的目標在於找出不同情境下影響雲端儲存成本的關鍵因素,下階段將透過 分析指標 r 來看混合式的儲存方案相較於自建方案能帶來多少成本的節省,期望能提 供企業做為是否採用雲端儲存方案的參考依據。 在研究中我們建立一個成本模型來分析不同資料比例上雲的情況下,混合與自建 儲存方案的成本分別為多少?其中混合的方案,則以資料上雲的比例來計算,租賃雲 儲存服務與自建儲存環境的混合總成本。在租賃的部分我們考慮了三家雲端儲存服務 供應商 Dropbox, Carbonite 與 Amazon,並以固定成本加上邊際成本乘上需求量的方式 來代表每個月的成本,而這三家供應商分別代表三種不同的定價結構,Dropbox 代表 的是高固定成本與低邊際成本、Carbonite 代表的是中等的固定成本及邊際成本,而 Amazon 代表的是低固定成本與高邊際成本。在自建儲存環境的部分我們考量了每年 的儲存需求量,並且根據每年的磁碟儲存量,輔以隨機的舊磁碟淘汰機制來算出每年 的磁碟需求量,接著進一步計算每年購買磁碟的成本,在原有磁碟的維護上面,我們 考量了其電力消耗、磁碟存放的空間成本及淘汰掉的磁碟產生的殘值等,不論運用的 是何種方案,在管理成本上我們也予以適當的考量以更貼近現實的情況。 在實驗設計中我們將採用全因子的模擬分析,根據模型列舉出可能的關鍵因子。 包含租賃方案的固定成本與邊際成本(f and v)、採用租賃方案儲存的資料比例(𝜙)、磁 碟的起始價格(𝑃0 )、磁碟價格模擬的指數參數(𝜇)、每期每顆磁碟運作所需的電力總成 本(𝜂)、起始所需的儲存空間(𝑀0 )、儲存需求量成長的指數參數(𝑔𝑚 )、起始的磁碟儲存 空間(𝛺0 )、磁碟儲存空間成長的指數參數(𝑔𝑐 )、每期每顆磁碟的汰換率(ARR)、使用一 年以上的磁碟與一年以內的磁碟損壞比例(k)與時間長度(T)等,共 12 項。其中雲端服 務定價(固定成本與邊際成本 f and v)及採用租賃方案儲存的資料比例(𝜙)兩個因子分成 三個等級,分別為低、中、高,剩下的 10 項分為兩個等級,分別為低、高,再依照列 舉的因素與級別去組合出32 × 210 共 9216 種不同的情境,每個情境我們會利用 R 去重 17.

(18) 複模擬來計算指標 r,並取其平均數、四分位數及變異數等統計相關指標來進行迴歸 分析,進一步得知因子之間的交互作用與辨識出哪些因子為影響自建與混合成本比例 的關鍵因子。 實驗設計表如下: 表 3. 實驗設計表 Levels Base. Low. High. Carbonite. Dropbox. Amazon. (Base). (High f Low v). (Low f High v). f = 19.799. f = 61.6837. f = 5.2104. v = 0.0494. v = 0.02509. v = 0.06773. 0.5. 0.2. 0.8. Factors. f and v. 𝜙. Levels Low. High. 𝑃0. 0.1. 0.5. 𝜇. -0.04. -0.02. 𝜂. 2. 5. 𝑀0. 25. 50. 𝑔𝑚. 0.6. 0.9. 𝛺0. 2. 8. 𝑔𝑐. 0.2. 0.5. 𝐴𝑅𝑅. 0.01. 0.05. 𝑘. 2. 6. T. 5. 15. Factors. 18.

(19) 綜合以上,我們期望透過隨機成本模型建立和完整的實驗設計,並利用 R 語言撰 寫模擬程式對模型參數進行全面的敏感度分析,來確認有哪些參數會是影響總成本及 比例的關鍵因素。相較於文獻中考量「全部自建儲存環境」與「全部採用租賃第三方 儲存服務」的研究,本研究更實際且全面地考慮自建與混合的方案,相信對未來企業 是否採用雲端方案而言,會是其中一種有力的參考依據。. 第二節 結果分析 針對上述 9216 種情境,我們利用 R 個別模擬 500 次後,先取指標 r 的平均數、四 分位數及變異數來看,發現過程中各情境模擬的結果平均數及四分位數都很相似,且 變異不大,故之後的分析皆以 r 指標 500 次模擬後的平均(𝑟̅ )進行,考量到所有的交互 作用,ANOVA 表中總共有 12 個主作用與 66 個交互作用,而下表只挑 P-value 小於 0.5 的顯示。 根據前述的實驗設計表,模擬後得 ANOVA 表如下: 表 4. ANOVA Table Source. Nparm. DF. Sum of Squares. F Ratio. P-value. 𝜙. 1. 1. 280.61310. 14093.93. <.0001*. 𝑃0. 1. 1. 106.29783. 5338.859. <.0001*. μ. 1. 1. 129.63271. 6510.865. <.0001*. T. 1. 1. 99.30959. 4987.871. <.0001*. η. 1. 1. 0.42295. 21.2430. <.0001*. 𝑀0. 1. 1. 1.95906. 98.3947. <.0001*. 𝑔𝑚. 1. 1. 0.03528. 1.7719. 0.1832. 𝛺0. 1. 1. 2.05322. 103.1238. <.0001*. 𝑔𝑐. 1. 1. 3.11270. 156.3368. <.0001*. ARR. 1. 1. 0.06436. 3.2326. 0.0722. 19.

(20) Source. Nparm. DF. k. 1. 1. f and v. 2. f and v*𝜙. Sum of. F Ratio. P-value. 1.0117e-5. 0.0005. 0.9820. 2. 3.87682. 97.3576. <.0001*. 2. 2. 5.25981. 132.0883. <.0001***. f and v*𝑃0. 2. 2. 1.45875. 36.6332. <.0001***. f and v*μ. 2. 2. 6.31118. 158.4909. <.0001***. f and v*𝑀0. 2. 2. 0.88243. 22.1601. <.0001***. f and v*𝑔𝑚. 2. 2. 4.18490. 105.0944. <.0001***. f and v*𝛺0. 2. 2. 0.06203. 1.5577. 0.2107. f and v*𝑔𝑐. 2. 2. 0.13904. 3.4918. 0.0305. f and v*T. 2. 2. 30.09557. 755.7821. <.0001***. 𝜙*𝑃0. 1. 1. 15.64491. 785.7732. <.0001***. 𝜙*μ. 1. 1. 24.46592. 1228.812. <.0001***. 𝜙*η. 1. 1. 0.07927. 3.9816. 0.0460. 𝜙*𝑔𝑚. 1. 1. 0.73568. 36.9501. <.0001***. 𝜙*𝛺0. 1. 1. 0.41146. 20.6656. <.0001***. 𝜙*𝑔𝑐. 1. 1. 0.57917. 29.0890. <.0001***. 𝜙*T. 1. 1. 30.92348. 1553.146. <.0001***. 𝑃0 *μ. 1. 1. 50.55855. 2539.327. <.0001***. 𝑃0 *η. 1. 1. 0.32539. 16.3429. <.0001***. 𝑃0 *𝑀0. 1. 1. 0.46911. 23.5611. <.0001***. 𝑃0 *𝑔𝑚. 1. 1. 0.16379. 8.2266. 0.0041**. 𝑃0 *𝛺0. 1. 1. 0.54804. 27.5254. <.0001*. 𝑃0 *𝑔𝑐. 1. 1. 1.18916. 59.7263. <.0001*. 𝑃0 *ARR. 1. 1. 0.02010. 1.0094. 0.3151. Squares. 20.

(21) Source. Nparm. DF. 𝑃0 *T. 1. 1. μ*η. 1. μ*𝑀0. Sum of. F Ratio. P-value. 42.79562. 2149.431. <.0001*. 1. 0.37151. 18.6590. <.0001*. 1. 1. 0.18366. 9.2244. 0.0024**. μ*𝑔𝑚. 1. 1. 2.25963. 113.4909. <.0001***. μ*𝛺0. 1. 1. 0.70482. 35.3997. <.0001***. μ*𝑔𝑐. 1. 1. 1.36276. 68.4450. <.0001***. μ*ARR. 1. 1. 0.02310. 1.1602. 0.2814. μ*T. 1. 1. 96.60760. 4852.163. <.0001***. η*𝛺0. 1. 1. 0.07171. 3.6018. 0.0577. η*𝑔𝑐. 1. 1. 0.14705. 7.3856. 0.0066*. η*T. 1. 1. 0.33562. 16.8569. <.0001***. 𝑀0 *𝑔𝑚. 1. 1. 0.22715. 11.4089. 0.0007**. 𝑀0 *𝛺0. 1. 1. 0.03137. 1.5757. 0.2094. 𝑀0 *𝑔𝑐. 1. 1. 0.01520. 0.7636. 0.3822. 𝑀0 *T. 1. 1. 0.39451. 19.8143. <.0001*. 𝑔𝑚 *𝛺0. 1. 1. 0.01554. 0.7804. 0.3770. 𝑔𝑚 *T. 1. 1. 4.46785. 224.3998. <.0001*. 𝛺0 *𝑔𝑐. 1. 1. 0.11533. 5.7925. 0.0161. 𝛺0 *T. 1. 1. 0.33206. 16.6779. <.0001*. 𝑔𝑐 *T. 1. 1. 1.24046. 62.3025. <.0001*. ARR*T. 1. 1. 0.02426. 1.2184. 0.2697. *:0.005. Squares. **:0.001 ***:<.0001. 21.

(22) 我們進一步將 9216 種情境的平均 r 以迴歸加以分析,發現在只有主作用的情況下 RSquare 為 0.55,在考慮了交互作用後的 RSquare 為 0.84,代表考量交互作用之後該 迴歸能解釋𝑟̅ 84%的變異,其中影響較顯著(P-value <0.0001)的有 10 種參數。但考量交 互作用後所繪製出的交互作用圖中,有 6 種參數圖的線呈現平行或甚至重疊的狀況, 即代表趨勢一致。而在交互作用的討論上,我們主要以交互作用之線斜率不同者來做 進一步探討,因此 10 種中只取 4 種值得討論的參數分別為資料上雲比例𝜙(F = 52555.36, p < .0001)、磁碟起始價格𝑃0 (F = 8645.886, p < .0001)、磁碟價格變動的指數 參數𝜇(F = 11045.45, p < .0001)及時間 T(F = p<.0001, p < .0001)等四項,以下將先探討 各參數的主作用,再針對較有顯著影響的參數個別做交互作用的討論。. 一、 主作用. 圖 1. 主作用 從圖 1 中可以看出 11 項參數對於平均成本指標(𝑟̅ )的影響為何,圖中黑色水平線 代表的是 r 等於 1 的情況,在水平線以下則偏向採用混合方案,反之則偏向採用自建 的儲存方案。 首先在其他參數皆不變的狀況下,可以看到資料上雲比例(𝜙)越高的狀況下指標 r 會越小,即較偏向於採用混合式的儲存方案,磁碟的起始價格(𝑃0 )與磁碟價格變動的 指數參數(𝜇)越高也同樣偏向採用混合方案,在時間長度(T)越長的情況下則平均指標 (𝑟̅ )越高,故偏向於自建的方案。另外企業起始的儲存需求量(𝑀0 )越大時則略微偏向採 用混合式的方案,而在磁碟的起始儲存量(𝛺0 )和磁碟儲存量的成長參數(𝑔𝑐 )越大時,則 22.

(23) 略微偏向採用自建的方案。而在租賃第三方雲端儲存服務的定價結構方面(f and v),方 案的不同也會對平均指標(𝑟̅ )造成影響,此部分將在後面進行探討。對於其他參數如: 磁碟運作的能源成本(η)、企業儲存需求量的成長參數(𝑔𝑚 )、每年磁碟的損壞機率 (ARR)及新舊磁碟的損壞比例(k)則對於平均指標(𝑟̅ )沒有較明顯的影響。. 二、 交互作用 由表 4 中我們可以得知幾個較具影響力的參數,分別為資料上雲比例(𝜙)、磁碟起 始價格(𝑃0 )、磁碟價格變動的指數參數(𝜇)及時間長度(T),以下將針對這四種參數來進 行交互作用的分析,並且在最後針對第三方雲端儲存服務的定價結構不同所產生之影 響進行探討。. 資料上雲比例(𝝓). 圖 2.1. 圖 2.2. 圖 2.3. 圖 2. 𝜙與其他參數的交互作用 圖 2 顯示為𝜙與其他參數的交互作用,藍線為資料上雲比例較高(𝜙 = 0.8)的情 況,紅線則為資料上雲比例較低(𝜙 = 0.2)的情況。其中較有顯著影響的在於𝜙與𝑃0 、𝜇 及 T 三個參數的交互作用。𝜙對於𝑃0 與𝜇的交互作用較為相似,在圖 2.1 與圖 2.2 中的 藍線可看出,當𝜙高時自建需求減少,同時𝑃0 與𝜇越大代表自建時購買磁碟的成本越 高,故會偏向於混合的方案(r<1);當𝜙低時(圖 2.1 與 2.2 紅線)代表自建需求提升,雖 然𝑃0 與𝜇的提升仍會因為成本增加而傾向混合,但幅度(斜率)沒有𝜙高時來的明顯。 在𝜙對於 T 的影響的部分,從圖 2.3 中藍線可看出𝜙越大,長時間下來傾向自建 (r>1)的速度會越快,原因在於上雲比例越高,其租賃第三方雲端儲存服務的成本上升 越快,故𝜙越大其隨著 T 成長的斜率越大。 23.

(24) 24.

(25) 磁碟起始價格(𝑷𝟎 )與磁碟價格變動的指數參數(𝝁). 圖 3.1. 圖 3.3. 圖 3.2. 圖 3.4. 圖 3. 𝑃0 與𝜇對於其他參數的交互作用 圖 3 顯示為𝑃0 與𝜇對於其他參數的交互作用,上方藍線代表起始價格較高(𝑃0 = 0.5),紅線則為起始價格較低(𝑃0 = 0.1),下方藍線為磁碟價格速度下降較慢(𝜇 = −0.2),紅線則為磁碟價格速度下降較快(𝜇 = −0.4)的情況。因𝑃0 與𝜇與其他參數所產生 的交互作用類似,故將兩者合併說明。𝑃0 與𝜇的提升代表磁碟的價格高並且掉價的速度 慢,因此在𝑃0 與𝜇高(圖 3.1 中上方及下方藍線)的情況下自建的成本較高,對於𝜙的提 升越會傾向於混合式的方案(r<1)。 在𝑃0 與𝜇之間的交互作用上,從圖 3.3 中的紅線可以看出𝑃0 小時𝜇的增加會使結果 偏向混合(r<1),但在𝑃0 大時(圖 3.3 藍線),隨著𝜇變大,反而會使混合方案的成本優勢 減少(斜率為正);而在圖 3.2 中紅線可以看到,𝜇較小時𝑃0 增加會使結果偏向混合,最 後在圖 3.2 中藍線可以看到,𝜇較大(掉價速度慢)時𝑃0 增加同樣會使混合方案的成本優 勢減少(斜率為正)。在此一交互作用中我們發現了一個較不直觀的結果,圖 3.2 及 3.3 中的藍線會使磁碟的價格較紅線高,但藍線卻顯示偏向自建,在這個結論上我們有兩 個可能的解釋,其一為圖 3.3 中越靠左看其掉價速度越快,所以當磁碟下降速度較快 時,即使磁碟價格在較高的狀況,我們仍然會考慮自建;另一個解釋為磁碟價格對於 相同的掉價幅度,價格高者掉價的實際值較價格低者多,所以產生價格高者省越多的 結果。 圖 3.4 中可以看出對於 T 的影響,依照主作用的探討,時間越長則會越傾向於自 25.

(26) 建的方案,因為租賃第三方雲端服務長期下來是較不划算的,但在磁碟價格較高、掉 價速度較慢(圖 3.4 藍線)的情況下,會延緩採用自建方案的優勢(斜率較小),相反的, 磁碟價格低、掉價速度快時(圖 3.4 紅線)傾向自建的速度越快(斜率較大)。. 時間長度(T). 圖 4.1. 圖 4.2. 圖 4.3. 圖 4.4. 圖 4. T 與其他參數的交互作用 圖 4 顯示為 T 與其他參數的交互作用,藍線代表長期(T=15),紅線則代表短期 (T=5)。整體而言與 T 交互關係較明顯的𝜙、𝑃0 與𝜇(圖 4.1、4.2 及 4.3),在前述的分析 中都有相關的討論,因此可以得出相關的結論為短期而言,𝜙越大(圖 4.1 中紅線)混合 方案越省(r<1)、𝑃0 與𝜇越大(圖 4.2 及 4.3 中紅線)則會略傾向於混合,但影響不顯著; 長期而言,𝜙越大(圖 4.1 中藍線)會使自建的成本優勢下降、而𝑃0 與𝜇越大(圖 4.2 及 4.3 中藍線)則導致自建的成本提升,故同樣會自建的成本優勢下降,且在𝑃0 與𝜇增加到一 定值時混合方案會較自建方案省(r<1)。 另外,此處值得一提的還有 T 與𝑔𝑚 之間的交互作用(F =224.3998, p < .0001)。由圖 4.4 中可看出,當企業的儲存需求量成長越快時,在短期(T=5)會傾向於混合,長期 (T=15)則是傾向於自建,可能的原因在於短期即使需求提升的速度變快,其總體的需 求量仍不足以使自建的成本小於混合的成本,因為短期而言磁碟的價格下降幅度與磁 碟儲存量的成長有限,故磁碟購買的成本相對增加,而第三方雲端儲存服務則只需以 固定的邊際成本增加成長的儲存需求;但長期而言,需求的儲存量太過龐大,以至於 租賃第三方雲端儲存服務時所需負擔的成本過高,又磁碟的掉價幅度與儲存量的成長 相較短期為多,故傾向於自建。. 26.

(27) 第三方雲端儲存服務之定價結構(f and v). 圖 5.1. 圖 5.2. 圖 5.3. 圖 5.4. 圖 5. f and v 與其他參數的交互作用 除了前述四項較有顯著影響的參數之外,由第三方雲端儲存服務之定價結構中我 們可以看出,不同的定價結構,在不同的參數影響下,可能會有成本上的差異。圖 5 顯示為 f and v 與其他參數的交互作用,其中紅線(a)代表低固定成本及高邊際成本的定 價結構,綠線(b)代表中固定及邊際成本的定價結構,藍線(c)代表的則是高固定成本及 低邊際成本的定價結構。 若以成本為主要考量,可以由平均指標(𝑟̅ )看出,越傾向於混合(r<1)者,代表其較 自建節省更多的成本,故為較好的定價結構。在圖 5.1 中,可以看出 f and v 對於𝜙的 交互作用中,隨著上雲資料比例的提升,高固定成本的定價結構傾向混合的速度較 快,因為該定價結構有較低的邊際成本,故在資料量大時,該定價結構的成本優勢提 升較快。 在和𝜇的交互作用中,可以由圖 5.2 看出當磁碟的價格下降速度越慢( 𝜇越大),對 於低跟中固定成本的定價結構而言,因為自建成本的提升,會使得結果偏向採用混合 方案,但對於高固定成本的定價結構,則仍然會以自建的方案較佳。 定價結構與 T 的交互作用中,我們可以由圖 5.3 看到在短期而言低固定成本的定 價結構最優,在中期則以中固定成本較好,長期來看則以高固定成本最省,其原因同 樣在於邊際成本的不同,隨著時間增加,邊際成本在租賃第三方雲端儲存服務時對總 成本的影響逐漸大於固定成本,故邊際成本越低的定價結構隨時間長度增加則越省。 最後為定價結構與𝑔𝑚 的交互作用(F =105.0944, p < .0001),𝑔𝑚 越大代表儲存需求 增加越快,在需求快速增加的情況下,固定成本低跟中的定價結構因為其變動成本較 高,所以成本上升的速度越快,反之固定成本高的定價結構則因為有較低的邊際成 27.

(28) 本,使得成本增加的速度較慢,故𝑔𝑚 提升對於固定成本高的定價結構會使混合式方案 的成本優勢逐漸增加,對於固定成本低跟中的定價結構則會使混合方案的成本優勢下 降(斜率為正)。. 28.

(29) 第五章 結論與未來發展 隨著雲端儲存服務的發展逐漸成熟,許多企業開始考量用雲端儲存服務的方式來 進行資料的儲存,而過去的文獻幾乎都圍繞著全部自建儲存環境或全部採用租賃第三 方雲端儲存服務的成本分析,為了更貼近現實的情況,本論文透過混合式的雲端儲存 成本模型的建立與成本指標(r)的分析,比較混合式與純自建的成本表現,並進一步找 出影響成本的重要因子。首先在模型的建立時,我們考慮了 12 項可能影響成本的參 數,透過全因子實驗設計的方式,將 12 項參數分別設定等級,並組合出 9216 種不同 的情境,再針對每種情境重複模擬 500 次後取指標 r 的平均來進行迴歸及交互作用的 分析。 混合式的成本模型雖然能較貼近現實的企業運作模式,但仍然有幾點限制,首先 在企業儲存需求與磁碟儲存量的成長上,我們是參考 Naldi and Mastroeni (2014)的做法 以指數模型來進行預估,對於實際企業與磁碟的儲存狀況無法做更精確的預測,另外 在磁碟價格的部分,我們同樣參考 Walker et al. (2010)與 Naldi and Mastroeni (2014)中 的價格模型,來預測其掉價速度,但實際價格不一定完全與此模型契合,最後在租賃 第三方雲端儲存服務時,我們採用 Naldi and Mastroeni (2013)以固定成本與邊際成本的 方式來討論,但其中資料的傳輸費用並沒有列入考量,因不同企業的資料取用量不盡 相同,因此難以量化分析,故本論文並無將其納入成本模型,又我們所採用的定價結 構,無法考慮在高需求量的情況下,供應商是否會給予折扣。 雖在本研究中有上述限制,無法完全符合現實的運作細節,但仍可以歸納出幾個 比較主要的結論。從分析結果可以發現有十個參數的影響都是顯著的,分別是租賃方 案的固定成本與邊際成本(f and v)、採用租賃方案儲存的資料比例(𝜙)、磁碟的起始價 格(𝑃0 )、磁碟價格模擬的指數參數(𝜇)、每期每顆磁碟運作所需的電力總成本(𝜂)、起始 所需的儲存空間(𝑀0 )、儲存需求量成長的指數參數(𝑔𝑚 )、起始的磁碟儲存空間(𝛺0 )、 磁碟儲存空間成長的指數參數(𝑔𝑐 )與時間長度(T),但考量交互作用圖後得出四個對於 方案選擇較具差別性的關鍵參數,分別是採用租賃方案儲存的資料比例(𝜙)、磁碟的起 29.

(30) 始價格(𝑃0 )、磁磁碟價格模擬的指數參數(𝜇)及時間長度(T),其交互作用關係如表 5 所 示,其中列代表的是主參數,每個儲存格記錄主參數的主作用以及主參數在高低程度 對於其他參數的交互作用下,成本指標 r (自建/混合成本)是逐漸增加(+)或是逐漸減少 (-)的趨勢,以及決策上應採用何種方案較佳(自建或混合)。 表 5. 關鍵參數交互關係趨勢表 變動參數 𝜙↑. 主參數 High − (混). 𝜙. low. 𝑃0 ↑. 𝜇↑. T↑. − (混). − (混). + (混→自). − (混). − (混). + (混→自). + (混). + (混). − (混). + (混→自). High. − (混). low. − (混). High. − (混). + (混). low. − (混). − (混). High. − (自). − (自→混). − (自→混). low. − (混). − (混). − (混). 𝑃0. 𝜇. T. − (混). − (混). + (混) + (混→自). + (混→自). −:𝑟斜率為負 + :𝑟斜率為正 混:選擇混合方案 自:選擇自建方案. 從表 5 的分析結果中我們能發現,當上雲比例高時,r 成本指標逐漸下降,因此 建議使用混合方案;而當上雲比例高,且硬碟價格高時(𝑃0 與𝜇大),r 成本指標也是逐 漸下降,因此同樣建議使用混合方案;另外當上雲比例高時,長時間(T=15)下,r 成本 指標逐漸上升,因此建議使用自建方案。另外從表中的前三列可以看出大部分的情 況,我們會選擇混合的方案,只有在時間(T)變長時,才會改採自建的方案;而在第四 列時間與其他參數的交互作用中,會發現即使長期而言自建方案較具有成本優勢,但 當磁碟價格高、掉價速度慢(𝑃0 與𝜇大)時,應改採混合的方案。 除上述四項因子外,研究中也發現第三方雲端儲存服務供應商對於儲存服務的定 30.

(31) 價結構(f and v)不同,也會對成本造成影響,其影響如表 6,其中欄代表的是三個方 案,列代表的是不同參數值的增加,對於指標 r 的趨勢及建議方案則表示在每個儲存 格中。從表中第一列我們可以看到當上雲比例(𝜙)增加時,不論採用何種定價結構,都 建議採用混合方案,第二列則說明當磁碟掉價速度變慢(𝜇上升)時高固定成本的定價結 構會轉為以採用自建方案較佳,最後第三列可以看出時間越長會以自建方案較佳,並 且中固定及低固定成本的定價結構,應會轉向採用自建方案。 表 6. 定價結構與參數交互關係趨勢表 定價結構. High f Low v. Base f and v. Low f High v. (e.g. Dropbox). (e.g. Carbonite). (e.g. Amazon). 𝜙↑. − (混). − (混). − (混). 𝜇↑. + (自). − (混). − (混). T↑. + (自). + (混→自). + (混→自). 變動參數. −:𝑟斜率為負 + :𝑟斜率為正 混:選擇混合方案 自:選擇自建方案. 從企業管理者的角度來看,我們可以歸納出幾個結論:首先,在考量混合與自建 兩種儲存方式時,雖然有許多因素都是重要的,但從研究結果中我們可以得知,某些 因素在方案決策上沒有很大影響力,如磁碟運作的能源成本(η)、企業儲存需求量的成 長參數(𝑔𝑚 )、每年磁碟的損壞機率(ARR)及新舊磁碟的損壞比例(k)等。 另外,上述四個參數中的資料上雲比例(𝜙)及時間(T)是較能由管理者在做策略規劃 時決定的,從結果中我們能發現,隨著𝑃0 與𝜇越大,𝜙高(𝜙 = 0.8)時較𝜙低(𝜙 = 0.2)時 傾向混合方案(r<1)的速度越快,故在磁碟價格較昂貴時,可以考慮採用混合方案並將 資料上雲比例(𝜙)提升,但在𝜙的決策上必須考量企業本身是否有足夠的彈性,能在較 低的轉換成本之下,將大比例的資料轉移至第三方提供的雲端儲存空間,以實踐混合 方案成本的效益。而在時間方面,長期而言資料上雲比例越大會使混合方案較不划 算,故可考慮降低上雲比例或改採用自建方案,短期而言則採用混合方案較好。 31.

(32) 本論文透過模型的建立與分析,試圖找出影響成本的關鍵因素,希望現實企業可 以根據不同的發展狀況與策略,看出混合式儲存方案與自建儲存環境何者較具有成本 優勢。本論文在成本的分析上已經將大部分可能的成本列入考量,希望能收到拋磚引 玉之效,未來能有更完整的延伸研究。 如在成本方面,未來的研究者可以進一步探討(1)供應商服務品質(2)安全性(3)設備 管理在成本上的調整。論文中主要圍繞的核心問題在於成本的高低,對於供應商的服 務品質並無多做評估,後續研究可以試著將服務品質納入模型。 對於安全性的部分(例如儲存設備的故障及資料防護是否足夠等),不論是租賃第 三方雲端儲存服務或是自建儲存環境,都會面臨到相關的問題,因而在本論文中並沒 有相關的探討,延伸性研究可以更精確地將此部分成本納入考量。 在管理成本的考量上。第三章時我們提過本研究不納入管理成本的考量,而這將 導致成本假設上較有利於自建,因此若最後分析出的結果仍建議採用混合方案,則此 結果的可信度將更高。但該說法僅適用於方案上的判斷,對於實際的管理成本並沒有 較好的量化方式,後續性研究若能精確地估計管理成本,則可進一步完善模型對於實 際成本的估計。除了管理成本之外,另外可能會發生的情況為租賃第三方雲端儲存服 務的固定成本及邊際成本(f and v)可能會隨著時間而有所變動,假若該成本下降,則會 使企業採用自建方案較省的時間延後,若該成本上升,則會使企業抉擇提前偏向自 建,相關的成本計算也有待更好的估計方式。 最後在方案的部分,除了論文中提到的全自建與混合之外,有些企業可能有不同 的儲存規劃,例如採用全自建儲存環境,並且租賃第三方雲端儲存服務,僅進行資料 備份等,在未來都是可以繼續探究的領域。本論文在成本的分析上已經將大部分可能 的成本列入考量,期望未來能有更全面的情境探討及資料能使這項研究更加完善。. 32.

(33) 參考文獻 中文部分 微軟客戶案例分享,金石堂網路書店善用雲端服務,支援電子商務高成長,上網日期 2015 年 2 月 12 日,檢自: https://www.microsoft.com/taiwan/casestudies/case/case_150212_kingstone.aspx 微軟客戶案例分享,Mazda 運用混合式雲端存放裝置實現更完備的資料保護並降低 95% 的成本,上網日期 2014 年 10 月 15 日,檢自: https://www.microsoft.com/taiwan/casestudies/case/case_141015_mazda.aspx 魏伊伶,(2016)。雲端與巨量應用趨勢下,全球儲存產業發展趨勢。ICT Journal,頁 5-10。. 西文部分 Benedikt Martens, & Frank Teuteberg. (2012). Decision-making in cloud computing environments: A costand risk based approach. Inf Syst Front, 頁 871-893. Byung Chul Tak, Bhuvan Urgaonkar, & Anand Sivasubramaniam. (2011). To Move or Not to Move: The Economics of Cloud Computing. 頁 1-5. Edward Walker, Walter Brisken, & Jonathan Romney. (2010). TO LEASE OR NOT TO LEASE FROM STORAGE CLOUDS. COMPUTER, 頁 44-50. Gabriella Laatikainen, Oleksiy Mazhelis, & Pasi Tyrväinen. (2014). Role of acquisition intervals in private and public cloud storage costs. Decision Support Systems, 頁 320-330. Loretta Mastroeni, & Maurizio Naldi. (2011). Pricing of insurance policies against cloud storage price rises. SIGMETRICS Performance Evaluation Review40(2), 頁 42-45. Maurizio Naldi, & Loretta Mastroeni. (2013). Cloud Storage Pricing: A Comparison of Current Practices. ICPE, 頁 27-34. Maurizio Naldi, & Loretta Mastroeni. (2014). Economic decision criteria for the migrationto 33.

(34) cloud storage. European Journal of Information Systems , 頁 1-13. Sean Marston, Zhi Li, Subhajyoti Bandyopadhyay, Juheng Zhang, & Anand Ghalsasi. (2011). Cloud computing—The business perspective. Decision Support Systems, 頁 176-189.. 34.

(35)

參考文獻

相關文件

有學生的作 有學生的作 有學生的作 有學生的作 品未能儲存 品未能儲存 品未能儲存 品未能儲存 老師的信.. 老師的信 老師的信 老師的信

Wi-Fi Supported Network Environment and Cloud-based Technology to Enhance Collaborative Learning... • Curriculum is basically a lesson plan that functions as a map

Wi-Fi Supported Network Environment and Cloud-based Technology to Enhance Collaborative Learning.. Centre for Learning Sciences and Technologies (CLST) The Chinese University of

A Cloud Computing platform supports redundant, self-recovering, highly scalable programming models that allow workloads to highly scalable programming models that allow workloads to

Classifying sensitive data (personal data, mailbox, exam papers etc.) Managing file storage, backup and cloud services, IT Assets (keys) Security in IT Procurement and

 Presents a metric selection framew ork for online anomaly detection i n utility cloud.. ◦ Select most essential metrics by appl ying metric selection and

• National Human Genome Research Institute(NHGR I) hosted several meetings on cloud computing and on informatics and analysis in 2010.. • “One thing that is clear is that as

• Instead of uploading and downloading the dat a from cloud to client for computing , we shou ld directly computing on the cloud ( public syst em ) to save data transferring time.