雲的類型有三種:公有雲(Public Cloud)、私有雲(Private Cloud)和混合 雲(Hybrid Cloud)。公有雲亦稱外部雲(External Cloud),指具有公用服務(如 水、電、天然氣、瓦斯等服務)的雲技術,是由第三方在網際網路上所提供的一 項服務,公開服務所需要的使用者,並按照使用者的選擇來計費;私有雲又稱內 部雲(Internal Cloud),為單一客戶單獨或是一個企業組織內部自行取用的雲端 運算技術,由該使用者或企業組織自行購買、擁有、維護與管理,提供對資料、
安全性及隱私性和服務品質的最有效控制;混合雲為使用者或企業組織同時使用 公有雲和私有雲混合組成的雲端運算技術,因此,利用此技術可以同時擁有二種 技術的優點。
‧
美國家標準與技術局(National Institute of Standards and Technology, NIST)
定義雲端運算是一種無所不在、隨需供給且方便的網路,擁有廣泛的運算資源,
如網絡、伺服器、儲存、應用程式、服務等,這些資源可透過最少量的管理工作 及不需與服務供應商的互動,即可快速提供各項服務給使用者,另外,NIST 亦 定義了雲端運算的基本特性有隨需應變自助服務(On-demand Self-service)、廣 泛網路使用(Broad Network Access)、資源彙整(Resource Pooling)、高度彈性
(Rapid Elasticity)和計量服務(Measured Service)等五項,分別簡述如下:
1、 隨需應變自助服務(On-demand Self-service):消費者在其需要時可自行使 用雲端服務,如網路存取,而不需要與雲端服務供應商互動。
2、 廣泛網路使用(Broad Network Access):由於網路使用無所不在,雲端服 務供應商的服務可隨時在網路取用,且使用者所使用的帄台無論為何(如手 機或PDA),均可透過標準機制使用網路。
3、 資源彙整(Resource Pooling):依據消費者的需求,雲端服務供應商透過多 重租賃模式服務消費者,指派或重新指派實體及虛擬資源,而消費者通常不 知道雲端服務供應商提供的所有資源之確切位置,只可能掌握國家、州或資 料中心等大範圍的區域地點。這些資源包含如存貯、處理、記憶體、網路頻 寬和虛擬機器等。
4、 高度彈性(Rapid Elasticity):運算能力可以迅速且具有高度彈性的提供給 消費者,彈性亦能因應要求調整資源規模大小,對消費者而言,雲端似乎無 窮無盡,且能依據其需求增減運算能力採購額。
5、 計量服務(Measured Service):雲端服務各層次均由雲端服務供應商掌控 與監管,這對於計費、存取控制、資源優化、處理能力規劃及其他工作相當 重要。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
7
二、 雲端運算的演化
雲端運算並不是一蹴發展而成的,而是經由超級電腦(Super Computer),漸 漸發展至各種運算而促使今日的雲端運算的崛起,以下為雲端運算的演化過程:
(一) 超級電腦(Super Computer)
超級電腦為一種主機電腦,擁有最快的速度且儲存力最強,進行的運算速度 最高可達一般個人電腦的十萬倍。超級電腦的機身,往往不是一個,而是由一群 電腦所組成。超級電腦可利用來開發新產品和檢驗產品,亦可用來進行大規模的 試驗,計算及研究。各國甚至各大型企業例如:Google、IBM 等都在積極研發或 添購更強大運算速度更快的超級電腦。
美國 Discovery 頻道公布了 2010 年世界之最,結果中國的超級電腦「天河 一號」(Tianhe-1A)被評為是去年速度最快的超級電腦,超越了美國的美洲豹
(Jaguar)。
TOP 500 SUPERCOMPUTER SITES(http://www.top500.org/)是一個定期會 公布目前名列全世界前 500 名的超級電腦排名的網站。以下為此網站於 2010 年 11 月所公佈的前十名(見表 2-1):
‧
1 China National SupercomputingCenter in Tianjin
Tinahe-1A-NUDT MPP, X5670 2.93Ghz 6C, NVIDIA GPU, FT-1000 8C(NUDT)
2 United States
DOE/SC/Oak Ridge National Laboratory
Jaguar-Cray XT5-HE Opteron 6-core 2.6 GHz(Cray Inc.) 3 China National Supercomputing
Center in Shenzhen(NSCS)
X5650, NVidia Tesla C2050 GPU (Dawning)
4 Japan GSIC Center, Tokyo Institute of Technology
TSUBAME 2.0-HP ProLiant SL390s G7 Xeon 6C X5670, Nvidia GPU,
Linux/Windows(NEC/HP) 5 United
States DOE/SC/LBNL/NERSC Hopper-Cray XE6 12-core 2.1 GHz (Cray Inc.)
6 France Commissariat a 1’Energie Atomique(CEA)
Tera-100-Bull bullx super-node S6010/S6030 (Bull SA)
7 United
States DOE/NNSA/LANL
Roadrunner-Blade Center
QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz/Opteron DC 1.8 GHz, Voltaire Infiniband(IBM)
8 United States
National Institute for Computational Sciences/University of
Tennessee
Kraken XT5-Cray XT5-HE Opteron 6-core 2.6 GHz(Cray Inc.)
9 Germany Forschungszentrum Juelich(FZJ)
JUGENE-Blue Gene/P Solution(IBM)
10 United
States DOE/NNSA/LANL/SNL Cielo-Cray XE6 8-core 2.4 GHz(Cray Inc.)
(二)叢集運算(Cluster Computing)
叢集運算是將多部個人電腦以高速的區域網路連結起來,使其可達到超級電 腦的高效能及共同處理程序的運算。叢集運算的優點在於具有高效能運算,可降 低運算成本,且其擴充性佳,而缺點在於管理困難,要有良好的演算法,才能將 工作妥散的分配到各個電腦上運作,且在運作時,需要完全相同規格的硬體及環
‧
(三)分散式運算(Distributed Computing)
分散式運算由網路連結個人電腦所形成的運算,且在網絡中的任一部電腦都
(四)格網運算(Grid Computing)
在 1998 年,Foster 與 Kesselman 發展了「格網」的全新概念,指以公開的 基準處理分散在各處的資料,亦將其形容為像電力或水力一樣,想要用的時候打 開即可得到。格網運算為分散式運算的延伸,也是一種擴充叢集運算的技術,將 各種不同帄台,不同架構,不同等級的獨立電腦,透過分散式帄行處理的方式,
做整合的運用。
(五)公用運算(Utility Computing)
公用運算主要是提倡一種理想的資訊架構,把風險從使用者本身轉移至服務 供應商。在此架構下,公用運算的訂價模式為採取「用多少付多少」的方式,將 運算功能視為如水、電、天然氣等公用設施(Utility)一樣可隨時供使用者需求 來提供此服務(On Demand Services),這些服務包含自動提供可計算、度量的 IT 資源,如服務器、存儲容量、商應用程序及網源等,且依照使用者的使用量來計 算費用。
‧
(Platform as a Service)及 IaaS(Infrastructure as a Service)三種,說明如下:
(一)SaaS(Software as a Service)
SaaS 為一種服務型的軟體。使用者在需要的時候,下載所需功能且安裝在 電腦裡使用,或直接在網路上使用線上的軟體。有了服務型軟體,使用者可不用 事先購買軟體,只在需要時付費使用,且不需要管理及維護軟體,操作也很簡單,
但使用者無法對其軟體進行任何的調整,只能在外觀或者作業的設定做些微的改 變,且並非所有的應用軟體都適合透過此服務來提供使用者使用。
現有的一些服務型軟體應用如 Google Map, Yahoo Mail Service 等網路信箱都是 SaaS 的產品,目前提供服務型軟體的代表企業有美國的 Salesforce 公司,SAP, ORACLE 等大軟體廠商也陸續開始提供 SaaS 型的服務。
‧
機帄台有 Google App Engine, AWS S3, Microsoft Azure, Yahoo Application Platform 等。
(三)IaaS(Infrastructure as a Service)
IaaS 為一種服務型的基礎設施。一開始被稱為 Haas(Hardware as a Service), 後來為了作明確的區分而改稱為 IaaS。IaaS 提供了核心計算資源和網路架構的服 務,亦提供了伺服器,網路設施,記憶體,儲存硬體,CPU 和資料中心設施等 IT 硬體環境,解決了傳統機房需要的硬體、軟體、儲存、電力及頻寬成本,可 使公司企業更用效率的取得資源。而目前存有 IBM Blue Cloud, HP Flexible Computing Services 等服務型基礎設施產品。
雲端運算具有超大規模、高通用性、虛擬化、使用者付費、成本低、高可靠 Google 應用服務引擎 Google App Engine(GAE)在 2008 年問世,是 Google 的 應用程式開發與代管帄台,可讓開發者提供 Python 程式碼,自行在帄台上建構 高流量的網路應用程式,不需管理高流量的基礎架構。而 GAE 也成功了擄獲了 全球各行各業各種規模的公司企業的心,它不僅使公司企業的時間與成本降低了 許多,並也改善了企業間合作的方式。另外,連相當耗費 CPU 運算的影像編輯 軟體,也有服務供應商嘗試將其做成雲端服務,如 Adobe Photoshop Express。
表 2-2 為各家公司所提供的雲端運算服務的比較。
‧
Azure Google App Engine Yahoo Application
Platform Amazon EC2 技術特性 整合不同裝置
Window Server 2008 與
Hypervisor 虛擬化技術
帄行分散技術 MapReduce、
BigTable 資料庫系統、 GFS 檔案系統
帄行分散技術 Hadoop、
MapReduce、
Hbase 資料庫、
(pre-beta)
Live Mesh
應用代管服務 GoogleAppEngine,
每月低於 500 萬瀏覽次的網 站可免費代管,可使用 500MB 儲存空間。
YAP、
SearchMonke,
使用 Y!OS API 的
Web Python,未來會支援更
多語言 PHP
SQL Service,
如資料表、檔 案等。
BigTable 資料庫系統
‧
(Pattern)及相關性(Relationship)的過程,亦視為資料庫知識發掘(Knowledge Discovery in Database,KDD)其中的一部分,其為在資料採礦上的應用極為重 要的影響,只有資料庫知識發掘才能確保資料採礦得到有意義的結果。根據 Fayyad(1996)等人對資料庫知識發掘的定義為:「KDD is the nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable
patterns in data」,他們認為在得到知識之前,原始資料必頇經過五個步驟的處 理,其流程圖(見圖 2-1)及步驟如下: