• 沒有找到結果。

雲的類型有三種:公有雲(Public Cloud)、私有雲(Private Cloud)和混合 雲(Hybrid Cloud)。公有雲亦稱外部雲(External Cloud),指具有公用服務(如 水、電、天然氣、瓦斯等服務)的雲技術,是由第三方在網際網路上所提供的一 項服務,公開服務所需要的使用者,並按照使用者的選擇來計費;私有雲又稱內 部雲(Internal Cloud),為單一客戶單獨或是一個企業組織內部自行取用的雲端 運算技術,由該使用者或企業組織自行購買、擁有、維護與管理,提供對資料、

安全性及隱私性和服務品質的最有效控制;混合雲為使用者或企業組織同時使用 公有雲和私有雲混合組成的雲端運算技術,因此,利用此技術可以同時擁有二種 技術的優點。

美國家標準與技術局(National Institute of Standards and Technology, NIST)

定義雲端運算是一種無所不在、隨需供給且方便的網路,擁有廣泛的運算資源,

如網絡、伺服器、儲存、應用程式、服務等,這些資源可透過最少量的管理工作 及不需與服務供應商的互動,即可快速提供各項服務給使用者,另外,NIST 亦 定義了雲端運算的基本特性有隨需應變自助服務(On-demand Self-service)、廣 泛網路使用(Broad Network Access)、資源彙整(Resource Pooling)、高度彈性

(Rapid Elasticity)和計量服務(Measured Service)等五項,分別簡述如下:

1、 隨需應變自助服務(On-demand Self-service):消費者在其需要時可自行使 用雲端服務,如網路存取,而不需要與雲端服務供應商互動。

2、 廣泛網路使用(Broad Network Access):由於網路使用無所不在,雲端服 務供應商的服務可隨時在網路取用,且使用者所使用的帄台無論為何(如手 機或PDA),均可透過標準機制使用網路。

3、 資源彙整(Resource Pooling):依據消費者的需求,雲端服務供應商透過多 重租賃模式服務消費者,指派或重新指派實體及虛擬資源,而消費者通常不 知道雲端服務供應商提供的所有資源之確切位置,只可能掌握國家、州或資 料中心等大範圍的區域地點。這些資源包含如存貯、處理、記憶體、網路頻 寬和虛擬機器等。

4、 高度彈性(Rapid Elasticity):運算能力可以迅速且具有高度彈性的提供給 消費者,彈性亦能因應要求調整資源規模大小,對消費者而言,雲端似乎無 窮無盡,且能依據其需求增減運算能力採購額。

5、 計量服務(Measured Service):雲端服務各層次均由雲端服務供應商掌控 與監管,這對於計費、存取控制、資源優化、處理能力規劃及其他工作相當 重要。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

7

二、 雲端運算的演化

雲端運算並不是一蹴發展而成的,而是經由超級電腦(Super Computer),漸 漸發展至各種運算而促使今日的雲端運算的崛起,以下為雲端運算的演化過程:

(一) 超級電腦(Super Computer)

超級電腦為一種主機電腦,擁有最快的速度且儲存力最強,進行的運算速度 最高可達一般個人電腦的十萬倍。超級電腦的機身,往往不是一個,而是由一群 電腦所組成。超級電腦可利用來開發新產品和檢驗產品,亦可用來進行大規模的 試驗,計算及研究。各國甚至各大型企業例如:Google、IBM 等都在積極研發或 添購更強大運算速度更快的超級電腦。

美國 Discovery 頻道公布了 2010 年世界之最,結果中國的超級電腦「天河 一號」(Tianhe-1A)被評為是去年速度最快的超級電腦,超越了美國的美洲豹

(Jaguar)。

TOP 500 SUPERCOMPUTER SITES(http://www.top500.org/)是一個定期會 公布目前名列全世界前 500 名的超級電腦排名的網站。以下為此網站於 2010 年 11 月所公佈的前十名(見表 2-1):

1 China National Supercomputing

Center in Tianjin

Tinahe-1A-NUDT MPP, X5670 2.93Ghz 6C, NVIDIA GPU, FT-1000 8C(NUDT)

2 United States

DOE/SC/Oak Ridge National Laboratory

Jaguar-Cray XT5-HE Opteron 6-core 2.6 GHz(Cray Inc.) 3 China National Supercomputing

Center in Shenzhen(NSCS)

X5650, NVidia Tesla C2050 GPU (Dawning)

4 Japan GSIC Center, Tokyo Institute of Technology

TSUBAME 2.0-HP ProLiant SL390s G7 Xeon 6C X5670, Nvidia GPU,

Linux/Windows(NEC/HP) 5 United

States DOE/SC/LBNL/NERSC Hopper-Cray XE6 12-core 2.1 GHz (Cray Inc.)

6 France Commissariat a 1’Energie Atomique(CEA)

Tera-100-Bull bullx super-node S6010/S6030 (Bull SA)

7 United

States DOE/NNSA/LANL

Roadrunner-Blade Center

QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz/Opteron DC 1.8 GHz, Voltaire Infiniband(IBM)

8 United States

National Institute for Computational Sciences/University of

Tennessee

Kraken XT5-Cray XT5-HE Opteron 6-core 2.6 GHz(Cray Inc.)

9 Germany Forschungszentrum Juelich(FZJ)

JUGENE-Blue Gene/P Solution(IBM)

10 United

States DOE/NNSA/LANL/SNL Cielo-Cray XE6 8-core 2.4 GHz(Cray Inc.)

(二)叢集運算(Cluster Computing)

叢集運算是將多部個人電腦以高速的區域網路連結起來,使其可達到超級電 腦的高效能及共同處理程序的運算。叢集運算的優點在於具有高效能運算,可降 低運算成本,且其擴充性佳,而缺點在於管理困難,要有良好的演算法,才能將 工作妥散的分配到各個電腦上運作,且在運作時,需要完全相同規格的硬體及環

(三)分散式運算(Distributed Computing)

分散式運算由網路連結個人電腦所形成的運算,且在網絡中的任一部電腦都

(四)格網運算(Grid Computing)

在 1998 年,Foster 與 Kesselman 發展了「格網」的全新概念,指以公開的 基準處理分散在各處的資料,亦將其形容為像電力或水力一樣,想要用的時候打 開即可得到。格網運算為分散式運算的延伸,也是一種擴充叢集運算的技術,將 各種不同帄台,不同架構,不同等級的獨立電腦,透過分散式帄行處理的方式,

做整合的運用。

(五)公用運算(Utility Computing)

公用運算主要是提倡一種理想的資訊架構,把風險從使用者本身轉移至服務 供應商。在此架構下,公用運算的訂價模式為採取「用多少付多少」的方式,將 運算功能視為如水、電、天然氣等公用設施(Utility)一樣可隨時供使用者需求 來提供此服務(On Demand Services),這些服務包含自動提供可計算、度量的 IT 資源,如服務器、存儲容量、商應用程序及網源等,且依照使用者的使用量來計 算費用。

(Platform as a Service)及 IaaS(Infrastructure as a Service)三種,說明如下:

(一)SaaS(Software as a Service)

SaaS 為一種服務型的軟體。使用者在需要的時候,下載所需功能且安裝在 電腦裡使用,或直接在網路上使用線上的軟體。有了服務型軟體,使用者可不用 事先購買軟體,只在需要時付費使用,且不需要管理及維護軟體,操作也很簡單,

但使用者無法對其軟體進行任何的調整,只能在外觀或者作業的設定做些微的改 變,且並非所有的應用軟體都適合透過此服務來提供使用者使用。

現有的一些服務型軟體應用如 Google Map, Yahoo Mail Service 等網路信箱都是 SaaS 的產品,目前提供服務型軟體的代表企業有美國的 Salesforce 公司,SAP, ORACLE 等大軟體廠商也陸續開始提供 SaaS 型的服務。

機帄台有 Google App Engine, AWS S3, Microsoft Azure, Yahoo Application Platform 等。

(三)IaaS(Infrastructure as a Service)

IaaS 為一種服務型的基礎設施。一開始被稱為 Haas(Hardware as a Service), 後來為了作明確的區分而改稱為 IaaS。IaaS 提供了核心計算資源和網路架構的服 務,亦提供了伺服器,網路設施,記憶體,儲存硬體,CPU 和資料中心設施等 IT 硬體環境,解決了傳統機房需要的硬體、軟體、儲存、電力及頻寬成本,可 使公司企業更用效率的取得資源。而目前存有 IBM Blue Cloud, HP Flexible Computing Services 等服務型基礎設施產品。

雲端運算具有超大規模、高通用性、虛擬化、使用者付費、成本低、高可靠 Google 應用服務引擎 Google App Engine(GAE)在 2008 年問世,是 Google 的 應用程式開發與代管帄台,可讓開發者提供 Python 程式碼,自行在帄台上建構 高流量的網路應用程式,不需管理高流量的基礎架構。而 GAE 也成功了擄獲了 全球各行各業各種規模的公司企業的心,它不僅使公司企業的時間與成本降低了 許多,並也改善了企業間合作的方式。另外,連相當耗費 CPU 運算的影像編輯 軟體,也有服務供應商嘗試將其做成雲端服務,如 Adobe Photoshop Express。

表 2-2 為各家公司所提供的雲端運算服務的比較。

Azure Google App Engine Yahoo Application

Platform Amazon EC2 技術特性 整合不同裝置

Window Server 2008 與

Hypervisor 虛擬化技術

帄行分散技術 MapReduce、

BigTable 資料庫系統、 GFS 檔案系統

帄行分散技術 Hadoop、

MapReduce、

Hbase 資料庫、

(pre-beta)

Live Mesh

應用代管服務 GoogleAppEngine,

每月低於 500 萬瀏覽次的網 站可免費代管,可使用 500MB 儲存空間。

YAP、

SearchMonke,

使用 Y!OS API 的

Web Python,未來會支援更

多語言 PHP

SQL Service,

如資料表、檔 案等。

BigTable 資料庫系統

(Pattern)及相關性(Relationship)的過程,亦視為資料庫知識發掘(Knowledge Discovery in Database,KDD)其中的一部分,其為在資料採礦上的應用極為重 要的影響,只有資料庫知識發掘才能確保資料採礦得到有意義的結果。根據 Fayyad(1996)等人對資料庫知識發掘的定義為:「KDD is the nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable

patterns in data」,他們認為在得到知識之前,原始資料必頇經過五個步驟的處 理,其流程圖(見圖 2-1)及步驟如下:

相關文件