• 沒有找到結果。

對服務導向架構(SOA)的計算網格而言,透 過 Advance Resource Reservation 來維護系統的 QoS,其最重要的關鍵為如何準確地預測資源未

執行效能。這對於 Resource Broker 進行資源配 置時,比較能夠為 Job 挑選更合適的計算資源,

而且我們所設計的 Reservation Scheduler 方式也 確實能以少量的時間對大規模的 Workflow 進 行 deadline 的設定與資源預留。

基於未來資源可用度預測上使用 Advance Resource Reservation 機制來維護系統工作品質 的方案,雖然可以有效地避免無資源可用的情 況以及降低 deadline delay 發生的機率。但是在 Grid 環境使用資源難免會出現無法預知的結果 而造成工作延遲。為了讓系統能夠更完善的處 理這些突發狀況,如何妥善解決 deadline delay 的問題是一個很重要的議題。過去相關的研究 方法會使用 Reschedule 的方式來彌補 deadline delay 所造成的損失。然而,將工作重新配置資 源所能彌補的幅度實在有限,因為這些相關研 究所開發的 Reschedule 機制通常都是將 Delay 的 Job 其後代所有 Child Job 重新配置資源。但 是重新配置的結果依然會受 Grid 環境的資源負 載動態性影響,而無法真正有效地解決 deadline delay 的問題。為此,我們可以設計一套基於長 時程資源未來可用度預測機制,實作一套 job rescheduling 的演算法 ,將目前的工作進度遷移 至其他資源上繼續執行工作,以更佳的方式彌 補 deadline delay 造成的損失。

參考文獻

[1]

Tyng-Yeu Liang, Chun-Yi Wu, Jyh-Biau

Chang, Ce-Kuen Shieh, “Teamster-G : A Grid-enabled Software DSM System”, In of the Proceeding of The 2005 International Workshop on Distributed Shared Memory on Clusters at the IEEE International Symposium on Cluster Computing and the Grid (CCGrid 2005), Cardiff, UK, May 9-12, 2005.

[2]

J. B. Chang, Ce-Kuen Shieh, Tyng-Yeu Liang,

“A Transparent Distributed Shared memory for Clustered Symmetric Multiprocessors”, Journal of Supercomputing, vol. 37, issue 2, pp.145-160, August 2006.

[3]

Cristiana A., Alan L. C., Sandhya D., Pete K.,

Honghui L., Ramakrishnan R., Weimin Y., Willy Z., “TreadMarks: Shared Memory Computing on Networks of Workstations”, IEEE Computer, pp. 18-28, 1996.

[4]

Speight E. and Bennett J.K., “Brazos: A third generation DSM system”, Proceedings of the 1997 USENIX Windows/NT Workshop, pp.

95-106, 1997.

[5]

IVY K Li,“A shared virtual memory system for parallel computing”, In Proceedings of the 1988 International Conference on Parallel Processing (ICPP'88), pp. 94-101, 1988.

[6]

Carter J.B., Bennett J.K. and Zwaenepoel W.,

“Implementation and Performance of Munin”, In Proceedings of 13th ACM Symposium on Operating System Principles, pp. 152-164, 1991.

[7]

Tyng-Yeu Liang, We-Chen Li, Jin An Huang,

“Developing A Workflow Management System for Teamster-G”, Proceedings of National Computer Symposium, pp.7-16, Nov.

27-28, 2009.

[8]

Tyng-Yeu Liang., I-Han W., Sheng-Yuan C.,

“A Long-term Resource Availability Predictor Using Frequent Workload Patterns”, The 5th Workshop on Grid Technologies and Applications (WoGTA’08), pp. 125-130, 2008.

[9]

Jia Yu, Rajkumar Buyya and Chen Khong Tham, “Cost-based Scheduling of Scientific Workflow Applications on Utility Grids”,The First International Conference on e-Science and Grid Computing, pp.-147, 1-1 July 2005.

[10]

TORQUE Resource Manager.

http://www.-clusterresources.com/pages/produ cts/torque-resourcemanager.php.

[11]

Hidemoto Nakada, Atsuko Takefusa,

Katsuhiko Ookubo, Makoto Kishimoto Tomohiro Kudoh, Yoshio Tanaka, Satoshi Sekiguchi, “Design and Implementation of a Local Scheduling System with Advance Reservation for Co-allocation on the Grid”,

The Sixth International Conference on Computer and Information Technology at IEEE. pp. 65-65, Sept 2006.

[12]

Globus project. http://www.globus.org.

[13]

I. Foster. Globus toolkit version 4: Software for serviceoriented systems. In IFIP International Conference on Network and Parallel Computing, Springer-Verlag LNCS 3779, pp. 2–13, 2005.

[14]

WSRF.http://www.oasis-open.org/committees/

tc_home.php?wg_abbrev=wsrf.

出席國際學術會議心得報告

計畫編號 NSC 96-2221-E-151-018-MY3

計畫名稱 一個基於開放式網格服務架構的共用記憶體多處理

器系統(第3年)

出 國 人 員 姓 名 服 務 機 關 及 職 稱

梁廷宇副教授 高雄應用科技大學電機系

會議時間地點

Dec. 8~11 2009, Shenzhen, China

會議名稱

The Fifteenth International Conference on Parallel and Distributed Systems (ICPADS'09)

發表論文題目

A User-Level Remote Paging System for Grid Computing

一、參加會議經過

本次參加 ICPADS 2009 會議行程共五天。第一天、高雄出發經香港轉深圳。第 二天發表論文。第三~四天參加會議議程與討論。第五天返回國門。

二、與會心得

本次參加的 ICPADS 2009 國際會議,為平行與分散式系統研究領域中最受到重 視的學術研討會。此會議的論文集被 IEEE 訂為 EI 的等級,所以在學術上非常受到 重視。今年很榮幸有機會參與次盛會,藉此與世界一流的學者交流,實在是非常難 得的學習經驗。本次在會議上所發表的論文題目為『A User-Level Remote Paging System for Grid Computing』,其目的是為網格計算開發一個使用階層的遠端分頁機制 稱為 Grid Remote Pager (GRP),藉以解決記憶體不足的問題。此篇論文主要的特色 在此機制可以隨著資源擁有者本身的記憶體使用情形來調整使用者可利用的記憶體 數量,以避免資源競爭的發生並提高記憶體的使用量。另一方面,此機制還支援記 憶體資源的保留功能,以保障程式的執行效能。在論文發表中,很多人對於我們的 研究成果感到興趣,其中包括中國大陸國防大學的學者,他們也是發表 Petaflops 超 級電腦:天河一號的學者。他們給了我們一些寶貴的建議。例如,分析程式的資料 存取行為,藉以改善 page replacement 的演算法,提高記憶體分頁命中的機會,進而 減少遠端分頁置換的次數。未來我們將會在最短的時間內,根據會議中所獲得的建 議,來對我們所發表的機制進行改善。相信經由後續的加強後,本篇論文將會成為 一篇不錯的期刊論文。另一方面,我們在本次的會議中,亦參與多個其他 session 的 研討。例如:Multicore、Parallel Computing with GPU 與 Cluster and Cloud computing 等,得到有很多其他人的研究經驗,收穫頗為豐富。

在此次的會議,有一個重要的論壇『When Petaflops meet the Cloud』,其議題在 討論:雲端計算(Cloud Computing)是否可以提供高效能計算的服務。在此論壇上,

發表看法的學者包括:天河一號的作者:Kai Lu、Ohio State University 的 Xaiodong Zhang、香港大學的 Lionel M. NI、以及 Dawning、Lenovo 與 IBM 的代表等。在此論 壇上,雖然持正反意見的學者專家都有。持反對意見的有 Zhang 和 Lu 教授。其原因 是需要高效能計算往往是為特定的科學領域,而雲端運算面對是普羅大眾,因此在 系統的設計與管理、乃至使用者介面都有很大的差異。相反地,持正面意見的學者 都為各個電腦公司的代表,他們認為這是一個商業的策略問題而不是一個技術問 題,意即是要不要提供而不是能不能的問題。雖然正反意見都有,但是他們都有一 個共同的看法,即是這兩個領域將來經由瞭解彼此的需求與特性而越來越緊密的結 合。

除了雲端計算外,另一值得注意的趨勢,即是 GPU 的崛起。此次會議,有很多 研究是利用 GPU 來作為平行運算的平台。由於 GPU 具有比 CPU 更多的運算核心,

而且有較低的 EPI 值,所以能夠以較少的能源獲得更高的運算效能。更重要的是,

GPU 的普遍性讓它越來越廣泛地運算在 HPC 的領域。但是目前受限於硬體的設計,

GPU 尚無法完全取代 CPU。例如:對於分支指令密集的程式執行效能不佳,程式介 面與 CPU 不相容、host_to_device 的資料傳輸頻寬不夠等,因此混合 CPU 與 GPU 的 系統架構最近被提出來,意即把 CPU 當成 control nodes,而 GPU 當成 computation nodes,然後一起共同解決同一問題。目前大陸的天河一號已經採用此一混合式的系 統架構,並成功地獲得 Petaflop 的運算效能,進而擠進 TOP500 的前十名內。相信這 將會是未來學術與產業發展的趨勢。

在參與此次的會議中,大陸讓我有些深刻的感受。例如:他們計劃 2010 年花費 數十億人民幣在深圳建置完成一個可以提供 10Petaflop 的 Supercomputing 中心,而 所有的硬體設備都是他們研發自製。由此可以感受他們那份的強烈企圖心。另一方 面,則是他們對於產業的發展往往有通盤的計畫,並且有很強的執行力去達到設定 的目標。例如:在雲端產業的發展上,他們準備在上海與深圳各誕生一朵雲,以作 為發展雲端產業的中心。目前不論是政策、資金、技術都已經準備到位,加上大陸 為數眾多的人才以及拼勁,相信很快就會達成預定的目標。相對地,雖然我們政府 也宣布要編列一百億的經費來獎勵民間發展雲端產業,但其計畫似乎不是很具體,

而且執行的效率似乎也需要加強。面對大陸的快速發展,我們真的必需要更加積極 地迎頭趕上才行。

無研發成果推廣資料

96 年度專題研究計畫研究成果彙整表

計畫主持人:梁廷宇 計畫編號:96-2221-E-151-018-MY3 計畫名稱:一個基於開放式網格服務架構的共用記憶體多處理器系統

量化

成果項目

實際已達成

數(被接受 或已發表)

預期總達成 數(含實際已

達成數)

本計畫實 際貢獻百

分比

單位

備 註

質 化 說 明:如 數 個 計 畫 共 同 成 果、成 果 列 為 該 期 刊 之 封 面 故 事 ...

期刊論文 0 0 100%

研究報告/技術報告

0 0 100%

研討會論文 3 3 100%

論文著作 篇

專書 1 0 100%

申請中件數 0 0 100%

專利 已獲得件數 0 0 100% 件

件數 0 0 100% 件

技術移轉

權利金 0 0 100% 千元

碩士生 7 7 100%

博士生 0 0 100%

博士後研究員 0 0 100%

國內

參與計畫人力

(本國籍)

專任助理 0 0 100%

人次

期刊論文 3 3 100%

研究報告/技術報告

3 3 100%

研討會論文 9 9 100%

論文著作 篇

專書 1 0 100% 章/本

申請中件數 0 0 100%

專利 已獲得件數 0 0 100% 件

件數 0 0 100% 件

技術移轉

權利金 0 0 100% 千元

碩士生 0 0 100%

博士生 0 0 100%

博士後研究員 0 0 100%

國外

參與計畫人力

(外國籍)

專任助理 0 0 100%

人次

其他成果

(

無法以量化表達之成 果如辦理學術活動、獲 得獎項、重要國際合 作、研究成果國際影響 力及其他協助產業技 術發展之具體效益事 項等,請以文字敘述填 列。)

獲得 2009 年全國計算機會議,『優秀論文』獎。

成果項目 量化 名稱或內容性質簡述

測驗工具(含質性與量性)

0

課程/模組

0

電腦及網路系統或工具

0

教材

0

舉辦之活動/競賽

0

研討會/工作坊

0

電子報、網站

0

目 計畫成果推廣之參與(閱聽)人數

0

國科會補助專題研究計畫成果報告自評表

請就研究內容與原計畫相符程度、達成預期目標情況、研究成果之學術或應用價

值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性) 、是否適

合在學術期刊發表或申請專利、主要發現或其他有關價值等,作一綜合評估。

1. 請就研究內容與原計畫相符程度、達成預期目標情況作一綜合評估

■達成目標

□未達成目標(請說明,以 100 字為限)

□實驗失敗

□因故實驗中斷

□其他原因 說明:

2. 研究成果在學術期刊發表或申請專利等情形:

論文:■已發表 □未發表之文稿 □撰寫中 □無 專利:□已獲得 □申請中 ■無

技轉:□已技轉 □洽談中 ■無 其他:(以 100 字為限)

本實驗室總共發表了 3 篇 SCI 期刊論文、12 篇國際會議論文、1 篇 Book Chapter。此外,

還獲得 2009 年全國計算機會議的優秀論文獎,並獲邀在『國科會工程科技通訊』第 100 期中 刊出研究成果。

3. 請依學術成就、技術創新、社會影響等方面,評估研究成果之學術或應用價 值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性)(以 500 字為限)

在技術創新上,本計畫開發了一個可支援長程資源可用度預測的資源監視器與一個可確保 服務品質的排程器。過去由於所有的資源監視器,都只能預測即時或者短時間的資源可用 度,因此需要頻繁遷工作至新的資源上執行,不僅造成程式執行效能的降低,也讓服務品 質的維護變得非常困難。而本計畫成功地利用資料探勘的技術開發了一個可準確預測資源 未來長程可用度的監視器,因此成功地克服前述的問題。在此監視器的支援下,我們進一 步開發出一個更能確保服務品質的排程器。此一成果為計算網格系統的一大突破,故被推 薦將成果發表在國科會工程科技通訊月刊上。

由於本計畫所開發的計算網格系統是以服務為導向,基本上和雲端計算的精神非常相近。

因此所開發的資源監視器與排程器都可以應用到雲端服務中心的資源管理與工作排程 上。對於國內的雲端產業有實質的應用價值。

相關文件