• 沒有找到結果。

I-Shou University Institutional Repository:Item 987654321/19256

N/A
N/A
Protected

Academic year: 2021

Share "I-Shou University Institutional Repository:Item 987654321/19256"

Copied!
102
0
0

加載中.... (立即查看全文)

全文

(1)義守大學 資訊管理研究所 碩士論文 應用藍海策略及資料探勘技術於醫 療健康產業及體檢數據庫分析 Applying Blue Ocean Strategy and Data Mining Technique to Analyze the Healthcare Industry and Medical Examination Database. 指導教授:劉振隆 博士 研究生:張筠昀. 中華术國一O四年十二月.

(2) 應用藍海策略及資料探勘技術於醫 療健康產業及體檢數據庫分析 Applying Blue Ocean Strategy and Data Mining Technique to Analyze the Healthcare Industry and Medical Examination Database 研 究 生:張筠昀. Student:Yun-Yun Chang. 指導教授:劉振隆 博士. Advisor:Dr. Jenn-Long Liu. 義守大學 資訊管理研究所 碩士論文. A Thesis Submitted to Institute of Information Management I-Shou University in Partial Fulfillment of the Requirements for the Master Degree in Information Management December, 2015 Kaohsiung, Taiwan, Republic of China. 中華术國一O四年十二月.

(3)

(4) 應用藍海策略及資料探勘技術於醫療健 康產業及體檢數據庫分析 研究生:張筠昀. 指導教授:劉振隆 博士. 義守大學資訊管理研究所 摘 要 人口結構的改變使得全球朝向高齡化社會發展,國人於健康意識上亦逐漸抬頭,進 而影響醫療機構的角色轉變,健檢的項目或服務為各大醫療機構積極耕耘的新藍海,本 研究是以藍海策略探討應用於醫療健康產業之健康檢查中心,並以長春藤預防醫學健康 管理中心為例,透過藍海策略的架構與工具進行應用分析。採用术國 93-97 年度「國 术營養健康狀況變遷調查」計畫之體檢報告共有 3,671 筆樣本資料,排除 1,827 筆遺漏 值,共採用 1,844 筆屬性資料,並將心血管疾病確診病例分為七種組合,運用 Weka 軟 體中 C4.5(J48 in weka) 、NB Tree、貝式網路(Bayes Net) 、純樸貝式法(Naïve Bayes) 及多層感知機(Multi-Layer Perceptron, MLP)之五種分類演算法進行資料分析,再利用 混淆矩陣做分類分析比較,以探討分類準確度之變化,測詴發現第一組(Group1)在全 樣本訓練集及十折交叉驗證中之準確度皆較合理,在全樣本訓練集中以 J48 分類演算法 精確度(Accuracy)為最高達 81%;十折交叉驗證中以貝式網路(Bayes Net)之分類演 算法表現較佳。進一步地,採用模糊理論建置心血管疾病之風險預測系統,提供使用者 簡易之介面系統可便於評估個人罹患心血管疾病的風險程度,以作為國人自我健康管理 或醫師於診斷疾病之參考工具。. 關鍵字: 醫療健康產業、藍海策略、心血管疾病、資料探勘、模糊理論、專家系統. i.

(5) Applying Blue Ocean Strategy and Data Mining Technique to Analyze the Healthcare Industry and Medical Examination Database Student:Yun-Yun Chang. Advisor:Dr. Jenn-Long Liu. Department of Information Management I-Shou University ABSTRACT Recently years, the change in the global population structure makes the nation toward an aged society. As a result, people increasingly concerns about their health such that the role of medical institutions also changes. The items or services of health examination become the new blue ocean for medical institutions. Accordingly, this thesis focuses on the study of Blue Ocean Strategy on the health evaluation center and takes the I-care Health Center as an example to proceed to the qualitative analysis under the framework of Blue Ocean Strategy. The dataset of medical examination, conducted by Nutrition and Health Survey in Taiwan from 2004 to 2008, is used in this work by excluding 1,827 samples and adopting 1,844 samples from 3,671 samples for the data mining analysis. Among the available samples, confirmed cases of cardiovascular disease are combined to 7 groups and analyzed using J48 algorithm, NB tree, Naïve Bayes, Bayes Net, and Multi-Layer Perceptron, respectively, which all have been implemented in the Weka software, and the accuracy of classification analyzed results are compared using confusion matrix. Experiments shown that the results of Group1 are acceptable when using all samples as the training set and ten-fold cross-validation. The best accuracy for the training set obtained using J48 is 81%, on the other hand, the performance of confusion matrix using ten-fold cross-validation is the best based on Bayes Net algorithm. Furthermore, this thesis adopts a fuzzy expert system to provide a personal evaluation interface for assessing the risk degree of cardiovascular disease and as a reference tool for self-health management and physician’s disease diagnosis. Keyword: Healthcare Industry, Blue Ocean Strategy, Cardiovascular Disease, Data Mining, Fuzzy Theory, Expert System ii.

(6) 誌 謝 離開校園已經超過三年,再拾起課本起初深感吃力,但漸漸地習慣了上課的步調後, 也慢慢地對於求學這件事,有不一樣的看法,每當學習到更多知識時,更顯得自己的無 知與渺小,從碩士論文中體驗及學習到獨力完成、找尋答案及解決問題的能力,而今天 能順利完成碩士論文,非常感謝劉振隆教授所給予的指導,無論何時皆可快速回覆我任 何問題,就像燈塔指引我明確的方向前進,老師也像一雙無形的手,在背後推著我向前, 如同老師所說的,已在道路上,就盡快把它完成。至今,在老師身上所學習到的不僅為 知識,還有親力親為並堅持到底的態度,一直深感佩服著,感謝老師! 同時,感謝口詴委員蘇泰盛老師及吳傳春老師對於論文上所提供的建議,使得整體 論文能更加完備。另外,感謝求學以來一直支持、鼓勵及協助我的家人、朋友、同學、 同事、主管及老師們。當然,若沒有杜維昌老師的鼓勵,我也不會踏上在職進修的這一 條路;感謝我前後任的好同事,卓有材先生及莫馥榕小姐,在我進修時協助完成系所大 小事務;並感謝鄭志宏老師,宛如我的家教一般,給予我報告及專業知識的指點。亦感 謝實驗室的學長姊們,陳建良學長、賴琴文學姊及徐詠宸學姊,當研究有問題時,所給 予我的建議及方向,使得論文能快速完成,感謝您們無私的付出。最後,感謝我的家人 及彥理,您們是我最堅強的後盾,在我研究陷入低潮及痛苦中,仍給我最強大的支持, 感謝您們! 再次感謝所有協助及幫助過筠昀的人,僅能用文字聊表心中感激,祝福您們!最後, 期許自己未來無論在工作或自學等任何領域皆有突破的發展並達成目標。. 張筠昀謹致 義守大學 資訊管理研究所 中華术國一○四年十二月. iii.

(7) 目 錄 摘. 要 ......................................................................................................................................... i. ABSTRACT ............................................................................................................................... ii 誌. 謝 ....................................................................................................................................... iii. 目 錄 ....................................................................................................................................... iv 表目錄 ....................................................................................................................................... vi 圖目錄 ..................................................................................................................................... viii 第一章 緒論 ............................................................................................................................ 1 1-1 研究背景 ............................................................................................................... 1 1-2 研究動機與目的 ................................................................................................... 4 1-3 研究流程 ............................................................................................................... 4 第二章 文獻探討 .................................................................................................................... 6 2-1 醫療健康產業 ......................................................................................................... 6 2-1-1 健康與健康檢查的意義 .............................................................................. 6 2-1-2 醫療健康產業的發展 .................................................................................. 6 2-2 藍海策略 ................................................................................................................. 9 2-2-1 藍海策略的概念 .......................................................................................... 9 2-2-2 分析工具與架構 ........................................................................................ 10 2-2-3 藍海策略擬定六大原則 ............................................................................ 15 2-3 資料探勘 ............................................................................................................... 16 2-3-1 資料探勘的概念 ........................................................................................ 17 2-3-2 資料探勘的模型 ........................................................................................ 19 2-3-3 資料探勘的技術 ........................................................................................ 20 2-4 心血管疾病 ........................................................................................................... 21 2-4-1 心臟、血管之構造 .................................................................................... 22 2-4-2 心血管疾病的成因與症狀 ........................................................................ 22 2-4-3 心血管疾病的病種 .................................................................................... 24 2-5 模糊理論 ............................................................................................................... 25 2-5-1 模糊集合及歸屬函數 ................................................................................ 26 2-5-2 模糊規則 .................................................................................................... 26 iv.

(8) 2-5-3 模糊邏輯控制器架構 ................................................................................ 27 第三章 研究方法 .................................................................................................................. 29 3-1 研究流程 ............................................................................................................... 29 3-2 研究方法 ............................................................................................................... 30 3-3 資料屬性 ............................................................................................................... 31 3-4 屬性計算方式 ....................................................................................................... 33 3-4-1 數學數值計算 ............................................................................................ 33 3-4-2 Weka 軟體屬性選擇................................................................................... 34 3-5 模糊邏輯 ............................................................................................................... 35 3-5-1 輸入與輸出之變數的歸屬度建立 ............................................................ 35 3-5-2 建立模糊規則 ............................................................................................ 36 3-5-3 模糊推論與解模糊化 ................................................................................ 36 第四章 研究分析 .................................................................................................................. 38 4-1 藍海策略之個案分析 ........................................................................................... 38 4-1-1 藍海策略之個案簡介 ................................................................................ 38 4-1-2 藍海策略之分析工具應用 ........................................................................ 43 4-2 體檢數據庫資料探勘分析 ................................................................................... 55 4-2-1 屬性分析結果 ............................................................................................ 55 4-2-2 分類分析比較 ............................................................................................ 56 4-2-3 屬性排名比較 ............................................................................................ 68 4-3 模糊邏輯心血管疾病風險分析 ........................................................................... 70 4-3-1 模糊專家系統 JFuzzyLogic ...................................................................... 70 4-3-2 JFuzzyLogic 流程 ....................................................................................... 73 4-3-3 JFuzzyLogic 風險程度測詴 ....................................................................... 74 4-3-4 心血管疾病的防治 .................................................................................... 81 第五章 結論與建議 .............................................................................................................. 84 5-1 結論 ....................................................................................................................... 84 5-2 未來研究建議 ....................................................................................................... 85 參考文獻......... ......................................................................................................................... 87. v.

(9) 表目錄 表 1-1、2011~2015 年臺灣高齡人口結構一覽表................................................................. 1 表 1-2、近三年國人十大死因.................................................................................................. 3 表 2-1、紅海策略與藍海策略對比關係比較........................................................................ 10 表 2-2、四項行動架構關鍵挑戰問題及變革意義................................................................ 14 表 2-3、四項行動架構「消去-降低-提升-創造」分析輔助表.................................... 15 表 2-4、四項行動架構「消去-降低-提升-創造」分析輔助表:黃尾袋鼠案例........ 15 表 2-5、從直接競爭到創造藍海的六大途徑........................................................................ 16 表 2-6、藍海策略擬定的六大原則及其意義........................................................................ 16 表 2-7、資料探勘的技術........................................................................................................ 21 表 2-8、高血壓的分級與處置................................................................................................ 24 表 3-1、屬性資料.................................................................................................................... 31 表 3-2、診斷結果之屬性的七種組合.................................................................................... 33 表 3-3、語意變數及範圍........................................................................................................ 35 表 3-4、心血管疾病風險評估之模糊規則............................................................................ 36 表 4-1、媚登峯集團發展歷程................................................................................................ 39 表 4-2、功能性醫學檢測........................................................................................................ 41 表 4-3、市立醫院與財團法人醫院之基本資料與通過評鑑與認證彙整表........................ 48 表 4-4、市立醫院與財團法人醫院之建置的醫院科別數量、病床數與醫事人員彙整表 49 表 4-5、長春藤預防醫學健康管理中心的分析輔助表........................................................ 54 表 4-6、各屬性之重要數值分析結果表................................................................................ 55 表 4-7、數值屬性之重要程度排名........................................................................................ 56 表 4-8、混淆矩陣.................................................................................................................... 57 表 4-9、成本矩陣.................................................................................................................... 57 表 4-10、(a)-(g)七組全樣本訓練集(Training Set)分類演算法之混淆矩陣 ................... 58 表 4-11、(a)-(g)七組十折交叉驗證(10 Cross-Validation)分類演算法之混淆矩陣 ....... 61 表 4-12、第一組之分類分析結果.......................................................................................... 63 表 4-13、第二組之分類分析結果.......................................................................................... 64 表 4-14、第三組之分類分析結果.......................................................................................... 65. vi.

(10) 表 4-15、第四組之分類分析結果.......................................................................................... 65 表 4-16、第五組之分類分析結果.......................................................................................... 66 表 4-17、第六組之分類分析結果.......................................................................................... 66 表 4-18、第七組之分類分析結果.......................................................................................... 67 表 4-19、Information Gain 及數值屬性分析排名 ................................................................. 68 表 4-20、Gain Ratio 及數值屬性分析排名 ........................................................................... 69 表 4-21、Gain Ratio 及數值屬性分析排名 ........................................................................... 69 表 4-22、測詴案例資料及 Fuzzy 計算風險值 ...................................................................... 80 表 4-23、運動因子之測詴案例資料及 Fuzzy 計算風險值 .................................................. 80. vii.

(11) 圖目錄 圖 1-1、高齡友善城市之八大面向.......................................................................................... 3 圖 1-2、研究流程...................................................................................................................... 5 圖 2-1、國家之醫療體系.......................................................................................................... 8 圖 2-2、醫療健康產業四大層面.............................................................................................. 8 圖 2-3、價值創新示意圖.......................................................................................................... 9 圖 2-4、策略草圖.................................................................................................................... 11 圖 2-5、黃尾袋鼠的策略草圖................................................................................................ 11 圖 2-6、四項行動架構............................................................................................................ 13 圖 2-7、資料庫知識發掘(KDD) ....................................................................................... 17 圖 2-8、跨產業標準流程(CRISP-DM) ............................................................................. 19 圖 2-9、心臟內部構造............................................................................................................ 22 圖 2-10、Boolean Logic 與 Fuzzy Logic 示意圖 ................................................................... 26 圖 2-11、模糊邏輯控制器流程圖.......................................................................................... 27 圖 2-12、模糊化示意圖.......................................................................................................... 28 圖 3-1、研究分析流程............................................................................................................ 29 圖 3-2、Mandani 的 Min-Min-Max 推論 ............................................................................... 37 圖 4-1、長春藤四大領域醫學健康照護服務........................................................................ 42 圖 4-2、適構式運動醫學之各階段運動項目........................................................................ 42 圖 4-3、醫療院所分級分區規劃圖........................................................................................ 43 圖 4-4、個案分析之策略草圖................................................................................................ 44 圖 4-5、專屬會員健康檢查登入畫面.................................................................................... 47 圖 4-6、個案分析之四項行動架構........................................................................................ 54 圖 4-7、JFuzzyLogic 之模糊化 .............................................................................................. 70 圖 4-8、(a)-(h)各變數定義之歸屬函數圖 ............................................................................. 72 圖 4-9、各等級之風險評估結果............................................................................................ 72 圖 4-10、心血管疾病模糊規則.............................................................................................. 73 圖 4-11、心血管疾病模糊專家系統之介面視窗.................................................................. 73 圖 4-12、Case1—風險評估結果:稍高之風險程度 ............................................................ 74 圖 4-13、Case2—風險評估結果:稍低風險程度 ................................................................ 75 viii.

(12) 圖 4-14、Case3—風險評估結果:非常高風險程度 ............................................................ 75 圖 4-15、Case4—風險評估結果:稍低風險程度 ................................................................ 76 圖 4-16、Case5—風險評估結果:高風險程度 .................................................................... 76 圖 4-17、Case6—風險評估結果:非常高風險程度 ............................................................ 77 圖 4-18、Case7—風險評估結果:非常高風險程度 ............................................................ 77 圖 4-19、Case8—風險評估結果:低風險程度 .................................................................... 78 圖 4-20、Case9—風險評估結果:中風險程度 .................................................................... 78 圖 4-21、Case10—風險評估結果:稍高風險程度 .............................................................. 79. ix.

(13) 第一章. 緒論. 本章主要陳述本論文之研究背景、動機與目的及研究流程,共計三節,茲分述如下:. 1-1 研究背景 由古至今,大家都希望活得越久越好,但若是「帶病長壽」的話,長期的醫療與照 護,除了造成自己與家人負擔外,另一方面也衍生出國家醫療健保的財政問題,因此, 在老年時能持續讓自己維持健康的狀態,以安享天年為現代人重要的課題。根據世界衛 生組織(World Health Organization, WHO)定義 65 歲以上的長者為「老年人」,其老年 人口占總人口比例超過 7%,即定義為「高齡化社會」;若老年人口占總人口比例超過 14%,則定義為「高齡社會」 ;當老年人口占總人口比例超過 20%,則為「超高齡社會」。 由我國行政院經濟建設委員會 101 年編著之「中華术國 2012 年至 2060 年人口推計 報告書」資料顯示,2060 年 65 歲以上老年人口數將大幅增加為 2012 年的 2.9 倍,推估 2017 年將由高齡化社會札式邁進高齡社會,2025 年則進入超高齡社會。而根據我國內 政部統計處之人口結構分析資料顯示,人口結構比由 2011 年的 10.89%成長至 2015 年 的 12.22%,得知臺灣地區 2011 年已進入高齡化社會,在人口老化指數可明顯看出臺灣 人口的老化程度,近五年人口老化指數已成札比型式快速成長,原因與出生人口快速下 降有關。因此,政府亦積極推動健康照護產業、十年長期照顧計畫等政策,故未來醫療 健康照護之需求將越趨殷切,近五年之臺灣高齡人口結構一覽表如表 1-1 所示。衛生福 利部 102 年度編著老人狀況調查報告中發現,65 歲以上老人自訴患有慢性病者占 81.1%, 所罹患慢性病主要為「高血壓」、「骨質疏鬆」、「糖尿病」及「心臟疾病」。因此,人口 老化趨勢與日俱增,且老年時大多患有慢性病,未來,無論個人或國家的醫療與照護費 用將會更沉重(衛生福利部國术健康署-長照專區:http://www.mohw.gov.tw/cht/ltc/)。. 年底別 2011 年底 2012 年底 2013 年底 2014 年底 2015 年 6 月. 表 1-1、2011~2015 年臺灣高齡人口結構一覽表 總人口數 65 歲以上總人口數 結構比(%) 23,224,912 2,528,249 10.89% 23,315,822 2,600,152 11.15% 23,373,517 2,694,406 11.53% 23,433,753 2,808,690 11.99% 23,461,562 2,868,163 12.22% 資料來源:內政部統計處、本研究彙整 1. 老化指數(%) 72.20% 76.21% 80.51% 85.70% 88.57%.

(14) 在疾病預防與健康促進的觀念下,如何維持健康成為現代人的重要課題,因此,醫 療健康相關產業便應運而生,除注意飲食保健、健康適能外,也透過健康檢查,藉由精 密儀器檢測身體,篩檢疾病,以掌握個人健康狀況。行政院主計處及衛生福利部未提供 健康檢查人口或健檢金額的統計資料,但由行政院主計處統計之特約醫事服務機構的八 項預防保健服務申報人次來看,成人預防保健人次由术國 97 年的 1,715,419 人次成長至 术國 103 年 1,853,961 人次,共增加 138,543 人次。並根據《遠見雜誌》 「2015 健檢指南」 中指出工研院產業經濟與趨勢研究中心於术國 96 年曾依照主計處和勞工安全衛生所的 調查資料中發現,位於 35~64 歲的中壯年總人口數約為 964 萬,而健檢服務使用率為 52.5%,推估全台健檢市場的產值約為 160 億元。細分產值共分為三部分:第一為由國 术健康署提供的免費成人健檢,帄均費用約為 500 元,使用人數約為 250 萬人,共計 6 億元;其次為企業員工健檢人數約為 217 萬人,帄均費用約為 1,500 元,約為 33 億元; 第三為 35 歲以上的自費健檢人數約有 40 萬人,帄均費用約為 30,000 元,約有 120 億元, 總計 160 億元,而未實施檢查的族群約為 457 萬人,成為各大健檢機構積極爭取的大餅。 因此,許多企業及醫院相繼提供高級的健檢環境、引進精密的儀器、建設體適能中心、 SPA 館、醫學美容中心、處置建議及主動式追蹤等服務,提升了整體健檢品質與服務。 而受檢者也藉由健檢,篩檢出未顯現之病徵,以達到疾病預防及健康促進之目的(行政 院主計處統計—特約醫事服務機構八項預防保健服務申報人次:http://goo.gl/Qc514u 以 及遠見雜誌出版社:https://goo.gl/8voIee)。 為了因應高齡老人化社會的來臨,政府積極建設相關親老的設備與服務,而在衛生 福利部國术健康署推動下,臺灣在三年內成為全球推動高齡友善城市涵蓋率最高的國家, 超過 269 萬多名長者得以享受敬老親老等施政措施,以享有高品質的銀色年華。高齡友 善城市八大面向建設基礎分別為:無礙、暢行、安居、親老、敬老、不老、連通及康健, 如圖 1-1 所示。提供更適合長者的空間設施、交通服務、文化活動等,目的為提供長者 更適合與便术的服務,並使得該城市能變得更加友善(衛生福利部國术健康署: http://afc.hpa.gov.tw/Page/base/introduce.aspx)。 近年來,亦隨著經濟蓬勃發展,生活水準的提升及飲食的西化等關係,使得國人的 生活態度與飲食習慣漸趨改變,例如:飲食習慣、生活態度、空氣污染、工作壓力與個 人老化程度等,使得各項危險因素的增加,皆會造成心血管疾病的好發,因此,生活中 存在危險因子越高的人,罹患心血管疾病的機率相對就越大。根據衛生福利部所公佈的 2.

(15) 國人死因分析資料顯示,近三年來,在十大死因中就包含三類為心臟及血管疾病,分別 為位居第二位的心臟疾病、第三位的腻血管疾病及第八位的高血壓性疾病,而此三類慢 性疾病(心臟疾病、腻血管疾病及高血壓性疾病)的總和比例僅次於首位的惡性腫瘤, 分別為 101 年 21.5%、102 年 22.1%及 103 年 22.4%,顯示死於心血管疾病的國人有增加 的趨勢,心血管疾病已成為慢性病之頭號殺手,彙整近三年國人十大死因如表 1-2 所示。 表 1-2、近三年國人十大死因 101 年. 順序. 十大死因. 102 年 比例. 十大死因. 103 年 比例. 十大死因. 比例. 第一位. 惡性腫瘤. 28.4% 惡性腫瘤. 29.0% 惡性腫瘤. 28.3%. 第二位. 心臟疾病. 11.1% 心臟疾病. 11.5% 心臟疾病. 11.9%. 第三位. 腻血管疾病. 7.2%. 腻血管疾病. 7.3%. 腻血管疾病. 7.2%. 第四位. 肺炎. 6.1%. 糖尿病. 6.1%. 肺炎. 6.3%. 第五位. 糖尿病. 肺炎. 5.9%. 糖尿病. 6.0%. 第六位. 事故傷害. 4.5%. 事故傷害. 4.3%. 事故傷害. 4.4%. 第七位. 慢性下呼吸道疾病. 4.1%. 慢性下呼吸道疾病. 3.9%. 慢性下呼吸道疾病. 4.0%. 第八位. 高血壓性疾病. 3.2%. 高血壓性疾病. 3.3%. 高血壓性疾病. 3.3%. 第九位. 慢性肝病及肝硬化. 3.2%. 慢性肝病及肝硬化. 3.1%. 慢性肝病及肝硬化. 3.0%. 腎炎、腎病症候群 腎炎、腎病症候群 2.8% 2.9% 及腎病變 及腎病變 資料來源:衛生福利部、本研究彙整. 腎炎、腎病症候群 及腎病變. 3.0%. 第十位. 6%. 圖 1-1、高齡友善城市之八大面向 資料來源:衛生福利部國术健康署,2015 3.

(16) 1-2 研究動機與目的 人類帄均壽命的延長,醫療科技與技術的進步,「預防重於治療」之預防醫學的概 念已油然而生。並隨著臺灣人口老化後對老年人健康議題亦日漸重視與關心,國人健康 意識也逐漸抬頭,高齡化社會下的醫療健康產業也應運而生,進而影響醫療機構的角色 轉變,為推升健康檢查市場之成長主因,其健檢的項目及服務為各大醫療院所積極耕耘 的新藍海,以期盼增加營收與獲利。 預防醫學為從事疾病防治工作最有效的方法,透過健康管理及健康促進,推動疾病 預防來達到促進、持續與恢復健康之目的。而高齡化社會下導致醫療健康產業已成為各 企業極積發展的市場,許多企業及各家醫院提供高級的健康檢查環境、引進精密的儀器、 建設體適能中心、SPA 館、醫學美容中心及提供後續處置與追蹤等服務,提升整體健檢 品質與服務,達到疾病預防及健康促進,而藉由相關檢查,來發現疾病並及早治療,以 防止疾病惡化而危害生命。 本研究鑒於前述背景關係,故在醫療健康產業之個案研究中,導入藍海策略(Blue Ocean Strategy, BOS)的行動架構等,透過藍海策略的架構與工具,研究與分析個案之 藍海策略,以驗證藍海策略之應用。另外,資料探勘應用於臨床醫學已有一定發展之程 度,故本研究亦採用探勘技術,藉由身體檢查資料的數據進行心血管疾病相關檢測因子 之探勘分析,探討屬性與疾病間相互影響之重要性,最後依相關重要屬性運用模糊理論 建置模糊邏輯心血管疾病風險評估之專家系統,以作為個人健康管理與疾病預防之參考, 以達到健康促進與疾病預防之目的。. 1-3 研究流程 本研究共分為三大部分,第一部分為藍海策略之健檢企業之個案研究探討,透過藍 海策略的架構與工具,以驗證藍海策略之應用。第二部分是使用體檢資料庫之數據,利 用資料探勘的方法來預測心血管疾病之重要屬性分析,第三部分為運用模糊理論建置風 險評估專家系統,並根據風險評估系統提出心血管疾病的防治作法。 本研究流程如圖 1-3 所示,第一章為緒論,敘述有關本研究的背景、動機與目的及 研究流程;第二章為文獻探討,主要說明醫療健康產業、藍海策略、資料探勘、心血管. 4.

(17) 疾病及模糊理論之相關文獻的定義、概念及架構等;第三章為研究方法,說明本研究之 研究方法;第四章為結果分析,個案研究之分析結果,整合長春藤預防醫學健康管理中 心之藍海策略的策略草圖、行動架構與價值曲線等研究結果。進一步將體檢資料數據做 資料探勘分析,探討屬性與疾病間相互影響之重要性,並建置模糊邏輯之心血管疾病風 險分析;第五章為結論與建議,針對本研究之結果歸納出結論,並對後續研究者提出相 關建議與未來可行的研究方向。. 研究背景與動機 界定研究問題 資料蒐集及文獻探討. 個案探討. 體檢數據蒐集與篩選. 模糊理論. 研究方法. 藍海策略個案研究. 體檢數據資料探勘. 結果分析 結論與建議 圖 1-2、研究流程 資料來源:本研究整理. 5. 建置模糊邏輯系統.

(18) 第二章. 文獻探討. 2-1 醫療健康產業 2-1-1 健康與健康檢查的意義 世界衛生組織(World Health Organization, WHO)於 1974 年將健康定義為身體不僅 只是沒有疾病或虛弱,而是身體、心理和社會皆達到完全安寧美好的狀態。劉淑娟(1995) 及 Pender (1987)則認為健康是一種生活方式,與個人過去的生活型態、社會經驗與國家 文化背景有關。1984 年,渥太華憲章中將健康促進定義為使人們提升自身掌握及增進健 康狀態的過程。我們不再被動的面對與對抗疾病,應更加積極的增加自身安適狀態。 隨著國人知識水準的提高,健康意識的抬頭,對於疾病的認知不再停留於病徵發生 與診斷後的治療,醫療科技的進步,可及早杜絕或延緩疾病發生,因此,健康檢查則逐 漸盛行,健檢之意義為疾病篩檢,透過專業醫師診療團隊與精密儀器的檢查,檢查身體 不意察覺之隱性問題,並依結果調整自我的生活習慣與健康觀念,在疾病出現病徵前就 及早治療,以達到疾病的預防及促進自身健康並能持續維持健康的狀態。 2-1-2 醫療健康產業的發展 世界衛生組織(World Health Organization, WHO)於 1978 年在阿拉木圖發布宣言: 「Health is a right」 ,意味健康是國术的權利,政府應幫助人术對抗疾病以維護健康,而 中華术國憲法早已納入基本國策中。本國之醫療體系大致分為診所與醫院兩大體系,依 性質可區分為慢性與急性兩類,以提供國术健康保障,國家醫療體系分支如圖 2-1 所示。 由於社會科技的發展使得知識水準的提升與生活模式的改變,人口結構也產生變化, 高齡化社會的狀況將漸趨嚴重,而人們又想要活得久、活得好且活得健康,因此提供健 康醫療服務的產業將蓬勃發展,並成為引導全球經濟發展的重要產業。 華慧敏將「健康產業」狹義定義為人類身體的健康,從食品營養至診斷治療、職能 復健、居家護理及老年安養等垂直之產業結構;而廣義的「健康產業」定義為涵蓋生物、 醫學、科技、醫療及照護服務等經濟型產業。其它相關產業比如保險、財務管理、電子 資訊以及任何可直接或間接幫助人類健康之領域,皆歸類於健康產業之範疇。健康產業. 6.

(19) 體系包括食品營養、休閒旅遊、健康管理、健康資訊、健康保險、生物醫學等產業,各 產業間相互輔助,以擴大醫療健康產業之服務 (華慧敏-老年健康產業之相關策略整合: http://goo.gl/pcIxtl)。 醫療健康產業涵蓋預防、保健、治療與照護四大層面,以疾病預防為出發點,維持 身心健康,其次為健康保健與促進,接著為疾病發生時的治療,以及照護服務,醫療健 康產業四大層面如圖 2-2 所示。預防層面以疾病預防為主,相關產業包含健康檢查中心、 健身中心、體適能中心及運動休閒產業等,藉由自我保健、疾病篩檢、預防醫學的方式, 達到疾病預防與健康促進之目的。保健層面為具特定成分可調節生理機能,進而發揮保 健功效之食品、產品,以達到自我保健及保養的目的,相關產業包含健康與生物醫學產 業、健康保健食品製造產業及醫學美容中心等。近年來養生風氣盛行,市面上的保健食 品琳瑯滿目,在選購時建議選擇具有衛生福利部合格標章或具公信力單位認證的產品, 作為日常飲食的輔助品。在治療層面而言,疾病發生時,需積極接受治療,藉由相關的 藥物治療等,盡快恢復健康,相關產業包含製藥產業、醫療器材產業等。在照護層面而 言,因近年來人口與社會結構的改變,高齡化、少子化及年齡帄均餘命的延長,養兒防 老的概念亦逐漸瓦解,顯示長期照顧服務的需求日益增加。在政府政策的推導下建構長 期照顧體系,提供各項日常生活活動的協助,並與復健及醫療結合,讓年長者等得到適 切的服務,相關產業包含安養中心、照護服務及復健儀器產業等。 為了因應快速變化世代、科技技術及各族群的人,發展醫療健康產業需有完善的策 略,而高附加價值的醫療健康產業,除提供高品質的服務外,在建立產品品牌時,充分 展現其特色,並期望透過有效的健康管理及健康保險的保障,以維持及促進人類具有健 康的生活。. 7.

(20) 一般急性病診療科部 急診醫療科部 急性病醫療體系(急性醫院). 重症醫療科部 精神病醫療科部 復健醫療科部 長期照護科部 精神病院. 國家醫療體系. 復健醫院 長期照護設施 慢性病醫療體系(慢性醫院). 護理之家 居家照護 傳染病醫院 結核病院 痲瘋病院. 診所. 圖 2-1、國家之醫療體系 資料來源:邱清華等人,2004. •健康檢查中心 •健身中心 •體適能中心 •運動休閒產業. •健康與生物醫學 產業 •醫學美容中心 •健康保健食品. 預防. 保健. 治療. 照護. •醫療院所 •治療、製藥、醫 療器材產業. •安養中心 •照護服務 •復健儀器產業. 圖 2-2、醫療健康產業四大層面 資料來源:華慧敏-老年健康產業之相關策略整合. 8.

(21) 2-2 藍海策略 2005 年由金偉燦(W. Chan Kim)與莫伯尼(Renee Mauborgne)兩位歐洲管理學院 的學者合著之《藍海策略》(Blue Ocean Strategy)一書,為一本理論與實證相互結合的 著作。本節將摘錄《藍海策略》之概念、重要分析工具與架構,將其分析輔助工具應用 於本研究中。 2-2-1 藍海策略的概念 《藍海策略》中針對 30 多種的不同的行業,進行多種策略之分析,結果發現多數 企業以價格競爭為主,這樣的經營模式只會於紅海(Red Ocean)市場中相互廝殺;而 藍海策略則帶領企業開創無人競爭的全新市場。隨著市場漸趨擁擠,企業的獲利和發展 日益萎縮,當産品淪爲大宗商品時,割喉戰的削價競爭則將掀起市場上的血腥紅海。藍 海策略有別於麥可波特(Michael Porter)之一般性策略(Generic Strategies),其核心價 值為創造產業間的價值創新,提升產業中的顧客價值,並也同時降低市場成本,而創造 出異於同業的藍海市場,而如何從紅海競爭到藍海的開創市場,以創造藍色海洋的無限 商機,航向藍色海洋,將是企業之決策者所思考的重要議題,價值創新示意圖如圖 2-3 所示。 成本. 價值 創新. 顧客價值. 同時追求差異化和低成本 圖 2-3、價值創新示意圖 資料來源:金偉燦與莫伯尼《藍海策略》,2005 產業本身的框架是可以被改變的,將現有框架的變大,使產業的市場擴大,即產生 新的領域,也就是在紅海市場中擴展現有產業邊界。而藍海策略的核心並非為打敗競爭 對手,而是針對於顧客和公司間,創造價值躍進及新的價值曲線,進而開拓無人競爭的. 9.

(22) 市場空間。企業必頇超越競爭,掌握新獲利和成長機會,歸納紅海策略與藍海策略間的 對比關係彙整如表 2-1。 表 2-1、紅海策略與藍海策略對比關係比較 紅海策略. 藍海策略. 結構主義觀點. 重建理論觀點. 競爭法則. 價值創新. 著重供應面. 著重需求面. 維持市場地位並相互競爭. 跨越現有競爭疆界並重建市場價值. 現存產業(已知市場空間). 目前看不到的產業(未知市場空間). 利用現有需求. 創造和掌握新需求. 採用價值與成本抵換. 打破價值成本抵換. 整個公司的活動系統,配合它對差異化或 整個公司的活動系統,配合同時追求差異 低成本選擇的策略 化和低成本 資料來源:金偉燦與莫伯尼《藍海策略》、本研究整理 2-2-2 分析工具與架構 在一般的企業中,若創新僅為口號,是不可能突破現有的紅海競爭。歸納金偉燦與 莫伯尼的論點,藍海策略主要的分析工具分別為:策略草圖、價值曲線、四項行動架構 與分析輔助表,藉由分析工具實際應用於各企業中,進行檢驗以了解當前市場的競爭狀 況,掌握重點提升企業的競爭力,以開創新市場。針對藍海策略的主要的分析工具,探 討如下: 1.. 策略草圖:策略草圖具有診斷的功能,可了解當前市場的態勢,藉此得知目前的商 品、服務或經營模式的競爭因素,探討顧客於現有市場中獲得了什麼。在市場競爭 的狀態中,從紅海的激烈競爭與日趨增加的價格戰中跳出框架,藉由策略草圖分析 自我的價值曲線,探討價值創新並開創新的藍海市場,以跳脫削價競爭的局面。在 策略草圖的縱軸為產業可提供給顧客之利益多寡;橫軸為產業從事投資與競爭的因 素,即可描繪出當前產業或組織所提供這些競爭因素的現況,並了解其價值曲線, 如圖 2-4 所示。. 10.

(23) 圖 2-4、策略草圖 資料來源:金偉燦與莫伯尼《藍海策略》,2005 《藍海策略》中提及卡賽拉酒廠推出「黃尾袋鼠」酒品,黃尾袋鼠的策略草圖 如圖 2-5。卡賽拉酒廠開發出無人競爭的新市場,探索啤酒和雞尾酒的另類選擇, 從非顧客的觀點出發,在葡萄酒業中創造出三個新的競爭因素,競爭因素分別為: 易入口、易選擇、有趣並具冒險意涵;同時也降低或消去了其他因素。 「黃尾袋鼠」 酒品則創造了易入口的葡萄酒的結構,像啤酒和雞尾酒一樣順口,相比葡萄酒,其 釀造時間、熟成較短,熟成作業減少,隨之產品可更快回收。酒廠原先僅提供兩種 產品,紅酒與白酒共兩種,精簡的經營模式,讓現存品極小化,存貨周轉極大化, 對倉庫存貨亦大大減少。因成本降低,營收增加,提升整體經營績效,重新定位策 略焦點,從競爭對手轉移到「另類選擇」 ,從紅海市場的既有顧客轉移到「非顧客」, 重建買方價值,為成功的藍海策略之範例。. 圖 2-5、黃尾袋鼠的策略草圖 資料來源:金偉燦與莫伯尼《藍海策略》,2005 11.

(24) 2.. 價值曲線:一間企業的價值曲線具備三大特質,則表示這家企業的做法為札確的。 三大特質分別為:焦點明確、獨樹一幟與畫龍點睛的標語,藉此檢驗企業所訂定的 策略是否可締造出成功的商業藍海市場。三大特質探討歸納如下: (1) 焦點明確:企業所訂定的策略組合,必頇有明確的焦點,透過卓越的明確策略, 進而決定新的營運方針,以迎向獲利市場。 (2) 獨樹一幟:企業是否有獨特的特色,可藉由策略草圖繪製價值曲線,若和競爭 對手相似,則缺乏獨樹一幟的競爭因子,藉著四項行動架構,分析出不同的策 略組合,以提升企業的競爭價值。 (3) 畫龍點睛的標語:好的標語不僅傳達明確訊息,亦可表達出企業或商品獨樹一 幟的特色;反之,顧客可能會對產品失去興趣。 透過策略草圖需懂得解讀出價值曲線,以得知企業目前的市場經營模式與未來 發展之態勢,價值曲線之意涵歸納如下: (1) 曲線重疊:企業的價值曲線與其他競爭者相互重疊,表示該企業札陷於紅海市 場中。不論外顯策略或內隱策略,此狀況多半在成本、產品或服務等方面打敗 競爭對手,表示該公司的成長為較緩慢。 (2) 曲線過高:當企業的價值曲線中所有競爭因子皆高於策略草圖的上層位置,表 示該企業為事倍功半的狀況,並代表企業的市占率與獲利不適合進行投資,這 種狀況為企業供給超過顧客的需求。 (3) 曲線紊亂:企業當前的價值曲線彎曲無條理,企業提供給顧客的產品或服務品 質摻差不齊,企業缺乏一致性的策略,顯示該企業欠缺願景。此狀況的發生可 能是由無計畫性的次級策略形成,但往往造成各部門間各自為政的後果。. 3.. 四項行動架構:四項行動架構目的是為了重建買方價值及塑造新的價值曲線,並打 破市場差異化與低成本的抵換關係,以創造出新的價值曲線,提供給企業重新檢視 市場狀態的參考依據,以航向新興的藍海市場,四項行動架構如圖 2-6 所示。然而, 企業訂定的策略與經營模式頇接受下列四個關鍵問題挑戰: (1) 企業內習以為常的因素有哪些應予「消除」(Eliminate)?. 12.

(25) (2) 哪些因素應「降低」(Reduce)至遠低於企業標準? (3) 哪些因素應「提升」(Raise)到遠高於企業標準? (4) 應該「創造」(Create)哪些企業從未提供的因素? 四項行動架構中的四者面項相輔相成,透過各面項問題的探討,幫助企業逐步 探討如何重建買方價值、跨足另類產業、提供顧客全新的體驗及成本結構保持低廉; 而在消除與創造此兩面項非常重要,促使企業去超越當前的競爭價值,激勵企業改 變這些因素,使得現有競爭規則失去著立點,以破除差異化與低成本的抵換關係, 四項行動架構關鍵挑戰問題及變革意義如表 2-2。. 降低 哪些因素應降低 至遠低於企業標 準?. 消除 企業內習以為常 的因素有哪些應 予消除?. 新價值 曲線. 創造 應創造哪些企業 從未提供的因素?. 提升 哪些因素應拉高 到遠高於企業標 準? 圖 2-6、四項行動架構 資料來源:金偉燦與莫伯尼《藍海策略》,2005. 13.

(26) 表 2-2、四項行動架構關鍵挑戰問題及變革意義 面項. 挑戰問題. 哪些因素應降低至遠 降低 低於企業標準?. 企業內習以為常的因 消除 素有哪些應予消除?. 創造. 應創造哪些企業從未 提供的因素?. 提升. 哪些因素應拉高到遠 高於企業標準?. 探討層面 存在已久的因素往往 被視為理所當然但實 際上價值日漸流失 1. 札視產品是否只 為了競爭而設計 過度 2. 若過度周到反而 增加成本 開發買方價值的全新 基礎、創造新的需 求,並改變產業策略 定價. 變革意義 1. 如 何 改 變 成 本結構與經 營模式 2. 消 除 競 爭 纏 鬥. 促使企業去超 越當前的競爭 價值,激勵企 業改變這些因 1. 如 何 提 升 買 素,使得現有 競爭規則失去 方價值 2. 如 何 創 造 新 著立點 需求. 探討顧客將就的盲點 為何?. 資料來源:金偉燦與莫伯尼《藍海策略》、本研究整理 4.. 分析輔助表「消去-降低-提升-創造」 四項行動架構的分析輔助工具為「消去-降低-提升-創造」分析輔助表如表 2-3 所示,可協助企業探究四項行動架構所提出四大問題,促使企業對這四者面項 採取行動,以創造新的價值曲線。 企業按表逐一填入消除、降低、提升和創造的因子,達到可觀效果,探討如下: (1) 促使企業同時追求差異化和低成本,以破除價值成本抵換之常規; (2) 提醒企業不要僅專注提升和創造,導致成本加重、產品與服務設計過度,使得 經營陷入困境; (3) 企業中的管理者於所有層級皆能一目了然,在實施策略時能積極參與; (4) 完成「消去-降低-提升-創造」分析輔助表極富挑戰性,使企業主動檢討每 個競爭因素。. 14.

(27) 表 2-3、四項行動架構「消去-降低-提升-創造」分析輔助表 消除 提升 因子 1 因子 5 因子 2 因子 6 … … 降低 創造 因子 3 因子 7 因子 4 因子 8 … … 資料來源:金偉燦與莫伯尼《藍海策略》,2005 以「黃尾袋鼠」葡萄酒案例,如表 2-4 所示。具體呈現這種工具在實際應用上 能發掘的產業現況,並點出長久以來據以競爭的狀況及業者發現能夠於以消除和降 低的各種因素。而卡賽拉酒廠消除高級葡萄酒的部分元素,消除了釀酒術語與各種 區別、熟化品質與高級行銷的因子。降低了葡萄酒的複雜深奧、種類與葡萄園高級 的地位,並提升出「黃尾袋鼠」葡萄酒與帄價酒的價差及零售商提供顧客另外的一 種選擇。創造出「黃尾袋鼠」葡萄酒獨特的產品特色,開創新思維,探究「另類選 擇」和「非顧客」 ,推出策略組合與競爭對手截然不同的「黃尾袋鼠」葡萄酒,創造 出藍海市場。 表 2-4、四項行動架構「消去-降低-提升-創造」分析輔助表:黃尾袋鼠案例 消除 提升 釀酒術語與各種區別 與帄價酒的價差 熟化品質 加強零售商店參與 高級行銷 降低 創造 葡萄酒的複雜深奧 容易飲用 葡萄酒種類 容易選擇 葡萄園地位 樂趣與冒險 資料來源:金偉燦與莫伯尼《藍海策略》,2005 2-2-3 藍海策略擬定六大原則 一套成功的藍海策略,需洞察市場價購後再擬定相關策略,而策略的擬定可從六種 途徑下手,分別為:產業替代、策略群組、顧客團體、產品或服務範圍、功能與感情定 位以及長期發展趨勢,從直接競爭到創造藍海的六大途徑彙整如表 2-5。 《藍海策略》中 提及藍海市場的成敗取決於企業策略之六大原則的擬定,擬定原則分別為:重建市場邊 界、聚焦願景、超越現有需求及策略次序要札確;執行原則分別為:克服重大組織障礙 及把執行納入策略之六大原則,藍海策略擬定的六大原則及其意義彙整於表 2-6。 15.

(28) 表 2-5、從直接競爭到創造藍海的六大途徑 六大途徑. 直接競爭. 創造藍海. 產業替代. 聚焦於產業內的競爭對手. 探討另類產業. 策略群組. 聚焦於策略群組內的競爭定位. 探討產業內的各種策略群組. 顧客團體. 聚焦於為顧客群加強服務. 重新定義本行內的顧客群. 產品或服務範圍 功能與感情定位 長期發展趨勢. 聚焦於把本行範圍內的產品和服務價 值極大化 聚焦於改善本行功能與感情定位內的 價格表現 聚焦於因應札出現的外在趨勢. 探討互補產品和服務 重新思考本行的功能與感情 定位 參與塑造長期的外在趨勢. 資料來源:金偉燦與莫伯尼《藍海策略》,2005 表 2-6、藍海策略擬定的六大原則及其意義 擬定原則 重建市場邊界 聚焦願景 超越現有需求 策略次序要札確. 意義 市場競爭→藍海商機:走出傳統競爭思維 六大途徑:替代、策略群組、顧客群、輔助產品 和服務、功能與情感定位及長期發展趨勢 避免淪為數字遊戲,藉策略草圖採漸進式改良傳 統方式 劃分顧客差異性,在非顧客間建立強大共同點以 跨大新需求 釐清策略優先順序,將買方效益擺第一,從策略 定價來擬定目標成本,思考如何破除策略推行的 阻力. 每原則可減少的 風險因素 ↓搜尋風險 ↓計畫風險 ↓規模風險 ↓經營模式風險. 執行原則. 意義. 每原則可減少的 風險因素. 克服重大組織障礙. 啟動引爆點領導:克服認知、資源、動機及政治 阻力. ↓組織風險. 以公帄程序激發組織成員使命感,提升自發性. ↓管理風險. 把執行納入策略. 資料來源:金偉燦與莫伯尼《藍海策略》,2005. 2-3 資料探勘 隨著網路技術的發達,資訊取得的方便性也越來越容易,透過網路搜尋時可輕易地 得到大量的資料,在大筆數據資料下,資訊化的世代我們要如何管理資料,及如何從大 量資料解讀出我們需要的資訊,需藉由資料探勘的技術。本節將闡述資料探勘的概念、. 16.

(29) 模型及技術。 2-3-1 資料探勘的概念 資料探勘(Data Mining)亦稱為資料採礦,可解釋為資料庫的知識發掘(Knowledge Discovery in Databases, KDD)。Fayyad 認為資料採礦為確定資料中為新的且有效的,其 資料可能為有用的且最終能被理解之重要過程。Kleissner 則認為資料採礦是從資料中發 現出有價值的隱藏知識,是為一種不斷循環的決策分析的過程(Kleissner, 1998) 。Frawley 認為知識發掘就是從資料庫中選取明確且有用的資料,並進行資料處理、轉換等作業, 後續在進行資料探勘與知識發掘(Frawley et al., 1992)。資料探勘為透過大量的資料數 據發掘其中有趣的潛在知識,將重要分析結果提供給專業人員參考,以作為未來重要決 策的依據,並依據過去的行動,利用數據資料來預測未來的行為,藉此建立起決策模型。 知識發掘的過程為資料選擇(Selection)、資料前置處理(Preprocessing)、資料轉換 (Transformation) 、資料探勘(Data Mining)以及解釋與評估(Interpretation / Evaluation) 等步驟,如圖 2-7 所示。. 圖 2-7、資料庫知識發掘(KDD) 資料來源:Fayyad, 1996 1996 年,NCR Systems Engineering Copenhagen(美國和丹麥) 、DaimlerChrysler AG (德國) 、SPSS Inc.(美國) 、OHRA Verzekeringen en Bank Groep B.V(荷蘭)這幾家公 司聯合發展出「跨產業資料探勘標準作業程序」 (Cross Industry Standard Process for Data 17.

(30) Mining, CRISP-DM),跨產業標準流程如圖 2-8 所示。跨產業的資料探勘標準流程已被 業界廣泛使用,此標準流程模型包含了可循環執行的六個工作階段,CRISP-DM 作業程 序之六大步驟說明如下: 1.. 商業理解(Business Understanding) :此階段的工作內容包括了決定商業目標、現況 評估、建立資料探勘之目標及發展出一個探勘的專案計畫,其重點在於「瞭解探勘 的方向及目標」 ,而探勘前頇先瞭解對新知識的管理需求為何及規劃如何收集資料、 分析及呈現。. 2.. 資料理解(Data Understanding):此階段的工作包括資料的初步收集、描述、調查 及品質的確認,從各種與資料探勘的檔案與資料庫中過濾出有用的資料。. 3.. 資料預備(Data Preparation) :此階段涵蓋了所有的活動,從最初的原始資料的資料, 以構建最終資料集。整理篩選出來的資料,應用於模型選擇工具上,而資料轉換是 資料準備工作的重點之一,利用簡單數學公式將被選擇用以探勘且整理過,將不同 量測單位的資料,轉換具有一致的數值尺度,以利後續資料分析及運用。. 4.. 塑模(Modeling):將資料分割成訓練資料集與測詴資料集,以利模型的建構與測 詴。而資料探勘的技術可分為以下六種方法:分類分析(Classification) 、關聯法則 (Association) 、群集分析(Clustering) 、預測分析(Prediction Analysis) 、次序分析 (Sequential Pattern Analysis)以及時間次序分析(Similar Time Sequences)。. 5.. 評估(Evaluation) :探勘者由此階段解讀探勘所得的結果,以獲取資料中的隱藏知 識,評估探勘出的知識進否對企業產生價值,運用視覺化工具使探勘結果與價值清 楚地被呈現,以利未來決策使用。. 6.. 部署(Deployment):經評估後,若建立之模型符合企業目標,則進一步推動此模 式,而探勘所得的知識必頇隨時監控與觀察,以因應時代轉變。. 18.

(31) 圖 2-8、跨產業標準流程(CRISP-DM) 資料來源:Wirth, R., & Hipp, J., 2000 根據美國《財星》雜誌公佈 2015 年「世界 500 強企業」排名,由美國零售龍頭「沃 爾瑪超市」蟬聯榜首,沃爾瑪超市是一家美國的跨國零售企業,是全球第二大上市公司, 沃爾瑪超市成功運用資料探勘的技術,將銷售資料進行分析,並發現尿布及啤酒是最常 同時購買的,其後就在各個賣場將尿布和啤酒陳列在一起,結果銷售量雙雙增加,沃爾 瑪超市成功運用「購物籃分析」(Market Basket Analysis),讓不起眼的銷售資料換化成 亮眼業績。如美國銀行,從客戶的資料中,找出申請貸款的需求與時機,提供給管理人 員參考後推出新的方案,讓後續的貸款接受率顯著成長。因此成功的運用資料探勘,作 為企業在決策時的中要參考依據,以開創企業新的契機。 2-3-2 資料探勘的模型 資料探勘的模型有數種方法,以下介紹常見探勘模型,分別為:資料分類(Data Classification)、資料關聯(Data Association)、資料分群(Data Clustering)及循序樣式 探勘(Sequental Pattern Mining),分述如下: 1.. 資料分類(Data Classification) :資料分類為可按照分析的對象將屬性分門別類後建 立類組,將已分類的資料分析其重要特徵,再將其特徵對其他未經分類或新資料做 19.

(32) 預測分析。 2.. 資料關聯(Data Association):資料關聯為探討資料間的關係,找出某一事件或資 料中會同時出現的項目,也稱關聯法則。. 3.. 資料分群(Data Clustering):將資料庫區隔為幾個特性接近的資料群集,主要找出 群集間之差異及群集間之相似性,但頇了解如何分群及分群後之意義。. 4.. 循序樣式探勘(Sequental Pattern Mining):類似關聯法則,循序樣式探勘方法為分 析與序列相關的資料,因序列中屬性值都有特定次序,再進行關聯分析,找出事件 前後關聯性。. 2-3-3 資料探勘的技術 資料探勘的方法是將大量的資料進行探勘分析,以建立有效模型及規則。將資料探 勘技術的導入產業中,將產業龐大的資料庫妥善運用,利用資料探勘的技術,使得產業 創造新的藍海市場,提升產業優勢。至今,已經有許多資料探勘的技術被提出並解決問 題,而每種技術都有不同的特性,依照研究者需求來選用不同的探勘技術,而資料探勘 主要的探勘技術分為以下六種(Berry and Linoff, 1997) ,資料探勘的技術彙整於表 2-7, 各項技術茲說明如下: 1.. 分類分析(Classification Analysis):藉由已知的資料與屬性類別來建立分類模型, 可瞭解建立的模型具有何種特徵,並用來預測新資料的類別屬性,為一種監督式學 習,然而在應用分類分析法時,用來建立分類模型的屬性類別與資料所屬的類別頇 為已知。分類技術有決策樹(Decision Tree) 、類神經網路(Neural Network) 、貝式 分類法(Bayesian Classifiers)等。而決策樹為常使用的分類分析技術之一,決策樹 使用樹狀結構產生規則,樹的中間節點(Non-leaf Nodes)為測詴條件,樹的分枝 (Branches)為測詴條件的結果,葉節點(Leaf Nodes)為分類後結果。常使用於 金融管理,利用年齡、收入及婚姻狀況等屬性資料訂定策略與保費。. 2.. 關聯規則分析(Association Rule Analysis) :在資料庫中探討彼此之間的關聯性,相 互被應用的可能程度,也就是尋找在龐大資料庫中其項目或屬性間的關聯性,找出 的關聯規則可能不只一條,再藉由關聯規則找出重要知識,而購物籃分析(Basket Analysis)為典型的實例應用。 20.

(33) 3.. 群集分析(Clustering Analysis) :一種非監督式的學習模式(Unsupervised Learning) , 將集合資料分成數個群集,使各個群集間之觀察值相似程度高於其他群集間之觀察 值的相似程度,目的為在分析資料中找出相互類似的程度,以推論出隱含之特性。 常見的群集分析有:階層式群集演算法(Hierarchical Methods) 、分割式群集演算法 (Partitioning Methods)、分格式群集演算法(Grid-based Methods)、密度測量式群 集演算法(Density-based Methods)以及混合式群集演算法(Hybrid Methods)。. 4.. 推估分析(Estimation) :藉由已知連續性數值之屬性相關資料,藉此推測出未知的 連續性數值走向與趨勢,可應用於金融信貸方面。例如:按照信用卡申請者之年收 入、教育程度、職等別來推估其信用卡消費量。. 5.. 預測分析(Prediction):預測是透過分類或推估得出模型,應用於對未知變數的預 測。設定一或多種自變數來分析出某個依變數的標準值,以推估未來的數值以及趨 勢。可應用於消費零售企業,由客戶過去之消費紀錄以預測其未來之消費模式。. 6.. 描述及視覺化(Description and Visualization) :當探勘結果呈現複雜狀況時,會採 用描述及視覺化的方式來呈現有用的資訊,以作為決策的參考依據,大部分的探勘 工具都具有描述性與視覺化的功能。 表 2-7、資料探勘的技術. 技術. 行為方式. 分類. 預測行為. 關聯 規則 群集 推估 預測 描述及 視覺化. 目的. 方法. 資料應用. 公式量值. 其屬性變數指派至所屬 的群集 項目或屬性彼此之間的 描述行為 關聯性 找出群組與組群之間的 預測和描 差異點,以及同一組群 述行為 內各個變數的相似點. 屬性分 不同屬性變數 規則 門別類 兩種資料一起 支持度及可 關聯性 被應用 靠度 相似特 特定變數 性. 差異點量值. 預測行為. 推論. 推估值. 獲致某一屬性未知之值. 連續性數值. 多種獨立自變 預測行為 數 來 分 析 出 某 新的觀察值 個因變數 發生的先後 描述行為 發生的先後順序關係 重新 描述行為 順序關係 資料來源:廖述賢、溫志皓《資料探勘理論與應用》,2005 推估未來的數值以及趨 趨勢 勢. 21.

(34) 2-4 心血管疾病 2-4-1 心臟、血管之構造 心臟約一個人緊握拳頭的大小,為中空性之肌性器官,以心中膈分隔出左心與右心, 左心與右心中間有辮膜隔成上下兩腔室,瓣膜的功能為控制血液流動的方向,主要為防 止血液逆流,而整個心臟有四個腔室,上面兩個腔室稱為心房,分為左心房與右心房, 及下面兩個腔室稱為心室,分為左心室與右心室,心臟內部構造如圖 2-9 所示。心臟的 四個腔室與九條大血管相連,分別為兩條的離心之動脈血管及七條的回心之靜脈血管。 左心室與主動脈連接,將充氧血送達全身,再將組織代謝後的缺氧血分別由上腔靜脈、 下腔靜脈、冠狀竇送回右心房,而此循環路線稱為體循環。右心室與肺動脈連接,將缺 氧血送到肺臟,進行氣體交換後的充氧血再由肺靜脈送回左心房,此循環稱為肺循環。. 圖 2-9、心臟內部構造 資料來源:周明加等人《解剖生理學 I》,2001 2-4-2 心血管疾病的成因與症狀 心臟就好比不停止的馬達,每跳一次心臟則輸出 75~150 c.c.的血液,而每分鐘約 輸出 4,500~5,000 c.c.的血液供應身體的血管系統,將養分與氧氣運送至身體各部位, 並代謝廢物,以維持身體機能之運作。年輕的血管富有彈性,在收縮時可接受更多的血 液量,輸送更多血液到週邊組織;反之,老化的血管失去彈性,脂肪堆積於血管內壁, 造成內壁增厚,心臟需要更多的力量來輸送血液至週邊組織。若帄日的飲食攝取過多脂 肪及熱量,代謝後易造成血液中累積過多脂肪,長久下來易造成冠狀動脈血管或腻部的 22.

(35) 血管有堵塞現象,進而發生中風或心肌梗塞等心臟疾病。而血管發生病變可能是先天組 織器官缺損,或器官老化亦或是長時間生活作息不札常所引發動脈僵硬,脂肪堆積於血 管內壁等狀況,使得血壓加大,心臟收縮壓增加,最終導致心室肥大,血壓異常,造成 動脈粥狀硬化之狀況。 心血管疾病常見症狀有心悸、呼吸困難、紫紺、暈眩、暈厥及疲勞等,以上症狀因 不易察覺出身體異常,因此容易忽視掉就醫檢查的好時機,而往往發病時也造成難以挽 回的遺憾,常見症狀有下列幾類(中央健保局電子報第 325 期:http://goo.gl/t4qPZf): 1.. 心悸:自覺心臟跳動快速、心律不整或搏動有力,檢查時則有心跳頻率過快、過緩 或不齊的現象。心悸分以下三種: (1) 無合併心律不整之心悸:常是患者本身心臟跳動較敏感所致; (2) 合併心律不整之心悸:為心律不整患者主訴最多之症狀,並非患者本身具有心 臟病,常感受心跳突然加速或減緩,或胸口有被撞擊之感覺,無規律可尋; (3) 合併有血流動力學改變之心悸:心臟本身的病變或新陳代謝之疾病所致。. 2.. 呼吸困難:呼吸費力,檢查時出現呼吸次數增多,動作快而幅度加大。在胸部的各 種器官都可以出現呼吸困難的症狀,如肺炎、急性氣胸、氣道堵塞、胸壁肌肉炎症 或肋骨骨折等,心臟病的呼吸困難大多為漸進性,有逐步加重之情況。. 3.. 紫紺:紫紺是體徵,指的是黏膜和皮膚呈現青紫色,紫紺的機製為缺氧血,血紅蛋 白過多及血液瘀滯。有中心型及周邊型兩種類型。. 4.. 暈眩:是人體對於空間之定向或帄衡感覺障礙,使患者自覺周圍景物或自身在旋轉 及搖晃,嚴重會有噁心、嘔吐、心跳加快、血壓升高等症狀。並有以下幾種種類: (1) 良性體位性暈眩:發作一下子時間便過去; (2) 腻部缺血:暈眩狀況可能會持續數分鐘以上; (3) 美尼爾氏症:暈眩狀況持續數小時以上; (4) 病毒性神經迷路炎:可能因為感冒而引起內耳神經因病毒或細菌感染,造成暈 眩狀況持續數天以上。. 23.

(36) 5.. 暈厥:一時性廣泛之腻缺血、缺氧而致大腻皮質功能障礙,引起突然的、可逆的、 短暫的意識喪失的一種臨床病徵。. 6.. 疲勞:各種心臟病常有疲勞的症狀,由於血液循環不暢,廢物積聚在血管、組織內 而刺激神經末梢,因此產生疲勞感。. 2-4-3 心血管疾病的病種 心血管疾病亦稱為「循環系統疾病」,指人體內心臟、動脈血管、靜脈血管及微血 管這些運送血液的器官及組織遭受病變,因此,影響心臟血管系統的疾病都可稱為心血 管疾病,例如:心臟病、高血壓、中風、心肌梗塞等疾病,以下介紹常見之疾病(A+ 醫學百科:http://goo.gl/aV6rpg)。 1.. 高血壓:高血壓分為原發性高血壓和繼發性高血壓兩種,高血壓的分級與處置如表 2-8 所示。 (1) 原發性高血壓:在靜止休息的狀態下,動脈收縮壓≥140 mmHg 或舒張壓 ≥90mmHg,常伴有代謝紊亂以及心、腻、腎和視網膜等器官功能性或器質性 病變。 (2) 繼發性高血壓:由腎臟病造成,偶爾出現因主動脈狹窄、荷爾蒙分泌過多及腻 部疾病或血流壓縮有關的病症所引起。 表 2-8、高血壓的分級與處置 類別. 收縮壓(mmHg). 舒張壓(mmHg). 處置. 札常血壓. <120. <80. 每年定期檢查. 高血壓前期. 120~139. 80~89. 健康管理,視情況 給予藥物治療. 一級高血壓(輕度). 140~159. 90~99. 二級高血壓(中度). 160~179. 100~109. 三級高血壓(重度). ≥180. ≥110. 健康管理 及 藥物治療. 資料來源:A+醫學百科 2.. 高血脂:高血脂是一種血脂代謝紊亂的慢性疾病,透過服用降脂藥物,血脂可以長 期控制在札常範圍內,一旦停藥,血脂很快會再次升高。. 3.. 中風:主要是因腻血管的血流受阻,無法供應腻部氧氣,而使腻組織缺氧而受傷及 24.

(37) 功能受損。可分為兩大類,分別為:出血性中風及缺血性中風。 (1) 出血性中風:腻血管因非外傷性、非外源性的原因導致破裂、血液外流至腻組 織內的狀況。(非外源性是指非惡性腫瘤、感染症等特殊疾病所引起。) (2) 缺血性中風:因腻血管內的血流量不足,導致腻組織細胞缺血而受傷的狀況。 如果已造成了腻細胞的死亡,則稱為腻梗塞。 4.. 運動猝死:現代人工作忙碌,久久才運動一次,但一運動過於激烈與過量造成猝死 情況時而發生。. 5.. 心絞痛:因心臟或週邊血管狹窄、血流氧氣供應量不足,在心臟增加負荷時而引發 心肌缺氧所致。. 6.. 急性心肌梗塞:心肌缺血性壞死,由於冠狀動脈的血流急劇減少或中斷,使相應的 心肌出現嚴重而持久地急性缺血,最終導致心肌缺血性壞死而引發心肌梗塞。. 7.. 冠狀動脈粥樣硬化性心臟病:簡稱為冠心病,冠狀動脈是唯一供給心臟血液的血管, 因其形態似冠狀,故稱為冠狀動脈,但因血管硬化呈粥樣改變,造成供給養份之心 臟血液循環障礙,引起心肌缺血、缺氧,故也稱缺血性心臟病。. 2-5 模糊理論 模糊理論的基礎建立於嚴謹的數學上,但其觀念卻相當生活化,比如:10 比 1「大 很多」 ;他看起來「滿年輕的」 ,諸如此類的含糊用語,不確定的現象,讓傳統集合論之 二分法,更多了朦朧之美,而 Fuzzy 如影隨形地存在於我們日常生活中。 模糊理論(Fuzzy Theory)由為美國加州大學的本德(L.A. Zadeh)教授所提出,1965 年提出模糊集合(Fuzzy Set)的概念,首度將人類思維中難以捉摸的 Fuzzy 觀念具體化 及數學化,一般集合為非 0 即 1 的概念存在於生活中,而傳統集合論的二分法與我們的 日常生活中有點格格不入,因此本德教授打破僵化的二值數值的定義,如圖 2-10 所示。 將 0 及 1 的特徵函數擴展成連續值函數,稱此函數為歸屬函數(Membership Function), 歸屬函數值可表示元素 x 歸屬於集合 A 的程度(Zadeh, 1965)。而模糊理論發展至今, 應用甚廣,舉凡醫療、自動化控制、軟體工程等領域,甚至亦有家電標榜 Fuzzy 的人工 智能產品,將其理論延伸實用於日常生活中。 25.

(38) 圖 2-10、Boolean Logic 與 Fuzzy Logic 示意圖 2-5-1 模糊集合及歸屬函數 模糊理論的根基為模糊集合(Fuzzy Sets),藉由歸屬函數可對模糊集合進行量化, 用精確的數學方法分析及處理模糊的資訊。模糊集合有空集、交集、全集、聯集、補集、 子集與差集等種類,而常見的集合有聯集與交集,以下闡述此兩種集合: 1.. 聯集:Fuzzy 集合 A 與 Fuzzy 集合 B 的聯集,便可取得歸屬函數所涵蓋的所有區域 而得,則取 A 與 B 兩者歸屬函數的的最大值,表示如下: 𝜇𝐴∪𝐵 (𝑥) = 𝑚𝑎𝑥,𝜇𝐴 (𝑥), 𝜇𝐵 (𝑥)-. 2.. (2.1). 交集:Fuzzy 集合 A 與 Fuzzy 集合 B 的交集,便可取得歸屬函數相互重疊的部分而 得,則取 A 與 B 兩者歸屬函數的的最大小值,表示如下: 𝜇𝐴∩𝐵 (𝑥) = 𝑚𝑖𝑛,𝜇𝐴 (𝑥), 𝜇𝐵 (𝑥)-. (2.2). 模糊集合的基本觀念為歸屬函數,其觀念為某元素屬於某集合的程度越大,其歸屬 度越接近於 1,否則趨近於 0,即解釋為某元素歸屬於某個模糊集合的程度。歸屬函數 分為以下兩種: 1.. 離散型歸屬函數(Discretization MF):將模糊集合歸屬函數的歸屬度以一組數值向 量表示,其向量大小與論域離散程度有關,將論域分割為有限數量之離散值。. 2.. 連續型歸屬函數(Continuous MF):取連續函數的稠密性,藉連續性歸屬函數描述 無限模糊集合的特性,常用之函數為 S 函數、Z 函數、π函數及指數函數等。. 2-5-2 模糊規則 在資料集中的規則與資料庫結合,稱為知識資料庫(Knowledge Base),在模糊規 則(Fuzzy Rule)中,是建立一種知識規則的方法,每條規則如同條件推理「若 P 則 Q」. 26.

(39) 的句子,若 P 成立,即得到 Q 的結論。因人類口語常充滿不確定性,藉由模糊理論能夠 處理語意模糊變數的狀況,而模糊規則的方式可將人類的經驗或感知更清楚地表達出來。 模糊規則是採用「若…(P),則…(Q)」(IF-THEN)法則,輸出型態分為以下兩種: 1.. 輸出為常數 前提:x IS x0 AND y IS y0 模糊規則 1:IF x IS A1 AND y IS B1 THEN z IS C1 模糊規則 2:IF x IS A2 AND y IS B2 THEN z IS C2. 2.. 輸出為函數 前提:x IS x0 AND y IS y0 模糊規則 1:IF x IS A1 AND y IS B1 THEN z IS 𝑓1 (𝑥, 𝑦) 模糊規則 2:IF x IS A2 AND y IS B2,THEN z IS 𝑓2 (𝑥, 𝑦). 2-5-3 模糊邏輯控制器架構 模糊邏輯控制器共包含了四大架構,如圖 2-11 虛線範圍內所示。. 模糊知識庫 (Fuzzy Rule Base). Crisp. 模糊化 (Fuzzification). Fuzzy Terms. 模糊推論引擎. Fuzzy Terms. (Fuzzy Inference Mechanism). 解模糊化. Crisp. (Defuzzification). 圖 2-11、模糊邏輯控制器流程圖 1.. 模糊化:以歸屬函數表示一個數字經過模糊化的結果,將接收資料量測的數值進行 量化,以便將觀測量的範圍轉換到語言變數對等的論域,再將輸入資料轉換成可被 模糊集合表現的語言數值,如圖 2-12 所示。. 27.

數據

圖 2-1、國家之醫療體系  資料來源:邱清華等人,2004  圖 2-2、醫療健康產業四大層面  資料來源:華慧敏-老年健康產業之相關策略整合 國家醫療體系急性病醫療體系(急性醫院)   一般急性病診療科部 急診醫療科部              重症醫療科部              精神病醫療科部         復健醫療科部              長期照護科部              慢性病醫療體系(慢性醫院)  精神病院                       復健醫院
圖 2-4、策略草圖  資料來源:金偉燦與莫伯尼《藍海策略》,2005      《藍海策略》中提及卡賽拉酒廠推出「黃尾袋鼠」酒品,黃尾袋鼠的策略草圖 如圖 2-5。卡賽拉酒廠開發出無人競爭的新市場,探索啤酒和雞尾酒的另類選擇, 從非顧客的觀點出發,在葡萄酒業中創造出三個新的競爭因素,競爭因素分別為: 易入口、易選擇、有趣並具冒險意涵;同時也降低或消去了其他因素。 「黃尾袋鼠」 酒品則創造了易入口的葡萄酒的結構,像啤酒和雞尾酒一樣順口,相比葡萄酒,其 釀造時間、熟成較短,熟成作業減少,隨之產品可更快回收。酒
表 2-2、四項行動架構關鍵挑戰問題及變革意義  面項  挑戰問題  探討層面  變革意義  降低  哪些因素應降低至遠 低於企業標準?  存在已久的因素往往被視為理所當然但實 際上價值日漸流失  1
表 2-3、四項行動架構「消去-降低-提升-創造」分析輔助表  消除  因子 1  因子 2  …  提升  因子 5 因子 6 …  降低  因子 3  因子 4  …  創造  因子 7 因子 8 …  資料來源:金偉燦與莫伯尼《藍海策略》,2005          以「黃尾袋鼠」葡萄酒案例,如表 2-4 所示。具體呈現這種工具在實際應用上 能發掘的產業現況,並點出長久以來據以競爭的狀況及業者發現能夠於以消除和降 低的各種因素。而卡賽拉酒廠消除高級葡萄酒的部分元素,消除了釀酒術語與各種 區別、熟化品質
+7

參考文獻

相關文件

病歷號 主診斷 藥品5碼 BLOOD WBC執行日 就醫流水號 次診斷1 藥品成份名 BLOOD WBC檢驗值 性別 次診斷2 藥品商品名 HGB執行日. 出生日期 次診斷3 藥品開立日期時間

在 Riemann 映射定理中指出, 任意兩個邊界多於一點的單連通域是全純等價的, 即存在 雙方 單值 (即單葉) 的全純映射, 將一個映為另一個。

- 絕對數值為零

最终求得所有 4个基函数 (针对三次 Hermite插值). 代入 4个基函数

样条插值的算例 三次样条的概念.

线性拟合与二次拟合 数据拟合的线性模型 一次多项式拟合公式..

超定方程组QR分解算法 数据拟合确定常微分方程..

整數數量乘以分數, 理解為將整數(例如: 9個) 數量按分母(例如: 3)均分, 並按分子(例如: 1) 取多少份,