• 沒有找到結果。

第二章 文獻探討

本章節將介紹糖尿病的相關病症成因和預防,以及資料探勘與的概念,再來探討資 料探勘為主的相關應用研究。

2-1 糖尿病

糖尿病(英語:Diabetes Mellitus )是一種代謝性疾病,它的特徵是血糖長時間高 於標準值。高血糖會造成三多一少的症狀:吃多、喝多、尿多、以及體重下降。除此之 外,糖尿病症狀還會使患者有以下幾條症狀。

1. 容易疲勞:糖尿病患者身體容易疲勞、長青春痘、做事無法像往日精神旺盛。

這種倦怠感有時是全身,有時僅下半身。例如稍微爬樓梯時,就覺得兩腿酸痛,

疲累不堪,或飯後感到倦怠等。

2. 視力減退:有些人常因視力模糊、眼睛容易疲勞,經眼科醫師檢後,才發現罹 患了糖尿病。糖尿病性網膜症於中高齡的患者較多;而白內障年輕人較易患,

所以應該特別小心。

3. 末稍神經症狀:糖尿病人易有頑固性的手脚痲痺與陣痛感。因糖尿病而引起的 神經炎脚痛症者較多,有時候會激烈的疼痛。也有人夜間小腿會抽筋。

4. 皮膚搔癢:糖尿病人皮膚的抵抗力也同時減弱,受傷時易引起感染、長癤瘡、

炎症容易擴張。尤其是女性患者有時會有陰部發癢的情形。

5. 傷口不易癒合

6. 女性月經異常:女性的糖尿病患者,有時月經不規則,或月經禁閉。這是因為 缺乏胰島素的荷爾蒙所致,是性荷爾蒙失去平衡而引起的。

7. 男性陽萎症狀:勃起神經與排尿時都是由骶髓中的神經中樞所控制。糖尿病人 因人體的糖或維他命代謝異常,會有引發陽萎現象。因此,沒有正確的醫學常 識而任意購服強壯劑、民間藥物,對治療陽萎都無效用。

如果未經治療,糖尿病可能引發許多併發症。急性併發症包括糖尿病酮酸血症與 高滲透壓高血糖非酮酸性昏迷,嚴重的長程併發症則包括心血管疾病、中風、慢性腎臟 病、糖尿病足、以及視網膜病變等。

糖尿病的成因:糖尿病乃因胰島(藍蓋罕士島,Islands Of Langerhans ) 中的 β 細胞 分泌的胰島素荷爾蒙先天性不足或相對性不足;或是肥胖,使糖質 ( 碳水化合物 ) 代 謝異常及其他原因所引起的慢性病。其中,胰島素由胰臟的β細胞產生。首先由肝臟吸 收後,將葡萄糖合成為肝醣,當胰島素不再產生或無效用時,肝醣的製造會減少,且葡 萄糖在周邊組織的利用就會減少,結果由各種來源進入循環之葡萄糖的移除會減緩,而 形成高血壓糖;此過多的血糖無法完全由腎小管再吸收,於是尿液中糖分上升,稱為糖 尿。換言之,就是胰島素經肝臟再至全身,讓需要胰島素的肌肉細胞和脂肪細胞等使用,

因有胰島素這種荷爾蒙,我們人體的熱量源葡萄糖才能進入上述的細胞內,胰島素從形 成、分泌到讓需要的末稍細胞使用,若某一環節發生問題,便產生所謂的糖尿病。

由此可知,胰島素的主要功能就是把葡萄糖和脂肪轉化成能源,或貯存在體內。

也就是當我們吃下東西後,由於消化的作用,血液裡的血糖會漸漸升高。靠著胰臟分泌 的胰島素,將葡萄糖合成肝醣儲存,使血液中的血糖下降;並使血液中的葡萄糖,轉變 成可供利用的能源。因此要是沒有胰島素或胰島素分泌不正常,人體無法把食物轉變成 身體可利用的能源或營養,那人體的正常功能也就無法維持。

臨床上糖尿病則被分為三類:

1. 第一型糖尿病是由於身體無法生產足夠的胰島素,過去也被叫做胰島素依賴型糖尿 病(Insulin Dependent Diabetes Mellitus, IDDM)或是青少年糖尿病。在台灣,根據 中華民國糖尿病衛教學會在 2002 及 2004 年的調查,第 1 型糖尿病約佔所有糖尿病 的 2~4%。通常從童年或青少年時期即已開始,但也可能在任何年紀發病。這種糖尿 病通常發生於纖瘦或正常體重的人身上。當身體本身的防禦(免疫)系統破壞到胰 臟的 beta 細胞時,就形成了第 1 型糖尿病。雖然沒有人知道確實的發生原因,但科 學家們相信,家族病史和環境刺激因子(例如像 B 型柯沙奇病毒(Coxsackie B Virus) 這類病毒)可能在「自體免疫」中扮演了某種角色。

2. 第二型糖尿病始於胰島素抵抗(細胞對於胰島素的反應不正常),隨著病情進展胰 島素的分泌亦可能漸漸變得不足。這個類型過去被稱為非胰島素依賴型糖尿病

(NonIInsulin Dependent Diabetes Mellitus, NIDDM)或成人型糖尿病,病因是體重過 重或缺乏運動。早期第二類糖尿病患者可能可以通過改善生活方式(如健康飲食、

適量運動、安全減肥、戒菸及避免二手菸暴露等)來控制、甚至治癒糖尿病。大多 數患者可通過口服降糖藥物來幫助控制體內血糖。一些第 2 類糖尿病患者需要胰島 素注射。

3. 妊娠糖尿病是一種發生在懷孕期間的糖尿病,通常在嬰兒出生後就會消失。台灣妊 娠糖尿病發生率為 5.7%,通常在孕期第 24 至 28 週時可以檢測出來。妊娠糖尿病應 在懷孕期間就應嚴密的控制血糖,以預防媽媽和寶寶發生問題。

糖尿病的預防與治療方式包括維持均衡飲食、規律運動、戒菸、維持理想體重。對 於糖尿病患者來說,血壓控制與足部護理也相當重要。第一型糖尿病必頇注射胰島素控 制血糖;而第二型糖尿病則可以使用口服藥控制,若有需要也可以搭配胰島素注射。糖 尿病用的部分口服藥與胰島素都可能造成低血糖。對同時患有肥胖症的第二型糖尿病患 者而言,減肥手術是有效的治療。而對於妊娠糖尿病的患者來說,血糖通常會在生產後 恢復正常。

2-2 資料探勘概述

資料探勘(Data Mining)除了廣泛地被運用在各專業領域上,近年來,相關的探勘技 術更是普遍被應用在醫療研究領域。在醫療研究領域上大部分都應用在輔助醫生判斷與 預測疾病方面。

資料探勘(Data Mining)又稱之為資料採礦。在廣義定義中可以解釋為資料庫之知識 發現(Knowledge Discovery In Databases,KDD),如圖 2-1 所示,知識發現的步驟為:資 料選取、資料前置處理、資料倉儲建立、資料探勘、評估與結果展示。也就是說,從一

個大型資料庫裡透過特定的方法挖掘出有價值的知識,去除一些不合適的資料,將資料 轉換找出具有意義的資料模式。而現今,是個資料爆炸的時代,要如何在巨量的資料中 快速且有效率地找出有價值的資訊,是目前各個行業領域所必需要的技術。近幾年,有 不少學者對於資料探勘提出相關的解釋與看法,Frawley 認為資料探勘就是從知識庫中 發掘出潛在、有用資訊的過程,其定義為「一種找出資料中重要、潛在、有用之資訊的 程序,而目的是為了瞭解資料的特徵、趨勢及規則性。」(Frawley et al., 1996)資料探勘 可以提供預測、分類、推論學習等分析功能,來幫助企業在進行各種決策中做決定 (Dunham),資料探勘結合了統計技術與人工智慧技術的混合模型,並且能夠在雜亂且龐 大的資料庫及資料倉儲中萃取出有價值的資訊(Olmeda And Sheldon)。

圖 2-1 資料庫知識發現(KDD)

圖 2-2 跨產業標準流程(CRISP-DM)

在 1996 年間,由數家公司聯合發展資料探勘所訂出跨產業標準流程(Cross Industry Standard Process For Data Mining, CRISP-DM),如圖 2-2 所示,CRISP-DM 具有產品中立 性,使用上不會受限制於特定作業平台,其程序分為六個步驟:

1. 商業理解 (Business Understanding):

在第一個步驟中,首先我們需要先了解商業要求、評估現況以及商業最終目的,定 義出資料探勘的問題,並且發展出專案計畫。

2. 資料理解 (Data Understanding) :

主要收集完整的資料,並且對資料做初步分析、資料描述以及資料品質的確認。

3. 資料預備 (Data Preparation) :

資料準備是在確認資料的可用性,接著經過選取、整理與處理成所需的資料型態。

主要是資料轉換的工作,必頇把不同數值尺度間的資料轉換以及將類別資料轉換成 數值形式資料,以方便進行資料分析。

4. 建模 (Modeling) :

在資料建模階段,頇將資料分割成訓練資料集與測詴資料集,來測詴與建立模型架 構,被用來建構模型的訓練集會占用大多數的資料(80%),而剩下的部分(20%)則被 當作測詴資料集。依照不同的專案會採取不同的方法,資料探勘的以下數種方法:

關聯法則(Association)、分類分析(Classification)、群集分析(Clustering)、預測分析 (Prediction Analysis)、次序分析(Sequential Pattern Analysis)與時間次序分析(Similar Time Sequences)。

5. 評估 (Evaluation) :

此階段主要分析結果,證實所設計出來的模型是否有符合專案之目的,確認探勘出 來的知識是否對企業有價值。

6. 部署 (Deployment) :

探勘出來的結果頇能與專案目標相結合出新知識,然後將新知識應用在所面臨商業 競爭上,探勘所得到的知識要隨時觀察,以防止時間與環境的改變,而成為不符合 目標所需的舊知識。

資料探勘發展到現在,已經有許多技術被提出來解決問題,每種技術都有不同的特 性,所以常會依照不同的需求來選用不同的探勘技術,資料探勘技術根據不同的分析方 式與功能可分為:分類分析(Classification Analysis)、關聯規則分析(Association Rule Analysis)、群集分析(Clustering Analysis)、推估(Estimation)、預測(Prediction)、描述及視 覺化(Description And Visualization) (Berry, And Linoff, 1997)。

1. 分類分析(Classification Analysis):

分類分析是一種監督式學習(Supervised Learning),先給予每一類別的屬性與特徵加 以定義,透過所準備的訓練資料,依據屬性建立一個分類模式,用來將尚未分類的

原始資料或新進的資料,依照前述的屬性與類別之關係加以分類。換句話說,分類 就是將每一類別的特徵定義好,再透過訓練資料建立分類模式,將尚未分類的資料 進行分類。主要的分類技術有:貝氏分類法(Bayesian Classifiers)、類神經網路(Neural Network)、決策樹(Decision Tree)、模糊理論(Fuzzy Theory)等。

2. 關聯規則分析(Association Rule Analysis) :

關聯法則是在資料庫中發掘屬性彼此之間的關聯性,這些關聯通常以規則來表示,

與其他的探勘技術不同的是,關聯法則可以不只有一個輸出屬性,且每一個規則的

與其他的探勘技術不同的是,關聯法則可以不只有一個輸出屬性,且每一個規則的

相關文件