• 沒有找到結果。

基於深度學習之心律不整輔助診斷系統

N/A
N/A
Protected

Academic year: 2021

Share "基於深度學習之心律不整輔助診斷系統"

Copied!
75
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學機電工程學系 碩士論文 指導教授:吳順德博士 基於深度學習之心律不整輔助診斷系統 An Auxiliary Diagnostic System of Arrhythmias Based on Deep Learning. 研究生:游凱翔 撰. 中. 華. 民. 國. 1. 0 i. 6. 年. 7. 月.

(2) 摘要 心臟病一直以來都是人類健康殺手,一旦病發有極高的致命性。而現行 心臟病的醫療十分被動,多數情況下於病人發病後,才在緊急狀況下進行治 療,容易造成遺憾。因此,近年來心臟病的長期監控逐漸受到重視,藉由攜 帶式或居家式心電圖量測儀器,病患可以自行量測心電圖並即時傳送到醫院, 使醫生更確實地掌握病患的近況,並在出現異常徵兆時,及時進行治療。 但長期監控同時也會造成資料量上升以及資料品質穩定度下降的問題, 本研究針對其提出一套結合深度學習領域中的卷積神經網路架構與 k-means 演算法的心律不整輔助診斷系統,並在最後對分類結果進行離群資料處理。 該系統能對心電圖資料進行初步分析與分類,在診斷時可提供資訊給醫療人 員,並標註出危險度較高的區段,減少醫療人員的負擔,並提升診察效率。 本研究提出之系統分為兩個部分,第一部分以 k-means 演算法對原始資 料進行分子類動作,透過此步驟可以使資料特徵更容易被捕捉。第二部分以 卷積神經網路為基礎,建構心電圖波形分類器,對分完子類之資料進行分類 並將結果進行離群資料處理。有別於傳統類神經網路,卷積神經網路的特點 在於該網路能自動提取資料中價值較高的特徵,並運用於資料的辨識,同時 卷積神經網路架構還能有效減少網路之參數數量,減少神經網路的訓練時間 與消耗資源,提升整體效率。 本研究使用 MITBIH 心律不整資料庫進行測試,準確度平均可達 99.41%, 漏診率僅 1.23%。整體而言,為一兼具穩定及高效之智慧型診斷輔助系統。. 關鍵字:心電圖、深度學習、卷積神經網路分類器、k-means 演算法、離群 資料處理. i.

(3) Abstract A Heart Attack has always been a deadly killer to humans’ health. It is unpredictable and fatal. However, the current related heart attack therapies are inactive. Most people look for first aid in an emergency, after someone has a heart attack, which cause tragedies easily. Recently, long-term monitoring has gradually been valued. People can take portable ECG machine and use Home ECG machine to record their cardiograms and send them back to the hospital immediately. If the doctors are aware of any unusual signs, patients will be notified that they should go to the hospital as soon as possible. At the same time, the long-term monitoring will cause the problems of the arising data base and declining in data quality. This study provides an auxiliary diagnostic system of arrhythmias in deep learning with a combination of convolution neural network (CNN), k-means clustering and outlier processing. The system can provide an initial analysis and classification of ECG signals and mark the more dangerous area for the doctors. In this way, we may enlighten the doctors’ burden and increase the efficiency of diagnosis. This study includes two parts. First, the original data will be classified by kmeans clustering. In this way, the features of the data will be extracted more easily. Second, the classifier of ECG signals, which can be used to classify the data of the subgroups, will be built on CNN, and conduct an outlier processing on the results. The differences between CNN and traditional methods are that CNN can get higher-valued features automatically and used in the identification of the data. CNN can also reduce the amount of network parameter, the training time of the neural network and the consumption of resources to increase the overall efficiency. ii.

(4) This study uses MTIBIH arrhythmias database to test the training model. The average accuracy rate of classification can be as high as 99.41%, only with a false negative rate of 1.23%. In conclusion, it is a smart auxiliary diagnostic system featured with stability and efficiency.. Keyword:electrocardiogram, deep learning, convolution neural network classifier, k-means clustering, outlier processing. iii.

(5) 誌謝 兩年時間匆匆而過,碩士生涯也即將告一段落。感謝在碩士路上幫助過我的 所有人。 首先感謝我的指導教授 吳順德博士,老師從大學時期就是我的專題指 導教授,在做專題的期間就感覺到老師對於教學的熱情、對學生的用心、對 研究的投入與堅持。進入碩士階段後,老師將研究的主導權交到學生的手上, 自己則從旁觀察,並在適當的時刻提出關鍵的建議,每每遇到困難,老師總 能夠指引我往對的方向前進,讓我的研究得以順利進行。 十分感謝本系 葉榮木教授、台北科技大學 劉益宏教授、逸奇科技總經 理 王逸民博士願意擔任學生的口試委員,給予學生指教與建議,讓本論文 能夠更加嚴謹完整。感謝本系教授在書報討論課程中提出的建議,讓本論文 成果增色不少。 也要感謝訊號處理實驗室的各位,感謝昆宏學長及鈞翔學長給予的指導 與幫助。也感謝孟羲、承宣、柏賢、旻祐…等等研究夥伴的鼎力相助,提供 我各個面向的意見,讓我能夠以更全面的觀點進行研究。還要特別感謝鈺婷 在我遇到挫折的時候一直陪伴在我身邊,不斷地給我支持與鼓勵。 最後要謝謝我的家人,因為有他們的支持,我才能無後顧之憂地投入研 究,並順利完成學業。 游凱翔 謹誌於 國立臺灣師範大學. 機電工程學系研究所. 中華民國 一百零六 年 七 月. iv.

(6) 目錄 摘要 ......................................................................................................................... i Abstract ...................................................................................................................ii 誌謝 ....................................................................................................................... iv 目錄 ........................................................................................................................ v 表目錄 ..................................................................................................................vii 圖目錄 .................................................................................................................viii 第一章 緒論 .......................................................................................................... 1 1.1 前言 ......................................................................................................... 1 1.2 研究動機與目的 ..................................................................................... 2 1.3 論文架構 ................................................................................................. 3 第二章 心電圖概論 .............................................................................................. 4 2.1 心電圖介紹. ............................................................................................ 4 2.2 心電圖十二導程 ..................................................................................... 6 2.3 心電圖判讀 ............................................................................................. 9 2.3.1 P 波 ............................................................................................. 9 2.3.2 QRS 綜合波 ............................................................................. 10 2.3.3 T 波 ........................................................................................... 10 2.3.4 U 波 .......................................................................................... 10 2.4. 心電訊號相關干擾 ............................................................................ 10 2.4.1. 基準線飄移 .............................................................................. 11. 2.4.2. 肌肉波干擾 .............................................................................. 11. 2.4.3. 電力線干擾 .............................................................................. 12. 2.5 MITBIH 心律不整資料庫 .................................................................... 12 v.

(7) 第三章 系統組成與理論介紹 ............................................................................ 19 3.1 心電圖診斷輔助系統架構 ................................................................... 19 3.2 濾波 ....................................................................................................... 21 3.3 K-means 分群演算法 ............................................................................. 23 3.3.1. 演算法介紹 .............................................................................. 23. 3.3.2 k-means 預分子類.................................................................... 26 3.4 Deep Learning (深度學習)..................................................................... 27 3.4.1 人工神經網路 ............................................................................ 28 3.4.2 深度學習 .................................................................................... 31 3.4.3 卷積神經網路(Convolutional Neural Network, CNN) ............. 33 3.4.4 心律不整心電訊號分類器 ........................................................ 35 3.5 離群資料處理 ........................................................................................ 40 第四章 實驗與結果 ............................................................................................ 42 4.1 實驗 ........................................................................................................ 42 4.1.1 實驗 1 - MITBIH 資料庫 12 類別分類實驗 ............................ 42 4.1.2 實驗 2 - AAMI 標準 5 類別分類實驗 ..................................... 49 4.2 結果彙整與討論 ................................................................................... 53 4.2.1 效益評估方法 ............................................................................. 53 4.2.2 實驗結果評估與比較 ................................................................. 54 4.3 與過去文獻之比較 ............................................................................... 60 第五章 結論 ........................................................................................................ 62 5.1 結論 ....................................................................................................... 62 5.2 未來展望 ............................................................................................... 63 參考文獻 .............................................................................................................. 64. vi.

(8) 表目錄 表 2 - 1 單極導程之正極與負極組成 .............................................................. 8 表 2 - 2 MITBIH 資料庫各資料檔案導程分配表 ......................................... 13 表 2 - 3 心電圖類別數量一覽表 .................................................................... 14 表 3 - 1 常見干擾及其對應頻率 .................................................................... 21 表 3 - 2 子類數量統計表 ................................................................................ 27 表 4 - 1 實驗 1-1 之實驗結果 ........................................................................ 45 表 4 - 2 實驗 1-2 之實驗結果 ........................................................................ 46 表 4 - 3 實驗 1-3 之實驗結果 ........................................................................ 47 表 4 - 4 實驗 1-4 實驗結果 ............................................................................ 48 表 4 - 5 AAMI 標準類別 ................................................................................ 49 表 4 - 6 實驗 2-1 之實驗結果 ........................................................................ 51 表 4 - 7 實驗 2-2 之實驗結果 ........................................................................ 51 表 4 - 8 實驗 2-3 之實驗結果 ........................................................................ 52 表 4 - 9 實驗 2-4 之實驗結果 ........................................................................ 52 表 4 - 10 實驗 1-1 與 1-2 實驗結果統計比較 ............................................... 54 表 4 - 11 實驗 1-1 與 1-3 實驗結果統計比較 ............................................... 56 表 4 - 12 實驗 1-1 至 1-4 實驗結果統計比較 ............................................... 58 表 4 - 13 實驗 1 與實驗 2 正確率之比較 ...................................................... 58 表 4 - 14 本系統與過去文獻研究成果比較 .................................................. 60. vii.

(9) 圖目錄 圖 1 - 1 同類別中形態迥異之兩個子類 .......................................................... 2 圖 2 - 1 Willem Einthoven 的心電圖機器 ........................................................ 4 圖 2 - 2 心電圖訊號 .......................................................................................... 4 圖 2 - 3 心臟去極化的過程 .............................................................................. 5 圖 2 - 4 心臟神經系統 ...................................................................................... 6 圖 2 - 5 心電圖 12 導程貼片分布位置 ............................................................ 7 圖 2 - 6 艾因托文三角形及三個肢體導程 ...................................................... 7 圖 2 - 7 心電圖 12 導程之視角圖 .................................................................... 8 圖 2 - 8 心電圖與心臟電氣活動關係圖 .......................................................... 9 圖 2 - 9 基準線飄移 ........................................................................................ 11 圖 2 - 10 肌肉波干擾 ...................................................................................... 11 圖 2 - 11 電力線干擾 ...................................................................................... 12 圖 2 - 12 正常波形 .......................................................................................... 14 圖 2 - 13 左束支傳導阻滯 .............................................................................. 15 圖 2 - 14 右束支傳導阻滯 .............................................................................. 15 圖 2 - 15 心房早期收縮 .................................................................................. 15 圖 2 - 16 變形的心房早期收縮 ...................................................................... 16 圖 2 - 17 結性早期收縮 .................................................................................. 16 圖 2 - 18 心室早期收縮 .................................................................................. 16 圖 2 - 19 心室融合心跳 .................................................................................. 17 圖 2 - 20 房室結性逃脫搏動 .......................................................................... 17 圖 2 - 21 心室性逃脫搏動 .............................................................................. 17 圖 2 - 22 心跳節律器心跳 .............................................................................. 18 viii.

(10) 圖 2 - 23 節律器融合心跳 .............................................................................. 18 圖 3 - 1 系統流程圖 ........................................................................................ 19 圖 3 - 2 切割後之訊號 .................................................................................... 20 圖 3 - 3 心電圖波形特徵分布頻段 ................................................................ 22 圖 3 - 4 隨機選取中心點(k=3) ....................................................................... 24 圖 3 - 5 初始分群結果 .................................................................................... 24 圖 3 - 6 重新定義中心點 ................................................................................ 25 圖 3 - 7 最終分群結果 .................................................................................... 26 圖 3 - 8 預分子類成果(以 RBBB 為例) ........................................................ 26 圖 3 - 9 人工神經網路架構 ............................................................................ 28 圖 3 - 10 單一神經元結構 .............................................................................. 29 圖 3 - 11 訓練流程 .......................................................................................... 30 圖 3 - 12 深度神經網路架構 .......................................................................... 31 圖 3 - 13 圖像分類器 CNN 模型 ................................................................... 33 圖 3 - 14 一維張量最大池化範例 .................................................................. 34 圖 3 - 15 心律不整心電訊號分類器架構 ...................................................... 35 圖 3 - 16 訓練資料比與正確率關係圖 .......................................................... 38 圖 3 - 17 理想情況下輸出張量機率值分布圖 .............................................. 40 圖 3 - 18 系統分類結果示意圖 ...................................................................... 41 圖 4 - 1 實驗 1-1 與 1-2 類別正確率比較圖 ................................................. 55 圖 4 - 2 實驗 1-1 與 1-3 類別正確率比較圖 ................................................. 57. ix.

(11) 第一章 緒論 1.1 前言 心電圖(Electrocardiography,ECG 或 EKG)為現行診斷心臟病患的重要 醫療技術,是一種透過成對的電極量測心臟跳動電性訊號,即時了解心臟狀 況的技術。醫生透過心電圖,可以知曉患者心臟的跳動頻率以及心肌的異常 狀況,且心電圖為無創檢測技術,不需要進行侵入式的檢測手段,有方便、 快速等多項優點,在醫療界有非常廣泛的應用。 現代的心臟病醫療過程,常是在心臟病患發病後,才急送至醫院進行治 療,此程序有一嚴重缺點---診療的起點常為「病人發病」,醫療人員被迫處 於被動,須在緊急的情況下進行病患的救治。且心臟病的發作通常會伴隨著 即時的致命危險,在這種種因素加總之下,導致心臟病近 10 年來一直高居 國人十大死因前三名[1],成為人類的健康殺手。 近年來病患突然心臟病發而去世的事件屢屢發生,這些人多為已被診斷 出心臟病的患者,在醫生及病患都知曉其患有心臟病的狀況下,卻依然發生 憾事。為了減少此種狀況的發生,對患者的心臟狀況進行長期的監控為一可 行之方法。但依照現行醫療方式,病人須在醫院長期住院,不僅影響病患的 生活,亦造成醫療資源的不必要損耗。於是攜帶型或居家型心電圖儀等遠距 心電圖監控儀器逐漸受到重視,目的就是能夠兼顧病患的生活品質和生命安 全。 藉由對心臟病患的長期監控,醫生如發現心臟發生異狀,就可以在造成 生命危險之前,將病患召回醫院,在非急迫的狀況下進行治療,避免心臟病 的急性發作。但長期監控的作法造成了另一項問題,心電圖量測資料的劇增, 將會對心臟科醫師或醫事檢驗師造成龐大負擔。為此本研究將針對此點,開 1.

(12) 發一套輔助診斷系統,對龐大的資料庫進行初步篩選,希望減輕相關醫療人 員的負擔,同時提高醫療品質。. 1.2 研究動機與目的 心電訊號的分類難度較機械訊號高,因為人體由大量的器官組織細胞所 組成,其中有各種機制作用,環環相扣,複雜度高,且每個人的基因、生長 環境、身體狀況各異,形成個體差異,再加上心電圖的量測容易受到周遭環 境干擾,同一種類的訊號就有甚大差異(圖 1-1),此種情況下,對於機器學習 模型的訓練是一大難題。. 圖 1 - 1 同類別中形態迥異之兩個子類 另外,由於心電訊號之複雜度高,以傳統方法對其進行特徵的擷取也十 分不易,複雜且多樣的特徵數量使得特徵擷取的過程耗時且費工,如要將大 量的特徵直接使用於訓練模型,會導致訓練時間非常漫長,且不保證能得到 最佳之成果。 這兩項問題導致對心電圖進行分析與分類的難度增加。過去曾有不少研 究者進行過類似的研究,也成功建立分類模型,但其辨識率都還有進步空間。 近年來深度學習崛起,2016 年 Serkan Kiranyaz 等人將卷積神經網路應用於. 2.

(13) 心電圖訊號分類[2],得到 99%的正確率,證明了深度學習應用於心電圖領域 的可行性與發展性。 本研究擬延續前人的研究,運用卷積神經網路集特徵擷取與學習模型為 一體的特性,省略傳統方法複雜且充滿不確定性的特徵擷取過程,降低模型 建立難度,嘗試結合張家熏提出之的預分子類方法[3],得到輸出結果之後以 輸出張量之最大值判斷該筆資料之歸屬類別,同時定義正確判斷的標準,當 輸出張量之最大值小於設定之閾值,則該筆資料被視為無法分類(未知類別)。 希望能藉此改善神經網路對同類別內差異過大之心電圖資料分類不佳的情 況,並降低漏診率,以救回更多心臟病患者的寶貴生命。 本系統預計以 google 公司開發之 TensorFlow 函式庫[4]進行實現,該函 示庫擁有速度快、自由度高、開發容易、支援多平台...等等優點。並能使用 GPU 進行運算加速,減少開發過程中之大量等待時間。 本研究之目的為開發出一套正確率高、漏診率低、運算速度快的心律不 整輔助診斷系統。以因應未來居家型心電量測時代來臨時大量增長之心電圖 訊號的分析需求,幫助醫生能在短時間內做出正確的判斷。. 1.3 論文架構 本論文分為五個章節。第一章為緒論,說明本論文的研究動機與目的; 第二章介紹心電圖相關之背景知識以及 MITBIH 心律不整資料庫;第三章說 明整體系統架構及介紹相關理論技術;第四章說明整個實驗的架構及設計理 念、評估系統的效能,並與過去文獻進行比較;最後,第五章總結整個研究 的貢獻以及未來有可能發展的方向。. 3.

(14) 第二章 心電圖概論 2.1 心電圖介紹. 心電圖起源於十九世紀中期,一開始的機器十分龐大(如圖 2-1),能夠量 測的訊息也不夠完整,但已能記錄心臟的電氣活動。. 圖 2 - 1 Willem Einthoven 的心電圖機器[5] 心電圖顯示了心臟的電氣活動,幫助我們了解心臟的運行狀況,在心臟 跳動的過程中,心肌會產生去極化現象,進而在皮膚表面產生微小的電位變 化,心電圖即是這些電位變化的一份紀錄表。. 圖 2 - 2 心電圖訊號[6]. 4.

(15) 心臟的跳動起源於被稱為竇房結的特化組織,每一次心跳的開始竇房結 會產生一去極化波,之後去極化波會在心臟中傳導,先傳到左右心房,在房 室結短暫停留後經由希氏束傳往心室,最後進行再極化,完成一次的心臟跳 動[5]。. 圖 2 - 3 心臟去極化的過程[7] 這些心臟的電氣活動中,包含了許多心臟的訊息,包括心跳的速率、間 隔、心肌強度等等。不同的症狀,心電圖也會有不同的表現,是醫生進行診 斷的重要依據。 現代心電圖不僅侷限在診斷心臟疾病,身體的很多狀況皆會對心臟造成 影響,例如肺栓塞、肝臟疾病、糖尿病…等等,眾多疾病都可以利用心電圖 做為診斷工具。. 5.

(16) 2.2 心電圖十二導程 心電圖藉由成對的電極進行量測,每一對電極稱為一個導程,單一的導 程只能量測一個方向的心電訊號,能夠獲取的資訊不足。現代心電圖量測多 採用十二導程心電圖量測方法,由多對電極貼片,藉由不同的貼片組合,分 別量測十二個導程的心電訊號。可以觀察到不同的特徵,較全面的得到心臟 資訊。. 圖 2 - 4 心臟神經系統[8] 心電圖十二導程包含三個肢體導程、三個加壓肢體導程及六個胸導程, 這些導程由 10 個電極貼片所構成,這些貼片皆有其規定之位置,左右手腕 及腳踝各一,右腳之電極為接地。構成肢體導程及加壓肢體導程所需之電極 迴路,同時也構成威爾森中央電端參與胸導程的量測。另外六個電極貼片則 貼於胸前,每個貼片對應到一個胸導程,作為正極使用,負極則統一為威爾 森中央電端。. 6.

(17) 圖 2 - 5 心電圖 12 導程貼片分布位置[3, 9] 三個肢體導程的分別為Ⅰ導程、Ⅱ導程、Ⅲ導程,這三個導程的電極貼 片位於兩手及左腳踝,這三個放置的位置被稱為艾因托文三角形(圖 2-6),由 這三個電極量測到的電位,構成了三個肢體導程。公式如下: Ⅰ導程 = 左手電位 - 右手電位 Ⅱ導程 = 左腳電位 - 右手電位 Ⅲ導程 = 左腳電位 - 左手電位. 圖 2 - 6 艾因托文三角形及三個肢體導程[10] 7.

(18) 餘下之 9 個導程皆屬單極導程,由一個正極和複數個電極所組成的負極, 其正極及相對應的負極組成如表 2-1 所示。 表 2 - 1 單極導程之正極與負極組成 導程. 正極. 負極組成. aVR. RA. (LA + LL) / 2. aVL. LA. (RA + LL) / 2. aVF. LL. (RA + LA) / 2. V1. 胸1. V2. 胸2. V3. 胸3. 威爾森中央電端(Vw). V4. 胸4. (RA+LA+LL)/3. V5. 胸5. V6. 胸6. 透過這十二個導程,得到十二個視角的心臟資訊,在診斷時,提供醫生 交叉比對,幫助其了解患者的身體狀況。. 圖 2 - 7 心電圖 12 導程之視角圖[7] 8.

(19) 2.3 心電圖判讀 單一心跳週期的心電圖基本由 P 波、QRS 綜合波、T 波以及不一定會出 現的 U 波所組成,紀錄了心臟狀況,由竇房結發送去極化波開始,心房心室 的跳動,到完成整個心跳。. 圖 2 - 8 心電圖與心臟電氣活動關係圖[7] 在診斷過程中,上述這些波形與其持續時間、波與波之間的時間(間段)、 波的開始到下一個波的開始(間期)都是非常重要的資訊。以下將逐一介紹各 波形之來源與意義。 2.3.1 P 波 P 波所對應的是心房部分,藉由 P 波可以評估竇房結的功能、去極化開 始的位置以及心房去極化持續的時間。例如:當去極化速度變慢或心房擴大 時,P 波的寬度會變寬,且對應不同的情況,P 波的震幅大小也會有不同的 變化。 9.

(20) 2.3.2 QRS 綜合波 QRS 綜合波包含 Q 波、R 波及 S 波。主要對應心室去極化的過程,由於 心室肌肉為心臟中最強壯的部分,因此 R 波通常為整個心電圖週期中震幅 強度最大的地方,同時 QRS 綜合波的持續時間也十分短暫,最長也不會超 過 120 毫秒。 在分割心電訊號週期的時候,通常會以 R 為標的進行切割,因 R 波震幅 最大,位置又處於整個週期的中央部分,擁有最明顯的特徵。 2.3.3 T 波 T 波代表了心室再極化的過程,正常來說 T 波與 R 波相關性較高,當心 電圖擁有高聳的 R 波,就會有直立的 T 波;相反的,當 R 波不明顯甚至沒 有 R 波時,T 波的方向就會變得不確定。 2.3.4 U 波 U 波不一定會在心電圖中出現,是 T 波之後的正向波,通常會包含於 T 波之中,U 波出現的原因目前還不是很確定,但某些特定疾病會導致病患較 容易出現 U 波,例如:低血鉀、左心室肥大...等等。. 2.4 心電訊號相關干擾 心電圖量測過程中,待測者本身的動作狀態、周遭環境等等因素皆會對 心電圖產生影響,這種原因可知且形式較為固定的非目標訊號,稱為干擾, 比較常見的有基準線飄移、肌肉波干擾、電力線干擾。. 10.

(21) 2.4.1 基準線飄移 會造成基準線飄移的原因多是在量測時的人為失誤造成,有可能是電極 貼片沒有適當黏貼,或是待測者太過緊張,呼吸動作過大,導致心電圖上出 現低頻率訊號,為基準線飄移。. 圖 2 - 9 基準線飄移[11] 2.4.2 肌肉波干擾 主要造成原因為待測者緊張或其他原因所造成之肌肉顫動. 圖 2 - 10 肌肉波干擾[11]. 11.

(22) 2.4.3 電力線干擾 交流電之供電頻率對心電圖量測儀器造成干擾,其頻率視各國供電系統 規格而定,在臺灣為 60Hz。. 圖 2 - 11 電力線干擾[11]. 2.5 MITBIH 心律不整資料庫 MITBIH 心律不整資料庫[6, 12]由麻省理工學院以及貝斯以色列醫院在 西元 1975 到 1979 年間共同合作建立,包含 48 筆心電資料,每筆資料包含 兩個導程的資料,長度為半小時,取樣率為 360Hz。資料庫內的每筆資料皆 經過標註,在每個心跳的 R 波峰處標明該心跳是正常心跳或是屬於某種症 狀。此資料庫至今已被國內外至少 500 間相關機構採用來進行基礎研究。 收藏的資料中,47 筆源於已知的 9 個病人,1 筆來源未知,包含 20 種 心跳類別,其中有 5 種並沒有對應之位置,較完整的資料類別為 15 類,考 慮各類資料的特性、數量及代表性,我們取用其中 12 種類別進行分析。 另外,資料庫中 48 筆資料導程配置並不完全相同(詳如表 2-2),包含 MLII、 V1、V2、V4、V5 等導程,不同導程間波形差異甚大,不宜混合訓練,只能 取其中一個導程作為分析之用。經觀察發現,48 個檔案中有 46 個檔案資料 包含 MLII 導程,分布最為普遍,故本研究使用其作為分析資料。 12.

(23) 綜合兩種條件進行篩選,本研究實際使用之資料庫類別及數量如表 2-3, 資料總數為 104955 個單一心跳訊號。 表 2 - 2 MITBIH 資料庫各資料檔案導程分配表 編號. 通道 1. 通道 2. 編號. 通道 1. 通道 2. 100. MLII. V5. 201. MLII. V1. 101. MLII. V1. 202. MLII. V1. 102. V5. V2. 203. MLII. V1. 103. MLII. V2. 205. MLII. V1. 104. V5. V2. 207. MLII. V1. 105. MLII. V1. 208. MLII. V1. 106. MLII. V1. 209. MLII. V1. 107. MLII. V1. 210. MLII. V1. 108. MLII. V1. 212. MLII. V1. 109. MLII. V1. 213. MLII. V1. 111. MLII. V1. 214. MLII. V1. 112. MLII. V1. 215. MLII. V1. 113. MLII. V1. 217. MLII. V1. 114. V5. MLII. 219. MLII. V1. 115. MLII. V1. 220. MLII. V1. 116. MLII. V1. 221. MLII. V1. 117. MLII. V2. 222. MLII. V1. 118. MLII. V1. 223. MLII. V1. 119. MLII. V1. 228. MLII. V1. 121. MLII. V1. 230. MLII. V1. 122. MLII. V1. 231. MLII. V1. 123. MLII. V5. 232. MLII. V1. 124. MLII. V4. 233. MLII. V1. 200. MLII. V1. 234. MLII. V1. 13.

(24) 表 2 - 3 心電圖類別數量一覽表 標記. 類別. 心電圖類型. 數量. N(1). Normal beat. 正常波形. 74727. L(2). Left bundle branch block beat. 左束支傳導阻滯. 8069. R(3). Right bundle branch block beat. 右束支傳導阻滯. 7250. A(4). Atrial premature beat. 心房早期收縮. 2544. a(5). Aberrated atrial premature beat. 變形的心房早期收縮. 150. J(6). Nodal (junctional) premature beat. 結性早期收縮. 83. V(7). Premature ventricular contraction. 心室早期收縮. 7122. F(8). Fusion of ventricular and normal beat. 心室融合心跳. 802. j(9). Nodal (junctional) escape beat. 房室結性逃脫搏動. 229. E(10). Ventricular escape beat. 心室性逃脫搏動. 106. /(11). Paced beat. 心跳節律器心跳. 3616. f(12). Fusion of paced and normal beat. 節律器融合心跳. 260. 12 種類別中包含了正常心跳與其他 11 種不同類型的心電圖,其波形特 徵如圖 2-12~圖 2-23 所示。. 圖 2 - 12 正常波形 14.

(25) 圖 2 - 13 左束支傳導阻滯. 圖 2 - 14 右束支傳導阻滯. 圖 2 - 15 心房早期收縮 15.

(26) 圖 2 - 16 變形的心房早期收縮. 圖 2 - 17 結性早期收縮. 圖 2 - 18 心室早期收縮 16.

(27) 圖 2 - 19 心室融合心跳. 圖 2 - 20 房室結性逃脫搏動. 圖 2 - 21 心室性逃脫搏動 17.

(28) 圖 2 - 22 心跳節律器心跳. 圖 2 - 23 節律器融合心跳. 18.

(29) 第三章 系統組成與理論介紹 此章節將介紹本研究提出之心電圖診斷輔助系統的整體架構及實作過 程應用到的濾波、k-means 分群演算法、深度學習、離群資料處理等技術之 理論基礎及實作方法。. 3.1 心電圖診斷輔助系統架構 本系統主要由三個部分組成,前處理、深度學習神經網路以及離群資料 處理。前處理包含濾波、切割以及預分子類,經過前處理之後,以 1 比 1 的 方式分為訓練資料及測試資料,以訓練資料進行模型的訓練,並以測試資料 對訓練完成之模型進行測試。最後進行離群資料處理,將無法確切分類之資 料挑出,即得系統之結果。. 圖 3 - 1 系統流程圖 19.

(30) 各流程步驟細節如下: i.. 濾波與切割 採用濾波器濾除心電圖特徵以外之訊號成分,再依照資料庫內 標註之 R 波峰位置進行切割,為方便與過去文獻進行比較,切割長 度為 192 個取樣點,資料時間長度為 0.53 秒,以較短長度涵蓋了 PQRST 波之範圍。. 圖 3 - 2 切割後之訊號[3]. ii.. k-means 預分子類 由於心電圖受測量環境及個體差異影響甚大,各類別內波形變 異大,為避免神經網路模型因類別內資料差異過大而產生震盪,進 而造成訓練結果的不理想,本實驗參考張家熏之碩士論文[3]運用 kmeans 演算法進行預分子類的動作,藉由將差異較大的資料視為不 同類別,讓神經網路能夠穩定的收斂。. 20.

(31) iii.. 神經網路模型訓練 本研究採用卷積神經網路做為系統之核心。將前兩步驟處理好 的資料分成訓練和測試兩個部分,數量大約為 1:1,進入模型中進 行訓練與測試。此模型會將輸入的資料進行分類,當模型處理過後 的分類結果與預計值相同,視為分類成功,反之則為失敗。在訓練 過 程 中 使 用 交 叉 熵 (cross entropy)[13] 作 為 模 型 的 誤 差 , 並 以 Adam[14]方法進行優化。當誤差低於閾值時,即視為完成訓練。. iv.. 離群資料處理 心電圖資料波形複雜、型態多變,在分類時系統有可能出現無 法確切分類之情況。這時如果強行將資料進行分類,分類錯誤的機 率將非常大,稱為離群資料。藉由將離群資料從資料庫中分離出來, 可以避免部分分類錯誤的情況。. 3.2 濾波 在第二章有提到,心電圖量測過程中常出現許多干擾,這些干擾對於分 析來說不僅毫無益處,甚至還會造成困擾。而這些干擾的分布頻率範圍各不 相同,要在完整保留 ECG 訊號的狀況下完全去除相當困難。 表 3 - 1 常見干擾及其對應頻率 干擾類型. 常見頻率分布. 基準線飄移. 0 Hz ~ 0.8 Hz. 肌肉波干擾. 6 Hz ~ 100Hz. 電力線干擾. 視各國規格而定(臺灣 60 Hz). 21.

(32) 本研究採取特徵優先的處理方式進行濾波器的設計,最大限度的保留心 電圖各波形的特徵,因本研究所採用之分類方法深度學習分支中的 CNN 模 型,該模型具有擷取特徵之功能。故在資料的處理過程中應優先保留特徵, 以利 CNN 模型運作。本研究依據國立臺灣師範大學林昆宏碩士之論文[11], 以心電圖的波形特徵分布頻率(圖 3-3)進行濾波頻段的選取,其中 P 波 T 波 的分布頻率約為 3 Hz ~ 10 Hz 之間,QRS 綜合波分布頻率則在 3 Hz ~ 40 Hz 之間,在保留特徵頻段的情況下,考慮濾波器的頻率響應特性及干擾的分布 情形,選擇採用 0.8 Hz ~ 50 Hz 的帶通濾波器進行濾波. 圖 3 - 3 心電圖波形特徵分布頻段[11] 此外,濾波器常出現相位延遲的現象,導致心電圖波形失真,資料失去 部分特徵,對後續之程序同樣造成影響,須極力避免。綜合以上因素,最後 我們選用零相位延遲之 Butterworth 帶通濾波器進行訊號的處理。. 22.

(33) 3.3 K-means 分群演算法 k-means 演算法[15]是典型的分割式分群演算法,藉由將資料點進行分 割,來達到分群的目的。k-means 演算法經常被用來進行其他演算法的前處 理,因 k-means 演算法就算在巨大的資料量也可以輕易的被應用,常被用來 找尋初始設定,或者是對資料進行初步的分群。 心電圖之複雜性及個體差異性大,就算是同一種類型的疾病,波形也常 有顯著差異,因此我們將單一類別內之資料,依照特徵分成若干子類,使 CNN 模型在訓練的過程中不會因為同一類別中資料差異過大而產生嚴重震 盪,造成收斂效果不佳的情況。 3.3.1 演算法介紹 k-means 演算法主要是透過尋找各群集中心點的方式來進行分群,並試 圖使最後結果符合下列公式: 𝑘. argmin ∑ ∑‖𝑥 − 𝜇𝑖 ‖2 𝑆. (3. 1). 𝑖=1 𝑥∈𝑆𝑖. 其中 S 代表群集,k 為總群集數, 𝜇𝑖 為 𝑆𝑖 群集之數值中心。k-means 演算法在眾多研究者的努力下,發展出多種方法,但本質上皆相同,最常被 使用的 Lloyd 演算法[16]其大略步驟如下: (1) 設定初始群集中心點 跟大部分學習型演算法相同,k-means 演算法需要設定初始值,而值 的數量由使用者決定,名稱中的 k 指的就是中心點的數量,同時也代表 使用者期望模型能分出的群集數量。初始化時,隨機指定 k 個資料點作 為中心點,此種作法可以使設定的中心點分布較均勻[17]。. 23.

(34) 圖 3 - 4 隨機選取中心點(k=3). (2). 建立初始群集 依據初始中心點{𝑚1 , 𝑚2 … , 𝑚𝑘 },將所有資料點進行分類,建立初始 群集。k-means 演算法採用最小平方法計算歐式距離,公式如下: (𝑡). 𝑆𝑖. (𝑡) 2. (𝑡) 2. = {𝑥𝑝 : ‖𝑥𝑝 − 𝑚𝑖 ‖ ≤ ‖𝑥𝑝 − 𝑚𝑗 ‖ ∀𝑗, 1 ≤ 𝑗 ≤ 𝑘}. (3. 2). t:疊代次數. 𝑗:群集編號. 𝑖:分類中群集編號. 𝑝:資料編號. 𝑆:群集. 𝑥:資料點. 𝑚:群集中心點. 𝑘:群集總數. 圖 3 - 5 初始分群結果 24.

(35) (3) 重新定義中心點 初始的群集中心點為隨機選取,分群結果通常無法達到要求,為了 取得更好的分群結果,中心點需重新定義,新的中心點會符合以下公式: (𝑡+1). 𝑚𝑖. =. 1 (𝑡). |𝑆𝑖 |. ∑ 𝑥𝑗 (𝑡). (3. 3). 𝑥𝑗 ∈𝑆𝑖. 新的中心點將會以舊的分群結果進行計算,以群集的形心作為新的 中心點。再回到上一步進行分群,重複進行此兩步驟,直到中心點不再 變化為止。. 圖 3 - 6 重新定義中心點 (4) 分群結果 最後的訓練結果會使得群集內平方差最小化,而群集間的平方差最 大化,意謂群集較為集中,且群集與群集間有最大的分別。. 25.

(36) 圖 3 - 7 最終分群結果 3.3.2 k-means 預分子類 預分子類為一種將資料庫中同一類別之資料進行分群的方法,該方法可 以改善同一類別資料差異過大,導致分類不佳的情況,其運作模式如圖 3-8 之範例所示。. 圖 3 - 8 預分子類成果(以 RBBB 為例) 26.

(37) 本研究以國立臺灣師範大學張家熏碩士之論文[3]為參考,使用 k-means 演算法將資料進行階段的預分子類動作,再依據實驗過程中得到的資訊對子 類數量進行微調,逐一檢視資料庫中之 12 類資料,並依據類別的資料分布 狀況預分子類。經過處理後,資料總共被分為 59 個類別,normal 類別子類 數最多,達 16 個;也有類別在評估後無分子類需要,維持單一類別。資料 庫原生類別與預分子類後之類別對照表如表 3-2。 表 3 - 2 子類數量統計表 標記. 類別. 子類數目. N(1). Normal beat. 16. L(2). Left bundle branch block beat. 10. R(3). Right bundle branch block beat. 3. A(4). Atrial premature beat. 8. a(5). Aberrated atrial premature beat. 1. J(6). Nodal (junctional) premature beat. 1. V(7). Premature ventricular contraction. 10. F(8). Fusion of ventricular and normal beat. 6. j(9). Nodal (junctional) escape beat. 1. E(10). Ventricular escape beat. 1. /(11). Paced beat. 1. f(12). Fusion of paced and normal beat. 1. 3.4 Deep Learning (深度學習) 深度學習[18]是一種機器學習的方法,屬於人工神經網路(artificial neural network)。人工神經網路發展已久,最早可追溯至二十世紀 40 年代,由 McCulloch, Warren S 及 Walter Pitts 提出的一種神經網路的計算模型[19],但 後來因為科學家們漸漸發現該模型存在許多問題,例如當時的電腦硬體並無. 27.

(38) 法支持神經網路模型所需的長時間運算等等,造成該領域研究一度停滯不前。 直到深度神經網路被提出,才又漸漸被眾人所關注。 以下從人工神經網路的原理開始講起,介紹深度學習的緣起,最後會提 到深度學習目前的應用。 3.4.1 人工神經網路 人工神經網路模型藉由不停地改變參數,試圖找到一個複雜的函式來代 表某一功能(分類、回歸…),要實現這個訓練方法,首先我們需要有大量的 輸入資料以及相對應的期望輸出,之後再針對資料特性建立合適的模型架構, 最後進行訓練。典型的人工神經網路由輸入層、輸出層以及隱藏層組成。 圖 3-9 為簡單的人工神經網路架構。. 圖 3 - 9 人工神經網路架構 圖 3-9 中的每一個圓都代表一個神經元,線則表示神經元與神經元間的 連結。在人工神經網路中,同一神經層內神經元不會互相連結,只有不同神 28.

(39) 經層間才會有連結產生,其連接方式十分多樣,圖 3-9 中的隱藏層的連接模 式稱為「全連接」,隱藏層中的神經元皆與輸入層中的每一個神經元有所連 接,這代表每個神經元皆可以接收到輸入層傳來的所有資訊。 (1) 模型架構 神經網路中基本單位為神經元,單一神經元由輸入(input, X)、輸出 (output, Y)、權重值(weight, W)、偏移量(bias, b)以及激勵函數(activation function, f(.))所組成。. 圖 3 - 10 單一神經元結構 單一神經元運作方式十分簡單,將輸入資料與權重矩陣相乘,加上 偏移量,再經過激勵函數處理,即完成動作。這些神經元構成了上述所 提之輸入層、隱藏層、輸出層,輸入層即為輸入向量,輸出層則為輸出 向量,人工神經網路藉由在這兩者之間加入隱藏層,嘗試建立輸入與輸 出之間的關係式。運算公式如下: 𝑙. 𝑎𝑛𝑚. 𝑚−1 = ∑ 𝑓(𝑤𝑛𝑘 𝑥𝑘 + 𝑏𝑘 ). (3. 4). 𝑘=1. 其中𝑎𝑛𝑚 為第 m 層之第 n 個神經元的運算結果,f (.)為激勵函數,l 為 𝑚−1 第 m-1 層神經元總數,𝑤𝑛𝑘 為第 m-1 神經層的第 k 個神經元至第 m 神. 29.

(40) 經層的第 n 個神經元的權重值,𝑥𝑘 為第 k 個輸入,𝑏𝑘 為第 k 個輸入之偏 𝑚−1 移值。在此運算模式之下,透過不斷改變𝑤𝑛𝑘 與𝑏𝑘 的值,就能使得模型. 的最終結果產生改變,訓練模型即是運用此機制。 輸出層與輸入層的神經元數量是由資料決定,而隱藏層的神經元數 目則是研究者可以自由變動的,通常隱藏層層數或單層神經元數越多, 模型就會有更好的逼近能力,但訓練時間與記憶體需求也會上升,且在 資料量不足的情況之下,過高的逼近能力會使模型容易過度訓練,使訓 練完成之模型只適用於訓練資料,對於沒有使用來進行訓練的測試資料, 效果不佳,失去其一般性。 (2) 訓練 要開始執行訓練之前,我們需要對模型進行初始化,通常採用隨機 的方式給予模型中所有參數初始值。之後正式開始訓練,訓練過程由有 限個循環組成,每一個循環,稱之為代(epoch),系統經由估算當代模型 的輸出與期望輸出的差距,判斷模型的訓練完成度。. 圖 3 - 11 訓練流程 30.

(41) 人工神經網路訓練時多使用反向傳播算法(Backpropagation, BP)[20] 來進行訓練,BP 的運作分為兩個步驟: Step 1 資料傳遞計算 在此步驟,資料會進入模型進行運算,得到當下模型的輸出。 並將其與理想輸出比對,計算出誤差。 Step2 權重更新 得到誤差之後進行運算得到梯度,再配合優化方法(例如:最大 梯度法)進行權重的更新,即完成一次訓練。. 傳統的隱藏層由於演算法與硬體設備的限制,神經層數量受限的問題嚴 重,增加模型之隱藏層數目雖可順利運作,但須耗費大量時間等待才能得到 結果,對於開發研究十分不利,漸漸乏人問津。 3.4.2 深度學習 深度學習為人工神經網路的一個分支,最早可追溯到由福島邦彥在 1980 年所提出之 Neocognitron[21],與傳統神經網路最大就在於「深度」二字,深 度指的就是網路中隱藏層的數目。. 圖 3 - 12 深度神經網路架構. 31.

(42) 西元 1989 年 Yann LeCun 等人嘗試以反向傳播算法實行深度學習框架, 進行郵遞區號手寫辨識,但結果卻不甚理想,要達到可接受的精準度,訓練 時間甚至達到三天,無法符合實際需求[22]。導致結果不理想的原因繁多, 硬體的限制與梯度消失現象[23]就是其中兩項因素。 近年來梯度消失的問題因預訓練方法[24]的提出而得到解決。運用高效 能圖型處理器進行神經網路訓練的方法,也大幅縮短了網路的訓練時間[25]。 以下大略介紹對深度學習領域影響深遠的兩門技術: (1) 預訓練方法 梯度消失問題是由於深度神經網路利用反向傳播算法進行優化時, 其用於估算模型完成度的誤差值,在接近輸出層之處雖然正常運作,但 越接近輸入層,誤差卻越稀薄的狀況,這個問題導致了前段模型訓練上 的困難,進而影響了這個模型的訓練效率。預訓練方法透過將深度神經 網路中的每一層視為一個非監督式的單層神經網路,對其進行個別訓練 之後再利用反向傳播算法進行優化,藉此降低梯度消失問題對訓練過程 的影響,有效提高了深度神經網路的訓練效率。 (2) 圖形處理器(graphics processing unit, GPU)應用於神經網路訓練加速 隨著深度學習架構的逐漸成熟與訓練方法的改良,為了能讓深度習 架構發揮更大的效益,利用 GPU 加速網路訓練速度的作法被提出,透 過大規模的平行處理程序,可以將訓練速度有效提升,在 Raina, Rajat 等 人發表的論文[25]中,使用 GPU 與雙核 CPU 的訓練速度甚至達到 15 倍 的差距。. 32.

(43) 3.4.3 卷積神經網路(Convolutional Neural Network, CNN)[26] CNN 為眾多神經網路中的一種,對於圖像辨識擁有良好的效果,通常做 法為在傳統的全連接層之前加入卷積層及池化層,網路透過卷積層擷取特徵, 再透過池化層進行重新取樣,降低取得圖像的解析度,減少資料量。適用此 方法的資料通常有降取樣之後趨勢不變以及同一特徵出現在資料中任何位 置皆具有同等效力的特性。採用 CNN 可以改善傳統機器學習領域在訓練之 前,需要透過各種方式擷取不同形式的特徵,並測試其對模型之效力,找尋 有效特徵的繁複過程,CNN 在訓練過程中,使濾波器特性不斷進行變化,找 尋能夠濾出適當資料特徵的濾波器。訓練完成後,在 CNN 運算過程中,資 料會與多個在訓練中選定的濾波器進行卷積取得特徵,之後傳入全連接層中 更進一步的運算。在圖 3-13 的模型中,即採用此架構進行運算。. 圖 3 - 13 圖像分類器 CNN 模型[26] 一個卷積神經層中會包含多個通道,模型運作時,資料會通過這些通道, 每個通道皆包含一獨立的濾波器,資料會與各自通道的濾波器進行卷積計算, 並將結果傳往池化層。公式如下:. 33.

(44) 𝑁𝑙−1 𝑙−1 𝑙−1 𝑥𝑘𝑙 = 𝑏𝑘𝑙 + ∑ 𝑐𝑜𝑛𝑣1𝐷(𝑤𝑖𝑘 , 𝑆𝑖 ). (3. 5). 𝑖=1. 𝑥𝑘𝑙 :第 l 層的第 k 個通道的輸入 𝑏𝑘𝑙 :第 l 層的第 k 個通道的偏移量 𝑆𝑖𝑙−1 :第 l-1 神經層的第 i 個通道的輸出 𝑙−1 𝑤𝑖𝑘 :從第 l-1 層第 i 個通道到第 l 層第 k 個通道的濾波器. 𝑐𝑜𝑛𝑣1𝐷(.):一維卷積運算 池化層接收到卷積層所傳來之資料後,開始進行池化程序,所謂池化, 就是將資料依照給定之參數區分為若干區域,在每個區域中依照指定方式選 出其中一個資料成員來代表該區域,常用的方式有最大池化,平均池化…等, 依照需求而定,圖 3-14 即為一維數列採用最大池化法的範例,該範例中取 兩個張量成員為一區域,並取區域中數值大的一員代表該區域保留至輸出張 量中,並傳到下一層神經層中繼續運算。. 圖 3 - 14 一維張量最大池化範例 與傳統人工神經網路相同,除了輸入層及輸出層這兩個資料的接口神經 元數目需要配合資料格式之外,CNN 神經層中的神經元數目都是可以由建 構者決定的。 事實上,在本研究之前已有 CNN 用於進行心電圖分類的研究發表[2], 該研究以 CNN 作為系統主體,開發出一套分類系統,可以將心電圖依照 AAMI 標準分為 5 類:N、S、V、F、Q,本研究希望在此基礎之上,更進一 步分辨出每個心跳的可能症狀,讓醫生進行診斷時有更多資訊可以參考。 34.

(45) 3.4.4 心律不整心電訊號分類器 本研究採用卷積神經網路作為基本架構,輔以資料標準化、Holdout 驗 證、批次訓練、適應性學習率等技術,使分類器系統更加完善及穩定。本研 究之心律不整心電訊號分類器的詳細架構如圖 3-15 所示。. 圖 3 - 15 心律不整心電訊號分類器架構 分類器網路中包含輸入層、三層卷基層、兩層全連接層、一層 Dropout 層以及輸出層,資料從輸入層傳入,經過卷基層擷取特徵,再將特徵傳入全 連接層,經過防止過擬合的 Dropout 層,最後由輸出層得到結果。 . 分類器模型介紹. (1) 輸入 輸入層之神經元數目由輸入資料決定,輸入張量中的每一個成員都會對 應到一個神經元,輸入層之輸入與輸出通常相等,主要負責的工作為傳遞資. 35.

(46) 料。在此分類器中,輸入資料為長度 192 之一維張量,故輸入層神經元數目 亦為 192。 (2) 卷積與池化 此部分為本模型的核心部分之一,包含三層卷積神經層與三層池化神經 層,在第一卷積層中包含 32 個通道,每一個通道中,輸入張量分別與獨立 的濾波器進行卷積運算,為了使資訊保持完整,使用自動補零的卷積方式, 使用該方式擷取之特徵,會保留完整的資料訊息,且特徵張量的長度會與輸 入相同,亦有利於模型的設計。資料通過卷基層的 32 個通道過後,會以池 化層進行重新取樣,將 32 個特徵的張量長度減半,由原本的 192 減為 96。 第二層則是進一步將特徵數提升到 64 個,長度則減為 48,最後之第三層則 是將特徵增加到 128 個,長度則減少到 24 個,為方便下一部分之全連接層 進行計算,我們將資料重新排列為資料長度 3072 的一維張量,作為卷積部 分的最後輸出。 (3) 全連接層 如果說卷積層取代了傳統的特徵擷取過程,那全連接層就是傳統做法中 的神經網路,負責找出特徵與輸出間的關係。本模型包含 2 層全連接層,神 經元數目分別為 512 及 256,採用線性整流函數(relu)作為激勵函數,其公式 如下: 𝑓(x) = max(0, 𝑥). (3. 6). relu 激勵函數可以使模型更快收斂,同時對避免梯度消失也有一定的效果。 (4) Dropout 層 Dropout 為一種防止過擬合的方法,該方法藉由在每次訓練的過程中, 隨機令固定比例之神經元失效,也就是說每次訓練的神經網路其實並不完全 相同,藉此避免模型過度貼近訓練資料,導致失去一般性。本模型設定 36.

(47) Dropout 層之保留比例為 0.5,每次訓練時只會有半數的神經元維持功能,其 他神經元則被阻斷,張量無法通過,藉此達到改變模型的效果。需要特別注 意的是,當模型訓練完成,以測試資料集進行測試時,我們須設定其保留比 例為 1,以保留所有神經元,維持模型的完整性。 (5) 輸出 經過了模型隱藏層的運算,最後的結果會傳到輸出層做最後的處理,本 模型之目標為將每一筆資料分類到該資料最有可能屬於之類別,故每筆資料 的輸出張量中應有單一成員特別突出,其他皆趨近於零,方便系統辨識該資 料屬於哪一類別,於是我們在輸出層中採用 Softmax 函數作為激勵函數,該 函數可對輸出張量進行處理,突出向量最大項,並使張量和等於 1,使張量 機率化,Softmax 函數之公式如下: 𝑒 𝑧𝑗 σ(z)𝑗 = 𝐾 𝑓𝑜𝑟 𝑗 = 1, … , 𝐾. ∑𝑘=1 𝑒 𝑧𝑘 . (3. 7). 運用技術介紹. (1) 資料標準化 MITBIH 心律不整資料庫收錄之資料,因量測對象、量測環境、病 症...等等原因,資料數值的分布範圍各異,導致分割過後之單次心跳資料 發生準位不同的情況,該現象會造成系統的辨識難度增加,降低整體辨 識率。在進行訓練前,須對所有資料進行標準化的動作,提升系統的辨 識率及穩定度。本研究標準化之過程如下: 𝐸1 = 𝐸𝑜 − 𝑚𝑖𝑛(𝐸𝑜 ) 𝐸1 𝐸2 = 𝑚𝑎𝑥(𝐸1 ) 𝐸𝑛 = 𝐸2 − 𝑎𝑣𝑔(𝐸2 ). 37. (3. 8) (3. 9) (3. 10).

(48) 𝐸𝑜 為輸入資料集,𝐸𝑛 為完成標準化的資料集,標準化分為三個步驟, 第一個步驟先將𝐸𝑜 減去整個資料集的最小值,將資料集的底部固定在 0, 是為𝐸1;第二步將𝐸1 除以其本身的最大值,以等比例縮放的方式,使整 個資料集的最大值為 1,是為𝐸2 ;最後,為避免標準化受到少數震盪範 圍較大的資料影響,導致訓練資料集與測試資料集間的標準化不一致, 讓模型的訓練難度增加,本研究將𝐸2 減掉其自身的平均值,將資料中心 移至原點得到𝐸𝑛,完成整個標準化流程。標準化過後,資料範圍將會被 限制在-1~1 之間,此外,整個資料集使用同一標準進行標準化,資料間 的相對特性也會被保留。 (2) Holdout 驗證 Holdout 驗證為一種驗證模型訓練的方法,此方法將資料分為訓練資 料集和測試資料集,以訓練資料集作為訓練資料,完成訓練之後以測試 資料集進行驗證,藉此確認模型的一般性。圖 3-16 顯示分類結果的正確 率會隨著訓練資料集比例成正相關,投入越多資料進行訓練,分類結果 就越好。本研究將訓練資料與測試資料比設定為 5:5,希望能在不投入 過多訓練資料的狀況下,得到較好的訓練結果。 99.10. 99.05. Accuracy (%). 99.00. 98.95. 98.90. 98.85. 98.80 30. 40. 50. 60. 70. Proportion of training data (%). 圖 3 - 16 訓練資料比與正確率關係圖 38.

(49) (3) 批次訓練 本研究使用之資料集共有 104955 筆單次心跳資料,其中運用於訓 練的資料約為 52476 筆,資料量龐大,每次訓練皆全數傳入會導致記憶 體不足,同時也會使訓練速度變得十分緩慢,故本研究採用批次訓練的 方式,將資料集分多次傳入模型中進行訓練,避免以上情況發生。批次 訓練的隨機性同時還可以避免模型在訓練過程中陷入局部最佳解。 (4) 適應性學習率 神經網路訓練剛開始與訓練接近完成時,所需的學習率並不相同, 在剛開始時,參數範圍最大,需要較大的學習率,快速找到可能包含最 佳解的區域,而當搜尋範圍越來越小,學習率也應相對縮小,才不會因 為學習率過大,陷入無法收斂的狀態。本研究採用每一千步學習率降為 原本的 96%之方案,在速度及準確率間取得平衡點。. 39.

(50) 3.5 離群資料處理 神經網路之輸出結果通常為一維張量,長度取決於資料類別的數量,假 設資料庫中擁有 12 個類別的資料,輸出張量長度即為 12,這 12 項分別表 示測試資料歸屬於某一類別之機率。由於輸出張量經過 Softmax 函數轉換, 使所有機率的總和為 1,並突出了張量最大值,理想狀態下應有某一項機率 明顯高於其他張量成員,甚至其值應接近於 1,如圖 3-17 所示。. 1.000. 0.900. Probability. 0.005 0.004 0.003 0.002 0.001 0.000 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Class. 圖 3 - 17 理想情況下輸出張量機率值分布圖 但心電圖資料波形複雜、型態多變,有部分資料進行分類時,輸出並無 法達到上述理想情況,機率最大值無法接近於 1。經觀察發現,一旦輸出張 量產生此情況,對於該筆資料之分類準確度會大幅降低,代表模型無法精確 歸類輸入資料。 此狀況下,我們將該筆資料視為離群值,代表該資料並無法完全切合任 何一個類別的特徵,導致無法精確歸類。這類資料我們會將其分類到獨立於 系統外之類別中,視為未知類別資料(Unknown)。. 40.

(51) 該類資料有可能是綜合了多類別之特徵,導致系統無法辨別。或者其資 料特徵並沒有出現在訓練資料中,系統無從判別。不論是哪一種狀況,此類 資料都應該從資料集中獨立出來,以方便後續進行處理。. 圖 3 - 18 系統分類結果示意圖 被分類到未知類別的資料,與非正常心跳類別一同被視為有危險性的心 電圖(圖 3-18 紅色部分)。在未來實際應用時,將會被系統標註為重點觀察區 域,提醒醫師或醫事檢驗師須特別注意並進行確認。. 41.

(52) 第四章 實驗與結果 本研究之目的為結合 k-means 預分子類與 CNN 分類器,建構一套有效 的心律不整輔助診斷系統,並對分類結果進行離群資料處理。以 CNN 分類 器作為核心,將另兩項技術混合或單獨使用,觀察其對訓練結果之影響,並 探討原因。另外,為方便與過去文獻進行比較,除了採用 MITBIH 原生類別 之外,亦採用 AAMI 標準類別進行實驗。. 4.1 實驗 本研究包含兩個實驗,實驗 1 測試資料來源於 MITBIH 心律不整資料庫, 並使用資料庫原有之類別表進行分類。實驗 2 同樣採用 MITBIH 心律不整資 料庫,但採用 AAMI 發布之心電圖標準類別進行分類。在這兩個實驗中,將 會針對 k-means 預分子類及離群資料處理兩個策略進行測試,觀察這兩項措 施在不同的情況下各自的運作狀況,並確認兩者互相影響的程度,找尋效果 最好,消耗最小的解決方案。 4.1.1 實驗 1 - MITBIH 資料庫 12 類別分類實驗 實驗包含四組實驗,以預分子類及離群資料處理兩種因素做為操作變因 互相搭配變化出四種不同組合,並將其他條件固定為控制變因,保證實驗結 果之變化與操作變因有足夠之相關性。 每次實驗皆以隨機方式將資料分為訓練資料集以及測試資料集,兩資料 集樣本皆無重複。在實驗中,採用訓練資料集進行模型訓練,訓練完畢後再 使用測試資料集進行測試,實驗結果為模型對測試資料的分類結果。採用多 次實驗平均進行比較,以確保實驗結果之一般性。. 42.

(53) . 實驗設計 本次實驗目的為確認 k-means 預分子類與離群資料處理對分類正確 率之影響,故其他因素皆為控制變因,包含資料集的比例、學習率…等 等,而預分子類與離群資料處理為操作變因,在四組實驗中皆有所不同。 每項實驗皆會進行 100 次的測試,並進行統計,最終以平均結果呈現。 實驗 1-1: 本實驗為對照組,單純使用心律不整心電訊號分類器進行辨識, 不對資料進行預分子類,也不進行離群資料處理。測試分類器之原 始效能,了解卷積神經網路模型本身之擬合能力,建立實驗的基準 參考,下列的實驗將以此作為標準進行評估。 訓練資料集與測試資料集數量比例約設定為 1 比 1,在分配時 會以隨機方式將每個類別分為數量大致相等的兩個部份,並配發到 訓練及測試兩個資料集。其中訓練資料集總共包含 52476 筆資料, 測試資料集則包含 52479 筆資料。 分類器之學習率則採用適應性學習率,初始學習率設定為10−3, 之後每訓練 1000 代,學習率會進行一次更新,降低為原本的 0.96 倍,以符合當下需要的訓練速度。而最後決定訓練是否完成的誤差 閾值則設為10−8,當訓練誤差小於閾值,即結束訓練,並投入測試 資料集進行測試,取得該模型對測試資料集之分類結果。 實驗 1-2: 本實驗延續實驗 1-1 之方式,以心律不整心電訊號分類器為主 要架構,輔以 k-means 預分子類方法,將資料庫依表 3-2 分為 59 類 做為新的資料庫使用。分配資料時以隨機方式將 59 個類別分為兩 個部分,分別配發至訓練及測試資料集。其中訓練資料集總共包含 52460 筆資料,測試資料集則包含 52495 筆資料。 43.

(54) 進行訓練與測試時,會將資料視為 59 類進行訓練,待訓練完畢, 得到分類結果後再進行類別重整,將 59 類重新整理成 12 類,並進 行結果估計。值得注意的是,由於同一母類別之所有子類事實上皆 為同個類別,故如有資料原被標記為子類 1 卻被分到同個母類別之 子類 2 的話,該筆資料視為分類正確。 實驗 1-3: 本次實驗亦延續實驗 1-1,以心律不整心電訊號分類器進行分類, 得到結果後,再進行離群資料處理,將分類不準確之資料分離,歸 入未知類別。分離過後之離群資料因為無法判斷為分類正確或不正 確,並不會與其他資料一同進行正確率計算,故計算分類正確率時, 資料數量會因此而些微減少。 實驗 1-4: 本次實驗延續實驗 1-1 至 1-3,以 k-means 預分子類將資料庫分 為 59 類做為新的資料庫使用進行訓練與測試,並進行離群資料處 理,將分類不準確之資料分離,歸入未知類別。最後進行類別的重 整,將 59 類重新整理成 12 類。 本次實驗之目的在於,嘗試將 k-means 預分子類方法與離群資 料處理同時運用在分類系統當中,觀察此兩項方法是否可以相輔相 成,進而得到比較好的分類結果。 . 實驗結果 實驗結果以混淆矩陣表示,如表 4-1~表 4-4 所示。. 44.

(55) 表 4 - 1 實驗 1-1 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 1. 37244.37. 2.95. 3.32. 50.55. 2.41. 0.36. 30.96. 12.33. 13.49. 0.08. 0.17. 1.01. 2. 9.24. 4015.31. 0.01. 0.61. 0.49. 0.00. 7.63. 0.10. 0.30. 0.82. 0.00. 0.49. 3. 6.06. 0.13. 3608.38. 6.29. 0.13. 0.33. 3.47. 0.09. 0.12. 0.00. 0.00. 0.00. 4. 116.65. 1.52. 8.92. 1136.69. 1.37. 0.63. 4.37. 0.08. 1.75. 0.00. 0.00. 0.02. 5. 9.18. 0.46. 0.12. 3.51. 56.14. 0.00. 5.26. 0.25. 0.00. 0.00. 0.06. 0.02. 6. 2.72. 0.00. 0.90. 0.85. 0.01. 36.71. 0.00. 0.00. 0.81. 0.00. 0.00. 0.00. 7. 49.04. 7.01. 1.88. 4.20. 2.44. 0.00. 3471.67. 22.76. 0.08. 1.16. 0.49. 0.27. 8. 46.50. 0.55. 0.47. 0.26. 0.28. 0.02. 33.92. 318.43. 0.19. 0.28. 0.00. 0.10. 9. 25.96. 0.05. 0.48. 1.26. 0.01. 1.50. 0.08. 0.27. 85.29. 0.00. 0.00. 0.10. 10. 0.99. 0.24. 0.05. 0.02. 0.04. 0.00. 2.29. 0.17. 0.08. 49.12. 0.00. 0.00. 11. 0.58. 0.00. 0.01. 0.00. 0.00. 0.00. 0.56. 0.00. 0.00. 0.00. 1806.83. 0.02. 12. 1.12. 0.77. 0.01. 0.07. 0.00. 0.00. 0.41. 0.00. 0.03. 0.00. 0.24. 127.35. 45.

(56) 表 4 - 2 實驗 1-2 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 1. 37260.92. 2.77. 4.35. 49.51. 2.64. 0.34. 40.18. 15.56. 10.69. 0.14. 0.59. 1.39. 2. 9.52. 4014.64. 0.04. 0.41. 0.46. 0.00. 9.11. 0.06. 0.38. 0.84. 0.02. 0.52. 3. 7.78. 0.10. 3609.30. 5.59. 0.05. 0.28. 2.82. 0.02. 0.04. 0.00. 0.02. 0.00. 4. 109.96. 1.04. 8.55. 1146.87. 1.46. 1.30. 4.45. 0.05. 1.30. 0.01. 0.00. 0.01. 5. 7.44. 0.61. 0.17. 3.61. 58.95. 0.00. 3.78. 0.41. 0.00. 0.01. 0.02. 0.00. 6. 3.41. 0.00. 1.32. 0.50. 0.02. 36.49. 0.00. 0.00. 0.26. 0.00. 0.00. 0.00. 7. 46.28. 5.29. 1.60. 2.45. 3.40. 0.03. 3480.54. 21.62. 0.03. 1.61. 0.74. 0.41. 8. 40.00. 0.42. 0.14. 0.41. 0.36. 0.10. 32.16. 329.22. 0.14. 0.03. 0.00. 0.02. 9. 29.11. 0.00. 0.57. 0.82. 0.00. 1.49. 0.06. 0.25. 82.70. 0.00. 0.00. 0.00. 10. 1.31. 0.11. 0.03. 0.05. 0.07. 0.00. 1.86. 0.25. 0.02. 49.30. 0.00. 0.00. 11. 0.48. 0.00. 0.00. 0.00. 0.00. 0.00. 0.48. 0.00. 0.00. 0.00. 1807.04. 0.00. 12. 1.39. 0.60. 0.06. 0.05. 0.04. 0.00. 0.79. 0.00. 0.02. 0.00. 0.34. 126.71. 46.

(57) 表 4 - 3 實驗 1-3 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Unknown. 1. 37065.79. 1.40. 2.20. 24.76. 0.65. 0.06. 18.66. 4.60. 5.33. 0.00. 0.15. 0.38. 238.02. 2. 7.06. 4006.78. 0.00. 0.16. 0.21. 0.00. 4.39. 0.01. 0.09. 0.39. 0.00. 0.29. 15.62. 3. 3.66. 0.11. 3602.15. 4.16. 0.01. 0.08. 2.14. 0.00. 0.00. 0.00. 0.00. 0.00. 12.69. 4. 79.76. 0.94. 5.70. 1089.82. 0.59. 0.28. 2.72. 0.01. 0.67. 0.00. 0.00. 0.00. 91.51. 5. 6.19. 0.10. 0.03. 2.08. 49.54 0.00. 3.23. 0.06. 0.00. 0.00. 0.02. 0.00. 13.75. 6. 1.59. 0.00. 0.49. 0.28. 0.00 31.98. 0.00. 0.00. 0.08. 0.00. 0.00. 0.00. 7.58. 7. 35.52. 4.20. 0.85. 1.66. 0.98. 0.00. 3406.16. 8.03. 0.00. 1.03. 0.34. 0.05. 102.18. 8. 28.45. 0.20. 0.17. 0.04. 0.04. 0.00. 15.58. 277.07 0.00. 0.01. 0.00. 0.02. 79.42. 9. 17.88. 0.01. 0.33. 0.43. 0.00. 1.03. 0.00. 0.17. 69.44 0.00. 0.00. 0.00. 25.71. 10. 0.77. 0.14. 0.02. 0.00. 0.00. 0.00. 1.09. 0.01. 0.01 48.40. 0.00. 0.00. 2.56. 11. 0.57. 0.00. 0.00. 0.00. 0.00. 0.00. 0.66. 0.00. 0.00. 0.00. 1806.41. 0.00. 0.36. 12. 0.76. 0.52. 0.02. 0.01. 0.00. 0.00. 0.31. 0.00. 0.00. 0.00. 0.18. 125.94. 2.26. 47.

(58) 表 4 - 4 實驗 1-4 實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Unknown. 1. 36242.80. 1.04. 2.74. 25.64. 0.93. 0.07. 25.43. 7.41. 5.49. 0.01. 0.50. 0.93. 1055.01. 2. 5.90. 3841.54. 0.01. 0.12. 0.28. 0.00. 5.75. 0.01. 0.18. 0.48. 0.00. 0.40. 181.33. 3. 4.71. 0.02. 3605.69. 3.81. 0.01. 0.06. 2.27. 0.00. 0.00. 0.00. 0.00. 0.00. 9.43. 4. 81.92. 0.69. 6.92. 1101.51. 0.80. 0.44. 2.43. 0.01. 0.81. 0.00. 0.00. 0.02. 79.45. 5. 5.03. 0.33. 0.05. 2.45. 54.92 0.00. 2.28. 0.20. 0.00. 0.00. 0.00. 0.00. 9.74. 6. 2.13. 0.00. 0.96. 0.40. 0.01 33.03. 0.00. 0.00. 0.02. 0.00. 0.00. 0.00. 5.45. 7. 33.11. 2.55. 0.74. 0.99. 1.98. 0.00. 3404.04. 10.89. 0.00. 1.00. 0.53. 0.20. 107.97. 8. 28.23. 0.23. 0.07. 0.12. 0.11. 0.01. 19.80. 297.91 0.02. 0.02. 0.00. 0.01. 56.47. 9. 20.41. 0.00. 0.44. 0.30. 0.00. 0.75. 0.01. 0.06. 72.56 0.00. 0.00. 0.00. 20.47. 10. 0.86. 0.03. 0.01. 0.00. 0.00. 0.00. 1.13. 0.13. 0.01 48.67. 0.00. 0.00. 2.16. 11. 0.47. 0.00. 0.00. 0.00. 0.00. 0.00. 0.25. 0.00. 0.00. 0.00. 1806.98. 0.00. 0.30. 12. 0.99. 0.33. 0.01. 0.01. 0.00. 0.00. 0.41. 0.00. 0.00. 0.00. 0.19. 126.42. 1.64. 48.

(59) 4.1.2 實驗 2 - AAMI 標準 5 類別分類實驗 實驗 2 依據醫療器材促進發展協會(AAMI)發布之標準類別將資料進行 重新分類再次實驗,依據該標準我們將資料庫中原有之 12 類重新歸為 5 類, 分別為 N、S、V、F、Q,各類分類依據以及包含之原類別如表 4-5。 表 4 - 5 AAMI 標準類別 AAMI 心跳類別 說明. MIT-BIH 心跳類型. N. S. V. 非異位心 跳 正常波形. 室上性 異位心跳 心房早期 收縮. 心室異位 心跳 心室早期 收縮. 左束支傳 導阻滯. 變形心房 早期收縮. 心室性跳 脫博動. 右束支傳 導阻滯. 結性早期 收縮. F. Q. 複合心跳. 未知心跳. 心室融合 心跳. 心跳節律 器心跳 節律器融 合心跳. 房室結性 跳脫博動. 實驗中同樣包含了四組實驗,其組成與實驗 1 相同,以同樣的分類組合, 再將分類結果轉為以 AAMI 標準類別呈現。實驗之參數也延續實驗 1 的設 定,此實驗的目的主要在於檢視模型在 AAMI 標準類別的表現,並希望能藉 由增加不同的分類方式,能與過去文獻進行更多比較。. 49.

(60) . 實驗設計 實驗 2-1: 參照實驗 1-1。不對資料進行預分子類,也不進行離群資料處理, 並改以 AAMI 標準類別進行分類處理 實驗 2-2: 參照實驗 1-2。以 k-means 預分子類將資料庫分為 59 類做為新 的資料庫使用進行訓練與測試,並在實驗的最後進行類別重整,將 59 類重新整理成 5 類。 實驗 2-3: 參照實驗 1-3。改以 AAMI 標準類別進行分類處理,再進行離 群資料處理,將分類不準確之資料分離,歸入未知類別。 實驗 2-4: 參照實驗 1-4,以 k-means 預分子類將資料庫分為 59 類做為新 的資料庫使用進行訓練與測試,再進行離群資料處理,將分類不準 確之資料分離,歸入未知類別。最後進行類別的重整,將 59 類重新 整理成 5 類。. . 實驗結果 實驗結果以混淆矩陣表示,如表 4-6~表 4-9 所示。. 50.

(61) 表 4 - 6 實驗 2-1 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 1. 44998.57. 75.58. 44.49. 15.50. 1.86. 2. 144.24. 1235.43. 8.87. 0.30. 0.16. 3. 64.54. 7.49. 3517.73. 23.17. 1.07. 4. 47.34. 0.53. 33.25. 319.84. 0.04. 5. 3.47. 0.06. 0.99. 0.04. 1933.44. 表 4 - 7 實驗 2-2 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. 1. 45018.84. 59.60. 49.44. 14.77. 2.35. 2. 134.30. 1248.48. 8.69. 0.44. 0.09. 3. 54.47. 6.04. 3533.20. 22.12. 1.17. 4. 41.76. 0.71. 31.77. 328.75. 0.01. 5. 2.65. 0.07. 1.10. 0.00. 1934.18. 51.

(62) 表 4 - 8 實驗 2-3 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. Unknown. 1. 44849.06. 36.65. 30.90. 4.85. 1.37. 213.17. 2. 105.44. 1179.84. 5.88. 0.16. 0.04. 97.64. 3. 43.47. 3.69. 3468.80. 8.46. 0.55. 89.03. 4. 30.37. 0.21. 17.45. 276.70. 0.02. 76.25. 5. 2.46. 0.01. 0.78. 0.00. 1932.06. 2.69. 表 4 - 9 實驗 2-4 之實驗結果. Actual. Predicted 1. 2. 3. 4. 5. Unknown. 1. 43950.34. 32.05. 34.40. 7.86. 1.47. 1118.88. 2. 99.96. 1199.05. 5.76. 0.23. 0.01. 86.99. 3. 39.86. 2.88. 3463.71. 11.47. 0.75. 98.33. 4. 28.56. 0.20. 20.75. 300.95. 0.00. 52.54. 5. 1.94. 0.01. 0.63. 0.00. 1933.14. 2.28. 52.

(63) 4.2 結果彙整與討論 本節將運用既有的幾項效益評估方法來檢視系統之輸出結果,並歸納出 系統的優缺點與可能的改進方向。 4.2.1 效益評估方法 本研究主要以正確率做為評估指標,再搭配分類結果之混淆矩陣進行細 部分析。分析項目包含漏診率、誤診率、各類別正確率等重要指標,這些指 標可以幫助我們更精準的評估模型的效能及訓練的正確性,也能夠幫助我們 了解模型的優缺點,有益於未來模型的改良。 . 正確率 正確率為最常見的模型評估指標,一般計算方式為,將正確分類之 資料數量除以資料總數。 𝐴𝐶𝐶 =. 𝑇𝑁 + 𝑇𝑃 𝑇𝑃 + 𝑇𝑁 + 𝐹𝑁 + 𝐹𝑃. (4. 1). 在實驗中,計算正確率會遇到兩種情況,一種是沒有進行離群資料 處理時的情況,計算時將分類正確之資料數量直接除以資料總數量即為 答案; 另一種是系統有進行離群資料處理的情況。在此情況下,分類結果會有 三種類型:分類正確、分類錯誤、未知類別。在本研究中,正確率的計 算將不考慮未知類別的資料,因此在計算正確率時,僅考慮分類正確與 分類錯誤兩種情況。 . 漏診率及誤診率 在檢視模型結果時,除了正確率,漏診率與誤診率也是關心的重點。 漏診率指的是在所有非正常心跳資料中,有多少資料被判斷為正常;誤 53.

(64) 診率則相反,其代表在所有正常心跳資料中有多少資料被判斷成非正常。 藉由檢視這兩項指標,可以了解分類系統之優缺點,也提供未來改進的 方向。 . 各類別正確率 計算單一類別之正確率須以當類別中分類正確之資料數量除以類別 總數。另一方面,當系統有進行離群資料處理時,同樣須將未知類別資 料排除後,方可進行計算。. 4.2.2 實驗結果評估與比較 本研究主要針對幾個方向進行比較與探討,分別是預分子類與離群資料 處理個別產生之效應,以及合併過後之效果。 (1) K-means 預分子類的效益 實驗 1-2 參考張家熏之碩士論文[3],使用了預分子類的技術嘗試對 模型效能做出改善,我們從正確率、漏診率、誤診率及各類別正確率等 指標來進行比較。 表 4 - 10 實驗 1-1 與 1-2 實驗結果統計比較 正確率. 漏診率. 誤診率. 實驗 1-1. 99.00%. 1.77%. 0.31%. 實驗 1-2. 99.02%. 1.70%. 0.34%. 從表中可以發現,預分子類技術對這三種統計指標並無明顯影響。 但並不能依此判斷預分子類之效果有無,下一步將比較兩實驗中之類 別正確率,就由此動作進一步確認預分子類之效益。. 54.

(65) 圖 4 - 1 實驗 1-1 與 1-2 類別正確率比較圖 在圖 4-1 中可以發現在兩實驗中,各類別之正確率並無顯著差異, 此結果與前一部份之比較結果相符。由此可研判,k-means 預分子類之 方法對於本研究所採用之卷積神經網路並無明顯效果。 另外比較實驗 1-3 與實驗 1-4 可以發現,有做預分子類時,被分到 未知類別的資料明顯增加,這情況在正常心跳類別最為嚴重。預分子類 的概念主要是透過將同類別中差異太大以致無法辨別之資料透過分類 方式,使其在分類時可以被較明確的分類,再加上不同子類間的資料可 以互相交錯。例如:原屬子類 1 之資料被分為子類 2,此時結果仍為正 確。藉由此兩項方式來提高系統之正確率。但是將類別做切割的動作同 時也造成類別的完整度降低,導致部分資料無法被確切歸類到某一子 類,雖然透過子類可以互相交錯的特性不會影響辨識結果,但在做離群 資料處理的時候,就會造成被分到未知類別的資料量上升。. 55.

參考文獻

相關文件

Categories of Network Types by Broad Learning Method.

Each unit in hidden layer receives only a portion of total errors and these errors then feedback to the input layer.. Go to step 4 until the error is

Ongoing Projects in Image/Video Analytics with Deep Convolutional Neural Networks. § Goal – Devise effective and efficient learning methods for scalable visual analytic

Principle Component Analysis Denoising Auto Encoder Deep Neural Network... Deep Learning Optimization

Hsuan-Tien Lin (NTU CSIE) Machine Learning Techniques 3/24.:. Deep Learning Deep

Deep learning usually refers to neural network based model.. Shallow – Speech Recognition. ◉

for training

Random Forest: Theory and Practice Neural Network Motivation.. Neural Network Hypothesis Neural Network Training Deep