• 沒有找到結果。

第四章 第四章 第四章

N/A
N/A
Protected

Academic year: 2021

Share "第四章 第四章 第四章"

Copied!
29
0
0

加載中.... (立即查看全文)

全文

(1)

第四章 第四章 第四章

第四章 心電圖診斷理論基礎與系統 心電圖診斷理論基礎與系統 心電圖診斷理論基礎與系統 心電圖診斷理論基礎與系統

本章節所要介紹的是和心電圖病症簡介,接著是對資料叢聚的k-mean 演算法做介紹,然後是小波轉換、支持向量機,還有特徵擷取做介紹,最 後則是本研究所使用的分類系統。

4.1 心電圖心電圖心電圖心電圖病症簡介病症簡介病症簡介 病症簡介

自 從 1975 年 來 , Beth Israel Hospital( 現 在 為 Beth Israel Deaconess Medical Center)的研究團隊和MIT(Massachusetts Institute of Technology,麻 省理工院)並共同合作,研究有關心律不整和相關的心臟疾病。其中最主要 的目地就是整理出有關於心律不整資料庫。在1980時MIT-BIH完成了第一 套MIT-BIH心律不整的資料庫,其發行的心律不整資料庫已經被世界上超 過500個研究單位和機構所使用,它是第一個能普遍獲得的標準測試資料 庫,可以用來評估心律不整或是心臟疾病偵測器的效能[33][34]。

MIT-BIH心律不整資料庫共有48筆資料,本研究使用46個筆資料如表 3-1所示,每筆資料長度為30分鐘,取樣頻率為360Hz,11bits的解析度,其 中每筆資料皆有兩組不同的導極(通常包含了MLII及V1,但是有些因對象 不同會是MLII 及 V2、V4或V5)的心電圖訊號。其中每組資料包含一個標 頭檔(Head file,.hea),一個說明檔(Annotation file,.atr),一個資料檔(Data file,.dat),茲分別敘述如下:

標頭檔:記載著每組資料名稱、心電圖資料長度、資料所屬的對極、

取樣頻率,固定為512位元組。其中每筆資料皆有兩組不同的導極(通常包 含了MLII及V1,但是有些因對象不同會是MLII 及 V2、V4或V5)的心電 圖訊號,取樣頻率為360Hz,解析度為11bits,電壓值介於-5mV至5mV之間,

記錄時間約30分鐘。

說明檔:註解資料檔中每一筆心電圖資料的屬性,其R波與前一R波在

(2)

資料檔中之間距和所屬的病症,其中每一個波形訊號之症狀註解都是至少 經由兩位心臟科醫生判定後再相互核對,如果判定後彼此註解不同,則經 過研究後再做最後決定。

資料檔:含有兩個通道的資料,且每通道資料為650000筆資料。

對於MIT-BIH心律不整資料庫中,有許多筆資料都含有數種不同類別 的心臟病症,如何看懂MIT-BIH心律不整資料庫的心電圖,說明如下:

MIT-BIH心律不整資料庫中,每一筆資料皆有醫生所判斷出的病症,並且 標示出病症的位置和特徵。在圖4-1中,圖(a)表示為MLⅡ導極所呈現出來 的波形,圖(b)為V2導極所產生的波形,其中圖中”N”表示為正常的波形 (Normal Beat),另外還有”A”、”F”、”V”等為心搏註解的縮寫,例 如”A”表示為心房期外收縮(atrial premature beat),”V”表示為心室期外 收縮(ventricular premature beat)、”F”表示為心室融合心搏(ventricular fusion premature)。

100 111 119 203 214 228

101 112 121 205 215 230

103 113 122 207 217 231

105 114 123 208 219 232

106 115 124 209 220 233

107 116 200 210 221 234

108 117 201 212 222

109 118 202 213 223

表 4-1 所使用的 MIT-BIH 心律不整資料庫的記錄

(3)

0 1 2 3 4 5 6 7 8 9 10 -1

0 1 2

28 1 1 1 1 1 1 1 1 1 1 1 1

Time / s

Voltage / mV

ECG signal 103.dat

0 1 2 3 4 5 6 7 8 9 10

-1 0 1 2

28 1 1 1 1 1 1 1 1 1 1 1 1

Time / s

Voltage / mV

ECG signal 103.dat

MLII

V2 (a)

(b)

圖 4-1 MIT-BIH 心律不整資料庫的心電圖

一般來說,以心電圖訊號能夠診斷出來的心電圖種類,依照心電圖病 症的特徵以及形成原因分為下列如表4-2所示。

MIT/BIH annotation

symbol Type of arrhythmia N Normal Beat

L Left bundle branch block beat R Right bundle branch block beat A Aberrated atrial premature beat V Premature ventricular contraction

F Fusion of ventricular and normal beat J Nodal (junctional) premature beat A Atrial premature Beat

E Ventricular escape beat

J Nodal (junctional) escape beat / paced beat

F Fusion of paced and normal beat 表4-2 MIT-BIH心電圖病症病碼

在此將對本研究所需要的心臟病症如表4-2所標示註記作介紹。

(4)

一、正常波形(Normal Beat):如圖4-2所示。

一般正常心跳速率的定義是每分鐘60至100下,且大部份的人在60至 80下之間,而且是從正常的竇性節律點所發出的人類的心跳主要由位於上 腔靜脈和右心房交接處附近的竇房結(sinusnode)負責操控。竇房結細胞是 一種「節律細胞」,它會自行產生胞膜內外之電位差,以達到閥值(threshold) 而誘發「發電」。由竇房結細胞所發出之電氣訊息,再傳至心房,導玫心 房細胞興奮及收縮。心房細胞的電氣訊息再經由心房、心室交接處之房室 結(atrioventricular node)傳入心室,導致心室細胞心房細胞興奮及收縮。

20 40 60 80 100 120 140 160 180 200

-150 -100 -50 0 50 100 150 200 250 300 350

圖4-2 正常波形

( MIT-BIH Arrhythmia Database Record 103)

二、左分支束阻塞(Left Bundle Branch Block):如圖4-3所示。

在心正常電傳導路徑上的任何阻滯都稱為傳導阻斷。當在左分枝束 (left bundle branch)中的傳導阻斷,左心室會較慢去極化。這會在心電圖上 也可以看到兩種變化:

(1) 左心室的去極化拖慢,使得QRS波組加寛,過0.12秒。

(2) 左心室之上的導極的導極(I,AVL,V5和V6)中的QRS波組會顯示 出非常特別的形狀。這些導極原本就有高大的R波,在左枝束阻塞時,左 心室去極化的延遲會使得這些R波上升的過程明顯的延長,造成寛頂的R

(5)

波或是有凹缺的R波。在右心室上的導極會形成對應的寛而深的S波。在左 分枝阻斷時,有時候也可以看到電軸左偏。

20 40 60 80 100 120 140 160 180 200

-400 -200 0 200

(a) MIT-BIH Record 109

20 40 60 80 100 120 140 160 180 200

-200 0 200

(b) MIT-BIH Record 111

20 40 60 80 100 120 140 160 180 200

-400 -200 0 200

(c) MIT-BIH Record 207

20 40 60 80 100 120 140 160 180 200

-200 0 200 400

(d) MIT-BIH Record 214

圖4-3 左束分支阻塞 ( MIT-BIH Arrhythmia Database)

三、右分支束阻塞(Right Bundle Branch Block):如圖4-4所示。

在心正常電傳導路徑上的任何阻滯都稱為傳導阻斷。當在右分枝束 (right bundle branch)中的傳導阻斷時,右心室的去極化就會被拖慢,一直 到左心室的去極化幾乎完成了之後才開始。同樣的,我們在心電圖上也可 以看到兩種變化:

(1) 右心室去極化的延遲使得整個心室去極化的時間拉長。因此,QRS 波組會變寛而超過0.12秒。

(6)

(2) 在右心室之上的導極,也就是V1導極和V2導極之上的寛QRS波組 會表現出非常獨特,而且極具診斷價值的形狀。在右分枝束阻斷時,你仍 然可以看到最初的R波以及由左心室的去極化所形成的S波,但是拖慢了的 右心室去極化隨後展開,此時左心室已經完全去極化,所以這這個右心室 去極化波的表現完全不會受到干擾,因此電軸會突然向右偏轉。

20 40 60 80 100 120 140 160 180 200

-500 0 500

(a) MIT-BIH Record 118

20 40 60 80 100 120 140 160 180 200

-500 0 500

(b)MIT-BIH Record 124

20 40 60 80 100 120 140 160 180 200

-200 0 200

(c)MIT-BIH Record 207

20 40 60 80 100 120 140 160 180 200

-500 0 500

(d) MIT-BIH Record 212

20 40 60 80 100 120 140 160 180 200

-500 0 500

(e) MIT-BIH Record 231

20 40 60 80 100 120 140 160 180 200

-200 0 200

(f) MIT-BIH Record 234

圖4-4 右束分支阻塞

( MIT-BIH Arrhythmia Database Record 118)

四、變形的心房期外收縮(Aberrated atrial premature beat):如圖4-5所 示。

所謂心律期外收縮指在正常心律外,有一突然、搶拍子似的早發性心

(7)

跳。它可以是由心房或心室發出。一般而言,心律早發性期外收縮,會造 成病人心悸,用較通俗的話就是心臟猛力「咚隆」一下,好像要跳出來一 樣。但也有部份病人,在心電圖上可記錄出心律期外收縮,然而病人毫無 臨床症狀。由二十四小時霍特式心電圖記錄知道,大多數人在一天中,或 多或少皆有心律期外收縮。源自心房的「心房期外收縮」,一般不會造成 厲害的血行力學障礙,所以治療價值不高。「心室早期收縮」則不同,若 病人心臟無器質性病變,則病人預後和正常人無異,通常不須加以治療。

若病人伴隨器質性心臟病,則心室期外收縮可能是一種警示性心律不整 (warning arrhythmia),須加以深入探討是否需要治療。

20 40 60 80 100 120 140 160 180 200

-80 -60 -40 -20 0 20 40 60 80

圖4-5 變形的心房期外收縮

( MIT-BIH Arrhythmia Database Record 201)

五、心室期外收縮(Premature Ventricular Contraction):如圖4-6所示。

心室期外收縮(簡稱為PVC)是心律不整中常見的類型,因為PVC的心 室去極化不會遵循正常的傳導路徑,所以QRS波組會變寛而且會奇怪的形 狀。但是並非每個導極的QRS波組都會變寛,所以在下診斷之前一定要看 過心電圖所有的十二個導極。雖然有時候可以看到反向P波,但是大部份 的時候都看不到P波。PVC和下一個心跳之間會有較長的停頓。

(8)

個別的PVC在正常的心臟是相當常見,很少需要治療。但是出現在急 性心肌梗塞時的PVC因為可能引發致命的心室頻脈(ventricular tachycardia) 或心室顫動(ventricular fibrilllation),所以是相當不好的警訊。其特徵會有 寛大且波形怪異的QRS綜合波。

20 40 60 80 100 120 140 160 180 200

-500 0 500

(a) MIT-BIH Record 106

20 40 60 80 100 120 140 160 180 200

-500 0 500

(b) MIT-BIH Record 119

20 40 60 80 100 120 140 160 180 200

-500 0 500

(c) MIT-BIH Record 203

20 40 60 80 100 120 140 160 180 200

-500 0 500

(d) MIT-BIH Record 208

20 40 60 80 100 120 140 160 180 200

-500 0 500

(e) MIT-BIH Record 228

20 40 60 80 100 120 140 160 180 200

-500 0 500

(f) MIT-BIH Record 231

圖4-6 心室期外收縮

( MIT-BIH Arrhythmia Database Record 119)

六、心室融合心跳(Fusion of ventricular and normal beat):如圖4-7所示。

心室融合心跳發生的原因是因為心房的電衝動傳過房室結的同時,另 一個發自心室的電衝動也正在向四面八方的心室心肌傳遞,這兩個電衝動 共同完成心室的去極化,造成一個型態上一部份屬於心室上心律,而另一 部份屬於心室心律QRS波組。

(9)

20 40 60 80 100 120 140 160 180 200 -200

-100 0 100 200 300 400 500

圖4-7 心室融合心跳

( MIT-BIH Arrhythmia Database Record 208)

七、房室交界處期外收縮(Nodal (junctional) premature beat):如圖4-8 所表示之。單一的異位性心室上心跳源自房室結附近,這稱為房室交界處 期外收縮。這是相當常見的現象,不代表心臟的疾病也不需要治療。但是 它們也可能引發持續較久的心律不整。在房室交界處期外收縮時,常常會 看不到P波,但是有些時候可以看到反向的P波,且它的出現會比預期的心 跳提早出現。

(10)

20 40 60 80 100 120 140 160 180 200 -400

-300 -200 -100 0 100 200

圖4-8 房室交界處期外收縮

( MIT-BIH Arrhythmia Database Record 124)

八、心房過早收縮(Atrial Premature Beat):如圖4-9所示。

單一的異位性心室上心跳源自心房附近,這稱為心房期外收縮。這也 是相當常見的現象,不代表心臟的疾病也不需要治療。但是它們也可能引 發持續較久的心律不整。我們可以藉由P波的形狀和心跳的時刻,來判斷 心房期外收縮和正常的竇性心跳。由於心房期外收縮起源自竇房結以外的 心房區域,因此心房去極化的過程和正常竇性心跳會不一樣,所以P波的 形狀也會不同。如果心房期外收縮起源的位置和竇房結相隔甚遠,則P波 的電軸會和正常P波的電軸不同。心房期外收縮起源也會比預定的心跳較 早發生,也就是說,它在下一個預期的竇性心跳之前闖進來。心房過早收 縮是由心房任何部分所發出來的異位心房收縮,這種收縮的特徵是:在正 常的竇性收縮之前會出現一個與正常發源自竇房結的P波不同波形的異常 P波。此P波的波形決定於此心房異位點的位置,若在心房的上部,則P波 的軸通常是正常的(導程Ⅱ有正的P波);當異位點在心房下部,則P波的軸 傾向於朝上,於是在導程AVR產生正的P波,而在導程MLⅡ則產生負的P 波。心房過早收縮於健康的人是常見的,並且常常和吃入興奮劑有關,然 而它們也會發生於心臟結構性疾病。

(11)

20 40 60 80 100 120 140 160 180 200 -500

0 500

(a) MIT-BIH Record 100

20 40 60 80 100 120 140 160 180 200

-500 0 500

(b) MIT-BIH Record 118

20 40 60 80 100 120 140 160 180 200

-500 0 500

(c) MIT-BIH Record 209

20 40 60 80 100 120 140 160 180 200

-500 0 500

(d) MIT-BIH Record 220

圖4-9 心房期外收縮

( MIT-BIH Arrhythmia Database Record 100)

九、心室跳脫心跳(Ventricular escape beat):如圖4-10所示。

心臟除了竇房結會激發心臟跳動外,還有其許多散佈各處的節律細胞 (pacemaker cells),自發性激活的速率最快的節律點會主導心臟的電氣活 動,而正常情況下最快的節律點就是竇房結。竇房結在其它競爭者完成較 慢的自發性去極化之前便將去極化波傳遞整個心肌,藉此掌控心臟的心 律。但是在竇性心律停止時,其他的節律點在脫離竇房結的壓制之後,便 可以加入解救心臟,使得心臟恢復跳動的工作中。這些竇房結以外的地方 產生的補救性心跳,就稱為跳脫心跳(escape beats)。其中心室跳脫心跳是 由心室節律點所激發,速率大約為每分鐘30至45次。

(12)

20 40 60 80 100 120 140 160 180 200 -100

-50 0 50 100 150 200

圖4-10 心室跳脫心跳

( MIT-BIH Arrhythmia Database Record 207)

十、交界性脫逸性收縮 (Nodal (junctional) escape beat):如圖4-11所示。

每個竇房結以外的節律點都可以藉著一個或一連串的跳脫心跳來解 救竇房結異常的困境。在所有的心律跳脫機制中,房室交界處跳脫心律是 最常見的一種。在房室交界處跳脫心律時 ,去極化波起源自房室結附近,

而一般的心房去極化型式則不會發生,因此,正常的P波也就不會出現。

事實上,大部份情況下根本不會有P波。但是有時候還是可以看到反向傳 導的P波(retrograde P wave)。常見的交界性節律有以下的特徵:

(1)沒有P波,或是在QRS綜合波前後發生有倒立的逆行的P波。

(2)QRS波的綜合波寛正常。

20 40 60 80 100 120 140 160 180 200

-80 -60 -40 -20 0 20 40 60 80 100

圖4-11 房室交界處跳脫心律

( MIT-BIH Arrhythmia Database Record 222)

(13)

十一、心律調節器心跳(Pace Beat):如圖4-12所示。

心律調節器是附有電源的電極,電源通常放置在皮下,而電極則經由 上下腔靜脈放入右心或右心室。對於自身的電衝動來源(竇房結),或是電 氣傳導有問題的心臟,心律調節器提供了額外的電力來源。心律調節器發 出電衝時,我們可以在心電圖上看一個刺型小波。心室型心律調節會形成 像PVC一樣形狀怪異而且寬的QRS波組,因為電極是放在右心室,所以右 心室會比左心室先收縮,這會在心電圖上形成和左分枝束阻斷相同的圖 形。有時候還可以看到反向的P波。

20 40 60 80 100 120 140 160 180 200

-600 -500 -400 -300 -200 -100 0 100 200 300 400

圖4-12 心律調節器心跳

( MIT-BIH Arrhythmia Database Record 107)

十二、節律器所融合心跳(Fusion of paced and normal beat):如圖4-13 所示

由於同時有兩個放電點使心肌去極化,一個為心律調節器發出電衝,

另一個為由竇房結細胞所發出之電氣訊息,再傳至心房,導致心房細胞興 奮及收縮。心房細胞的電氣訊息再經由心房、心室交接處之房室結

(atrioventricular node)傳入心室,導致心室細胞心房細胞興奮及收縮,所融 合的波形,其圖形包含刺型小波和像正常波形。

(14)

20 40 60 80 100 120 140 160 180 200 -100

-50 0 50 100 150 200 250 300 350

圖4-13節律器所融合心跳

( MIT-BIH Arrhythmia Database Record 217)

4.2 k-means分群法分群法 分群法分群法

為了辨認某些事物具有相似之特性,並將此等事物依照某些特性,劃 分數個群集,使在同一群集內之事物具有高度之均質性,而不同群集之事 物則具有相異性;若以幾何圖形表示之,則同一群集內之事物,應相互聚 集在一起,而不同群集之事物則彼此遠離。在使用分割式分群法(partitional clustering)時,我們必須先指定群聚的數目,然後藉著反覆疊代運算,逐 次降低一個誤差目標函數的值,直到目標函數不再變化,就達到分群的最 後結果。其中介紹最基本也最常被使用到的分群方法,就是所的k-mean分 群法(k-mean clustering)。其主要目標是要在大量高維皂資料點中找出具有 代表性的資料點,這些資料可以稱為群集中心(cluster centers),然後在根據 這些群中心,進行後續的處理,這些處理可以包含:

1. 資料壓縮:以少數的資料點來代表大量的資料,達到資壓縮的功 能。

2. 資料分類:以少數代點來代表特定類別的資料,可以降低資料量 及計算量,並可以避免雜訊的不良影響。

分割式分群法的目的是希望盡量減小每個群聚中,每一點與群中心的

(15)

距離平方誤差(square error)。假設我們現在有一組包含c個群聚的資料,其 中第k個群聚可以用集合Gk來表示,假設Gk包含nk筆資料{x x x Lxnk}

3 2

1, ,

此群聚中心為yk,則該群聚的平方誤差ek可以定義為:

2

= i i k

k x y

e

其中xi是屬於群集 k。

而這c個群聚的總和平方誤差E便是每個群聚平方總和,可稱為分群的

「誤差函數」(error function);

2

~

=1

= k cek

E

我們分群的方法,也就是一個最佳化的問題,也就是說我們要如何選 取c個群聚以及相關的群聚中心,使得E的值為最小。

我們也可以使用另一套數學來描述,給定一組n點資料

{x x xn}

X L

2 1,

= ,每一個都有d維,k-mean分群法的任務是找到一組m個代 表點Y {y y Lym}

2 1,

= ,每一點也是d維,以使下列的目標函數愈小愈好:

2

1

) , ,

(

=

=

n

i

k

i y

x U

Y X J

其中xi屬於Gk而且ykGk的代表點。同時在上述目標函數中,目標

函數U是一個m× 的分組矩陣,每一個元素值都是0或1,而且每一直行的n

總和等於1,如果U(i, j)=1,代表第i個資料點是屬於第j組。

若要直接對上述目標函數進行最小化,是一件較因難的事,因為這個 目標函數有n個限制條件,很難直接捋用傳統的方式來進行最佳化,但我 們可以觀察兩個現象:

1. 當Y(群聚中心)固定時,我們可以很容易找到所對應的U(資料分群 方式),使得J(X,Y,U)的值最小。此最佳的U值,即代表最佳的分 群方式,因此若將每因此若將每個資料點歸類到距離最近的代表

(16)

點,即可完成此目標。

2. 當U(資料分群方式)固定時,我們也可以很快地找到對應的Y(群 中心),使J(X,Y,U)的值為最小。此最佳的Y集合,代表每個代表 點至其組員的距離平方和為最小,因此此最佳的Y集合即是每一群 的平均點。

在演算法開始進行前,我們必須事先決定好預期分群的群聚數目。假 設預期的分群群聚數目為c,則根據上述觀察,我們可以經由下列步驟來進 行 k-means 分群法:

1. 隨機選取c個資料點,將之分別視為c 個群聚的群中心,這就是Y。

2. 由固定的Y,產生最佳的U。換句話說,對每一個資料點x,尋找與 之最接近的群中心,並將x加入該群聚。

3. 計算目標函數J(X,Y,U),如果保持不變,代表分群結果已經穩定 不變,所以可以結束此疊代方法。再由固定的U,產生最佳的Y。

跳回第2個步驟。

在上述方法中,我們是先找群中心,再開始反覆疊代的過程。事實上,

我們也可以先進行任意分群,然後再進行反覆疊代的過程,得到的結果應 該很類似,如圖4-14所示(a)為4筆測試資料,(b)選擇2筆資料作為群聚中 心,(c)計算資料點和群聚中心的距離,並且作類別的歸類,(d)持續疊代,

直到可容許的誤差範圍,最後可以發現資料已被分門別類。

(17)

圖 4-14 k-mean 分群示意圖

4.3 小波轉換簡介小波轉換簡介小波轉換簡介小波轉換簡介

約在 1986 年,一群在調和分析領域的數學家,發現了小波函數。剛 開始時,只有屬於數學、物理和地震波的研究者,注意到這個新發現。而 小波函數和 DSP 之間相互的關聯也隨之被發現,很快地,其他領域的專 家、科學家與工程師們,都加入了這個發展與研究的行列。也因為這些跨 領域學者的共同開發,小波函數從一開始就是理論與應用並行,而且發展 快速。

廣義來說,小波函數就是那些在時間領域與頻率領域都具有局部性的 函數。依據海森堡測不準定理可知,任何函數的時間反應與頻率反應不可 能同時都很狹窄。而從應用的角度來說,就是任何濾波器,無法同時在時 間領域和頻率領域上都具有高準確度。小波函數也像其它函數一樣受到這 種理論的限制。然而小波函數卻容許在此限制下盡可能地設計出高效率的 濾波器。

小波轉換與數位信號處理在 Daubechies[43]及 Mallat[21]結合下,已有 所改變。發展至今,小波轉換不論在數學、電腦科學、物理或工程上皆有

(18)

舉足輕重的地位。小波轉換對於各種訊號分析已提供了完整的架構,本研 究也將它應用在心音圖信號壓縮上。

就本研究建構的分析工具所採用的小波理論基礎,是由 Joseph Fourier 在 1807 年提出的頻域分析理論(Fourier synthesis)開始的,他主張所有的波 形都會由 sine 以及 cosine 波組成,而後在 1910 年 Haar 發展出 Haar function,這個函數是由方波所組成,而在 1938 年的時候 Littlewood-Paley 對 Fourier series 建立 L-P 理論。到了 1970 年代,主要是 Hardy space theory 的發展。一直到了 1982 年,Strömberg 提出第一個正交小波,其特性為具 有良好的時頻局部定位性,同時也證明小波的存在,因此在 1984 年的時 候 Morlet 將小波的概念引入訊號分析之中,並與 Grossmann 定義連續小 波轉換,也正式將之命名為「wavelet」,接著就進入了小波轉換研究的黃 金時期。於是在 1985 年,Meyer 建立 Meyer wavelet,具正交、易衰減等 特性的平滑小波,其傅利葉轉換為緊湊支撐(compact support),且屬於連續 函數空間。在同年,Tchamitchian 亦提出雙正交小波。而在 1986 年的時候,

Battle、Lemarié 提出 Battle-Lemarié wavelet,為將 B-spline 正交後所得,

對時頻域的支撐為 infinity,具有指數衰減的效應。接著在 1987 年時,Mallat 便證實可透過多重解析度分析來產生小波基底。在 1988 年的時候,

Daubechies 提出 Daubechies wavelet,為有限支撐,且具有良好的時頻局部 定位性,而本論文亦採用了 Daubechies wavelet 為小波壓縮的基礎演算法。

隔年,Coifman 跟著提出一組包含 vanishing moment 的正規化尺度函數及 小波函數建造方式。而在 1991 年,Wickerhauser 提出小波包(wavelet packet) 的算法。隨後到了 1993 年,Goodman 提出多重小波(multi-wavelet)的概念,

並與 Lee、Tang 等拓展 Mallat 的正交小波,而得出多重小波。在 1996 年 的時候 Chui-Lian 研究出 orthonormal 多重小波。接著在 1998 年,Jiang 提 出時頻解析度最佳化的正交多重小波。到了現今,有許多的研究都廣泛的 運用小波轉換,例如新一代的 JPEG2000 壓縮,心電圖與心音圖的應用等

(19)

等。

如果訊號的性質並未隨時間變化而發生很大變動,則稱這種訊號屬於 固定性(stationary)的訊號。然而大多數的情形下,訊號中屬於固定性的分 量並非真正希望量測到的,反而是非固定性的分量才是要研究的部分,例 如一些不定時產生的突波(spike),或是不規則的漂移。這個時候傅利葉分 析在應用上就顯得不夠充分。那是因為若以傅利葉分析轉換至頻域,將會 失去時域之相關訊息。而 D. Gabor 為了修正這個缺點,提出將訊號切割成 許多小段,逐段作傅利葉分析以得到較多時域上的訊息,這就是所謂的短 時間傅利葉轉換(Short-Time Fourier Transform,STFT)。然而這個方法也同 樣有其限制,就是切段的長度究竟該如何選擇。如果訊號的頻率很低,則 訊號長度必須拉長;如果要分析的頻率很高的訊號,當然必須選擇較短的 訊號視窗長度(window length)。但是如果事先無法得知要分析的訊號究竟 屬於那個頻帶,這種方法也無法使用。為了解決這個問題小波分析就被推 導出來了。

所謂小波,是指一個定義為有限長度且平均值為零的波形。藉著拉伸 (stretch)或壓縮(compress)小波函數之後,逐段平移(shifting),展開被分析 的訊號,如圖 4-15 所示:

圖 4-15 傅利葉轉換、短時間傅利葉轉換與小波轉換比較

(20)

小波轉換的原理和傅利葉轉換很相似,差異在於小波轉換只是以小波 函數經過一定比例之拉伸或壓縮之後,所形成的一系列函數作為展開之基 底函數。可以數學式表示如公式 4-1:

( , ) ( ) b a, ( )

W f b aψ f t ψ t dt

−∞ (公式 4-1)

其中,ψ( )t 為小波函數:

1/ 2

, 0

b a

t b

a a

ψ = ψ a >

(公式 4-2)

其中 a 為壓縮或拉伸的比例,b 為整段訊號的平移。

由於小波轉換有將原始訊號對頻率做壓縮的特性,所以 I. Hossain 在 2003 年提出使用小波轉換將心電圖中的肺部產生的訊號消除的方法,如圖 4-16 所示:

圖 4-16 含有肺部訊號的心電圖

粗線的部分表示是為正確心電圖的訊號,可以看出肺部的聲音相對心 電圖來說是比較低頻的,所以他將純粹的肺部訊號做小波轉換,將訊號做 切割為 20-40Hz,40-70Hz,70-150Hz,150-300Hz,300-600Hz,600-1200Hz 與 1200-2400Hz 的區段,接著取出 150Hz 以下的小波係數當作 template,

而使用這個 template 將雜訊消除,消除結果如圖 4-17 所示:

(21)

圖 4-17 肺部訊號使用小波轉換從心電圖中消除的結果

4.4 支持向量機簡介支持向量機簡介支持向量機簡介支持向量機簡介

支持向量機(Support Vector Machine,簡稱 SVM)是 1998 年以統計理論 為基礎所提出的機器學習理論[44]。它不像是傳統的類神經網路方法是基 於經驗風險最小化(Empirical Risk Minimization Principle, ERM)而是一種結 構風險最小化原理(Structural Risk Minimization Principle, SRM)的統計學習 理論,用於分類與回歸問題。SRM 使 VC(Vapnik Cherovnenkis)維數的上限 最小化,這使得 SVM 方法比類神經網路的具有更好的泛化能力。這套演 算法可以歸納如下:他是透過核函數的映射,將原本非線性的特徵空間 mapping 到一個高維的核特徵空間中去訓練一個線性學習器。(而且在這個 高維空間中我們並不需要知道資料當中的特徵向量有什麼性質)而由於 Generalisation Theory 而有對偶表示的形式而成為有效率的演算法。而其 中有幾個條件和理論更完善了『支持向量機』的架構。例如 VC 維的理論,

使得有限集合的分析可以拓展到無限假設集的領域。Lagrange 理論則可以

(22)

將學習問題轉化成沒有不等式約束的最佳化問題。再經由 Kuhn-Tucker 條 件的補充,將這個方法進一步推廣到具有不等式條件亦可使用。而 Mercer 條件使得對應的最優化問題變成一個沒有局部最小值的凸二次函數問 題。通過以上的完整學習演算法架構,SVM 可以自動尋找出那些對分類有 較好區分能力的支援向量,並由此構造出的分類器可以最大化類與類的間 隔,因而有較好的適應能力和較高的分辨率。該方法只需要由各類域的邊 界樣本的類別來決定最後的分類結果。而支持向量機由於其各種快速演算 法[22][23](例如:SMO)的出現,使得其在生醫訊號的診斷、圖像/人臉識別、

語音/文字辨識、以及生物基因工程、回歸分析等領域都有很大的進展與應 用。

SVM 可由最簡單的二元分類開始做起,然後推廣至多類分類。其原理 都是根據二分法的原理開始的,故介紹的時候以二分法為主。

XX

X X X

X X

X X

X

Support vector

Margin

Optimal Hyper-plane

X2

X1

=0 +b x wT

圖 4-18 支持向量機二元分類圖

此時輸入向量xri

為 d 個維度,

( 1, 2,..., )

i d

x = x x x uur

而由於是二分法,所以會有兩個 label(1 or -1)。

(1, 1 ) 1, 2,...,

yi = i = N

(23)

而 由 於 要 決 定 支 持 向 量 機 的 最佳 分 類 面 ( optimal separating hyperplane),所以會有權重向量 weight vector 和一個偏移值 bias 分別表示 w

ur

和 b,而最佳分類面此時就可以表示為w x i + =b 0 ur uur

,而此時所有的分 類就可以表示為y w xi

(

ur uur i+b

)

1 i=1, 2,...,N,而為了使得分類間距(2 / w

ur )為

最大,所以必須使得 w2

ur 為最小,根據 Lagrange 理論(引入 Lagrange 乘子

Lagrange multiplierαi,和 Lagrange 函數Ld ( )α 和 Kuhn-Tucker 條件的補充 可得:

( ) ( )

1 1 1

1 2

N N N

d i i j i j i j

i i j

L α α α α y y x x

= = =

= ∑∑ uur uur (公式 4-3)

在約束條件(constraint)

1

0

N i i i

α y

=

= αi 0之下,滿足條件的輸入向量 便稱為支持向量(Support Vector),經由 Training 便可以得出 Lagrange 乘子 與偏移值。

而若是輸入資料的噪擾很高(high noise level)則必須增加一個參數,稱 為間隔鬆弛變量(Margin Slack Variable)ξi i=1, 2,...,N,來調整其誤差值能 夠 小 於 某 個 範 圍 以 下 。 此 時 , 原 本 的 式 子 可 表 示 為

( )

1 1, 2,...,

i i i

y w xur uur +b ≥ +ξ i= N

而最佳分類面可表示為如公式 4-4 所示:

( ) 2

1

, 1 1, 2,...,

2

N

i i

i

J wξ w C ξ i N

=

= +=

ur ur

(公式 4-4) 其中 C 是一個衡量 Training Error 和 VC 維度大小的損失參數(penalty parameter),所以 Lagrange 函數成為:

( ) ( )

1 1 1 1

1 0 , 0

2

N N N N

d i i j i j i j i i i

i i j i

L α α α α y y x x α C α y

= = = =

= ∑∑ uur uur = (公式 4-5)

(24)

而求解 Lagrange 函數(Lagrangian)Ld( )α 之最大值就可以得到最佳分 類面(optimal separating hyperplane)。但是由於輸入的資料在原本的空間中 是呈現非線性分佈的,所以此時必須透過核函數(kernel functions)將輸入資 料映射到一個高維度的線性空間,然後再來求取最佳化平面的最佳化參數 值。

而這些核函數比較著名的如公式 4-6~9:

Linear:K x x(uur uuri, j)=uur uurx xi j (公式 4-6)

Polynomial:K x x(uur uuri, j) (= γuur uurx xi j+coef)d (公式 4-7)

RBF:K x x(uur uuri, j)=expγ(uurxiuurxj)2 (公式 4-8)

Sigmoid:K x x(uur uuri, j)=tanh(γuur uurx xi j +coef) (公式 4-9)

其中的 d、γ 與 coef 皆為常數參數值。

SVM 理論只考慮高維特徵空間的內積運算K x x(uur uuri, j)= Φ( ) ( )uurxi ⋅ Φ uurxj ,而

不直接使用函數Φ,從而巧妙地解決了因Φ未知而 W 無法顯示表達的問 題,稱K x x(uur uuri, j)為核函數,已經証明,只要滿足 Mercer 條件的對稱函數即 可作為核函數。

對於兩類問題分類,存在線性可分和線性不可分兩種支持向量機,但 是在實際中,為了將兩類模式儘可能分類開來,一般要構造非線性可分的 支持向量機。一個複雜的模式識別分類問題,在高維空間比低維空間更容 易線性可分。支持向量機就是首先透過核函數把訓練樣本中的低維數據映 射到高維特徵空間,然後在高維特徵空間構造一個最佳分類平面。由於構 造的核函數滿足 Mercer 條件,所以在訓練中只需考慮核函數 K,而不必明 確知道低維向高維的映射函數Φ

(25)

一個二元函數 K(x,y)通常稱為是一個核函數(簡稱核),給定 K(x,y),若 有實數 λ 和非零函數Ψ( )x 使得abK(x,y)Ψ(x)dx=λΨ(y)成立,則稱 λ 為核的 一個特徵值,稱Ψ( )x 為核的關於特徵值 λ 的一個特徵函數。而對稱半正定 的連續核便稱為 Mercer 核。

Mercer 核 K(x,y)可以展開成一致收斂的函數

Ψ Ψ

=

i

i i

i x y

y x

K( , ) λ ( ) ( ) (公式 4-10)

其中λiΨ( )x 分為核 K(x,y)的特徵值和特徵向量,它們的個數可能無 限或無窮個。

Mercer 核函數很多,如徑向基函數核,雙曲正切函數核等。由已知的 Mercer 核經過某些運算可以生成新的 Mercer 核,特別是由內積定義的核 函數必是 Mercer 核:

( i, j) ( ) ( )i j

K x x = Φ x ⋅ Φ x uur uur uur uur

(公式 4-11) 由 Mercer 核的特徵函數張成的函數集為特徵空間,記為 F。原樣本空 間記為 X。

如果我們做如下樣本空間 X 到特徵空間 F 的非線性映射Φ

1 1 2 2 3 3

( )x ( λ ( ),x λ ( ),x λ ( )x )

Φ = Ψ Ψ Ψ LL

則有:

( )

( , ) i i( ) i( ) ( ) ( )

i

K x y =

λΨ x Ψ y = Φ x ⋅ Φ x (公式 4-12)

從此可以看出:當我們樣本空間通過非線性映射映入特徵空間時,如 果只用映射內積,則可以用相對應的核函數來代替,而不需要知道映射的 顯示表述式。這是從線性支持向量機到非線性支持向量機的關鍵一步。

(26)

在特徵空間 F 中應用線性支持向量機的方法,分類決策函數式變為:

( ( ) ) ( i i( ( ) ( )) )

sv

y = Sgn w∗ Φ x +b = Sgn

α y Φ x Φ x +b (公式 4-13)

考慮 Mercer 定理,可以化簡為 )

) , (

( yK x x b Sgn

y = αi i i + (公式 4-14)

這就是非線性支持向量學習機的最終分類決策函數。雖然用到了特徵 空間及非線性映射,但實際計算中並不需要知道他們的顯示表述。只需求 出支持向量及其支持的 α 和 b 值,通過核函數的計算,即可得到原來樣本 空間的非線性輸出值。

= =

+

= + Φ

=

1 1

) , ( )

( )

(

i

n

j

j j

j i

i

i x b yK x x b

x

y λψ α (公式 4-15)

1 2 , 1

( ) ( , , , )

n

i i i i

i

y x

α ψ ψ ψ

=

Ψ =

Φ = L L (公式 4-16)

利用兩個常用的 kernel 來證明 Mercer 定理:

範例一:Polynomial 展開

( ) ( )

[ ] [ ]

( ) ( )

( ) ( ) ( )

( ) [ ] [ ]

[ ]

2 6

1 2 1 2

2 2

1 2 1 2 1 2

2 2

1 2 1 2 1 2

2 2 2 2

1 1 2 2 1 1 2 2 1 2 2 1

2 1 1

1 2 1 2

2 2

1 1 2 2 1

, , ,

, , ,

1, 2 , 2 , , , 2 1, 2 , 2 , , , 2

1 2

1 1 1

1

T

T

x z R x z R

x x x z z z

x x x x x x x

z z z z z z z

x z x z x z x z x z x z x z

z z

x z x x x x

z z

x z x z x z

φ φ

φ φ

φ φ

= =

= 

= 

= + + + + +

     

+ =  +    +

   

 

= + + [ ]

( )

( )

1 2 2

2

1 1 2 2

2 2 2 2

1 1 2 2 1 1 2 2 1 2 2 1

1 1

1 2

x z x z x z

x z x z x z x z x z x z

+ +

= + +

= + + + + +

數據

圖 4-14 k-mean 分群示意圖  4.3 小波轉換簡介小波轉換簡介小波轉換簡介 小波轉換簡介  約在  1986  年,一群在調和分析領域的數學家,發現了小波函數。剛 開始時,只有屬於數學、物理和地震波的研究者,注意到這個新發現。而 小波函數和  DSP  之間相互的關聯也隨之被發現,很快地,其他領域的專 家、科學家與工程師們,都加入了這個發展與研究的行列。也因為這些跨 領域學者的共同開發,小波函數從一開始就是理論與應用並行,而且發展 快速。  廣義來說,小波函數就是那些在時間領域與頻率領域都具有局
圖 4-17 肺部訊號使用小波轉換從心電圖中消除的結果

參考文獻

相關文件

第四章 連續時間週期訊號之頻域分析-傅立葉級數 第五章 連續時間訊號之頻域分析-傅立葉轉換.. 第六章

第三節 研究方法 第四節 研究範圍 第五節 電影院簡介 第二章 文獻探討 第一節 電影片映演業 第二節 服務品質 第三節 服務行銷組合 第四節 顧客滿意度 第五節 顧客忠誠度

Relation Between Sinusoidal and Complex Exponential Signals

是以法國物理學家 Augustin Fresnel 命名的。.

由此可知,在家或出家行者所要走的菩薩道是相同的,都是鎖定「無

第四章 直角座標與二元一次方程式.

第四章 直角座標與二元一次方程式.

第四章: 中學報稅的設計 第五章: 初中諒程主建議 第六章: 高中諒我建議,..