第三節 全文架構
本論文共分為五個章節,以下為各章節概述:
【第一章】緒論
說明本論文的研究背景、研究動機、研究目的、研究方法與本文架構。
【第二章】基礎理論與文獻探討
簡介本論文所使用之演算法、理論基礎、技術背景。
【第三章】系統架構
介紹所提出的腦波擷取系統與廣義迴歸類神經網路(GRNN)電路設計
架構,並說明內部各電路所使用之元件。
【第四章】實驗數據
包含系統環境說明與相關實驗數據分析
【第五章】結論
對於所提出之硬體架構以及實驗的結果進行總結
6
在介紹 ERP 與 P300 腦波之前,首先要來介紹 EEG(Electroencephalography),
EEG 為一種紀錄大腦活動的生理監測方法,雖然有一些需要將頭蓋骨打開的特
7
具,因為它具有毫秒範圍的時間分辨率(Temporal resolution),這是那些使用高分
辨率解剖成像技術所無法做到的。
EEG 所衍生出的技術,包含誘發電位(evoked potential,EP),這是指在呈現刺 激(可能是聽覺、體感或視覺的刺激)時,將固定時間內的 EEG 平均。事件相關電
位(ERP)是基於此平均 EEG 的方法,但有更複雜的刺激過程,ERP 被用在認知科
學、認知心理學、心理生理研究等研究領域。
事件相關電位(ERP)常被用於測量大腦對感覺或運動事件之特定認知,而其
中一個腦機介面(BCI)的實作方式便是基於 ERP。ERP 為將 EEG 腦電圖之腦波依
事件標記,擷取時間區段之腦波,疊加後產生之波形,並依照其振幅為正或負,
潛時之時間範圍命名,如 N100、P300。如圖 2-1:
圖 2-1 為 ERP 之成分波,此圖的 N1 即 N100 波與 P3 即 P300 波。圖中的負 電壓為上,在 ERP 的研究中常見但不是普遍的表示法。
8
如上述,P300 為 ERP 之一種,是 ERP 中常被探討的主要峰值(peak)之一,
本研究主要以 P300 腦波為研究題材,P300 波的 P 是指 Positive,也就是正向波
(positive wave),300 為此種波形的潛時為 300 毫秒,也就是當 Oddball 實驗中刺 激出現後的 300 毫秒會誘發出此峰值,故在 EEG 中此引發的反應波形被稱為 ERP
的 P300 成分波。P300 與人的認知能力有很大的相關性,包括訊息傳導、刺激評
估、記憶、情緒、專心程度及清醒程度等,屬於高級大腦皮質的活動能力。在腦
機介面 (Brain-Computer Interface, BCI)的發展上,因為 P300 的波形容易被檢測
出來,且在固定的時間範圍內會產生,這些都是理想的實際應用上的優點。
oddball paradigm 為最常見之誘發 P300 腦波的實驗之一,使用兩種刺激物(高 頻率與低頻率)交替出現,當受測者受到低頻率出現之目標時,就可觀察到明顯
的 P300 腦波,如圖 2-2,P300 主要在頭皮上之中線位置之電極(Fz、 Cz、 Pz)與
大腦視覺區之枕葉可清楚觀察到,圖 2-3 為本論文中使用的乾式電極腦波帽所提
供之電極位置,在本篇論文中選用之電極位置為枕葉之電極位置,因為受到眼動
訊號干擾較少,有文獻指出: oddball paradigm 實驗中較高頻率出現之刺激物所產
生之腦波其振幅較小[6],而較低頻率出現的刺激物其振幅較大。
9
圖 2-2 P300 腦波可被偵測到之電極位置
P300 波的潛時與人的認知能力有很大的相關性,所以因人而異,每個人的 腦波量測結果皆有不同,我們希望能夠因應每個人的腦波的個體差異,希望能夠
開發出一種客製化的方式,能將腦波應用於不同的個體,又因為大多數研究設備
皆是濕式電極量測腦波儀,在使用上不甚方便,局限於醫療應用與研究,我們希
望能研究出一套適用於商業化發展之腦波擷取與分析之系統,在腦波資料較少的
情況下,我們希望能使用乾式電極腦波帽[5]擷取腦波,並與視覺刺激程式連結,
擷取後的腦波能被快速分類,故使用廣義迴歸類神經網路(GRNN)來做分類,因
10
其不需要太多資料即可做出很好的分類結果,在下兩節即做類神經與 GRNN 之
介紹。
圖 2-3 本論文所使用之乾式電極腦波帽,其提供之電極位置為此八個電極
11
第二節 類神經網路介紹
生物的大腦是由神經細胞所構成的,神經細胞包含了神經核、軸突、樹
突和突觸,而當樹突接收外部訊息時,也就是外部神經脈衝高於閥值時,神經元
會被激發,產生新的神經脈衝至軸突,而依據此新脈衝所經過的突觸(也就是神
經元與神經元之間聯絡的點)是興奮突觸還是抑制突觸,會改變脈衝的速率,也
就是說影響大腦學習的主要關鍵在於神經元如何轉換脈衝與突觸的強度。
類神經網路是一種模仿生物大腦的計算系統,如圖 2-4,是一種經驗的數
學模式,旨在讓電腦具有生物大腦的學習能力,透過已知的訊息建立輸入資料與
輸出資料的關係。類神經網路可用於識別、預測、最佳化問題、結合是記憶和控
制領域。
圖 2-4 類神經網路方塊圖 類神經網路
輸入 輸出
12
望的值接近,而此模式稱之為測試模式(Testing Pattern)。
13
類神經網路的組成可以分為處理單元、層和網路三個層次。處理單元是
類神經網路的基本單位,也稱為神經元。運算元的結構如同生物神經元的神經核
一般,其功能為處理輸入和輸出的動作,透過運算元的運算,將輸入至運算元的
訊號加以處理和轉換,輸出轉換的訊號,成為其它運算元的輸入訊號。
層是由若干相同作用的處理單元集合而成。層分為輸入層、隱藏層和輸
出層。輸入層的處理單元負責接收數據,隱藏層的處理單元負責計算,提供類神
經網路表現處理單元之間的交互作用與問題內在結構的能力,介於輸入層和輸出
層之間。輸出層的處理單元負責輸出結果。網路則由若干不同作用的層集合為成。
以下圖 2-5 表示上述之類神經網路架構圖:
圖 2-5 類神經網路架構圖
14
類神經網路可以以學習方式來分類,可分為監督式學習網路和非監督式
學習網路。監督式學習為透過已知的輸入和期望的輸出來建立類神經網路,特點
為以期望值和實際輸出值作比較,當實際輸出偏離期望輸出時,即修正網路內的
連結權重,直到誤差降到最低才停止。此種網路須從問題領域中取得訓練模式,
學習輸入變數和輸出變數的內在對映規則,以應用於新的案例。此網路所需要收
集的資料分為訓練模式和測試模式。訓練模式是供類神經網路學習輸入變數和輸
出變數間的內在對映規則,進行網路連結權重的修正。測試模式則是用來測試判
別分類的資料。
非監督式學習是在缺乏期望輸出值的情況下,取得輸入向量的規則性而 建構模式,因此適合用來做資料的分群,並找出對應的法則。此網路所需要收集
的資料分為訓練模式和測試模式。訓練範例只有輸入值,沒有輸出值,所以網路
必須由訓練模式自行推估出這些變數之間的群聚規則,測試模式則是用來測試判
別分類的資料。
15
第三節 GRNN (General Regression Neural Network) 介紹
在 1988 年時,Donald F. Specht 提出了機率類神經網路(Probability neural
network, PNN),此網路屬於監督式學習方式,其基本構想原理是從機率模型所啟 發而來。但是,由於機率類神經網路只適合用於做分類問題,對於連續變數的問
題去無法解決。在此所謂連續變數的定義如下:
在一定區間內可以任意取值的變數叫連續變數,其數值是連續不斷的,
相鄰兩個數值可作無限分割,即可取無限個數值,例如: 生產零件的規格尺寸,
人體測量的身高、體重、胸圍等為連續變數,其數值只能用測量或計量的方法取
得。
因此,在 1991 年 Donald F. Specht 提出了廣義迴歸類神經網路(General
Regression Neural Network,GRNN)為一種監督式學習網路。此廣義迴歸類神經 網路 (GRNN) 是由機率類神經網路(PNN)所演變而來,可以用來學習動態模式
並做預測或控制,且 GRNN 具有快速訓練以及分類準確等優點。[7]
16
第四節 GRNN 演算法則
設 Testing Pattern x 為 廣義迴歸類神經網路 (GRNN) 類神經網路之輸
入,且 𝐲
∗
為 GRNN 網路系統之輸出。則圖 2-6 為廣義迴歸類神經網路 (GRNN)系統輸入和輸出方塊圖。
圖 2-6 GRNN 系統輸入輸出示意圖
假 設 在 廣 義 迴 歸 類 神 經 網 路 (GRNN) 中 已 存 有 p 個 Training Pattern 𝐱
𝑖
, i = 1,…, p,每一個 Training Pattern 𝐱𝑖
皆可視為網路的一種輸入而這些Training Pattern 之系統實際輸出分別為 𝐲
𝑖
,其中 𝐲𝑖
為 𝐱𝑖
之實際輸出。輸入維度為 n 之 Testing Pattern x 和 Training Pattern 𝐱
𝑖
,且假設 𝐲∗
及 𝐲𝑖
之維度為m。
17
以下說明如何在給定 x 為輸入的情況下,利用 𝐱
1
, … . . 𝐱𝑝
以及𝐲1
, … . . 𝐲𝑝
來計算 𝐲
∗
,其中 𝑦𝑗 ∗
和 𝑦𝑖𝑗
為向量 𝐲∗
和 𝐲𝑖
之第 j 個元素, j = 1,…, m 。 Testing Pattern x 和 Training Pattern 𝐱𝑖
定義 𝑥
𝑗
和 𝑥𝑖𝑗
為向量𝐱 和 𝐱𝑖
之第 j 個元素,其中 i 、 j = 1,……,m。18
而𝑊(𝐱, 𝐱
𝑖
)的數值亦受𝜎影響,𝜎為調整𝑊(𝐱, 𝐱𝑖
)之恆正參數,若其越大則 TestingPattern x 和 Training Pattern 𝐱
𝑖
間的差距影響較小,若其越小則表示越重視 TestingPattern x 和 Training Pattern 𝐱
𝑖
間的差距。故𝜎 為調整分類準確率的一個重要參數。
則𝑦
𝑗 ∗
之輸出如式 2-3 所示:𝑦
𝑗 ∗
= ∑𝑝 𝑖=1
𝑦𝑖𝑗
𝑊(𝐱, 𝐱𝑖
)∑
𝑝 𝑖=1
𝑊(𝐱, 𝐱𝑖
) 式 2-3若 Testing Pattern x 和 Training Pattern 𝐱
𝑖
越相似,則 Testing Pattern x 之輸出結果與 Training Pattern 𝐱
𝑖
應該越接近,也就是期望與 Training Pattern 𝐱𝑖
的比較中, 𝐱
𝑖
的比較結果佔有比較重要的地位。因此,如上述式 2-3,若 Testing Pattern x 和 Training Pattern 𝐱
𝑖
之間的距離接近,則𝐷(𝐱, 𝐱
𝑖
)值為小,根據式 2-2,𝑊(𝐱, 𝐱𝑖
)值為大。則從式 2-3 中可知,𝑊(𝐱, 𝐱𝑖
)的值越大,與𝑦
𝑖𝑗
相乘後之數值也越大,所以在𝑦𝑗 ∗
裡,該次的運算結果佔有比較重的比重。因此就能從所有 Training Pattern 中對 Testing Pattern 找出一個代表他的 𝑦
𝑗 ∗
輸出。19
由 式 2-3 可 知 廣 義 迴 歸 類 神 經 網 路 (GRNN) 之 運 作 只 需 要 知 道 輸 入
Training Pattern 𝐱
1
, … . . 𝐱𝑝
,以及這些 Training Pattern 之系統實際輸出分別為 𝐲1
, … . . 𝐲𝑝
,便可以對於任意輸入 x 來計算出系統之輸出 𝐲∗
。 把上述公式以廣義迴歸類神經網路 (GRNN) 之架構圖呈現,如圖 2-7 所示,可以再加以詳細說
明如下:
圖 2-7 GRNN 一般情況架構圖
GRNN 架構是可以分成三層,擁有輸入層 (Input Layer) 、隱藏層和輸出層
(Output Layer) ,隱藏層又稱為特徵層,其可以再區分為模式層 (pattern Layer) 和 總和層 (Summation Layer) 。可分為四個步驟:
步驟 1: 輸入 Testing Pattern x 和 Training Pattern 𝐱
𝑖
以上述式 2-1 計算出20
𝐷(𝐱, 𝐱
𝑖
)。步驟 2: 𝐷(𝐱, 𝐱
𝑖
) 套入式 2-2 計算出 𝑊(𝐱, 𝐱𝑖
)。步驟 3: 𝑊(𝐱, 𝐱
𝑖
) 對應每一筆𝑦𝑖𝑗
,代入式 2-3。步驟 4: 系統之輸出 𝑦
𝑗 ∗
。上述的廣義迴歸類神經網路 (GRNN) 架構圖是最一般的情況,呈現出輸入和輸
出每一筆對應關係,如果把上述的架構圖改成特例的情況如圖 2-8 所示:
圖 2-8 GRNN 特例情況架構圖