第三章 研究方法
3.5 眼睛狀態決策(Eye State Decision)
3.5.2 特徵擷取
由於開眼影像與閉眼影像在外觀上有明顯的差異,開眼影像的輪廓較為複雜,
而閉眼影像通常呈現一條微彎的曲線輪廓較為簡單,因此可以考慮利用兩者的輪 廓複雜度當作特徵,輪廓複雜度計算的方法眾多,但其公式及用法皆不盡相同,
複雜度函數(Complexity Function)及熵(Entropy)皆可用來描述影像的複雜度,本研 究將以上述兩種方法為基礎,提出了一個新的特徵擷取方法,算出的特徵值意義 上同為複雜度的概念,此值愈大代表影像複雜度較高,為開眼的可能性也愈高,
反之,則為閉眼的可能性高。
(1) 複雜度函數(Complexity Function):
根據開閉眼外觀上的明顯差異,Tian 與 Qin[25]於 2005 年提出了利用複雜度 函 數 (Complexity Function) 計 算 眼 睛 影 像 輪 廓 的 複 雜 度 並 訂 定 一 個 門 檻 值
(threshold)來及時判斷眼睛的開闔狀態。Hong 等人[26]則在 2007 年加入考慮垂直 方向的複雜度,進而判斷眼睛的開闔狀態。
複雜度函數的定義如下:
∑ ∑
(11)
假設影像大小為 , 表示二元影像 的複雜度值, 是二元 影像第 列、第 行的像素值, 則表示第 列、第 行的權重係數。每一個像素 點 會和右邊像素點相減並取絕對值後乘上一個權重值 ,最後累加得
到一張影像的複雜度值。
25
開眼狀態時眼睛有黑白明顯變化的位置通常位於中間,而周圍呈現較為均勻 的灰階像素值,因此權重值會隨著離眼睛中心距離愈近而越大,愈靠近邊緣而愈 小,如圖 19,高峰的地方即為權重值最高的影像中心位置,因此權重值的加入 更可以描述眼睛複雜度的大小。
權重值的定義如下:
(12)
假設 M、N 為影像的長和寬, 則表示第 列、第 行的權重值。
圖 19、複雜度函數權重值示意圖
26
(2) 熵(Entropy):
熵一詞最早於 1864 年出現並應用於熱力學中,由 Rodolf Julius Emanuel Clausius 提出,可以用來表達能量混亂的程度。接著於 1948 年由 Claude Elwood Shannon 提出可以將此概念用於資訊理論上,可以用來描述某載體中蘊含資訊量 的多寡。熵在物理意義上表示亂度,Chen 等人[27]於影像的應用為根據影像像素 值出現的機率來評估影像中的資訊量及複雜度,熵值越高表示影像中不同訊號出 現的機率較高,影像上意義則表示資訊愈豐富愈複雜,因此可以根據熵值來表達 影像的複雜程度。
(13)
∑
(14)
上面兩式(13)、(14)為熵值的定義, 代表訊號源 的範圍, 代表訊號源 出 現的機率大小,M、N 為影像的長和寬,ㄧ般來說, 的定義可以視情況而定,
假設要計算的是灰階值的熵時, 表示灰階值為 的像素點數目;若要計算水平投 影量之熵時, 表示第 個列上灰階值為 0 或 255 的像素點數目,若要計算垂直 投影量之熵時, 表示第 個行上灰階值為 0 或 255 的像素點數目,當影像內容
有變化時,這些熵值也會跟著變化。
27
(3) 特徵擷取方式:
由於灰階值的熵值及水平、垂直投影的熵值無法充分描述開閉眼的情形,因 此本研究將思考利用其他影像特徵計算熵值,由於複雜度函數方法中所計算出的 複雜度值恰能描述影像黑白相間的情形,因此將考慮以每一列所計算出的複雜度 值當作熵值的訊號來源,若直接套用會有機率不符的問題產生,因此本研究將利 用式(15)類熵的計算來得出整體影像的特徵值。
假設影像 I 的大小為 ,本研究將定義此特徵值 的算法如下:
∑
(15)
上式中的 為根據複雜度函數所算出來的每一列複雜度值,其定義如下:
∑
(16)
其中 (17)
是二元影像 第 列、第 行的像素值, 為第 列、第 行的權重係數。
經由式(15)所運算出來的特徵值 意義上仍為複雜度的概念,由於複雜度 函數一列中的 值愈大表示黑白相間的情形愈多,利用式(15)可以拉開開閉眼影
像的特徵值差距而更具鑑別度。
28