特徵擷取

第三章研究方法

3.5 眼睛狀態決策（Eye State Decision）

3.5.2 特徵擷取

由於開眼影像與閉眼影像在外觀上有明顯的差異，開眼影像的輪廓較為複雜，

而閉眼影像通常呈現一條微彎的曲線輪廓較為簡單，因此可以考慮利用兩者的輪廓複雜度當作特徵，輪廓複雜度計算的方法眾多，但其公式及用法皆不盡相同，

複雜度函數(Complexity Function)及熵(Entropy)皆可用來描述影像的複雜度，本研究將以上述兩種方法為基礎，提出了一個新的特徵擷取方法，算出的特徵值意義上同為複雜度的概念，此值愈大代表影像複雜度較高，為開眼的可能性也愈高，

反之，則為閉眼的可能性高。

(1) 複雜度函數(Complexity Function):

根據開閉眼外觀上的明顯差異，Tian 與 Qin[25]於 2005 年提出了利用複雜度函數 (Complexity Function) 計算眼睛影像輪廓的複雜度並訂定一個門檻值

(threshold)來及時判斷眼睛的開闔狀態。Hong 等人[26]則在 2007 年加入考慮垂直方向的複雜度，進而判斷眼睛的開闔狀態。

複雜度函數的定義如下：

∑ ∑

(11)

假設影像大小為，表示二元影像的複雜度值，是二元影像第列、第行的像素值，則表示第列、第行的權重係數。每一個像素點會和右邊像素點相減並取絕對值後乘上一個權重值，最後累加得

到一張影像的複雜度值。

開眼狀態時眼睛有黑白明顯變化的位置通常位於中間，而周圍呈現較為均勻的灰階像素值，因此權重值會隨著離眼睛中心距離愈近而越大，愈靠近邊緣而愈小，如圖 19，高峰的地方即為權重值最高的影像中心位置，因此權重值的加入更可以描述眼睛複雜度的大小。

權重值的定義如下:

(12)

假設 M、N 為影像的長和寬，則表示第列、第行的權重值。

圖 19、複雜度函數權重值示意圖

(2) 熵(Entropy):

熵一詞最早於 1864 年出現並應用於熱力學中，由 Rodolf Julius Emanuel Clausius 提出，可以用來表達能量混亂的程度。接著於 1948 年由 Claude Elwood Shannon 提出可以將此概念用於資訊理論上，可以用來描述某載體中蘊含資訊量的多寡。熵在物理意義上表示亂度，Chen 等人[27]於影像的應用為根據影像像素值出現的機率來評估影像中的資訊量及複雜度，熵值越高表示影像中不同訊號出現的機率較高，影像上意義則表示資訊愈豐富愈複雜，因此可以根據熵值來表達影像的複雜程度。

(13)

∑

(14)

上面兩式(13)、(14)為熵值的定義，代表訊號源的範圍，代表訊號源出 現的機率大小，M、N 為影像的長和寬，ㄧ般來說， 的定義可以視情況而定，

假設要計算的是灰階值的熵時，表示灰階值為的像素點數目;若要計算水平投影量之熵時，表示第個列上灰階值為 0 或 255 的像素點數目，若要計算垂直投影量之熵時，表示第個行上灰階值為 0 或 255 的像素點數目，當影像內容

有變化時，這些熵值也會跟著變化。

(3) 特徵擷取方式:

由於灰階值的熵值及水平、垂直投影的熵值無法充分描述開閉眼的情形，因此本研究將思考利用其他影像特徵計算熵值，由於複雜度函數方法中所計算出的複雜度值恰能描述影像黑白相間的情形，因此將考慮以每一列所計算出的複雜度值當作熵值的訊號來源，若直接套用會有機率不符的問題產生，因此本研究將利用式(15)類熵的計算來得出整體影像的特徵值。

假設影像 I 的大小為，本研究將定義此特徵值的算法如下:

∑

(15)

上式中的為根據複雜度函數所算出來的每一列複雜度值，其定義如下:

∑

(16)

其中 (17)

是二元影像第列、第行的像素值，為第列、第行的權重係數。

經由式(15)所運算出來的特徵值意義上仍為複雜度的概念，由於複雜度函數一列中的值愈大表示黑白相間的情形愈多，利用式(15)可以拉開開閉眼影

像的特徵值差距而更具鑑別度。

在文檔中可應用於一般課堂環境中之人眼開闔狀狀態研究 (頁 31-35)

第三章 研究方法

3.5 眼睛狀態決策（Eye State Decision）

3.5.2 特徵擷取

第三章研究方法