• 沒有找到結果。

第三章 研究方法

3.5 眼睛狀態決策(Eye State Decision)

3.5.2 特徵擷取

由於開眼影像與閉眼影像在外觀上有明顯的差異,開眼影像的輪廓較為複雜,

而閉眼影像通常呈現一條微彎的曲線輪廓較為簡單,因此可以考慮利用兩者的輪 廓複雜度當作特徵,輪廓複雜度計算的方法眾多,但其公式及用法皆不盡相同,

複雜度函數(Complexity Function)及熵(Entropy)皆可用來描述影像的複雜度,本研 究將以上述兩種方法為基礎,提出了一個新的特徵擷取方法,算出的特徵值意義 上同為複雜度的概念,此值愈大代表影像複雜度較高,為開眼的可能性也愈高,

反之,則為閉眼的可能性高。

(1) 複雜度函數(Complexity Function):

根據開閉眼外觀上的明顯差異,Tian 與 Qin[25]於 2005 年提出了利用複雜度 函 數 (Complexity Function) 計 算 眼 睛 影 像 輪 廓 的 複 雜 度 並 訂 定 一 個 門 檻 值

(threshold)來及時判斷眼睛的開闔狀態。Hong 等人[26]則在 2007 年加入考慮垂直 方向的複雜度,進而判斷眼睛的開闔狀態。

複雜度函數的定義如下:

∑ ∑

(11)

假設影像大小為 , 表示二元影像 的複雜度值, 是二元 影像第 列、第 行的像素值, 則表示第 列、第 行的權重係數。每一個像素 點 會和右邊像素點相減並取絕對值後乘上一個權重值 ,最後累加得

到一張影像的複雜度值。

25

開眼狀態時眼睛有黑白明顯變化的位置通常位於中間,而周圍呈現較為均勻 的灰階像素值,因此權重值會隨著離眼睛中心距離愈近而越大,愈靠近邊緣而愈 小,如圖 19,高峰的地方即為權重值最高的影像中心位置,因此權重值的加入 更可以描述眼睛複雜度的大小。

權重值的定義如下:

(12)

假設 M、N 為影像的長和寬, 則表示第 列、第 行的權重值。

圖 19、複雜度函數權重值示意圖

26

(2) 熵(Entropy):

熵一詞最早於 1864 年出現並應用於熱力學中,由 Rodolf Julius Emanuel Clausius 提出,可以用來表達能量混亂的程度。接著於 1948 年由 Claude Elwood Shannon 提出可以將此概念用於資訊理論上,可以用來描述某載體中蘊含資訊量 的多寡。熵在物理意義上表示亂度,Chen 等人[27]於影像的應用為根據影像像素 值出現的機率來評估影像中的資訊量及複雜度,熵值越高表示影像中不同訊號出 現的機率較高,影像上意義則表示資訊愈豐富愈複雜,因此可以根據熵值來表達 影像的複雜程度。

(13)

(14)

上面兩式(13)、(14)為熵值的定義, 代表訊號源 的範圍, 代表訊號源 出 現的機率大小,M、N 為影像的長和寬,ㄧ般來說, 的定義可以視情況而定,

假設要計算的是灰階值的熵時, 表示灰階值為 的像素點數目;若要計算水平投 影量之熵時, 表示第 個列上灰階值為 0 或 255 的像素點數目,若要計算垂直 投影量之熵時, 表示第 個行上灰階值為 0 或 255 的像素點數目,當影像內容

有變化時,這些熵值也會跟著變化。

27

(3) 特徵擷取方式:

由於灰階值的熵值及水平、垂直投影的熵值無法充分描述開閉眼的情形,因 此本研究將思考利用其他影像特徵計算熵值,由於複雜度函數方法中所計算出的 複雜度值恰能描述影像黑白相間的情形,因此將考慮以每一列所計算出的複雜度 值當作熵值的訊號來源,若直接套用會有機率不符的問題產生,因此本研究將利 用式(15)類熵的計算來得出整體影像的特徵值。

假設影像 I 的大小為 ,本研究將定義此特徵值 的算法如下:

(15)

上式中的 為根據複雜度函數所算出來的每一列複雜度值,其定義如下:

(16)

其中 (17)

是二元影像 第 列、第 行的像素值, 為第 列、第 行的權重係數。

經由式(15)所運算出來的特徵值 意義上仍為複雜度的概念,由於複雜度 函數一列中的 值愈大表示黑白相間的情形愈多,利用式(15)可以拉開開閉眼影

像的特徵值差距而更具鑑別度。

28

相關文件