• 沒有找到結果。

以電腦視覺為基礎之眼睛定位與追蹤技術於即時的眨眼偵測與虹膜辨識

N/A
N/A
Protected

Academic year: 2021

Share "以電腦視覺為基礎之眼睛定位與追蹤技術於即時的眨眼偵測與虹膜辨識"

Copied!
9
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

以電腦視覺為基礎之眼睛定位與追蹤技術於即時的眨眼偵 測與虹膜辨識(第 2 年)

研究成果報告(完整版)

計 畫 類 別 : 個別型

計 畫 編 號 : NSC 96-2221-E-011-137-MY2

執 行 期 間 : 97 年 08 月 01 日至 98 年 07 月 31 日 執 行 單 位 : 國立臺灣科技大學資訊工程系

計 畫 主 持 人 : 范欽雄

計畫參與人員: 碩士班研究生-兼任助理人員:張書銚

公 開 資 訊 : 本計畫涉及專利或其他智慧財產權,2 年後可公開查詢

中 華 民 國 98 年 08 月 11 日

(2)

以電腦視覺為基礎之眼睛定位與追蹤技術 於即時的眨眼偵測與虹膜辨識(2/2)

計畫編號:NSC-96-2221-E-011-137-MY2

執行期限:民國 97 年 8 月 1 日至 98 年 7 月 31 日

主持人:范欽雄 國立台灣科技大學資訊工程系 副教授 計畫參與人員:張書銚 國立台灣科技大學資訊工程系 碩士班研究生

摘要

生物識別系統主要是利用人體的生理特徵進行個 人身份的比對,例如人臉、虹膜、視網膜、掌紋、指 紋、聲紋等,其中人的虹膜由於不易受到複製且不會 因時間而改變,又不同人擁有相似虹膜的機率微乎其 微,所以虹膜具有高度的唯一性和穩定性,非常適合 作為生物識別的特徵。於本報告裡,我們以三個主要 的處理階段來實現一個高識別率的虹膜辨識系統。首 先說明系統如何由網路攝影機擷取人眼影像進而分離 出虹膜影像,再利用影像處理的技術予以改善,使得 虹膜影像更適於後續的辨識。接著討論如何建立虹膜 的特徵向量,在虹膜影像展開的過程中,我們解決了 虹膜影像旋轉不變性的問題,然後利用直接線性鑑別 分析的方式進行特徵抽取,使得所產生出來的特徵向 量擁有最大類別間距離與最小類別內距離的特性。最 後,我們探討多種最近特徵分類法與其辨識的效果,

並將上述方法實作完成一套人眼虹膜辨識系統。根據 實驗的結果顯示,在樣本特徵向量數較少的情況下辨 識率有96.47%,若在每個類別中增加樣本特徵向量的 個數,則系統的辨識率更可以達到98.50%。

關鍵詞:生物識別、直接線性鑑別分析、最近特徵分 類法、虹膜辨識。

Abstract

Biometric recognition systems perform personal identification with physiological characteristics, including faces, irises, retinas, hand textures, fingerprints, and voices. Of these physiological characteristics, one’s irises are different from the others and not easy to be copied. In addition, irises do not change forever.

According to such cues, irises have high quality of uniqueness and stability, and they are great for biometric recognition. In this report, we present a human iris recognition system with a high recognition rate. The iris recognition system consists of three major processing phases. First, the system captures the images of human’s eyes from a web camera, and obtains iris images from them. We further manipulate the iris images using digital image processing techniques, so that the resulting iris images are suited to be recognized. Second, the system makes feature vectors from the iris images. Before extracting feature vectors, we must unwrap the iris images. In this phase, the problem of rotation invariant is

well solved. We then adopt direct linear discriminant analysis to extract feature vectors such that the distance between the feature vectors of different classes is the largest but the distance between those in the same class is the smallest. Finally, the system employs the nearest feature classifiers to discriminate the feature vectors. To verify the effectiveness of the proposed methods, we realize a human iris recognition system. The experimental results reveal that the recognition rate achieves 96.47% in the case of fewer sampling feature vectors, whereas it can attain 98.50% if more sampling feature vectors are added to each class.

Keywords: biometric recognition, direct linear discriminant analysis, the nearest feature classifier, iris recognition.

1.

前言

近年來由於科技的進步和資訊安全的發展,再加 上最近許多金融犯罪案都牽涉到個人的身份辨識問 題,使得身份識別的嚴謹度和重要性日益受到重視。

為了能達到身份辨識的目的,傳統都是使用個人的帳 號、ID 卡或是密碼等來確定使用者身份,但若是遺失 或是忘記都會造成使用者的不便,甚至若被盜取更可 能造成重大的損失,因此若能利用個人獨一無二的生 理特徵作為身份辨識的依據,不但沒有遺失 ID 卡或 忘記密碼的問題,也不用擔心遭人複製,因此以個人 生理特徵作為辨識依據的生物識別系統已漸漸取代了 傳統的身份辨識方法。

生物識別系統,主要是利用人體的生理特徵進行 個人身份的比對,例如人臉、虹膜、視網膜、掌紋、

指紋、聲紋等,而在這些生理特徵中,虹膜辨識可以 說是最具有潛力的。自從 1991 年 Johnson[1]討論了基 於虹膜辨識的個人身份辨識系統的可能性後,許多使 用虹膜作為辨識依據的系統就被開發出來[2-5],此 外,也有許多公司推出正式的產品在市面上販售,如 松下的 Authenticam 虹膜辨識系統、BM-ET500 虹膜辨 識系統等。

在過去許多的虹膜辨識系統當中,大部分是將虹 膜影像轉換至頻率域(frequency domain) 後再處理,像 是 Daugman 所提出來的系統就是使用 2-D 賈伯濾波 器(Gabor filter),再結合類神經網路的技術[6],此外,

像是 Wildes[5]提出使用 Laplacian-pyramid 技術的系統

等,都有將影像經過轉換,但此步驟需要額外的處理

(3)

時間,若影像直接在空間域(spatial domain)做處理,則 可避免轉換所需的時間而能降低系統的負擔。

有鑑於此,本報告提出一個基於直接線性鑑別分 析(direct linear discriminant analysis; DLDA )與最近特 徵分類法(the nearest feature classifier)的人眼虹膜辨識 系統。直接線性鑑別分析在處理特徵抽取的問題上是 非常強健的,因為經過此分析後所得的虹膜特徵具有 最大類別間距離與最小類別內距離的特性,這對於後 續的分類問題上有很大的助益。最近特徵分類法則討 論了最近特徵線(the nearest feature line; NFL)、最近特 徵平面(the nearest feature plane; NFP)與最近特徵空間 (the nearest feature space; NFS)等方法,其中我們採用 了 Ma 等人[7]對於最近特徵線的改良方法,以獲得較 佳的分類效果。

本報告所使用的影像擷取設備為廉價的網路型攝 影機,整體系統分為三個程序,即:影像擷取與前處 理程序、虹膜特徵抽取處理程序、虹膜辨識處理程序,

它們皆在空間域內完成,經由實驗顯示:本系統擁有 不錯的辨識效能。

2.

影像擷取與前處理程序

當系統擷取原始的人眼影像後,接著就要從影像 中取得瞳孔中心,在過去的研究中,對瞳孔中心的決 定都是採用簡單的搜尋方法,像是直接使用固定的門 檻值來決定瞳孔的灰階值[8],或是使用投影的方式 [7]。但在本系統中,若是瞳孔中心的位置不正確,往 後在決定虹膜的內徑與外徑時,會得到錯誤的虹膜區 域,因此,我們對於瞳孔中心的決定,提出一個新的 統計式演算法。

2.1 瞳孔中心的決定

為了讓系統能更快速、更精準地將眼睛位置偵測 出來,我們必須先縮小搜尋的範圍;由於在人臉的影 像中,膚色是一個較容易擷取的特徵,因此,我們首 先利用光源補償、HSV色彩空間轉換、影像二值化、

數理形態學的侵蝕與膨脹、相連元件區塊的標記,以 及利用人臉影像的一些基本條件來偵測並擷取出臉 部區域,以便後續處理。

(a) (b) 圖1 (a)人眼影像做灰階值統計的區域部分;(b)

圖1(a)所示區域內部的灰階值分佈圖。

由於瞳孔的灰階值偏低,就算經由硬體設備中 500W的強力光源照射,其灰階值也不會高於80,所 以取80為門檻值,即將灰階值高於80的像素略去。雖 然瞳孔區域內絕大多數的像素灰階值皆為峰值,但是 由於光源照射的影響,必須以峰值加10當作門檻值才 能找出完整的瞳孔區域,因此從人眼灰階影像中,找 出低於門檻值的像素,即為可能的瞳孔區域。

爲了定出瞳孔中心的位置,我們使用一個八方向

的瞳孔中心定位器。此定位器的基本想法是把影像中 每個可能為瞳孔中心的像素當作圓心,由內向外找出 最大瞳孔與其半徑,最後比對所有的最大瞳孔半徑 後,找出最大值,則該圓心即為瞳孔中心。圖2為瞳 孔中心定位器搜尋瞳孔候選影像的示意圖。

圖2 瞳孔中心定位器搜尋瞳孔候選影像的示意 圖。

2.2 虹膜內徑與外徑的決定

虹膜的內徑與外徑實際上並不一定屬於同心圓,

但若當成同心圓做處理,不但可減少處理的複雜度,

進而提高辨識的速度,且對於辨識的效果並不會有太 大的影響,許多過去的研究也顯示了這個結果[8-9]。

在決定虹膜內徑與外徑的方法上,本報告採用的 是環型邊界檢測器[3,8],它的基本想法是以2.1節所找 到的瞳孔中心為圓心,半徑為 r ,將圓周上的灰階值 加總並取其平均,且 r 不斷的增加並重複前述步驟就 可以得到一個灰階分佈圖,再經由微分和迴旋積後即 可得到虹膜的內徑與外徑,分別如式(1)與式(2)所示。

0 0 0

1 , ,

( , ) arg max ( )

σ r x y

2

r r

I x y

r G r ds

r πr

<

= ∗ ∂

(1)

0 0 0

2 , ,

( , ) arg max ( )

σ r x y

2

r r

I x y

r G r ds

r πr

>

= ∗ ∂

(2) 此處 ( , )

I x y 代表人眼影像,

r 代表半徑,

0 0

( ,

x y 表

) 示瞳孔中心, G r

σ

( ) 為一維高斯濾波器,而 r 0 為門檻 值,最佳經驗值設為50。由圖3可以看出使用環型邊界 檢測器找到虹膜內徑與外徑的結果。

圖3 使用環型邊界檢測器找到的虹膜內徑與外徑。

2.3 虹膜影像的前置處理

本報告針對虹膜影像所採用的前置處理包括影

像增強與雜訊抑制,其中影像增強的部分,使用的是

直方圖等化(histogram equalization),而在雜訊抑制

上,使用的是 3 3 × 低通高斯濾波器。圖4為使用直方

圖等化和二維低通高斯濾波器的處理結果。由此圖可

以看出:使用直方圖等化後,原始影像的灰階值對比

度增加了,且虹膜紋路的特徵也變得比較明顯;而使

用低通高斯濾波器後,人眼虹膜影像中的高頻資訊被

濾除了,影像上的雜訊也消失了,經由這兩個步驟處

(4)

理過的影像對於後續的辨識有正面的效果。

圖4 (a)原始虹膜影像;(b)使用直方圖等化處理 後的影像;(c)使用低通高斯濾波器處理後 的影像;(d)先使用直方圖等化再使用低通 高斯濾波器處理後的影像。

3. 特徵抽取處理程序

辨 識 系 統 若 直 接 以 虹 膜 影 像 形 成 特 徵 向 量 (feature vector),則不但辨識率差且辨識的速度也很 慢;若我們能從虹膜影像中找出重要的特徵當作辨識 的依據,則可以改善這些問題。如何從虹膜影像中抽 取出最小維度的特徵向量,仍足以辨別所有使用者個 別的身份是特徵抽取最主要的目的。而抽取出最小維 度的特徵向量,就是要降低資料的維度,如此不但可 以有效地減少後續辨識所花費的時間和運算量,更可 以達到提升辨識率的效果。

3.1 虹膜影像之展開與正規化

在使用者擷取人眼影像時,由於不同的距離和 角度的關係,會使得不同的使用者擷取下來的虹膜影 像大小不同,甚至從同一位使用者所擷取下來的虹膜 影像都會有這個問題,而用來作為辨識的虹膜特徵向 量通常是固定的長度,因此對虹膜影像做正規化有其 必要。本報告係藉由極座標轉換成直角座標的方法將 虹膜影像展開(Huang等人[10]),其進行步驟如下:

在一張虹膜影像中,若以瞳孔中心為圓心,則對 於影像中虹膜範圍內的所有像素座標

( , )

x y 都可以 對 應 到 一 個 極 座 標

( cos , sin )

r θ r θ , 其 中 r

( , )

x y 到圓心的距離, θ

( , )

x y 到圓心的連線與 x 軸的夾角。

爲了要達到正規化的目的,並將虹膜影像展開成 矩形,我們定義矩形的寬為64個像素,這樣的做法除 了方便後續馬賽克法的運算外,也考慮到虹膜內、外 徑的差約為50~75個像素(參考2.2節)的緣故。在實際 轉換時,由於定義矩形的寬為64個像素,因此必須將 虹膜的外徑與內徑相減後再除以64,才是轉換時半徑

r 的實際使用單位。

另外定義矩形的長為360個像素,這種做法的理 由也是基於方便馬賽克法的運算,且當半徑較大時比

較不會漏失資訊。在實際的轉換時,由於定義的矩形 長為360個像素,且第二象限含有過多的雜訊,因此 轉換時所用到的部分係從 θ = ° 90 開始,依順時針方 向至 θ = − 180 ° 為止,總共270度的範圍,所以必須將 270度除以360為3/4度當作實際轉換角度的單位。

由於虹膜影像內含有大量的虹膜特徵資訊,為了 計算方便略去一些資訊是不會影響辨識效率的。首先 處理矩形寬的部分,從 θ = ° 90 且半徑 r = 虹膜內徑 長的位置開始,在虹膜影像上由內向外讀取像素值,

並依序由矩形的左上角(座標(0,0))往下存入,直到 r = 虹膜外徑長,總共64個半徑單位的像素皆處理過。

接著處理矩形長的部分,先以順時針的方向在虹 膜影像上,由 θ = ° 90 到 θ = − 180 ° ,依照每個角度單 位重複執行步驟4,總共處理360個角度單位並存入矩 形中,而儲存的方向則是由左向右,按照這個方法可 以將虹膜影像轉換成一個長為360個像素且寬為64個 像素的矩形,如圖5所示。

圖5 虹膜影像展開與正規化的示意圖。

由於靠近虹膜外徑的部分可能會受到眼瞼與睫 毛的雜訊影響,因此我們捨去靠近虹膜外徑1/4的部 分;換言之,矩形下面1/4的部分會被省略,只取上面 48個像素。

為了解決虹膜影像旋轉的問題,我們參考(Ma et al., 2002)的做法,可以在步驟4中的起始角度上多增加 幾個起始值,本報告所使用的起始值共9個,分別為 θ = ° 83 , θ = ° 86 , θ = ° 88 , θ = ° 89 , θ = ° 90 , θ = ° 91 , θ = ° 92 , θ = ° 94 以及 θ = ° 97 ;經由實驗也證實了使 用9個不同角度的起始值對於解決虹膜影像旋轉的問 題有很大的助益。

3.2 使用馬賽克法降低資料維度

虹膜影像完成展開與正規化後,其大小為一張 48

×

360的矩形影像,總共含有17,280個像素。在後續 做 特 徵抽 取時 , 每一 張矩 形 影像 構成 一 筆維 度為 17,280的資料,而在計算散佈矩陣(scatter matrix)時,

若直接使用如此高維的資料來計算的話,將是一個沉 重的負擔。為了減少特徵抽取上計算處理的時間與增 強效率,本報告使用馬賽克法來降低資料維度(施嘉南, 2003),對於虹膜特徵資訊間強弱的關係亦可以保留。

本報告使用的馬賽克遮罩大小為8

×

8像素,此遮

罩對於影像處理的方法跟一般的迴旋積不同,它係對

(5)

於遮罩內的所有像素計算出平均值後,再取代所有遮 罩內的像素,然後依序由左至右、由上往下處理整張 影像,對於處理過的像素不會重複處理。圖6為使用馬 賽克法處理所得的矩形影像示意圖,此時矩形虹膜影 像變成6

×

45的矩陣,我們將其依序展開,使它成為一 個270維的向量,但此向量並非特徵向量,必須經由特 徵抽取後,才是真正辨識時所使用的特徵向量。

圖6 馬賽克法示意圖。

3.3 直接線性鑑別分析

在過去的研究中,為了解決線性鑑別分析(linear discriminant analysis; LDA)的小樣本數問題[11-13],一 直有許多有效的方法被提出,像是Swets 和Weng 於 1996 年 提 出 結 合 主 成 份 分 析 (principal component analysis; PCA)和LDA的方法[14],首先,它使用PCA 將原始特徵資料集合轉換至另一個維度較低的特徵空 間中,接著,再使用LDA對轉換後的資料抽取特徵,

但此方法在使用PCA降低維度時,反而捨去了重要的 鑑別資訊。

Yu和Yang在2001年提出了一個想法來解決上述 的問題[15],就是同時對類別間的散佈矩陣 M 與類別 B 內的散佈矩陣 M 做對角化。這個想法是由於 W M 的 B 零核空間(null space)中包含了對於鑑別沒有用處的資 訊 , 因 此 對 M 做對角 化,再捨去 相對於本徵值 B (eigenvalue) 中 接 近 0 或 是 等 於 0 的 本 徵 向 量 (eigenvector),而 M 的零核空間中包含了對鑑別最有 W 利的資訊,因此對 M 做對角化後,留下相對於特徵 W 值中接近0或是等於0的特徵向量,這樣就可以找到對 於分類擁有最佳效果的DLDA轉換矩陣。

3.4 DLDA演算法

假 設 原 始 特 徵 資 料 的 維 度 為 q , 以 下 為 求 取 DLDA的演算法,總共包含六個步驟:

1. 對 M 做對角化: B

首 先 找 到 一 個 矩 陣 U , 使 得 U M U Λ 且 T B =

T =

U U I ,其中 Λ 為一個對角化矩陣,其對角線 上的值為 M 之本徵值並且是按照大小的順序排 B 列。

2. 捨去矩陣 U 中對辨識沒有幫助的本徵向量:

取出矩陣 U 中相對於前 r 個大的本徵值對應的本 徵向量,並且組成一個 q r

×

的矩陣 M ,使得

T

B

=

B

>

W M W D 0 ,其中 D BΛ 的子矩陣,其 大小為 r r

×

3. 令 Y WD =

B1 2

Y WD = B 1 2 ,則 ( WD B 1 2 ) T M WD B ( B 1 2 ) = I 。 4. 令 Z Y S Y ,並對 Z 做對角化: =

T W

Z Y S Y ,並從中找到一個矩陣 Q ,使得 =

T W

T =

Q ZQ ΡQ Q I T = ,其中 Ρ 為一個對角化矩 陣,其對角線上的值為Z 之本徵值並且是按照大 小的順序排列。

5. 捨去矩陣 Q 中對辨識沒有幫助的本徵向量:

取出矩陣 Q 中相對於前 s 個小的本徵值對應的本 徵向量,尤其是本徵值為0的本徵向量,並且組成 一個 r s × 的矩陣 X ,使得 X ZX D ,其中 T = W D WΡ 的子矩陣,其大小為 s s × 。

6. 求取DLDA轉換矩陣:

A X Y = T T ,則 D W 1 2 A 為DLDA轉換矩陣。

求得DLDA轉換矩陣後,對於原始特徵資料做運 算就可以求得特徵向量(feature vector),再交給辨識處 理程序進行辨識。

4. 虹膜辨識處理程序

在決策法則或分類器的選擇上,一般最常用也是 最容易使用的是歐幾里德距離(Euclidean distance),由 於它是單純計算點與點之間的距離,若使用在辨識 上,可以看作是兩個特徵點(feature point)之間的距 離,也就是兩張影像的差距,可是它對於同一個類別 的影像之間的相關性並沒有考慮在內。

最近特徵線法(The nearest feature line; NFL)則改 善了歐幾里德距離沒有考慮到的部分(Li和Lu[16])。首 先將同一類別中的所有影像,兩兩之間產生一條特徵 線(feature line),並將欲辨識的影像投影到特徵線上求 得投影點,它可以看成是產生此特徵線的兩張影像的 線性組合,即結合了兩張影像的變化,並且調整該線 性組合使得投影點與欲辨識的影像差距達到最小。由 於考慮了同一類別內不同特徵點兩兩之間的相關性,

因此在辨識的效果上會比簡單使用歐幾里德距離來得 好。

4.1 特徵點到單一特徵線距離的計算

在資料庫中的每張影像經過前處理和特徵抽取後 所得到的資訊可當作此影像的特徵向量,而每個特徵 向量在高維度(high dimension)的空間中皆可以視為一 個特徵點,假設某一個類別中的兩個特徵點為 y 1

y ,則穿越此兩點的一條直線

2 y y

1 2

可稱為成此類別的 一條特徵線,若要計算欲分類特徵點 x 到此特徵線的 距離,首先必須求出 x

1 2

y y 上的投影點 p

圖7 特徵線示意圖。

參考圖7,投影點 p 可藉由 y 1y 2 表示為:

1 ( 2 1 )

p = y + σ yy (3)

(6)

其中 σ ∈ℜ 稱為位置參數(position parameter),可由

pxy y 1 2 成垂直的關係獲得,即

2 1

( p x − ⋅ ) ( yy ) = 0 (4) 將式(3)代入式(4)可得:

1 2 1 2 1

[

y

+

σ y

(

y

)− ⋅

x

] (

y

y

)=0

再將此式展開可計算出 σ :

1 2 1 2 1 2 1

( ) ( ) ( ) ( )

σ = x y − ⋅ yy yyyy (5) 由式(3)可知 σ 描述了 py 1y 2 的關係,如下 所示:

1 1

1 2 2

2

, 0

, 0

0 1

,

1 ,

1 ,

p y

p y p y y

p y

p y

⎧ <

⎪ = =

⎪⎪ < <

⎨ ⎪ = =

⎪ >

⎪⎩

落在往 方向的延長線上 若

介於 之間 若

落在往 方向的延長線上 若

σ σ

σ σ σ

求得 σ 後,再利用式(3)求出 p ,則 xp 的歐 幾里德距離 d x y y ( , 1 2 ) 即可獲得。

4.2 特徵點到多類別特徵線距離的計算

對於實際的應用上,我們將每位使用者分別建立 一個類別,假設有 N 位使用者,則對此第 k 個類別計 算其中所有的特徵線 L i , i

=1, 2, ,L

k l ,則待分類特

徵點 x 到此類別所有特徵線的距離共有 k l 個,分別為 ( , 1 ),

d x L d x L ( , 2 ), L ( , ) , d x L k

l

,從中取出最小的則 為待分類特徵點 x 到此類別的距離,即

( , ) 1 min ( , )

k i k

l

i

d x C d x L

< <

= (6) 其中 C k 代表第 k 個類別。對 N 個類別經過上述 的計算後可以得到 N 個距離,再從它們之中找出最小 的,則可獲得 x 的分類結果,表示為:

1

ˆ

Arg min ( ,

k

)

k k N

C d x C

< <

= (7)

4.3 最近特徵線法的改良

最近特徵線法在某些情況下會造成分類錯誤的問 題,假如沒有考慮到特徵線為無限延伸的線[7]。如圖 8所示,假設 y 1y 2y 3y 4 為資料庫中兩個不同類 別的特徵點,其中 y 1y 2 屬於 C 1 類別, y 3y 4 屬於 C 2 類別, x 為待分類的特徵點, y y

1 2

y 1 y 2 所產 生的特徵線, y y

3 4

y 3y 4 所產生的特徵線, p 1xy y

1 2

上的投影點,而 p 2xy y

3 4

上的投影點。經 由最近特徵線法可知, x 將被分類為 C 1 類別,但是 x 距離 y 3y 4y 1y 2 為近,依照常理判斷, x 應被 分為 C 2 類別,但是卻因為距離 y y

1 2

較近而被分為 C 1 類別,這個結果將造成分類上的錯誤。

圖8 分類錯誤示意圖。

為了避免分類時發生上述的錯誤,可以藉由對計 算待分類特徵點到特徵線的距離上使用不同的定義來 改善,如下:

1 1

1 2 1 2

2 2

( , )

x y

d x y y x p x y

σ τ τ σ τ

τ σ

⎧ − <

= ⎪ ⎨ − ≤ ≤

⎪ − <

若 若

若 (8)

其中 τ 1 與 τ 2 為兩個門檻值,通常在 τ 1 的選擇上 會選用小於0的值, τ 2 會選用大於1的值,而原始的最 近特徵線法可看成 τ 1

= −∞

τ 2

= +∞

,本報告使用 的 τ 1 與 τ 2 分別為-0.7與1.7。

4.4 最近特徵平面法

利用線性代數中關於正交基底(orthogonal basis) 與正交投影(orthogonal projection)的理論,可以進一步 將最近特徵線法擴展為最近特徵平面法[17-18]。圖9 為最近特徵平面法的示意圖;於此圖中, A , BC 為 同一類別中的三個特徵點,由它們所產生的特徵平面 為 Ex 為欲分類的特徵點,其投影在此平面上的投 影點為 p

圖9 最近特徵平面法的示意圖。

由 正 交 基 底 的 理 論 知 , ( A , B , C ) ( , , )

E span = V V V = span OA OB OC uuur uuur uuur

,其中 O 為原點,而 V A , V 與 B V 為產生此平面的正交基底且 C 必須彼此正交,因此 V A , V 與 B V 可表示為: C

A

A

B A

A A

A B

C A B

A A B B

OA OB OB

OC OC

OC

=

= − ⋅

⋅ ⋅

= − −

⋅ ⋅

V

V V V

V V

V V

V V V

V V V V uuur

uuur uuur

uuur uuur uuur

(9)

則欲分類特徵點 x 在此平面上的投影點 p 可藉 由 V A , V 與 B V 表示為: C

C

A B

A B C

A A B B C C

x

x x

p = ⋅ − ⋅ − ⋅

⋅ ⋅ ⋅

V

V V

V V V

V V V V V V (10)

(7)

依此, x 到特徵平面 E 的距離可藉由歐幾里德距 離的公式求出:

( , )

d x E = − x p (11) 我們以此距離作為分類的依據,對於每個類別中 的任意三個特徵點產生其特徵平面,並求出待測特徵 點到此平面的距離,再從所有求出的距離中找出最小 值則可得到辨識的結果,其細節如同4.2節所述。

4.5 最近特徵空間法

我們依照上一節的想法,可以把特徵面推廣到整 個空間,由同一類別中的所有特徵點產生一個類別的 特徵空間。假設某個類別中含有 n 個特徵向量,則產 生該類別特徵空間的正交基底可表示為 V , 1 V , …, 2

V ,欲分類特徵點 n x 在此空間上的投影點 p 可藉由 其正交基底表示為:

1 2

1 2

1 1 2 2

n n

n n

x

x x

p = ⋅ − ⋅ − − ⋅

⋅ ⋅ ⋅

V

V V

V V V

V V V V L V V

(12) 則 x 到特徵空間 S 的距離可藉由歐幾里德距離 公式求出:

( , )

d x S

= −

x p

(13) 其分類方法如同4.2節所述,在此不再贅述。

由於虹膜影像在擷取時往往受到光源或雜訊的影 響使得特徵受到破壞,且最近特徵空間法是由同類別 中所有特徵點產生其特徵空間,因此也將雜訊加入 了,這使得不同類別產生出來的空間會有交集的情況 產生,如此會使得辨識率大為降低。

對於上述的問題,可以使用一些方法來改善,例 如一個結合最近特徵空間與歐幾里德距離或是最近特 徵線的方法就是不錯的選擇。我們使用一個門檻值,

當分類時所求得的值高於門檻值時,就以最近特徵空 間法作為辨識的方法,若值低於門檻值就改用歐幾里 德距離或是使用最近特徵線法重新辨識。

5.

實驗結果

雖然虹膜辨識已是一個被廣泛研究的主題,但不 像指紋辨識與人臉辨識有許多公共的資料庫可以用來 測試實際辨識的效能,因此本報告所採用的資料庫是 從本實驗室的成員身上收集而得,包括15位使用者,

其中每位使用者擷取20張虹膜影像。

每張原始人眼影像經由虹膜影像擷取與前置處理 程序所得到的獨立虹膜影像,其大小會因為拍攝人眼 影像時,使用者與網路攝影機的距離遠近而有所不 同,其長與寬約為170~210個像素。而每張虹膜影像 皆可透過特徵抽取得到對應的特徵向量,用以代表該 虹膜影像。圖10顯示了同一位使用者的10張虹膜影像。

圖10 資料庫中同一位使用者的10張虹膜影像。

實驗中,由於代表每位使用者的樣本特徵向量數 過少,我們參考一篇人臉辨識系統的作法來增加使用 者的資料量[19],它是將人臉影像上下左右移動幾個 像素以增加人臉影像的張數。但是在本虹膜辨識系統 中,由於擷取虹膜影像時,有經過瞳孔中心定位的動 作,若對虹膜影像上下左右移動幾個像素,在經過瞳 孔中心定位後,與之前未移動的虹膜影像比較起來,

完全不會有任何改變,因此我們使用旋轉虹膜影像的 方法,以增加每位使用者的資料量,且藉由產生旋轉 的資料作為測試,也可以檢驗系統對於虹膜影像旋轉 問題的解決能力。

旋轉的方法是藉由3.1節討論影像展開時所取的 起始角度不同來達成。我們對每個使用者的資料產生 正、負5度經由旋轉的資料,則每個使用者的樣本特徵 向量數增加為60個(由原本的20張影像產生的20個特 徵向量加上新產生的40個)。我們將原始未經過旋轉的 資料(每位使用者20個特徵向量)當作試驗一,並從每 個人的資料庫中取出4個特徵向量作為訓練資料,剩餘 16個作為測試資料。另外,增加旋轉影像的資料(每位 使用者60個特徵向量)當作試驗二,從資料庫中取出每 個人12個特徵向量作為訓練資料,剩餘48個作為測試 資料。

5.1 前置處理對人眼虹膜辨識系統的影響

本系統的影像前置處理包含了兩個部分,一個是 影像增強,另一個是雜訊抑制;影像增強在實驗中討 論 了 兩 個 方 法 , 分 別 為 直 方 圖 等 化 與 同 態 濾 波 (homomorphic filter),而雜訊抑制也討論了兩個方法,

分別為低通高斯濾波器與中值濾波器。為了使實驗的 環境與條件一致,特徵抽取的選擇上皆為不使用任何 特徵抽取方法,即虹膜影像展開後經由馬賽克法所得 到的向量不經特徵抽取直接用於辨識。又分類法則皆 採用歐幾里德距離計算。

在實驗中,由於高斯濾波器的尺寸在5

×

5與7

×

7 時,會導致虹膜紋路過於模糊而使得特徵受到破壞,

因此實驗所使用的高斯濾波器尺寸為3

×

3,同理,中 值濾波器的尺寸也是採用3

×

3。我們分別進行了直方 圖等化 + 高斯濾波器、直方圖等化 + 中值濾波器、同 態濾波器 + 高斯濾波器、同態濾波器 + 中值濾波器等 配合歐幾里德距離的辨識實驗,其結果如表1所示。

表1 不同的影像前置處理方法對辨識率的影響 受測資料

辨識 試驗一 試驗二

前置 結果 處理方法

辨識率 (%)

辨識時間 (秒/張)

辨識率 (%)

辨識時間 (秒/張) 直方圖等化+

高斯濾波器 94.77 1.23394 94.76 6.65679 直方圖等化+

中值濾波器 87.04 1.23372 86.25 6.76530 同態濾波器+

高斯濾波器 84.49 1.23743 83.37 6.77423 同態濾波器+

中值濾波器 71.24 1.23433 73.19 6.66331

(8)

由表1可看出本系統中,在試驗一的部分,前置處 理使用直方圖等化比同態濾波器的辨識率高,而前置 處理使用高斯濾波器的辨識率也比中值濾波器高。而 在試驗二中,實驗所表現出來的結果也與試驗一相 符,因此前置處理方法中,直方圖等化配合高斯濾波 器對於辨識的效果會最好。

另外,在辨識所消耗的時間上,由於試驗一的每 個使用者的虹膜影像資料張數較少,所以消耗的時間 較少。試驗二中每個使用者的虹膜影像張數為試驗一 的3倍,因此所須辨識的時間也較多。

5.2 特徵抽取對人眼虹膜辨識系統的影響

本系統所選擇的特徵抽取方法有兩個;一個是主 成 份 分 析 (PCA) , 另 一 個 是 直 接 線 性 鑑 別 分 析 (DLDA)。為了顯示特徵抽取對本系統效能的重要性,

也與未使用特徵抽取方法的辨識效能做比較。另外,

在影像前置處理的部分,所使用的是直方圖等化配合 高斯濾波器,而在分類器的選擇上使用歐幾里德距離。

在我們的實驗中,由不同的特徵抽取方法所得到 的特徵向量的維度皆不同。若不使用特徵抽取的方 法,則直接使用經由馬賽克法所產生的虹膜向量做辨 識,其維度為270。而由馬賽克法所得到的虹膜向量經 由 PCA 特 徵 抽 取 後 , 我 們 取 前 10 大 的 本 徵 值 (eigenvalue)所對應的本徵向量(eigenvector)作為其特 徵向量(feature vector),它的維度為10,而經由DLDA 特徵抽取後所得到的特徵向量維度則由系統所給定的 門檻值來取得,它會隨著實驗數據的不同而有所差 距,大約為13~14個維度。表2顯示了不同的特徵抽取 方法對辨識率的影響。

表2 不同的特徵抽取方法對辨識率的影響 受測資料

辨識 試驗一 試驗二 特徵 結果

抽取方法

辨識率 (%)

辨識時間 (秒/張)

辨識率 (%)

辨識時間 (秒/張) 不使用特徵

抽取 94.77 1.24324 94.76 6.79603 PCA 95.25 0.22791 95.43 0.43862 DLDA 95.93 0.21925 96.72 0.42335 由表2可看出,在資料量較少時,PCA與DLDA對 辨識率的效能提升較不明顯,PCA與不使用特徵抽取 方法的效能比較,約可提升0.5%,而DLDA與不使用 特徵抽取方法的效能比較,約可提升1.2%;若加大資 料量後,PCA與不使用特徵抽取方法的效能比較,約 可提升0.7%,而DLDA與不使用特徵抽取方法的效能 比較,約可提升2.0%。由實驗證實,DLDA在解決分 類的問題上,比起PCA有較好的效果。

在所消耗的時間上,很明顯地,若特徵點較多且 不使用特徵抽取方法時,由於每筆資料的維度皆為270 維,且特徵點又多的情況下,在辨識時所需的計算量 非常大,因此消耗的時間也是使用PCA或DLDA的十 幾倍,而且隨著辨識的次數增加,時間也會慢慢增加,

由此數據可知,使用特徵抽取對於縮短辨識時間有很 大的幫助。

5.3 分類法則對人眼虹膜辨識系統的影響

在第4章中,我們討論了四種分類法則,分別是歐 幾 里 德 距 離 或 稱 為 最 近 鄰 居 法 、 最 近 特 徵 線 法 (NFL) , 最 近 特 徵 平 面 法 (NFP) 與 最 近 特 徵 空 間 法 (NFS);此處,我們將討論這四種方法對於本系統辨識 率的好壞。

在試驗二的實驗中,由於最近特徵平面法是由同 一類別中任意三個點產生一個平面,若類別中的特徵 向量個數少的情況下(如試驗一),則計算量在一般的 個人電腦上還能負荷,可是在本試驗中每個人的特徵 向量數有60個,因此對每個類別需產生 C 3 60 =34,220 個平面,而且還需計算投影與距離,這對一般的個人 電腦幾乎無法負擔這樣的計算。在我們測試時,每次 辨識的時間皆超過5秒以上,且隨著辨識次數的增加,

時間也幾乎呈倍數的增加,以致系統無法運作,因此 在此試驗中,我們不測試最近特徵平面的辨識率與辨 識時間。

另外,最近特徵空間法是將整個類別中的所有特 徵點產生辨識所需的特徵空間,這種方法可能會使得 不同類別所產生的空間有互相交錯的情形,而導致辨 識率的下降。解決此問題的有效方案,就是採用門檻 值來判斷使用最近特徵空間法或是使用另一個分類法 以提高辨識率。在此,我們選擇的門檻值為最近特徵 空間法的分類結果中第二名與第三名距離的差(定為

T ) ,若第一名與第二名的差大於

h

T ,則使用最近特

h 徵空間法分類的結果作為辨識結果,若第一名與第二 名的差小於 T h ,則系統的分類器採用最近特徵線法。

表3顯示不同的分類法則對辨識效能的影響,其中影像 前置處理使用直方圖等化配合高斯濾波器,而特徵抽 取使用DLDA。

表3 不同分類法則的辨識效能 受測資料

辨識 試驗一 試驗二 分類 結果

法則 辨識率

(%)

辨識時間 (秒/張)

辨識率 (%)

辨識時間 (秒/張) NN 95.93 0.22713 96.72 0.43725 NFL 96.47 0.54683 98.50 2.23862 NFP 95.82 1.41925 N/A N/A NFS 90.33 0.73693 88.15 2.71836 由於我們所使用的是改良過的最近特徵線法,由 試驗一可看出,其辨識率在我們所選擇的四個分類方 法中是最高的。在試驗二中,由於每個類別內的特徵 點個數都增加了,其辨識率更可以提高約2%;由此可 知,改良過的最近特徵線法對於分類的問題有最好的 表現。在實驗的過程中,我們也測試了系統對特徵向 量訓練時所耗費的時間,如表4所示。由此表可看出,

系統在對資料庫內的特徵向量作訓練時,所需要的訓

練時間並不會太多,由以上幾個小節的實驗也顯示了

系統無論在訓練或是辨識上皆有很好的表現。

(9)

表4 不同的特徵抽取方法在訓練時所需的時間(秒) 受測資料

特徵抽取方法

試驗一 訓練時間(秒)

試驗二 訓練時間(秒) 不使用特徵

抽取 0 0

PCA 10.33781 12.25839 DLDA 11.16846 13.75993

6.

結論

生物識別系統是最近

幾年很熱門的研究主題,作為生物識別的許多生 理特徵中,虹膜由於擁有唯一性和穩定性,所以用它 來辨識身份可以說是在生物識別領域中最具有潛力 的。

本報告提出了一個結合直接線性鑑別分析與最近 特徵分類法的虹膜辨識系統。首先,系統由網路攝影 機擷取人眼影像並使用統計式演算法找出瞳孔區域,

接著使用八方向的瞳孔中心定位器與環型邊界檢測 器,配合影像處理的方法得到獨立且適於辨識的虹膜 影像。分離出虹膜影像後,使用極座標轉換直角座標 達到展開虹膜影像與正規化的目的,藉由展開虹膜影 像也解決了虹膜影像旋轉的問題。而使用直接線性鑑 別分析做特徵抽取,所產生出來的特徵向量擁有最大 類別間距離與最小類別內距離的特性。最後,使用改 良式的最近特徵線法作為決策法則。

本系統經由實驗展現了絕佳的辨識率,在樣本特 徵向量數較少的情況下辨識率有96.47%,若在每個類 別中增加樣本特徵向量的個數,則系統的辨識率更可 以達到98.50%。

參考文獻

[1] R. Johnson, “Can iris patterns be used to identify people?” Chemical and Laser Sciences Division

LA-12331-PR, Los Alamos National Laboratory,

Los Alamos, California, 1991.

[2] J. G. Daugman, “High confidence visual recognition of persons by a test of statistical independence,” IEEE Transactions on Pattern

Analysis and Machine Intelligence, vol. 15, no. 11,

pp. 1148-1161, 1993.

[3] J. G. Daugman, “High confidence recognition of persons by iris patterns,” in Proc. of the IEEE Int.

Conf. on Security Technology, pp. 254-263, 2001.

[4] R. Wildes, J. Asmuth, G. Green, S. Hsu, R.

Kolczynski, J. Matey, and S. McBride, “A machine vision system for iris recognition,”

Machine Vision and Applications, vol. 9, pp.1-8,

1996.

[5] R. Wildes, “Iris recognition: an emerging biometric technology,” Proceedings of the IEEE, vol. 85, no. 9, pp. 1348-1363, 1997.

[6] J. G. Daugman, “Complete discrete 2-D Gabor transforms by neural networks for image analysis and compression,” IEEE Transactions on Acoustic,

Speech, and Signal Processing, vol. 36, no. 7, pp.

1169-1179, 1988.

[7] L. Ma, Y. Wang, and T. Tan, “Iris recognition using circular symmetric filters,” in Proc. of the 16th Int.

Conf. on Pattern Recognition, vol. 2, pp. 414-417,

2002.

[8] 施嘉南,使用馬賽克與最大量測路徑法於自動 人眼虹膜辨識系統之應用,電機工程系碩士論 文,國立台灣科技大學,台北市,民國 92 年。

[9] Y. Liu, S. Yuan, X. Zhu, and Q. Cui, “A practical iris acquisition system and a fast edges locating algorithm in iris recognition,” in Proc. of the 20th

IEEE Conf. on Instrumentation and Measurement Technology, vol. 1, pp. 166-168, 2003.

[10] Y. P. Huang, S. W. Luo, and E. Y. Chen, “An efficient iris recognition system,” in Proc. of the

Int. Conf. on Machine Learning and Cybernetics,

vol. 1, pp. 450-454, 2002.

[11] 楊恩典,主成份分析法在動態系統監控上之應 用,化學工程學系碩士論文,國立台灣大學,

台北市,民國 89 年。

[12] 林咸仁,改良線性鑑別式分析在少量訓練樣本 下之人臉辨識研究,資訊工程學系碩士論文,

國立成功大學,台南市,民國 91 年。

[13] 王君楷,結合支向機技術發展之自動人臉辨識 系統,電機工程系碩士論文,國立台灣科技大 學,台北市,民國 92 年。

[14] D. L. Swets and J. J. Weng, “Using discriminant eigenfeatures for image retrieval,” IEEE

Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 8, pp. 831-836, 1996.

[15] H. Yu and J. Yang, “A direct LDA algorithm for high-dimensional data with application to face recognition,” Pattern Recognition, vol. 34, no. 10, pp. 2067-2070, 2001.

[16] S. Z. Li and J. Lu, “Face recognition using the nearest feature line method,” IEEE Transactions

on Neural Networks, vol. 10, no. 2, pp. 439-443,

1999.

[17] 吳佳珍,以鑑別性小波參數為主之人臉辨識系 統,資訊工程學系碩士論文,國立成功大學,

台南市,民國 90 年。

[18] J. T. Chien and C. C. Wu, “Discriminant waveletfaces and nearest feature classifiers for face recognition,” IEEE Transactions on Pattern

Analysis and Machine Intelligence, vol. 24, no. 12,

pp. 1644-1649, 2002.

[19] M. Nagao, M. Yamamoto, K. Suzuki, and A.

Ohuchi, “MTS approach to facial image recognition,” in Proc. of IEEE Int. Conf. on

Systems, Man, and Cybernetics, vol. 4, pp.

937-942.

參考文獻

相關文件

基因編輯技術以人工核酸酶辨識特定 DNA 位置,並於此處切斷雙股 DNA。DNA 斷

從視覺藝術學習發展出來的相關 技能與能力,可以應用於日常生 活與工作上 (藝術為表現世界的知

在基礎教育階段,學生通過視覺藝術評賞、視覺藝 術創作和視覺藝術知識 三個學習範疇

Flash 動畫網頁時,會先偵測電腦的 Flash Player 版本,如果是可接受的 Flash Player 版本,SWF 就會順利播放;如果電腦中沒有檢視 SWF 所需的

科目: 中文 英文 數學 常識 視覺藝術 體育 音樂 普通話 電腦

MASS::lda(Y~.,data) Linear discriminant analysis MASS::qda(Y~.,data) Quadratic Discriminant Analysis class::knn(X,X,Y,k,prob) k-Nearest Neighbour(X 為變數資料;Y 為分類)

本研究主要以 But-for 崩塌竣工時程分析技術為基礎進行理論推導,確認此延遲分析技術 計算邏輯之問題與完整性,之後提出修正之計算邏輯,使

Keywords: Aerial Image, Runway Recognition, Runway Detection, Hough Transform, Width