• 沒有找到結果。

區域式主動表現模型演算法應用於人臉特徵匹配

N/A
N/A
Protected

Academic year: 2021

Share "區域式主動表現模型演算法應用於人臉特徵匹配"

Copied!
64
0
0

加載中.... (立即查看全文)

全文

(1)

國 立 交 通 大 學

電機與控制工程學系

碩 士 論 文

區域式主動表現模型演算法應用於人臉特徵匹配

Local Active Appearance Models Using For Face

Feature Matching

研 究 生:林育弘

指導教授:林進燈 博士

中華民國九十六年 七 月

(2)

區域式主動表現模型演算法應用於人臉特徵匹配

Local Active Appearance Models Using For Face Feature

Matching

研 究 生:林育弘 Student:Yu-Hung Lin

指導教授:林進燈 博士

Advisor:Dr. Chin-Teng Lin

國立交通大學

電機與控制工程學系

碩士論文

A Thesis

Submitted to Department of Electrical and Control Engineering

College of Engineering and Computer Science

National Chiao Tung University

in Partial Fulfillment of the Requirements

for the Degree of Master

in

Electrical and Control Engineering

July 2007

Hsinchu, Taiwan, Republic of China

(3)

區域式主動表現模型演算法應用於人臉特徵匹配

學生:林育弘

指導教授:林進燈 博士

國立交通大學電機與控制工程研究所

中文摘要

中文摘要

以主動表現模型為基礎,提出一個新的模型建立方法:區域式主動表現模 型。主動表現模型目前應用廣泛,它結合形狀與紋理的資訊,使用主成分分析法 建立一個統計模型。在主動表現模型特徵匹配中,使用模型紋理與影像紋理資訊 的差異預測模型參數的走向而得到最佳的匹配。 由觀察得知,人臉主要變化的區域為眼睛與嘴巴,而且彼此間變化大致上 獨立。所以在擷取形狀與紋理資料後,我們將形狀與紋理資料分成三個區域:眼 睛、嘴巴、其他區域。每個區域都有自己的形狀與紋理資訊。將這三個區域分別 利用主成分分析法各自建立三個獨立模型:眼睛、嘴巴與其他區域模型。將三個 模型結合即為我們提出的區域式主動表現模型。 區域式主動表現模型使用區域式的紋理相減差異去預測模型參數,各模型間 的收斂獨立運作。而位移參數則用全域紋理相減差異來預測。由實驗可得 1)區域 式主動表現模型模擬效果表現較主動表現模型佳。2)因為區域式主動表現模型的 區域各自獨立,不需考慮到資料間變化的排列組合,所以需要的訓練資料較少即 可達到一樣的模擬效果,且在訓練資料較少的情形下,需要挑選的特徵向量較 少,所需提供給模型參數儲存的空間也可以減少,即可用比較小的空間達到一樣 的模擬程度。3)區域式主動表現模型的模型參數各自獨立,所以在人臉特徵匹配 後,若要再做嘴巴眼睛的表情辨識可直接將相關的模型參數直接用來做分類器的 輸入。

(4)

Local Active Appearance Models Using For Face Feature

Matching

Student: Yu-Hung Lin

Advisor: Dr. Chin-Teng Lin

Department of Electrical and Control Engineering

National Chiao Tung University

English Abstract

Abstract

We propose a new model based on active appearance model (AAM), called local active appearance model (LAAM). A popular approach, active appearance model, uses a combined statistical model (PCA) of shape and texture. The AAM searches use the texture residual between the model and the target image to predict improved model parameters to obtain the best possible match..

After observation, we find the eyes and mouth regions of face vary a lot and change nearly independently. After extract facial shape data and texture data from manual labeled images, we divide shape and texture data into three major regions : eyes, mouth, and other region. Each region has their shape and texture information. We form their statistical model of shape and texture. Model of eyes, model of mouth, and model of other are establish. Combining three models, we can get the local active appearance model (LAAM).

LAAM model predict improved model parameters using local texture difference between the model and the target image. The prediction of translation parameter uses global texture difference between the model and the target image. After experiment, we can get conclusion as follow: 1) The LAAM modeling performs better than AAM modeling. 2) Because of the independence character of eyes, mouths and other models. We don’t need to consider about the relation of each region’s expression. For the same performance the training data number can reduce. For the fewer of data number, we can choose fewer number of eigenvector to get the same performance. 3) The LAAM model parameter is independent of each other. If we want to do the classification of the expression of eyes or mouth, the model parameter can be sent to a classifier directly.

(5)

致謝

致 謝

本論文的完成,首先要感謝指導教授林進燈博士這兩年來的悉心指 導,讓我學習到許多寶貴的知識,在學業及研究方法上也受益良多。另外 也要感謝口試委員們的建議與指教,使得本論文更為完整。 其次,感謝實驗室鶴章學長、得正學長與所有學長姊、學弟妹們在研 究過程中所給我的鼓勵與協助,在理論及程式技巧上給予我相當多的幫助 與建議,讓我獲益良多。 感謝我的父母親對我的教育與栽培,並給予我精神及物質上的一切支 援,使我能安心地致力於學業。此外也感謝姊姊對我不斷的關心與鼓勵。 謹以本論文獻給我的家人及所有關心我的師長與朋友們。

(6)

章節目錄

中文摘要 ...ii

English Abstract... iii

致謝...iv 章節目錄 ...v 表格目錄 ...vii 圖片目錄 ... viii 1 第一章 緒論 ...1 1.1 研究動機...1 1.2 研究目的...1 1.3 系統流程...2 1.4 論文大綱...4 2 第二章 相關研究 ...5 3 第三章 區域性主動表現模型建模 ...8 3.1 形狀資訊擷取...8 3.1.1 形狀校準...9 3.2 紋理校正...11 3.2.1 紋理資料點校準...11 3.2.2 紋理資料點亮度校準...13 3.3 區域性主動表現模型建模...14 3.3.1 主成分分析...14 3.3.2 區域性主動表現模型建模...16 4 第四章 區域式主動表現模型定位演算法 ...21 4.1 人臉影像差異...21 4.2 模型更新演算法...27 5 第五章 實驗結果 ...31 5.1 實驗設計...31 5.1.1 人臉表情定義...31 5.1.2 人臉資料特色...32 5.2 區域表現模型之模型建立測試...33 5.3 區域表現模型之人臉特徵定位測試...42

(7)

6 第六章 結論與未來展望 ...48

6.1 結論...48

6.2 未來展望...50

(8)

表格目錄

表 1 : 主動表現模型與區域式主動表現模型比較 ...35 表 2 : 主動表現模型與區域式主動表現模型比較(二) ...36

(9)

圖片目錄

圖 1-1 : 區域式主動表現模型定位結果 ...2 圖 1-2 : 系統架構 ...3 圖 3-1 : 四個相同形狀的笑臉,但不同的位置、大小、角度...8 圖. 3-2 : (左)定義的形狀資料點分布 (右)實際手工標定的結果 ...9 圖. 3-3 : (左)未處理的形狀資訊 (右)校正過後的形狀資訊 ...11 圖. 3-4 : 臉部標定點(左) 人臉三角形化網狀圖(右) ...12 圖 3-5 : 三角形之間的轉換...12 圖 3-6 : 三角形化紋理資訊擷取...13 圖 3-7 : 亮度對模型的影響:(第一列)輸入圖形 (第二列)模擬結果...14 圖 3-8 : 區域式主動表現模型流程圖 ...16 圖 3-9 : 手動標定影像取出形狀與紋理資訊 ...16 圖 3-10 : 眼部、口、其它部分三個區域的形狀與紋理資訊 ...17 圖 3-11 : 區域式主動表現模型眼睛區域前四個參數ceye ±3

σ

eye的影響 ...19 圖 3-12 : 區域式主動表現模型嘴巴區域前四個參數cmouth ±3

σ

mouth的影響 ...19 圖 3-13 : 區域式主動表現模型其他區域前四個參數cother ±3

σ

other的影響 ...20 圖 3-14 : (比較)主動表現模型前四個參數

c

±

3

σ

的影響...20 圖 4-1 : 區域式主動表現模型 – 模型預測因子 R 的訓練流程圖 ...25 圖 4-1 : 區域式主動表現模型 – 模型預測因子 R 的訓練流程圖(二) ...26 圖 4-3 : 區域式主動表現模型 – 人臉特徵定位演算法流程圖 ...29 圖 4-4 : 區域式主動表現模型 – 人臉特徵定位演算法流程圖(二) ...29 圖 5-1 : 臉部表情定義 ...31 圖 5-2 : 人臉標定資料 ...33 圖 5-3 : 區域主動表現模型維度 ...34 圖 5-4 : 模型測試流程圖 ...35 圖 5-5 : LAAM AMM 模擬差異 ...38 圖 5-6 : 嘴巴區域形狀模擬誤差 ...39 圖 5-7 : 嘴巴區域紋理模擬誤差 ...39 圖 5-8 : 眼睛區域形狀模擬誤差 ...40 圖 5-9 : 眼睛區域紋理模擬誤差 ...40 圖 5-10 : 其他區域形狀模擬誤差 ...41 圖 5-11 : 其他區域紋理模擬誤差 ...41

(10)

圖 5-12 : 人臉偵測結果 ...42 圖 5-13 : 區域式主動表現模型 – 人臉特徵定位演算法結果 ...44 圖 5-14 : 區域式主動表現模型 – 人臉特徵定位演算法結果(人臉一) ...45 圖 5-15 : 區域式主動表現模型 – 人臉特徵定位演算法結果(人臉二) ...45 圖 5-16 : 區域式主動表現模型 – 人臉特徵定位演算法結果(人臉三) ...46 圖 5-17 : 區域式主動表現模型 – 人臉特徵定位演算法結果(人臉四) ...46 圖 5-18 : 區域式主動表現模型 – 人臉特徵定位演算法結果(人臉五) ...46

(11)

1

第一章

緒論

1.1 研究動機

與人臉相關的研究在電腦視覺領域中佔有重要的地位,如人臉辨識技術 應用在非侵入式生物認證、保全門禁系統、犯罪資料庫搜尋…等。表情辨識 技術應用於人類與電腦間的互動。在人臉辨識或表情辨識之前,需要先定位 人臉五官精確位置才能提供正確的資料給辨識系統。。一般會直接以人臉偵 測系統的輸出結果當作人臉辨識或表情辨識的輸入資料,但由於臉型與五官 比例的差異性,假若我們直接使用人臉偵測系統的輸出結果當作訓練資料, 在同樣的資料區段描述的不一定是相同的五官位置,會隨著人臉的不同而有 位置上的偏移差異。一般的人臉偵測系統只能給定人臉的大略位置與大小, 所以在人臉偵測過後仍需要人臉特徵點定位系統的輔助找到五官的精確位 置。得到人臉五官精確位置能夠幫助人臉辨識、人臉建模擷取特徵的正確 性。所以研究人臉特徵點定位是研究人臉辨識、人臉建模、表情辨識的一個 基礎,所以人臉特徵點定位是一個關鍵性的技術,應用廣泛,人臉特徵點定 位的精確與否,會影響之後應用的效果。

1.2 研究目的

在人臉偵測系統偵測出大致人臉位置與大小後能夠精確的鎖定人臉特徵(眼 睛、嘴巴、鼻子…等)與特徵的輪廓。利用可變形的形狀與紋理模型(在此,紋理 是指人臉位置上的亮度值),對一個新影像做匹配追蹤。實驗中,使用人臉為偵 測的物體,此方法能同時在靜態影像與動態影片中自動地找到人臉形狀特徵,如:

(12)

眼睛、嘴巴四周…等,正確地匹配五官位置還有人臉紋理特徵。如圖 1-1 所示, 有一等待定位的人臉影像,由初始圖(左一),一開始只知道人臉大略的大小與位 置(由人臉偵測系統得知),將我們之前建立的平均模型投影至初始偵測位置,經 由人臉特徵匹配程式收斂,由圖中(左二)程式第三次迴圈、(左三)程式第八次迴 圈到(右三)程式收斂,可以觀察到模型整體位置與模型的人臉形狀有逐漸與新影 像匹配正確。所以此程式可正確定位出物體的形狀(右三)與內部紋理的資訊(右 二)。如此可得到精確的五官位置。 圖 1-1 : 區域式主動表現模型定位結果

1.3 系統流程

主動表現模型演算法(Active Appearance Models : AAM) [1]合併形狀與紋 理的資訊建立一個統計模型,主動表現模型演算法的匹配搜尋以統計模型為基 礎,使用模型與目標影像的差異去預測模型與位移參數如何改變去得到最佳匹 配。我們以主動表現模型演算法為基礎,在統計模型方面提出區域性主動表現模 型(Local Active Appearance Models : AAM),對於物體中趨近於獨立變化部分, 如:人臉中的眼睛與嘴巴。將這些區域各自獨立(眼睛區域、嘴巴區域與其他區域) 以主成分分析法(PCA)製作區域式統計模型,再做人臉上的結合形成區域式主動 表現模型,區域式主動表現模型比主動表現模型更能夠精確的模擬出人臉的形狀

(13)

與紋理表情。 圖 1-2 : 系統架構 在追蹤特徵形狀與紋理部份,區域式主動表現模型使用區域式的紋理相減差 異去預測模型參數,而位置、大小、旋轉參數則用全域紋理相減差異來預測其收 斂數值。在預測的步驟中由於速度上的需求,在預測各參數的改變大小的最佳化 步驟使用的預測因子 R 由訓練資料計算得知。 系統在實際執行的流程如圖 1-2 所示,輸入的初始人臉影像經由人臉偵測系 統偵測出大致的人臉大小與位置,再經由特徵匹配系統得到精確的人臉形狀與紋 理資訊。經由錯誤判斷決定此次的結果是否有真正收斂。若有真正收斂則以此次 的結果當作下一張影像的初始值繼續由特徵匹配系統得到精確的人臉形狀與紋 理資訊。若錯誤太大則下一張影像回到初始的人臉偵測系統偵測大略的人臉大小

(14)

與位置再經由特徵匹配系統得到精確的人臉形狀與紋理資訊。而在特徵匹配系統 中,需要先訓練區域式主動表現模型與訓練預測因子 R 才能夠建立特徵匹配系統 。

1.4 論文大綱

本文章節依序為第二章介紹相關研究,回顧人臉特徵點定位的相關論文。第 三章介紹區域性主動表現模型建模,第四章敘述區域性主動表現模型匹配追蹤演 算法,第五章為研究結果,第六章則是結論。

(15)

2

第二章

相關研究

許多學者發表過建立一個表現統計模型並對一影像中的物體做匹配搜尋的方 法。Nastar 等人 [2] 利用三維可變形亮度模式建立一個形狀與亮度變化的模 型,模型維度為XYI,模型建立使用主成分分析法。他們利用最接近點表面匹配 演算法(closest point surface matching algorithm)混合光流追蹤法與可變形 形狀匹配法執行追蹤。使得在變形物體的影像匹配上更穩定而且更有效率,對於 影像中因為遮蔽物遮蔽而被隱藏的區域可以模擬出原本的圖像。因為他們利用最 接近點表面匹配演算法,對於初始值的比重佔很大的因素。Lantis 等人 [3] 與 Edwards 等人 [4] 用主動式形狀模型(Active Shape Model)找到最好的形狀, 然後利用此形狀去與物體的紋理模型做比對。[3][4]使用標定點分佈模型 (Points Distribution Models)提供了一個在任何情況下能完整參數化地敘述形 狀,可以應用在不同解析度下,主動式形狀模型(Active Shape Model)搜尋中的 形狀定位。Poggio 等人 [5],[6]除了形狀與紋理上的預測,額外預測人臉姿勢 的變化情形。使用合成網路模組模擬人臉的姿勢,並根據隨機梯度遞減演算法 (stochastic gradient descent algorithm)開發適合合成網路模組應用的合成 分析演算法收斂人臉姿勢與人臉形狀紋理資料。Vetter [7] 使用一般的最佳化 方法讓高解析度的人臉模型與影像做匹配。其中使用3D人臉模型的線性物體分類 法(linear object class approach)產生多方向的人臉,形狀與紋理資訊分開處 理,形狀方面使用線性形狀近似調整人臉視角方向,紋理方面使用線性紋理近似 加入紋理的資訊。最後兩個方法因為問題維度過高與模型品質過高使得執行速度 較慢。在追蹤領域中,快速的模型匹配演算法是一個很熱門的議題,Gleicher [8] 利用一個可變形(利用很多變換如放射,投影等)單一模板,選擇參數使誤差最 小,此方法會先計算參數變化時對可變形單一模板的差分方程式。在追蹤上提出 誤差分解法(difference decomposition method):最佳化為基礎的方法,對於非 線性上的追蹤有較佳的穩定性,對於非線性上的追蹤搜尋的影像區域較小而且可

(16)

以分隔較多張後的影像也能穩定追蹤到。並且提出分段式的放射可變形單一模板 較單一放射可變形單一模版更能較佳的趨近變形的圖形。Hager 與 Belhumeur [9] 承 襲 Gleicher , 加 上 光 影 變 化 的 模 型 使 穩 健 性 加 強 , 其 最 佳 化 以 (sum-of-squared different SSD)為基礎,優點為可以克服光影變化所造成的追 蹤錯誤。Sclaroff 與 Isidoro [10] 使用有限元素低能量法,模型建立方面使 用彩色的紋理投影三角形網狀模型(texture-mapped triangular mesh model),

並使用主動式塗抹法(Active Blob Method),追蹤以彩色為基礎紋裡豐富之物體 為目標,此方法已經用來追蹤頭部[11] 使用不變形的圓錐頭部模型。還有很多 電 腦 視 覺 技 術 例 子 結 合 形 狀 與 紋 理 的 模 型 然 後 與 新 的 影 像 做 匹 配 [1][12][13][14]T.F. Cootes 等 人 [1] 提 出 的 主 動 式 表 現 模 型 (Active Appearance Model)演算法,使用合併形狀與紋理的統計模型,接著在追蹤上, 使用模型與目標影像的差異去預測模型參數如何改變去的到最佳匹配,實驗上以 人臉為追蹤目標。被廣泛應用於各方面。 Hou XW 等人 [16] 以主動式表現模型 為基礎提出直接式表現模型,直接使用紋理資訊直接預測形狀與紋理與位置,而 且在新的人臉位置與紋理上的預測基礎使用模型與目標影像差異的主成分分析。 Song Gang等人[15]提出將 Lucas-Kanade 光 流 跟 蹤 演 算 法 與 人 臉 特 徵 點 定 位 的 统 计 模 型 DAM(direct appearance model)在Bayesian框架下结合起来,提出了视频中人脸特徵定位與 跟踪的一種混合模型方法。其中使用兩層直接表現模型DAM(direct appearance model),分別為高解析度的直接表現模型與低解析度的直接表現模型,高解析度 的直接表現模型對於人臉的細節如五官變化…等能夠精確的模擬。而低解析度的 值皆表現模型能夠較穩定的追蹤人臉的位置。所以若高解析度的直接表現模型若 追蹤失敗,會以低解析度的直接模型追蹤找回失去的人臉再交由高解析度的直接 表現模型追蹤,增加人臉追蹤的穩定性。D. Cristinacce 等人 [17] 提出樣板 選取追蹤演算法(template Selection Tracker TST),建立ㄧ組形狀與紋理資料 庫首先以紋理為基礎對資料庫做Nearest Neighbor Selection,選取最接近的幾 個資料,使用Nelder-Meade提出的A simplex method for function minimization 作形狀參數的最佳化,主要為儲存特徵樣板之後以形狀限制搜尋技術收斂形狀參

(17)

數定位人臉五官的位置。 本論文以主動式表現模型為基礎,在建立模型部分,將物體中變化較多樣且 可分別運作的部份獨立出來(如人臉中的眼睛與嘴巴部分),分別去做主動式外表 模型。在追蹤演算法中,因為執行速度上的要求,最佳化步驟中需要的預測因子 R 是由訓練資料得到。修改其中追蹤的步驟預測物體位置、大小、旋轉角度與形 狀與外表。其技術方法在第三章與第四章中有詳細的介紹。

(18)

3

第三章

區域性主動表現模型建模

在本章裡,說明區域性主動表現模型建立模型的方法,主要步驟為取出校正 過後(位置、尺寸、角度)的形狀資料與校正(數量、亮度)過後的紋理資料,將形 狀與紋理參數分離成眼睛、嘴巴與其他部分三個不同的資料群,接著利用主成份 分析法將各部份選取重要資訊,建立模型。

3.1 形狀資訊擷取

D.G. Kendall [18] 在Statistical Shape Analysis.中對於形狀的定義如定義一所示: 定義一: 形狀 是一個物體將位置、大小、旋轉的效應都濾除剩下來所有的幾何 資訊。 圖 3-1 : 四個相同形狀的笑臉,但不同的位置、大小、角度 圖3-1有四個笑臉,由定義一我們可以知道這四個笑臉有相同的形狀,差異 只在她們有不同的位置、大小與角度。所以想要單純擷取物體形狀資訊那我們就 要濾除位置、大小、角度上的干擾。對一個形狀的描述,我們可以標定一定數目 的點在圖形的輪廓周圍,並以那些點的座標值來代表此圖形的形狀。而對一個n 個點,k維度的形狀,可將每個維度結合成一個kxn的向量。對一個平面形狀的描 述將會是:

[

]

T n n y x y x y x X = 1, 1, 2, 2,K, , (3.1) 由定義一可知,我們在擷取形狀資訊,必須將位置、大小、旋轉因素消除,才能

(19)

真正算是形狀的資訊,所以我們由一張影像中擷取出標定點後還需對位置、大 小、旋轉因素做調整的動作。 我們首先定義形狀資料點的分布,人臉的特徵主要來自於眉毛、眼睛、鼻子、 嘴巴與人臉輪廓。所以我們將這些區域以58個資料點標定出來。如圖3-2(左) 為我們定義的形狀資料點分布,圖3-2(右)為實際手工標定的結果。 圖. 3-2 : (左)定義的形狀資料點分布 (右)實際手工標定的結果

3.1.1 形狀校準

執行形狀校準時,依序為這四個步驟: 1. 計算每個形狀的中心點。 2. 調整每個形狀至一定大小。 3. 調整原點座標至形狀的中心點。 4. 校正角度誤差。 有關中心點的計算如下:

(

)

⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = −

= = n j j n j j y n x n y x 1 1 1 , 1 (3.2) 為了要進行第二個步驟,我們需要建立一個形狀尺寸的量測標準。

(20)

定義二: 形狀尺寸的量測標準

S

( )

X

一個形狀向量帶入是一個恆正實數的函 數,而且符合下面的特性:

( )

aX aS

( )

X S = (3.3) Frobenius norm 用來當作形狀尺寸的量測標準:

( )

= − + − = n j j j x y y x X S 1 2 2 ] ) ( ) [( (3.4) 另一種狀尺寸的量測標準:

( )

− − + − = n j j j x y y x X S 1 2 2 ] ) ( ) [( (3.5)

第四步驟使用奇異值分解(Singular Value Decomposition : SVD):

1. 將已經完成尺寸與位置校正的兩個形狀X1與X2轉換成 n x k 的矩陣(在 平面形狀中 k=2) 2. 計算X1TX2的 SVD, T UDV 3. 用來根據X2調整X1的旋轉矩陣就是 T VU ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − = ) cos( ) sin( ) sin( ) cos( θ θ θ θ T VU (3.6) 圖 3-3 中綠色資料點代表眉毛形狀、紅色資料點代表眼睛形狀、淺藍色資料點代 表鼻子形狀、黃色資料點代表嘴巴形狀、藍色資料點代表人臉輪廓形狀。圖 3-3(左) 顯示訓練資料的形狀資訊在未處理前的資料分佈情形,其分布點非常雜亂,許多 區域的分布相互重疊,如:眼睛與眉毛區域、眼睛與鼻子區域、鼻子與嘴巴區域、 嘴巴下半與人臉輪廓區域。經由上面所述執行過位置、角度、大小的校正後,結 果如圖 3-3(右)所示各點的分布情形很清楚。

(21)

圖. 3-3 : (左)未處理的形狀資訊 (右)校正過後的形狀資訊

3.2 紋理校正

以下介紹擷取紋理資訊的方法,將形狀標定點作三角形化,由每個三角形取 出固定量的紋理資訊點數,對亮度做調整。

3.2.1 紋理資料點校準

由於要用統計模型製作人臉模型,人臉形狀與紋理資料數目大小必須固定 。一般普遍使用的方法即為將人臉周圍用一個四方形定義出範圍,利用一個遮罩 將周圍背景資訊錄除,再將四方形依照某個一定比例正規化,即可得到一定的文 理資料點數。(如圖 3-6 所示)。此方法的缺點是:1.背景資料不易完全去除 2. 人臉的形狀不同,有長形臉與寬型臉的分別,直接對人臉的框做正規化人臉會有 所變形 3.隨著人臉表情的不同,一些區域(如嘴巴的張開與閉合)的總紋理資料 數目也會不同,這會造成之後建立模型時產生資訊的重疊而降低模型的精準度。 所以我們提出另一種紋理資料點數目校正的方法。形狀上的資料量在定義形狀參 數時即可固定(數目為 nxk),我們將人臉標定點定義為 58 個如圖 3-2(左)所示。 而紋理資料會因為人臉形狀上的不同再同一區域中其灰階值數目不盡相同(如: 嘴巴張開與閉合,三角臉與國字臉…等的差異,同一區域中灰階值數目不相同), 所以要做紋理資料擷取數目上的校正。我們需要利用形狀上的資訊,由於形狀標 定點內部即為我們需要的紋理資訊,將形狀標定點作三角形化如圖 3-2(右)所 示,得到一個人臉的三角形化網狀圖。如此以來,對於不同的人臉我們都可以得 到相同數量的三角形,再利用一個一般表情的人臉來定義出每個三角形內部應該 取出紋理資訊的點數與相對位置。即可將人臉紋理特徵點大小值確定。

(22)

圖. 3-4 : 臉部標定點(左) 人臉三角形化網狀圖(右) 兩個人臉經由三角形演算法三角形化後,相互對應的三角形取出紋理資料點 的方法如下,如圖 3-3 所示,若已知 A1、A2、A3、A4、B1、B2、B3 的座標值要 求得 B4 座標值的方法為先計算式子(3.7)中的 a、b 值再帶入式子(3.8)中即可得 到 B4 座標值。圖 3-4 為紋裡資料的擷取成果。 ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − − − 1 4 1 4 1 3 1 2 1 3 1 2 A A A A A A A A A A A A y y x x b a y y y y x x x x (3.7) ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − − − = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ 1 1 1 3 1 2 1 3 1 2 4 4 B B B B B B B B B B B B y x b a y y y y x x x x y x (3.8) 圖 3-5 : 三角形之間的轉換

(23)

圖 3-6 : 三角形化紋理資訊擷取

3.2.2 紋理資料點亮度校準

得到紋理資訊後,為了使模型更穩定,不易受亮度的影響,會對其值做調整,假 設調整前紋理資訊為g ,調整後紋理資訊為b g ,調整方法為: f 100 + − = b b f g g g if gfi >255 gfi =255 (3.9) if gfi <0 gfi =0 fi g 代表g 向量內各點的資訊。 f 圖 3-7 正中央為建立模型的資料之一,模型建立後,若將資料亮度做整體上的 調整,送入模型重新我們會發現亮度差異越大,模型模擬出來的結果會越差。所 以雖然亮度調整為一個簡單的動作但是,對模型好壞的影響很大。

(24)

50 30 20 0 -20 -30 -50 圖 3-7 : 亮度對模型的影響:(第一列)輸入圖形 (第二列)模擬結果

3.3

區域性主動表現模型建模

3.3.1 主成分分析

主成份分析法用於資料的分析已經有一段時間了。主要是用來將多個變量 經過線性變換以選出較少個數重要變量的方法。其中每個變量在數學上的意義 j 為與其他變量正交,也就是不具有交互相關性。於是,我們可以用此方法將原本 包含大量變數的資料用較少的主成份所表示,不但可以達到降維的作用,同時也 能對於一些雜訊(比較不重要的成份)有所過濾。 使用主成份分析的方法,事實上就是在利用奇異值分解法(Singular Value Decomposition) 解出資料的相關變異矩陣(Covariance Matrix) 的特徵值與特 徵向量。參考資料[20]介紹基本的數學概念。假設有一個一維的矩陣X,計算它 的相關變異就等於計算它的自身變異量。

(25)

cov( X )= var( X ) = ( Xi− X ) i−1 n

( Xi − X ) ( n − 1) (3.10) 在此,

X

i表示矩陣 X 的第 i 列,且 X = Xi i= 1 n

n (3.11) 於是,此矩陣的自身的相關變異矩陣為

Cn×n= c

(

i, j,ci, j = cov Dim

(

i,Dimj

)

)

(3.12)

在此, Cn×n 表示這是一個具有 n 行跟 n 列的矩陣。 Dimx 表示第 x 維。 一旦我們得到了一個方形的相關變異矩陣後,即可計算其特徵值與特徵向 量。這些特徵向量彼此互相垂直,但更重要的,它們同時說明了資料量的一些資 訊。我們將這些這些特徵向量與其所對應的特徵值按照大小順序排列,較大的特 徵值所對應的特徵向量包含了資料集中較為重要的資訊。於是,我們可以捨棄掉 一些包含比較少資訊,也就是較不重要的成份,並且不會失去原資料集的大部分 資訊。假設一個資料集最初為 n 維,於是可以計算出 n 個特徵值與特徵向量。若 是我們只選取 p 個特徵向量做為主成份,則原本 n 維的資料,經過處理後,可用 p 維來表示。

(26)

3.3.2 區

域性主動表現模型建模

Local Active Appearance Model Modeling Flow Chart Manual Labeled Face Image Shape Alignment Texture Alignment Shape , Texture Data Extraction Eye Region Shape , Texture Data Mouth Region Shape , Texture Data Other Region Shape , Texture Data PCA for Eye Model PCA for Mouth Model PCA for Other Model Combine LAAM 圖 3-8 : 區域式主動表現模型流程圖 手動標定影像 形狀資訊 紋理資訊 圖 3-9 : 手動標定影像取出形狀與紋理資訊

(27)

區域主動表現模型的模型建立方法流程圖如圖 3-9 所示,由手工標定的人 臉圖形中擷取形狀與紋理資訊,對形狀與紋理資訊做校準,人臉變化性較大的部 分為嘴巴與眼睛,而且其動作為獨立的,所以我在再將人臉整體形狀與紋理的資 訊分成三個部份,再利用主成分分析模擬出眼睛、嘴巴、其他部份的模型 以下簡述本實驗所使用的方法: 先從手動標定的影像取出人臉整體形狀與紋理的資訊(如圖 3-9 所示),我 們在直覺上的判斷,人臉變化性較大的部分為嘴巴與眼睛,而且其動作趨近於獨 立的,所以我在再將人臉整體形狀與紋理的資訊分成三個部份,分別是眼睛部份 的形狀與紋理的資訊,嘴巴部份的形狀與紋理的資訊,其它部份的形狀與紋理的 資 訊,這三個區塊(如圖 3-10 所示),再利用主成分分析法分別對這三個區域計算 特徵值與特徵向量挑選。 圖 3-10 : 眼部、口、其它部分三個區域的形狀與紋理資訊 1. 取得 M 張訓練影像,先由手動標的地影像將人臉整體形狀與紋理的資訊 取出(如圖 3-11 所示) 2. 假設形狀資訊 x:維度(2B,1),紋理資訊 g:維度(A,1),結合排列為 N×1 的向量Γi (=

[

]

T iN i i Γ Γ Γ1, 2,L, ),因為有 M 張影像,則會產生一個 N×M 的矩

(28)

陣。 3.計算平均向量Ψ與標準差σ Ψ = 1 Mi=1Γi M

( ) = Ψ − Γ = M i k ik k M 1 2 1 σ (3.13)

4.

將每個Γi 與平均向量Ψ與標準差σ 做正規化,得到的結果為Φi

5.

計算其相關變異矩陣 C

C= 1 M ΦnΦn T = AAT (N2× N2 matrix) n=1 M

where A= Φ

[

1 Φ2 ...ΦM

]

(N2× M matrix) (3.14)

6.

計算 AAT的特徵向量 u i,基本上會產生 N2個特徵向量,將其從對應的 特徵值由大到小排列。 7. 保留對應前 K 個最大的特徵值的特徵向量。 8. 將訓練影像以這些特徵向量為基底加以表示: 每張影像經過正規化之後的Φi ,可以此 K 個特徵向量作一線性組合來表 示。 Φi= wjuj, (wji T uj) j=1 K

(3.15) 將三者(眼睛部份、嘴巴部分、其他部分的形狀與紋理),以 1.~8.的步驟分 別製作出各自的模型,再將三者合成,即為我們所要介紹的區域式主動表現模型 區域式主動表現模型也可以轉換成以下表示法, eye x 、xmouthxother:眼睛、嘴巴、其它部份的形狀資訊。 eye xxmouthxother:眼睛、嘴巴、其它部份的形狀資訊平均。 eye ggmouthgother:眼睛、嘴巴、其它部份的紋理資訊。 eye ggmouthgother:眼睛、嘴巴、其它部份的紋理資訊平均。 eye s Q_Qs_mouthQs_other:眼睛、嘴巴、其它部份有關形狀的特徵向量。 eye g Q _ 、Qg_mouthQg_other:眼睛、嘴巴、其它部份有關紋理的特徵向量。 eye ccmouthcother:眼睛、嘴巴、其它部份模型的參數,主成分分析模擬的係數。

(29)

eye eye g eye eye eye eye s eye eye c Q g g c Q x x _ _ + = + = (3.16) mouth mouth g mouth mouth mouth mouth s mouth mouth c Q g g c Q x x _ _ + = + = (3.17) other other g other other other other s other other c Q g g c Q x x _ _ + = + = (3.18) 如圖 3-13、圖 3-14、圖 3-15、所示,分別改變區域式主動表現模型的ceyemouth ccother,取各自的前四個模型參數各自±3σ 。圖 3-15 為主動表現模型, 我們做個比較對照。 Ce1: Ce2: Ce3: Ce4: 圖 3-11 : 區域式主動表現模型眼睛區域前四個參數ceye ±3

σ

eye的影響 Cm1: Cm2: Cm3: Cm4: 圖 3-12 : 區域式主動表現模型嘴巴區域前四個參數cmouth ±3

σ

mouth的影響

(30)

Co1: Co2: Co3: Co4: 圖 3-13 : 區域式主動表現模型其他區域前四個參數cother ±3

σ

other的影響 C1: C2: C3: C4: 圖 3-14 : (比較)主動表現模型前四個參數

c

±

3

σ

的影響

(31)

4

第四章

區域式主動表現模型定位演算法

現在有 1.一張新的人臉影像作人臉形狀定位與紋理模擬,2.一個區域 式主動表現模型如上一章所敘述,3.大概的人臉位置、角度、大小資訊。其中大 概的人臉位置、角度、大小資訊是模型放置的初始點。我們需要一個有效率的演 算法去調整模型參數ceyecmouthcother與位移參數tt=

(

tx,ty,θ,s

)

Ttx:人臉 x

方向位置、t :人臉 y 方向位置、y θ :人臉旋轉角度、s:人臉大小。,對需要 特徵定位的人臉影像做最佳的匹配。

4.1 人臉影像差異

eye eye g eye eye eye eye s eye eye c Q g g c Q x x _ _ + = + = (3.16) mouth mouth g mouth mouth mouth mouth s mouth mouth c Q g g c Q x x _ _ + = + = (3.17) other other g other other other other s other other c Q g g c Q x x _ _ + = + = (3.18) 我們現在重新定義問題,有一張新的人臉影像需要作人臉形狀定位與紋理模 擬,已經根據手工標定的訓練資料製作出區域式主動表現模型(如第三章所敘 述),先利用人臉偵測程式得到大概的人臉位置、角度、大小資訊。其中大概的 人臉位置、角度、大小資訊是模型放置的初始點。已知大概人臉位置、角度、大 小資訊,將模型初始值根據人臉大概尺寸調整其大小,放入初始位置中,如圖 1-1 中的 initial 所示,目前所需要求得的參數為區域式表現模型的參數ceyemouth ccother,與位移參數tt=

(

tx,ty,θ,s

)

Ttx:人臉 x 方向位置、t :人臉 yy 方向位置、θ :人臉旋轉角度、s:人臉大小。在位移參數 t 上的預測,我們以 total

(32)

他區域紋理資訊的總和)與模型模擬之所有人臉紋理gm_total (geye+gmouth+gother) 相減的差異向量rtotal(t) (4.1)做預測分析。c 使用以eye xeye在人臉影像中取得的眼 睛 區 域 紋 理 資 訊gs_eye 與 模 型 模 擬 之 眼 睛 區 域 紋 理 資 訊 gm_eye 的 差 異 向 量 ) ( eye eye c r (4.2)來做預測分析。cmouth使用以xmouth在人臉影像中取得的嘴巴區域 紋 理 資 訊 gs_mouth 與 模 型 模 擬 之 嘴 巴 區 域 紋 理 資 訊 gm_mouth 的 差 異 向 量 ) ( mouth mouth c r (4.3)來做預測分析。cother使用以xother在的人臉影像中取得的眼睛區 域 紋 理 資 訊 gs_other 與 模 型 模 擬 之 眼 睛 區 域 紋 理 資 訊 gm_other 的 差 異 向 量 ) ( other other c r (4.4)來做預測分析。 Re:圖 1.1 : 區域式主動表現模型定位結果 模型與影像的紋理差異向量 (須做正規化)表示法如下:

整體人臉差異向量:rtotal(t) = gs_totalgm_total (4.1) 眼睛區域差異向量:reye(ceye)= gs_eyegm_eye (4.2) 嘴巴區域差異向量:rmouth(cmouth) = gs_mouthgm_mouth (4.3) 其他區域差異向量:rother(cother) = gs_othergm_other (4.4) 錯誤的量測使用平方相加來預測: 整體人臉錯誤: T total total total t r r E ( )= (4.5) 眼睛區域錯誤: T eye eye eye eye c r r E ( )= (4.6) 嘴巴區域錯誤: T mouth mouth mouth mouth c r r E ( )= (4.7) 其他區域錯誤: T other other other other c r r E ( )= (4.8)

(33)

錯誤一般表示:E(p)=rTr p:t,ceye,cmouth,cother (4.10) (4.9)式的一階泰勒展開式為 p p r p r p p r δ δ ∂ ∂ + = + ) ( ) ( (4.11) 在進行定位時,兩個紋理資訊差為

r

,我們希望能夠選擇適當的

δ

p調整模 型與位移參數,使得 2 ) (p p r +δ 最小(模型紋理資訊與圖片紋理資訊差異最小),將 ) (p p r +δ 令為零,經推導我們可以得到結果: ) ( p Rr p=−

δ

Where T T p r p r p r R ∂ ∂ ∂ ∂ ∂ ∂ = −1 ) ( (4.11) R 中的∂rp由差分方程式可以計算出來,其中∂rp為一個 mxn 的矩陣如式子 (4.12 所示),m 代表區域式主動表現模型的紋理維度,n 代表模型控制參數個數。 由式子(4.11)若有模型紋理gm與形狀資訊 x 定義之影像紋理 gs的差異向量 m s g g p r( )= − ,即可計算出

δ

p調整模型與位移參數,使得r(pp) 最小,也使 得模型特徵收斂到正確的位置與正確的文理資訊。在實際的最佳化過程中,必須 每次都去計算它的∂rp,這會很花費時間,影響到執行的速度。因為紋理上的 差異會做正規化的動作。所以我們可以假設∂rp這個微分式對於追蹤人臉而言 趨近一個定值。所以我們可以先利用訓練資料事先計算。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ = ∂ ∂ n m m m n n p r p r p r p r p r p r p r p r p r p r L M O M M L K 2 1 2 2 2 1 2 1 2 1 1 1 (4.12) p r ∂ ∂ 的訓練過程如下:以手工標定的影像為基礎取出影像的紋理資訊g ,s

計算此張圖所對應的模型參數ceyecmouthcother、位移參數t

(

)

T y x t s t t= , ,θ, 並計 算對應的模型紋理資訊g 即可計算出差異向量m r(p)= gsgm,以此數值當作 調整的基本值,一次調整一個模型參數或位移參數pi,調整的大小

δ

pi【1】就模

(34)

各別的標準差σeye、σmouth、σother,以標準差σeye、σmouth、σother為參考在極限 值± 50. ×σ 中分割 10 個等分(− 50. ×σ、− 40. ×σ、− 30. ×σ…0.3×σ、0.4×σ 、 σ × 5 . 0 )以此當作

δ

pi值的改變基準,調整過後可由式(3.16)~(3.18)計算出相對 應的模型與影像紋理資訊g′ 、m g′ (在此模型紋理的變異較大)即可計算出新的差s 異向量r′ )(p = gs′ −gm′ ,將新的差異向量r′( p)與原來的差異向量r( p)相減,即 可得到∂ ,ri

δ

pi為我們設定的值,∂ 可計算出來,就可以得到rirjpi i = 1,2,3,...n ,j = 1,2,3,...m,m 代表區域式主動表現模型的紋理維度,n 代表 模型控制參數個數。

δ

pi有十個數值調整,所以可以計算出十個 i j p r ∂ ∂ 取其平均 為 i j p r ∂ ∂ 訓練的結果。【2】就位移參數而言定義一個區間也是分割成 10 個等 分,此區間的大小為經驗法則,就我們嘗試結果此區間在人臉大小約 60*60 時此 區 間 大 小 約 正 負 10 個 像 素 。 以 此 當 作

δ

pi 的 調 整 基 準 , 調 整 位 移 參 數

(

)

T y x t s t t= , ,θ, ,可由原本的形狀資料 x 調整為 x′ 。由 x′ 定義之新的形狀可以擷取 出新的影像紋理資訊g′ ,可計算出新的差異向量s r′ )(p = gs′ −gm將新的差異向 量r′( p)與原來的差異向量r( p)相減,即可得到∂ ,ri

δ

pi為我們設定的值,∂ 可ri 計算出來,就可以得到 i j p r ∂ ∂ ,由於

δ

pi也有十個數值調整所以以其平均代表其 數值, 得到∂rp即可由式子(4.11)計算 R,R 就可用在實際定位中用來預測參 數的走向。就區域主動表現模型預測因子有Rt(維度:整體紋理資料數量 x 位移 參數數量)、Reye(維度:眼睛區域紋理資料數量 x 眼睛區域模型參數數量)、 mouth R (維度:嘴巴區域紋理資料數量 x 嘴巴區域模型參數數量)、Rother (維度: 其他區域紋理資料數量 x 其他區域模型參數數量) ) (t r R t =− t total

δ

Where T total total T total t t r t r t r R ∂ ∂ ∂ ∂ ∂ ∂ = −1 ) ( (4.13) ) ( eye eye eye eye R r c c =−

δ

Where T eye eye eye eye T eye eye eye c r c r c r R ∂ ∂ ∂ ∂ ∂ ∂ = −1 ) ( (4.14) ) ( mouth mouth mouth mouth R r c c = −

δ

Where T mouth mouth mouth mouth T mouth mouth mouth c r c r c r R ∂ ∂ ∂ ∂ ∂ ∂ = −1 ) ( (4.15) ) ( other other other other R r c c = −

δ

Where T other other other other T other other other c r c r c r R ∂ ∂ ∂ ∂ ∂ ∂ = −1 ) ( (4.16)

(35)

式子(4.13)為位移參數

(

)

T y x t s t t= , ,θ, 的預測方法,已知預測因子Rt與整體的 差異向量rtotal(t)即可求得位移參數的改變值。式子(4.14)為眼睛區域模型參數 eye

c 的預測方法,以知預測因子Reye與眼睛區域的差異向量reye(ceye)即可求得眼

睛區域模型參數的改變值。式子(4.15)為嘴巴區域模型參數cmouth的預測方法, 以知預測因子Rmouth與眼睛區域的差異向量rmouth(cmouth)即可求得嘴巴區域模型 參數的改變值。式子(4.16)為其他區域模型參數cother的預測方法,以知預測因子

other

R 與眼睛區域的差異向量rother(cother)即可求得其他區域模型參數的改變值。

(36)

圖 4-2 : 區域式主動表現模型 – 模型預測因子 R 的訓練流程圖(二)

圖 4.1、4.2 為區域式主動表現模型中預測因子 R 的訓練流程圖,圖 4.2 增 加了實際訓練時的影像以便於更能了解整個模型預測因子 R 的訓練流程。圖 4.2 中由手工標定訓練影像擷取紋理資訊g ,s g 經由區域主動表現模型的主成分分s

析維度轉換為模型參數ceye,cmouth,cother,在此之後分為兩個步驟,第一為利用

other mouth eye c c

c , , 計算區域主動表現模型的模型紋理資訊g ,第二為調整模型參數 m

或位移參數p:t,ceye,cmouth,cother得到 p′ 【1】若 p′ 為位移參數 t (p′=t),則根 據位移參數的改變而由形狀參數 x 改變為 x′ 所對應出新的影像紋理資訊g′、【2】s

若 p′ 為模型參數ceye,cmouth,cother(p:t,ceye,cmouth,cother),則根據改變的模型參數

other mouth eye c c c′ , ′ , ′ 計算區域主動表現模型的模型紋理資訊g′ ,將m g′ 或m g′ 與s g 相減m 可以得到 r′ 與原本的 r (因為為初始為訓練資料轉換出來所以初始的r→0)相 減可以得到∂r

δ

p已知及可計算出∂rp在經由式子(4.11)我們就可以訓練出 預測因子 R,圖 4.2 中的人形由右到左由上到下依序為:手工標定之訓練影像、 由訓練影像擷取出的紋理資訊、模型模擬訓練影像的紋理資訊、模型或位移參數

(37)

調整過後的紋理資訊、前兩者相減後的資訊。

4.2 模型更新演算法

得到由 4.1 中所訓練出的參數預測因子RtReyeRmouthRother,我們可

以 利 用 式 子 (4.13)

δ

t =−Rtrtotal(t) 、 (4.14)

δ

ceye = −Reyereye(ceye) 、 (4.15)

) ( mouth mouth mouth mouth R r c c = −

δ

、(4.16)

δ

cother = −Rotherrother(cother),建立一個疊代 式的演算法作最佳化的收斂來更新參數t,ceye,cmouth,cother使其收斂到最佳值。收斂 之演算法為:

1. 由

x

的定位擷取影像中紋理資訊gs_eyegs_mouthgs_other

2. 計算錯誤向量:r = gsgmr(t),reye(ceye),rmouth(cmouth),rother(cother)

,與計算目前的錯誤: 2

r

E= :EtotalEeyeEmothEother

3. 利用

δ

t =−Rtrtotal(t)、

δ

ceye =−Reyereye(ceye)、

δ

cmouth =−Rmouthrmouth(cmouth)、

) ( other other other other R r c c = −

δ

計算

δ

t,δceye

δ

cmouth

δ

cother

4. 更新參數 t k t t→ + δ eye eye eye eye c k c c → + δ mouth mouth mouth mouth c k c c → +

δ

other other other other c k c c → +

δ

初始值:k = keye = kmouth = kother= 1

5. 計算新的形狀資訊

x

'與新的紋理資訊gm_eyegm_mouthgm_other

6. 由

x′

的定位擷取影像中紋理資訊gs′_eyegs_mouthgs′_other

7. 計算新的錯誤向量:r′=g'sg'mr( ′t),reye(ceye)′,rmouth(cmouth)′,rother(cother)′,

計算新的紋理錯誤 E1totalE1eyeE1mothE1other

8.If (E1total >Etotal)

{ kkeyekmouthkother各除以二 ; 回到第 4 步。}

(38)

else {

If ( E1eye >Eeye ) {keye 除以二並回到第 4 步。}

else If (E1mouth > Emouth ) {kmouth 除以二並回到第 4 步。}

else If ()E1other > Eother ) {kother 除以二並回到第 4 步。}

else 接受新的預測。}

直到所有的

k

keyekmouthkother接近零且錯誤率沒有提升。 }

此演算法首先計算目前紋理錯誤EtotalEeyeEmothEother,在算出各個參

數的更新參數,再計算出更新過後的紋理錯誤E1totalE1eyeE1mothE1other

首先會比較E1totalEtotal,若錯誤較大代表我門在位移上的參數預測錯誤,代表 模型位置與影像中實際人臉的位置誤差更遠此時我們直接將位移參數與模型參 數的移動改為原來的一半,不再繼續半段模型參數的正確性。主要是因為整體上 人臉位置相差更遠所以區域模型:眼睛、嘴巴與其他模型位置,沒有與圖像中的 眼睛、嘴巴與其他區域對應,所以預測的結果一定不符合我們的預期還有可能越 發散越遠所以我們不需經過判斷直接更改模型參數的更新。若錯誤有較小表示我 們在位移上的參數預測正確,區域模型:眼睛、嘴巴與其他模型位置,與圖像中 的眼睛、嘴巴與其他區域距離相去不遠,所以可以進一步判斷內部模型的預測結 果是否正確,若某區域的錯誤率有上升代表我們估計錯誤,則將此區域的參數位 移值減半重新估計此區域的模型參數,若所有的區域模型錯誤率都有下降代表我 們預測的結果正確,接受此次的預測更新原始模型與位移參數,或當所有參數的 位移值都衰減到趨近於 0,則代表目前模型參數與位移參數所在位置是最佳位置。 主要先利用整體的紋理資訊預測位移參數,等模型位移接近圖片影像中的人臉 後,在進行內部區域模型的個別收斂。

(39)

LAAM Face Feature Location Algrithm Initial Image Texture gs Texture gm Initial Model Ceye, Cmouth Cother, t -Calculate Etotal, Eeye Emouth ,Eother Calculate Ceye', Cmouth' Cother' , t' Texture gs' Texture gm' -Calculate E1total, E1eye E1mouth ,E1other No k=k/2 Compare If Converge Or Not YES Refresh Model By Ceye' , Cmouth' Cother' , t' No More Improvemeant End Start 圖 4-3 : 區域式主動表現模型 – 人臉特徵定位演算法流程圖 圖 4-4 : 區域式主動表現模型 – 人臉特徵定位演算法流程圖(二) Initial Image Texture gs Texture gm Initial Model Ceye, Cmouth Cother, t -Calculate Etotal, Eeye Emouth ,Eother Calculate Ceye', Cmouth' Cother' , t' Texture gs' Texture gm' -Calculate E1total, E1eye E1mouth ,E1other No k=k/2 Compare If Converge Or Not YES Refresh Model By Ceye' , Cmouth' Cother' , t' No More Improvemeant End Start

(40)

圖 4-3、4.4 為區域式主動表現模型人臉特徵定位演算法的流程圖,圖 4.4 在流程圖敘述框的周圍增加了演算法在實際執行時的影像以便於更能了解整個 區域式主動表現模型人臉特徵定位演算法流程。先由人臉偵測程式偵測到大概的 人臉,初始的位置與大小為初始模型放置的初始點,擷取初始形狀x對應的影像 紋理資訊gs,將gs與模型初始參數gm相減得到差異向量與誤差先預測模型參數 與位移參數所需的調整值,更新參數後可以重新計算出新的模型紋理資訊g′m與 新的影像紋理資訊g′s藉由將gs與模型初始參數gm相減得到新的差異向量與新 的誤差。比較兩者誤差而調節參數的變化若收斂則更新模型與位移參數重新此流 程,若錯誤率沒有下降則結束此收斂程式。

(41)

5

第五章

實驗結果

以手工標定的人臉訓練資料訓練區域式主動表現模型與主動表現模 型,比較區域式主動表現模型模擬後形狀資料與紋理資料與原本資料的差 異,透過與主動表現模型與原始資料的差異作比較,以實驗得知區域式主動 表現模型的模擬能力。另外利用新的人臉影像透過區域式主動表現模型人臉 特徵匹配演算法的收斂得到形狀與紋理資料,與原始手工標定的形狀與紋理 資料比較,得到收斂演算法的匹配能力。

5.1 實驗設計

5.1.1 人臉表情定義

我們首先定義人臉的表情,經由觀察,人臉變化較大的部份為眼睛與 嘴巴區域而且彼此間的變化是獨立的。我們初步定義(如圖 5-1 所示)。 眼部表情:1.正常、2.閉眼、3.閉左眼、4.閉右眼、5.張大、6.皺眉 口部表情:1.正常、2.閉嘴微笑、3.微笑、4.張嘴、5.抿嘴、6.o 型嘴 圖 5-1 : 臉部表情定義

(42)

5.1.2 人臉資料特色

準備 230 張手工標定的人臉影像,共五個不同人拍出,一個人臉有 46 張影 像。其中每個人各提供 36 張影像(共 180 張)作訓練資料,用來訓練區域式主動 表現模型(LAAM)與主動表現模型(AAM)。其餘每個人各提供 10 張影像(共 50 張) 用來做測試模型資料用。每個人表情的變化以 5.1.1 定義的人臉表情做排列組合 達到所有人臉表情都在訓練資料中。手工標定資料如圖 5.2 所示,每行的變化為 同一個人臉不同表情的變化,每列的變化為不同人臉的變化。

(43)

圖 5-2 : 人臉標定資料

5.2 區域表現模型之模型建立測試

使用以上所述 180 張人臉當作模型訓練資料,測試資料 50 張。經由第三章 所述之建立模型的步驟(如圖 3.8 所示),先擷取出形狀與紋理資料,作形狀與紋 理上的校正,將資料分為眼睛、嘴巴與其他區域再利用主成分分析建立眼睛、嘴 巴與其他區域的統計模型,再將三個模型合成建立出區域式主動表現模型。區域 式主動表現模型維度如圖 5-3 所示。 圖 3.8 : 區域式主動表現模型流程圖 嘴巴部份:形狀維度:1x16,紋理維度:1x109,合成維度:1x125。

(44)

眼睛部份:形狀維度:1x52,紋理維度:1x390,合成維度:1x442。 其他部份:形狀維度:1x48,紋理維度:1x1445,合成維度:1x1490。 整體(眼睛、嘴巴、其他)合成維度 1x2060。 主動表現模型的形狀維度:1x116,紋理維度:1x1944,合成維度:1x2060。 兩者的整體維度是一樣的。 圖 5-3 : 區域主動表現模型維度 模型選取參數在區域式主動表現模型方面,眼睛部份的特徵向量選取前 179 個(維度 1x442),嘴巴部分的特徵向量選取前 112 個(維度 1x125),其他部分的 特徵向量選取 179 個(維度 1x1493)。在主動表現模型方面,特徵向量選取前 179 個(維度 1x2060)。資料模擬度都趨近於 100%。雖然表面上而言,區域主動表現 模 型 所 需 控 制 參 數 的 數 目 比 主 動 表 現 模 型 多 ( 179+125+179[LAAM] > 179[AAM] ),比較上可能會不公平。但就模型模擬所需的資料儲存,區域主動表 現模型需儲存的資料量為 359247(179x442+112x115+179x1493),主動表現模型 需儲存的資料量為 368740(179x2060),所以在資料量的儲存上區域主動表現模 型較主動表現模型少,但是能提供較多的模型參數供系統做變化上的模擬。若主 動表現模型要達到相同的參數量,其儲存空間需要原來的三倍。 以測試資料(50 張)進行模型的模擬測試。方法如圖 5.4 所示。先取出測試 手工標定影像的形狀與紋理資料,經由 AAM 與 LAAM 的模擬(對 PCA 做投影-降維 再做反投影-升維),模擬過後的 AAM 與 LAAM 形狀與紋理資料在與原始形狀與紋 理資料相減比較。

(45)

圖 5-4 : 模型測試流程圖

測試結果如表 5-1 所示,顯示區域式主動表現模型與主動表現模型模擬資料 與原始資料的比較結果:

Mouth Eye Other

AAM LAAM AAM LAAM AAM LAAM Shape Error 0.78 0.03 0.72 0.24 0.76 0.76 Texture Error 6.43 0.47 5.76 3.08 4.51 4.07 表 1 : 主動表現模型與區域式主動表現模型比較 經由表一的比對我們會發現,LAAM 與 AAM 表現的比較,在嘴巴與眼睛區域 差異明顯(嘴巴區域中,形狀差異 AAM=0.78 而 LAAM=0.03,紋理差異 AAM=6.43 而 LAAM=0.47。眼睛區域中,形狀差異 AAM=0.72 而 LAAM=0.24,紋理差異 AAM=5.76 而 LAAM=3.08),所以可以得到 LAAM 在變化較大的區域較 AAM 模擬的更精確。在 其他區域(鼻子與臉頰)模擬的表現則差不多。由於在特徵值挑選時,模型選取參 數在區域式主動表現模型方面,眼睛部份的特徵向量選取前 179 個,嘴巴部分的

(46)

特徵向量選取前 112 個,其他部分的特徵向量選取 179 個。在主動表現模型方面, 特徵向量選取前 179 個。資料模擬度都趨近於 100%。

在控制的參數上 LAAM 比 AAM 多出兩倍,或許有人會質疑說若將 AAM 的控制 參數增加是否會變的更好。所以我們做了另一組實驗。模型選取參數在區域式主 動表現模型方面,眼睛部份的特徵向量選取前 179 個,嘴巴部分的特徵向量選取 前 112 個,其他部分的特徵向量選取 179 個。在主動表現模型方面,特徵向量選 取前 540 個。資料模擬度都趨近於 100%。以測試資料(50 張)進行模型的模擬測 試。測試結果如表 5-2 所示,顯示區域式主動表現模型與主動表現模型模擬資料 與原始資料的比較結果:

Mouth Eye Other

AAM LAAM AAM LAAM AAM LAAM

Shape Error 0.72 0.03 0.59 0.24 0.76 0.76 Texture Error 5.75 0.47 5.07 3.08 4.10 4.07 表 2 : 主動表現模型與區域式主動表現模型比較(二) 由表二可得知,既使主動表現模型(AAM)增加控制參數個數,由於資料模 擬度的飽合,錯誤率沒有下降太多,結果仍較區域式主動表現模型(LAAM)差。 而且須儲存資料量也很大。現在來探討區域式主動表現模型(LAAM)表現較好的 原因:主成份分析法(PCA)主要是做資料的座標軸轉換,若將計算出來的特徵向 量依照特徵值做遞減的排列,越大的特徵值所對應的特徵向量其訓練資料在此特 徵向量座標軸的分佈標準差越大(資料較分散),如此挑選少量但特徵值大的特徵 向量當作基底座標,由於在這些特徵向量下資料分布都比較分散,即用比較少量 的維度表現出一般高維度展現出的資料群。

(47)

主動表現模型(AAM)將一個人臉資料群(1x2060),利用主成份分析法 的座標轉換轉成令一個座標軸。區域式主動表現模型(LAAM)則是將眼睛部份(維 度1x442)、嘴巴部份(1x125)、其他部分(1x1490)三部份利用主成份分析法,分 別轉換到三個不同的座標系統。由於人臉的眼睛、嘴巴與其他部分資料群最廣分 布的座標軸方向可能不同,三個座標系統可以分別依照他們的資料特性做適當的 分布。所以這是區域式主動表現模型(LAAM)模擬精確度會優於主動表現模型 (AMM)的原因。

區域式主動表現模型(LAAM)的模型參數,ceyecmouthcother,控制著各部份

的變化,若要做某個部位的判斷如眼睛表情(眼睛的閉合)或嘴巴表情(嘴巴的張 閉)…等可直接結取模擬過後的參數ceyecmouthcother去做判斷。

圖 5.5 為區域式主動表現模型與主動表現模型差異度的比較分析,圖 5.5 中 第一列為原始資料,第二列為主動表現模型(AAM)根據第一列的原始資料模擬出 的最佳結果,第三列為區域式主動表現模型(LAAM)根據第一列的原始資料模擬出 的最佳結果。我們可以看出第一行中,原始資料嘴巴呈現微笑的狀態。主動表現 模型(AAM)模擬結果嘴巴呈現微張的情形,區域式主動表現模型(LAAM)模擬結果 嘴巴呈現微笑的狀態。第二行中,原始資料嘴巴呈現 o 型嘴的狀態。主動表現模 型(AAM)模擬結果嘴巴呈現微張的情形,區域式主動表現模型(LAAM)模擬結果嘴 巴呈現 o 型嘴的情形。第三行中,原始資料眼睛是閉眼的狀態。主動表現模型(AAM) 模擬結果眼睛是張開的狀態,區域式主動表現模型(LAAM)模擬結果眼睛則是閉 眼的狀態。第四行中,原始資料嘴巴是張大的狀態。主動表現模型(AAM)模擬結 果嘴巴是微張的狀態,區域式主動表現模型(LAAM)模擬結果嘴巴則是張大的狀 態。由視覺上來說,區域式主動表現模型(LAAM)的模擬結果會較主動表現模型 (AAM)的模擬結果好。

(48)

Original Data AAM LAAM 圖 5-5 : LAAM AMM 模擬差異 圖 5.6~5.11 顯示主成分分析時,在各種資料模擬度下 AAM 與 LAAM 的比較。 5.6 表示嘴巴區域形狀資訊表現情形、5.7 表示嘴巴區域紋理資訊表現情形、5.8 表示眼睛區域形狀資訊表現情形、5.9 表示眼睛區域紋理資訊表現情形、5.10 表 示其他區域形狀資訊表現情形、5.11 表示其他區域紋理資訊表現情形、橫軸表 示資料模擬度(0%~100%)、縱軸表示模擬與實際的誤差、藍色實線表示 AAM 的分 佈情形、紅色虛線表示 LAAM 的分佈情形。可以看到在嘴巴區域形狀與紋理資料 上 LAAM 的分佈都較 AAM 低,這代表在嘴巴區域 LAAM 在各個資料模擬度下表現都 比 AAM 好。

在眼睛區域除了形狀上低資料模擬度時 AAM 較 LAAM 好外,形狀與紋理資料 上 LAAM 的分佈整體都較 AAM 低,這代表在眼睛區域 LAAM 在各個資料模擬度下表 現都比 AAM 好。在其他區域形狀與紋理資料模擬誤差不大。由資料模擬程度上來 說,不同資料模擬度下,區域式主動表現模型(LAAM)的模擬結果會較主動表現 模型(AAM)的模擬結果好。

(49)

圖 5-6 : 嘴巴區域形狀模擬誤差

(50)

圖 5-8 : 眼睛區域形狀模擬誤差

(51)

圖 5-10 : 其他區域形狀模擬誤差

(52)

5.3 區域表現模型之人臉特徵定位測試

使用 5.2 建立的區域主動表現模型作人臉特徵匹配。所需的人臉初始位置與 大小由 OpenCV 之人臉偵程式提供[19],主要功能是提供此影像中人臉的大概位 置與大小。如圖 5.12 所示,一、三行為人臉影像,二、四行為人臉偵測結果。 圖 5-12 : 人臉偵測結果 得到人臉大概位置與大小,再利用第四章所述之人臉特徵定位演算法(下圖 4.3)已大概位置與大小為初始,以模型與影像紋理的差異向量預測模型參數與位 移參數,去追蹤人臉詳細形狀與紋理資訊。

數據

圖 4-1 : 區域式主動表現模型 – 模型預測因子 R 的訓練流程圖
圖 4-2 : 區域式主動表現模型 – 模型預測因子 R 的訓練流程圖(二)      圖 4.1、4.2 為區域式主動表現模型中預測因子 R 的訓練流程圖,圖 4.2 增 加了實際訓練時的影像以便於更能了解整個模型預測因子 R 的訓練流程。圖 4.2 中由手工標定訓練影像擷取紋理資訊 g , s g 經由區域主動表現模型的主成分分s 析維度轉換為模型參數 c eye , c mouth , c other ,在此之後分為兩個步驟,第一為利用
圖 5-2 : 人臉標定資料  5.2  區域表現模型之模型建立測試  使用以上所述 180 張人臉當作模型訓練資料,測試資料 50 張。經由第三章  所述之建立模型的步驟(如圖 3.8 所示),先擷取出形狀與紋理資料,作形狀與紋 理上的校正,將資料分為眼睛、嘴巴與其他區域再利用主成分分析建立眼睛、嘴 巴與其他區域的統計模型,再將三個模型合成建立出區域式主動表現模型。區域 式主動表現模型維度如圖 5-3 所示。  圖 3.8 : 區域式主動表現模型流程圖 嘴巴部份:形狀維度:1x16,紋理維度:1x109,
圖 5-4 : 模型測試流程圖
+6

參考文獻

相關文件

• Extension risk is due to the slowdown of prepayments when interest rates climb, making the investor earn the security’s lower coupon rate rather than the market’s higher rate.

• A delta-gamma hedge is a delta hedge that maintains zero portfolio gamma; it is gamma neutral.. • To meet this extra condition, one more security needs to be

A novel surrogate able to adapt to any given MLL criterion The first cost-sensitive multi-label learning deep model The proposed model successfully. Tackle general

• Extension risk is due to the slowdown of prepayments when interest rates climb, making the investor earn the security’s lower coupon rate rather than the market’s... Prepayment

• As all the principal cash flows go to the PAC bond in the early years, the principal payments on the support bond are deferred and the support bond extends... PAC

O.K., let’s study chiral phase transition. Quark

We showed that the BCDM is a unifying model in that conceptual instances could be mapped into instances of five existing bitemporal representational data models: a first normal

The Hull-White Model: Calibration with Irregular Trinomial Trees (concluded).. • Recall that the algorithm figured out θ(t i ) that matches the spot rate r(0, t i+2 ) in order