一. 緒論
1.3. 研究內容與論文貢獻
1.3.1. 資料來源
對於Hidden Markov Model 這一類的動作辨識方法來說,所需用以訓練、辨識的 資料,只要是能代表動作地觀察值序列即可;而這種觀察值的取得,則可以由2D 或 3D 取得,對於辨識方法本身的差異度並不大。
由於大部分的作法中,都是使用離散型的隱馬可夫模型(Discrete Hidden Markov Model),所以如果特徵本身就是離散的符號序列(例如基礎動作或姿勢的名稱或代號)
的話,可以直接利用HMM 來處理;但是如果特徵資料是連續性的數值(如位置、角 度),則必須在進行訓練或辨識前,先將資料做分群或分類,轉換為離散的符號序列。
由於3D 動作的資料取得較為困難,因此本論文的實際數據實驗是以 2D 的影像序 列來進行;而對於3D 的動作辨識,則是以模擬的資料來進行簡單的初步測試。
1.3.2. 辨識方法
而在訓練、辨識的部份,主要使用Hidden Markov Model的一種變形-多觀察值型 隱馬科夫模型(Hidden Markov Model with Multiple Feature Streams,簡稱為HMM/MFS)
[15]進行對動作的訓練與辨識。而接受的資料類型,也是使用離散(Discrete)的符號;
因此如果是連續性的數值資料,必須要先轉換為離散的符號。
傳統的HMM 只能夠接受一組觀察值序列,對於有多組特徵的時候,大多是把多 組特徵怎合成一個特徵向量(feature vector),然後利用 Vector Quantization 之類的方 法,將他轉換為單一的特徵序列,並以這個特徵序列當作觀察值序列供HMM 進行訓 練、辨識。但是這樣的缺點就是無法將各觀察值分開考慮,是必須全部一起考慮的。
而HMM/MFS 和一般的 HMM 的主要差異,就在於他能同時接受多組獨立觀察值 序列。因此,對於每個觀察值可以以各自獨立的方式去做計算;而如果再對觀察值加 入權重後,也可以分別定義各觀察值的重要性,使的整個模型能有更好的通用性。
整個辨識的流程大致如下:
M L
O N
圖 1-1 訓練與辨識流程圖
這一部分為本論文的主要理論部份,將於第二章、第三章對於現有的模型的介紹。
而在實際使用多觀察值型隱馬可夫模型時,則發現不少資料會有「無法辨識」的
於第四章做說明。
1.3.3. 論文貢獻
本論文主要的貢獻,在於提供了將多觀察值型隱馬可夫模型套用在動作辨識這方 面的概念;我們在動作的辨識中,不再只能同時考慮整體的狀態,而能同時使用多組 不同的獨立特徵來當作觀察值,並考慮不同特徵的重要性。
此外,本論文也對使用在使用多觀察值型隱馬可夫模型時,可能發生的「無法辨 識」的情形,提出了幾種「容錯可能性」的計算方法,來解決這個問題、增加辨識的 正確性。