研究內容與論文貢獻 - 緒論 - 利用多觀察值型隱馬可夫模型進行人體動作辨識

一. 緒論

1.3. 研究內容與論文貢獻

1.3.1. 資料來源

對於Hidden Markov Model 這一類的動作辨識方法來說，所需用以訓練、辨識的資料，只要是能代表動作地觀察值序列即可；而這種觀察值的取得，則可以由2D 或 3D 取得，對於辨識方法本身的差異度並不大。

由於大部分的作法中，都是使用離散型的隱馬可夫模型（Discrete Hidden Markov Model），所以如果特徵本身就是離散的符號序列（例如基礎動作或姿勢的名稱或代號）

的話，可以直接利用HMM 來處理；但是如果特徵資料是連續性的數值（如位置、角度），則必須在進行訓練或辨識前，先將資料做分群或分類，轉換為離散的符號序列。

由於3D 動作的資料取得較為困難，因此本論文的實際數據實驗是以 2D 的影像序列來進行；而對於3D 的動作辨識，則是以模擬的資料來進行簡單的初步測試。

1.3.2. 辨識方法

而在訓練、辨識的部份，主要使用Hidden Markov Model的一種變形－多觀察值型隱馬科夫模型（Hidden Markov Model with Multiple Feature Streams，簡稱為HMM/MFS）

[15]進行對動作的訓練與辨識。而接受的資料類型，也是使用離散（Discrete）的符號；

因此如果是連續性的數值資料，必須要先轉換為離散的符號。

傳統的HMM 只能夠接受一組觀察值序列，對於有多組特徵的時候，大多是把多組特徵怎合成一個特徵向量（feature vector），然後利用 Vector Quantization 之類的方法，將他轉換為單一的特徵序列，並以這個特徵序列當作觀察值序列供HMM 進行訓練、辨識。但是這樣的缺點就是無法將各觀察值分開考慮，是必須全部一起考慮的。

而HMM/MFS 和一般的 HMM 的主要差異，就在於他能同時接受多組獨立觀察值序列。因此，對於每個觀察值可以以各自獨立的方式去做計算；而如果再對觀察值加入權重後，也可以分別定義各觀察值的重要性，使的整個模型能有更好的通用性。

整個辨識的流程大致如下：

M L

O N

圖 1-1 訓練與辨識流程圖

這一部分為本論文的主要理論部份，將於第二章、第三章對於現有的模型的介紹。

而在實際使用多觀察值型隱馬可夫模型時，則發現不少資料會有「無法辨識」的

於第四章做說明。

1.3.3. 論文貢獻

本論文主要的貢獻，在於提供了將多觀察值型隱馬可夫模型套用在動作辨識這方面的概念；我們在動作的辨識中，不再只能同時考慮整體的狀態，而能同時使用多組不同的獨立特徵來當作觀察值，並考慮不同特徵的重要性。

此外，本論文也對使用在使用多觀察值型隱馬可夫模型時，可能發生的「無法辨識」的情形，提出了幾種「容錯可能性」的計算方法，來解決這個問題、增加辨識的正確性。

在文檔中利用多觀察值型隱馬可夫模型進行人體動作辨識 (頁 14-17)