虛擬視角畫面建立

第五章 3D 人體模型建立

5.2 虛擬視角畫面建立

本系統由前一小節計算得到的關節景深值，藉由座標轉換，可以得到虛擬視角的畫面，如圖5.3。圖 5.3 中，藍色攝影機為實際的擺設位置，紅色攝影機為虛擬的擺設位置，在得知關節的景深資訊後，我們可經由座標轉換，建立俯視與

側視虛擬視角的3D 人體模型畫面，如圖 5.4。

(a) (b)

圖5.3 虛擬攝影機示意圖，藍色為真實攝影機的擺設位置，紅色為虛擬攝影機的擺設位置，

(a) 側視，(b) 俯視。

圖5.4 以不同視角建立人體 3D 模型：(圖中左上)為俯視的 3D 人體模型，人體正面向下，

(圖中左下)為側視的 3D 人體模型，人體正面向左。

第六章實驗結果與加速方法

本章節中，將依照前兩章所提到3D 人體模型建立的方法，利用程式進行模擬實驗並分析實驗結果。本系統使用的程式語言為C++，程式作業環境為 Microsoft Visual Studio 2005，測試電腦環境為 Pentium 4 3 GHz，2G RAM，作業系統為XP 及 Vista，分別以影像品質較好的攝影機與筆電的網路攝影機，在單純及複雜的背景環境下，對使用者進行3D 姿態的偵測，以俯視及側視的虛擬視角重建3D 人體模型，來顯示系統辨識的正確性並對結果作分析。

6.1 關節對應的結果探討

我們在不同環境下對人體姿態做偵測，由於只對前景物上的膚色做偵測，在影像品質穩定的情況下，背景的膚色區域不會影響肢體的判斷。如果背景的雜訊為較大而未能被濾除，且偵測為膚色，亦在手部的偵測範圍內，此狀況則會造成短暫的手部辨識錯誤，如圖6.3。另一方面，由於本系統是以前景物的近似中軸線段來調整腳部姿態，所以在腳部形成的膚色近似中軸線段，像是短褲，不會影響腳部的判定，如圖6.1(a)、(b)。

一般成人為7 到 9 頭身，若以頭部長度為參考長度，來計算肢體的相對長度，

其誤差較大。所以本系統以畫面上頭頂到肩膀距離的長度χ(約為身高的 1/6 至 1/7)為參考，來動態調整肢體長度，此方法會因為不同受測者人體比例的不同，

而產生誤差約為身高的0 倍至 1/42 倍。若畫面的高度為 H，在受測者全身入鏡 時，由於距離鏡頭的距離變化，會使在畫面上的人體身高為0 至 H。本系統當受 測者在畫面上身高為0.3H(如圖 6.8)至 0.9H 時，若對不同人固定以身高的 1/6 定 義χ，肩膀的高度與其它肢體長度的誤差為0 至 0.0216H；如果受測者真實身高 範圍為100 至 250 公分內，則實際肩膀的高度與其它肢體長度的誤差為 0 至 5.95 公分。這個誤差值，並不會影響像是擺動手部、拳擊、抬腳、原地走路、原地跑

步等姿態的辨識。我們在系統介面的輸入影像畫面中，即時於左上方重建俯視視角的3D 人體模型，左下方重建側視視角的 3D 人體模型。

(a) (b)

圖6.1 中，由於腳部位置的偵測是基於前景物的近似中軸線段做判定，因此受測者褲管的長短，所造成的腳部膚色近似中軸線段，不會影響系統對腳部的判定。如果前景物與背景顏色接近，會使得前景物截面線段破損嚴重，造成近似中軸線段形狀過扁或過小而被濾除，此狀況下會發生錯誤的偵測，如圖6.2 腳部區域。此時我們可適度調低前背景色度扭曲門檻值(τCD)，增加擷取的前景物像素面積。

在手部的活動範圍內，以膚色近似中軸線段的端點，來定位手末端及手肘位置。若雜訊造成過大膚色前景物而未能被濾除，且在手部的活動偵測範圍內，會造成手部偵測錯誤的狀況，如圖6.3(a)。若未能手部的偵測出膚色近似中軸線段，

本系統以預設手部姿態表示，如圖6.3(b)。未來在不同環境下的對膚色在色彩空間中的分布作學習，期望可以使膚色辨識率提升。

(a) (b)

圖6.2 腳末端顏色接近背景顏色，造成腳部擷取過短的狀況，(a) 拖鞋與背景顏色接近的例

子，(b) 赤腳的例子。

(a) (b)

圖6.3 手部偵測錯誤的狀況，(a) 雜訊造成過大的膚色前景物，且恰在手部的活動範圍內，

使右手的末端偵測錯誤，(b) 右手同(a)，左手因為偵測出膚色，而以預設姿態表示，

(c)、(d) 手舉過頭的情況。

假設頭部在最高位置，則以水平掃描線掃瞄到的第一個跨越3 條掃瞄線以上的近似中軸線段的起點，即當作頭頂的位置，如圖6.3(c)、(d)。未來可以加入時間因素，以前幾張關節位置的變化量，來預測頭部及其它關節的位置。另一種作法，可以依近似中軸線段平均截面線段的寬度，來分析頭部或手部位置。但是由於背景複雜或顏色與前景物近似的偵測環境下，會使得頭部、手部人體區域破損

圖6.4 膚色區域、衣著接近背景顏色的偵測結果。

嚴重，很難以破損的近似中軸線段來辨識頭部或手部，這時必須先整合破損的近似中軸線段後，再以分布區域面積的大小，來分辨頭部或手部。

若單純以輸入影像與背景模型的像素RGB 絕對值差的和來取得前景物，會使膚色區域或衣著，在與背景顏色接近時，難以分離前背景區域。本系統採[11]

的方法，可以得到較佳的前背景分割，以建立較佳的3D 人體模型，如圖 6.4。

我們進一步以不同顏色的衣著，在背景較凌亂的場景中做測試，其測試結果如圖6.5、圖 6.6、圖 6.7。由前一章所述，本系統自動依人體在畫面中的身高，

動態調整肢體的長度，肢體的景深值亦產生相對的變化，如圖6.5。當腳部部分重疊時，由於前景物截面線段的寬度變化，只要不為同一近似中軸線段，系統可以建立此兩腳的末端資訊，如圖6.6。

(a) (b) 圖6.5 動態調整肢體長度，(a) 距鏡頭較近，(b) 距鏡頭較遠。

圖6.6 腳部部分重疊的偵測結果。

圖6.7 複雜場景中的偵測結果。

由於本論文是依據人體區域輪廓及人體比例來選取頭部位置，因此在人體背向螢幕時，亦可建立3D 人體模型，但是人體方向會誤判成是正面，如圖 6.8。

未來我們可以進一步的分析膚色在頭部區域分布的面積大小，來辨識受測者為正面或背面，甚至進一步辨識畫面中的人臉方向，但是此方法會因為頭部遮蔽物(口罩、墨鏡等)或光頭(人臉正、背面的膚色面積差不多大)，使得此方法在某些情況下不適用。當受測者距離鏡頭漸遠時，我們很難以人體區域外部輪廓判寬窄的變化，來選取頭部的位置，此時本系統依人體比例動態調整肢體相對長度，在距離鏡頭甚遠時，亦可計算畫面中人體關節的相對景深值資訊，如圖6.9。

本論文進一步探討軀幹往前曲折的狀況。當人體區域的立足點不變，表示受測者沒有往鏡頭視線的前或後方移動，因此不調整其它比肢體(手、腳部)與χ的比例，此時若外接矩形的高度變小，表示受測者做原地蹲下的動作。如果頭部與

圖6.8 背面的偵測結果。

身體互相遮蔽，會造成頭頂到畫面上肩膀的距離縮短。我們可以由頭頂到畫面上肩膀的距離長度χ的變化，動態調整軀幹在畫面上的長度(2χ)，藉此估測軀幹在螢幕上的長度，來計算軀幹的景深值，如圖6.10。受測者在往下蹲時，如果身體曲折，可由前述的方法，如圖6.10 所示；如果身體不曲折，則軀幹在螢幕上的長度不變，只在畫面上往下移動。此方法的限制為衣著顏色明顯與背景有差異，才能在頭部下方找到畫面上肩膀的位置。

圖6.9 受測者距鏡頭較遠的偵測結果。

圖6.10 受測者蹲下的偵測結果。

6.2 加速方法

由第三章介紹的掃描線演算法，我們發現對畫面中的每個像素做前景物偵測，其運算量較大。本系統使用類似降低解析度的概念，調整掃描線的間距以減少偵測的資料量，以提升系統運算速度。

為了得知每條掃描線上前景物截面線段的端點位置，除了完整的偵測掃描線上所有像素外，可再衍生降低解析度的概念，來減少偵測的像素資料量。

圖6.11 以降低解析度的概念，減少偵測的像素資料量，圖中淺、深藍色的實線，分別表示一般

的水平、垂直掃描線所需偵測的像素；淺、深藍色的虛線，分別表示以 i 為掃描線上像 素的偵測間距；紅色線段表示偵測到的前景物截面線段。

表6-1 影像來源、掃描線方向、肢體表示及辨識比較

[15] [16] [17] 本論文

影像來源灰階彩色

掃描線方向 0°、45°、90°、145° 0°、90°

肢體表示 2D 3D

肢體辨識無無有有

部分遮蔽不可不可不可可

頭部位置未限定未限定未限定最高處

第七章結論及未來工作

本篇論文中，我們將[15]、[16]、[17]研究中擷取近似中軸線段的條件放寬，

使用水平(0°)及垂直(90°)的掃描線及膚色資訊，來建立適用於辨識人體姿態的前景物及膚色近似中軸線段，再藉由人體比例及基本運動學的概念，重建受測者的 3D 姿態人體模型。我們以腳部的外接矩形來偵測腳末端，並調整髖骨位置，使姿態較符合真實情況。系統會依人體比例來動態調整錯誤選取的頭部大小，並推算其它肢體的相對長度，此方法當使用者距離鏡頭甚遠時，亦有機會偵測使用者的3D 姿態。由本論文提出的方法，在正身面對鏡頭時的正確率較高，因此適合應用在人機互動的操作上，而不需使用控制感應器即可操作簡單的指令。經實驗結果得知，在複雜的環境下或衣著與背景顏色相似的情況下，皆可偵測使用者的 3D 姿態。本系統使用畫面品質較好、影像擷取速度較快的攝影機作測試，速度可以達到20 至 24fps，其特定姿態(手部擺動、拳擊、抬腳、原地踏步、原地跑步等)的辨識率可達 85%以上；畫面品質較差的攝影機，如筆電的網路攝影機，

則會因影像的擷取速度較慢，降至8 至 15 fps，其特定姿態的辨識率可達 80%以上。

未來相關研究可探討人臉及身體在影像畫面中的方向，並進一步在不同環境光下對膚色區域做學習，以提高前景物上膚色區域的辨識率。另一方面，當受測

在文檔中基於影像掃描之即時單攝影機3D人體姿態估測 (頁 48-0)

第五章 3D 人體模型建立

5.2 虛擬視角畫面建立

第六章 實驗結果與加速方法

第七章 結論及未來工作

第六章實驗結果與加速方法

第七章結論及未來工作