章節說明

第一章緒論

1.4 章節說明

本論文一共分為六章，第一章描述相關研究背景，並說明研究動機目的。第二章說明如何從影像中偵測人體並作特徵擷取。第三章介紹在影像系統辨識六種人體姿態方法。第四章為簡述人體姿態感測模組與辨識原理。第五章則是描述影像系統與人體姿態感測模組之實驗結果，第五章為結論與未來工作。

第二章人體辨識與特徵擷取

在本論文的研究中，我們期望能在攝影機畫面中找出人體的位置並辨識其姿態，因此首要便是如何能夠在畫面中判斷人是否存在。而在本章節中，將描述如何透過人體特徵與人體比例關係來完成人體的判斷。

2.1 人體偵測

本系統架構流程，如圖 2.1 所示。以攝影機擷取影像後，分別取出每張畫面中屬於膚色與黑色的部分，並將過大與過小的區塊視為雜訊區塊予以去除，接著以人體的頭部和身體的比例關係圖找出人體上半身的位置，以橢圓樣板來進行比對。當確認為身體的上半身時，將人頭和身體的座標位置紀錄下來給予後續影像處理判斷姿態使用。

圖 2-1 系統流程圖

2.1.1 人體膚色之偵測

由於影像在 RGB 空間中會因為光源的強弱，而使原本相同顏色相同的物體在影像畫面中所呈現出不同顏色。因此只要對 R 與 G 予以正規化，再由 RGB 彩色空間轉換到 Normalized color coordinates (NCC) [13]空間，便能減少 R 與 G 對光線的靈敏度，而 B 對光線的靈敏度較低因此在此忽略。其正規化公式如下：

r=R/R+G+B (1) g=G/R+G+B (2)

其中 R、G 與 B 分別代表像素上之數值，r 與 g 則分別代表正規劃後之 R 與 G 值成分。正規化後 r 與 g 在膚色情況下之分布將如圖 22 所示。其中 X 軸代表 r ， Y 軸代表 g。由圖五可以觀察出膚色的分布範圍將會相當的集中，其中 X 軸的範圍約在 0.2~06 之間，而 Y 軸的範圍則約在 0.2~0.4 之間。因此可以利用兩個二次方程式，即可定義出膚色的上界 f1 和下界 f2,如式(3)與(4)，其數學式如下：

f1=-1.376*r²+1.0743*r+0.2 (3) f2=-0.706*r²+0.5601*r+0.18 (4) 由於白色像素發生時(r=0.33, g=0.33)，其 r 與 g 也會包含在定義的範圍中，

因此在這裡加入下面的條件加以排除：

圖 2-2 r 與 g 在膚色情況下之分布

w=(r-0.33)²+(g-0.33)²>0.0004 (5)

圖 2-5、一個二維矩陣表示的二值化影像

圖 2-6、經過連通標記法運算後之輸出結果

圖 2-7、經過連通標記法運算後之膚色與黑色區塊

在經過連通標記法運算後獲得影像畫面如圖 2-7 所示，可得知每個區塊的長寬與座標，由於每一區塊皆可能為人頭影像候選區塊後，人的頭髮與臉部的組合總是近似橢圓，因此針對每一個區塊進行橢圓比對，便可將人體的手腳等不符合橢圓形區塊去除，減少下一步驟比對上半身橢圓之運算量，如圖 2-8 與圖 2-9。

由於本論文中攝影機所取得的每張畫面大小為 320*240 畫素，因此人的頭部畫素大小在距離攝影機 2 公尺處約為 60*60 畫素，六公尺處則約 15*15 畫素，

圖 2-8 橢圓比對前之膚色與黑色區塊圖 2-9 除去不符合橢圓形區塊

圖 2-10 移除過大與過小區塊

在景深兩公尺之內時，畫面中的人體因距離過近不易保有完整的上半身身體，而景深六公尺以外，畫面中的人體上半身則不夠明顯加以辨識，因此對於超過 60*60 和小於 15*15 的區塊當作雜訊於予忽略並移除，如圖 2-10。

2.2 人體特徵擷取

經過連通標記法與橢圓比對之後，剩餘之區塊皆認為疑似人頭之部位，而人的肩膀在影像處理中經過 Sobel filter[15]後也為近似橢圓之圖形。因此將每一個疑似人頭之區塊，以人體比例圖找出相對應之人體上半身範圍，再進一步比對出肩膀便可確認已找出畫面中之人體。圖 2-11 中為人體各部位之間的比例，由此圖可知頭部的高度為全身高度的 0.137 倍，兩邊的腋下寬度為全身高度的 0.224 倍，由腳部至腰部的高度為 0.435 倍。我們重新定義 H 所代表的意義，將原來代表人的全身高度改為人頭之上下高度，以符合本論文所需，如圖 2-11，因而可換算出上半身的高度和寬度為頭部高度的 1.63 倍和 3.175 倍，其中 1.63 倍為人體

圖 2-11 人體比例圖[4]

兩邊腋下寬度與頭部高度的比例。影像處理中對上半身的橢圓樣板比對是針對人的肩膀進行比對，而 1.63 倍的寬度比顯然不符所求，因此必須增加雙手寬度，

將身體寬度由頭部高度的 1.63 倍增加為 2 倍，身體高度則依舊維持 3.175 倍。

圖 2-13 為圖 2-12 對映至原始影像後，所找出畫面中的人體上半身範圍，而人身上所穿著的衣物也會增加身體的寬度，因此將範圍在作些微調整，如圖 2-15。

圖 2-13 比例對應圖

其中當人面對於不同攝影機角度時，對應於原始影像之上半身邊緣偵測結果如圖 2-14，可知其肩膀梯度皆符合橢圓外形。因此把所得到的影像範圍以 Sobel filter [15]找出梯度，如圖 2-17，並且定義頭的高度為參數 d，身體的寬度和高度參數為 width 與 dd，帶入（7）式之橢圓公式，並以 sum of absolute difference(SAD)

（8）判斷是否符合上半橢圓樣板。

圖 2-18 比對出肩膀之橢圓圖 2-19 皆符合橢圓形之區塊

圖 2-20 區塊 A 橢圓比對失敗圖 2-21 區塊 B 橢圓比對成功 2.3 結論與討論

本章將 RGB 彩色空間轉換到 Normalized color coordinates(NCC)空間以減少光源變化對於顏色之影響，並利用擷取出來的膚色與黑色區塊找出人頭影像，透過連通標記法(Connected component labeling)、人體比例圖與橢圓比對等判斷人頭與人體上半身是否存在影像當中，當比對成功時進一步將畫面中的人頭與人上半身的位置與以紀錄下來。

第三章人體姿態辨識法則

在前一章中，除了能找出畫面中是否有人體的存在，並能紀錄頭部與人體上半身的位置，因此本論文利用每張影像中人體各部位的位置，將人體的姿態分為靜態與動態兩種，分別進行判斷站、坐、躺、走路、上樓與下樓等六種常見的人體姿態。其中靜態姿態為站立、坐下與躺下，動態姿態為走路、上樓與下樓。

3.1 站、坐、躺之姿態辨識

靜態姿態當中，畫面中人並非處於移動狀態，當前後影像所找出的頭部與上半身位置在沒有位移狀況下，本論文提出以下方法可以判斷為靜態姿態中的站立、坐下或躺下。在人體的站立或坐下姿態中，人的頭部與肩膀為垂直方向，躺下時頭部與肩膀則為水平方向，因此在找出人頭的時候，將人頭的左右兩邊與人頭下方先圈選出可能的上半身位置，如圖 3-1，分別以 Sobel filter 找出三個影像範圍的上半身梯度，並且使用 SAD 對這三個區域進行肩膀的橢圓樣板比對，當比對最為接近肩膀之橢圓在人頭的左右兩側時，則可判斷此人正楚於躺下姿態，

如圖 3-2。

在站立姿態時，人的雙手位置通常會在腰部以下位置，如圖 3-3，其中紅線代表透過人體比例圖以人頭的位置所找出的人體腰部位置，並且將之前找出的膚色區塊對應至上半身範圍內，將膚色區塊最接近地面的高度以綠線表示。

圖 3-1 三種位置之上半身範圍圖 3-2 躺下姿態之比對

圖 3-3 站立姿態之對應圖

由人體比例圖了解到人的腰部與肩膀之距離為人頭高度的 3.14 倍，與膝蓋之距離為人頭高度的 1.54 倍，因此當綠線的高度位置在肩膀與膝蓋之間時，可認定人楚於站立姿態且雙手位置在腰部以下，如圖 3-4。

圖 3-4 站立姿態之手部位置

圖 3-5 坐下姿態之對應圖

同理，在坐立姿態時，人的雙手位置通常會在腰部以上位置，如圖 3-5 與圖 3-6，

代表雙手位置的綠線在腰部與肩膀距離內時，認定人楚於坐下姿態而雙手位置在腰部以上。

圖 3-6 坐下姿態之手部位置

3.2 走路、上樓、下樓之姿態辨識

動態姿態中，走路、上樓與下樓分別代表著畫面中人體不同的行進方式。可以利用前後張影像的人頭位置，在 x 軸與 y 軸的位置變化來加以判斷，在走路姿態中，代表水平方向的 x 軸位置變化最大，人在走路姿態時速度約 3km/hr，每一步伐相當於身高高度的 0.3 倍，透過人體比例圖可換算出每步伐約為人頭高度的 2.19 倍，因此當前後影像的人頭 x 軸相對位置差距超過人頭高度的 2.19 倍時，

可判斷為向左或向右之走路姿態如圖 3-7。

上下樓的姿態中，代表垂直方向的 y 軸位置變化最大，因此可以利用前後張影像人頭的 y 軸位置，當差距超過下張影像 1 倍人頭高度時，可判別為上樓或下樓姿態，如圖 3-8 與 3-9 所示。

圖 3-7 走路姿態之比對

圖 3-8 上樓姿態之比對

圖 3-9 下樓姿態之比對

3.3 結論與討論

本章使用前後張影像人頭位置變動幅度，先將畫面中的人體姿態分類為靜態姿態（站、坐、躺）與動態姿態（走路、上樓、下樓），並以人體姿態之間不同的特徵差異，分別辨識出站、坐、躺、走路、上樓與下樓等六種姿態。影像系統在辨識人員姿態上可能因為畫面角度、遮蔽或受測人員的動作造成系統的誤判，

另因已有基於慣性感測器之姿態辨識模組，對於躺下有良好之辨識結果，但是對於站立、坐下、上樓與下樓等姿態則較差，可將兩者加以結合以得到更佳的辨識率。

第四章基於三軸加速規之人體姿態辨識

在前兩章的描述中，我們使用影像系統解決了如何在環境中尋找出人體以及作六種姿態辨識，而在此章節中將簡述本實驗室研發的人體姿態估測模組，並且與影像系統以類神經網路作結合。

4.1 人體姿態估測模組

本實驗室研發之人體姿態估測模組如圖 4-1 所示[22]，包含了 Freescale 公司的 MMA7260QT 三軸加速規加速規、Atmel 公司的 Atmega128L 8 bit 微控器及 Chipcon 公司的 CC2420 Zigbee chip。透過一個三軸加速度計量測人體的加速度，

作為判斷人體姿態的依據。此三軸加速度計經由微控器的 A/D converter 讀取加速度計的數值後，在微控器中完成辨識演算法，以達成即時辨識姿態之功效。

4.2 人體動態與靜態姿態判定

在文檔中基於影像處理之人體姿態辨識 (頁 15-0)

第一章 緒論

1.4 章節說明

第二章 人體辨識與特徵擷取

第三章 人體姿態辨識法則

第四章 基於三軸加速規之人體姿態辨識

第一章緒論

第二章人體辨識與特徵擷取

第三章人體姿態辨識法則

第四章基於三軸加速規之人體姿態辨識