• 沒有找到結果。

第一章 緒論

第一節 研究動機

嬰兒(本研究定義嬰兒為 1 歲以下幼兒)的情緒發展會影響未來的學習力、注 意力甚至於成長後的個性及人際關係。研究指出嬰兒一出生情緒便開始發展[盧 93],而在人一生的情緒發展中尤以嬰兒時期的情緒發展最為重要。著名心理學家 Erikson,將情緒發展劃分為八個階段[1]。該研究指出其中階段一(即 0 歲至 1 歲 之嬰兒)情緒發展順利時,未來會容易對人類產生信任及安全感。反之若情緒發展 產生障礙時,在面對新環境時會容易產生焦慮,不容易信任他人。所以若是能得 知嬰兒目前情緒及生理需求並予以滿足,使嬰兒情緒發展順利,對其將來進入學 校甚至於進入社會有些許幫助。

嬰兒的情緒發展是人格發展的奠基期,對未來發展影響甚大。由於嬰兒的情 緒發展一生只有一次,錯過就無法重來,若出現嬰兒負面情緒頻率過高而父母不 了解原因導致無法予以滿足甚至於不加以理會,就可能造成嬰兒成長後的個性扭 曲變形,人際關係發展不順利。所以如何得知嬰兒目前情緒及生理需求並予以滿 足,就成為父母及現今社會關注的議題。

雖然嬰兒情緒相關議題相當值得關注,但由於現今社會結構已經從原本三代 同堂大家庭漸漸轉變為小家庭。若想要養育下一代,通常只能由父母獨力撫養,

或者是交由親友及托兒所照料。因此父母與嬰兒親子相處時間大幅縮減,導致父 母在無法十分了解嬰兒所表達的情緒及生理需求的情況下,不易將嬰兒情緒發展 引導到正確道路上。

而嬰兒表達情緒及生理需求的方式大致分為兩種,分別為身體動作及聲音。

嬰兒時常藉由身體動作及聲音吸引父母注意力並且以此與父母溝通,告知父母他 所表達的情緒及生理需求。

其中身體動作又細分為臉部表情及肢體動作。臉部表情為嬰兒表達情緒及生 理需求最原始的反應,是不需經過學習就與生俱來的天賦,所以父母容易直接觀 察而得知。當嬰兒情緒發生改變或產生需求時,最直接的反應就是顯現在臉上,

2

3

第二節 研究困難

本研究對象設定為 0 歲至 1 歲的嬰兒,由於嬰兒在 1 歲之前只能使用臉部表 情及不帶詞意的聲音來向父母表達自己目前情緒及生理需求。而嬰兒原始的情緒 反應與其本身的生理需求直接相關,像飢餓、受到驚嚇、尿布潮濕等,會引起哭 鬧等一些不愉快的情緒。而滿足該嬰兒需求後,像飢餓感消失、安撫、更換乾淨 的尿布後,不舒適的感覺消失,情緒也會變得愉快,所以嬰兒情緒會在極短時間 內轉換。由於嬰兒情緒時常轉換,十分不穩定,導致系統要在短時間內辨識出嬰 兒情緒時,辨識困難度將會提升。

由於 0 歲至 1 歲的嬰兒,其身體活動性不大,若沒有父母在身旁協助移動,

嬰兒不容易移動身體離開監視系統拍攝的範圍,所以本研究能使用固定攝影機來 觀測嬰兒的情況。在大多數臉部表情辨識方面的研究,通常要求實驗資料是以正 面臉部為主。但是實際上嬰兒頭部轉動的情況是無法限制,像嬰兒哭泣時臉部轉 動方向是朝左邊或朝右邊,一般的表情辨識系統無法將此類型的狀況辨識成相同 的「哭泣」,容易導致辨識效果不佳,所以本研究必須解決嬰兒臉部轉動的問題。

本研究擬利用膚色做為嬰兒臉部特徵,來偵測出嬰兒的臉部區域,其優點是 計算較為簡易,且不容易受到嬰兒臉部轉動、部分遮蔽而影響系統偵測嬰兒臉部 區域的效率及其正確率。但是利用膚色做為嬰兒臉部特徵具有以下缺點。

(1)光線的差異:無論是在室內或室外,位於強光處或陰影處,所在區域是白光或 黃光,均會造成膚色區域其範圍值的差異。圖 1.1 所示為位於不同光線環境下所 拍攝的嬰兒。其中圖 1.1(a)為位於日光燈下,圖 1.1(b)則為位於黃燈下。由上述兩 圖可知,嬰兒位於日光燈下拍攝時較適合偵測膚色區域,因為位於黃燈下拍攝時,

其影像色彩偏向黃色系,易使得其膚色區域與背景顏色相似,導致系統難以正確 偵測出嬰兒的膚色區域。另外,圖 1.1(c)為嬰兒被陰影覆蓋時所拍攝,圖 1.1(d)則 為在正常狀況下所拍攝,由上述兩圖可知,當嬰兒被陰影覆蓋時,其影像色彩偏 暗色,易造成膚色色彩失真,增加系統辨識的困難性。

(2)嬰兒人種的差異:不同人種其膚色區域範圍均不相同,像亞洲人種膚色偏黃,

非洲人種膚色偏黑,歐美人種膚色偏白,使得系統難以設定膚色區域範圍。

(3)其他原因:攝影機拍攝所在地的背景顏色及其複雜度,均會增加膚色偵測的困 難性。圖 1.2 為攝影機架設於不同背景複雜度下所拍攝嬰兒之範例。圖 1.2(a)之拍

4

(a) (b) (c) (d) 圖 1.1 不同光線環境下所拍攝嬰兒之範例。

(a)日光燈,(b)黃光,(c)有陰影,(d)沒有陰影。

(a) (b) (c) 圖 1.2 不同背景複雜度下所拍攝嬰兒之範例。

(a)單一背景,(b)兩色背景,(c)複雜背景。

攝背景為單一色彩,圖 1.2(b)之拍攝背景為雙色色彩,圖 1.2(c)之拍攝背景為複雜 色彩。由此三圖可知,當拍攝背景的色彩越單調時,越容易區分膚色區域及背景。

反之,若拍攝背景的色彩越豐富,近似於膚色區域的色彩越多,越不易正確的區 分膚色區域及背景。

另外本系統使用攝影機內建的收音麥克風所錄製的聲音當作嬰兒產生的聲 音,所以會將嬰兒聲音及背景雜音均錄製至系統,像父母交談聲、電視聲音等背 景雜音,而該如何突顯嬰兒發出的聲音,也是困難處之一。此困難若不克服則會 導致聲音辨識結果不佳。

第三節 論文架構

本論文共分為七章,第一章說明本研究的動機及其研究困難。第二章為文獻 探討,此章將進行情緒分類方法的分析,並比較其優劣處,及介紹目前影像領域、

語音領域辨識情緒的相關技術。第三章說明本研究的目的、研究環境、設備架設 方式及系統流程之概述。第四章將詳細解說本研究如何偵測出嬰兒臉部區域並擷 取特徵以進行表情分類。第五章將詳細解說本研究如何擷取嬰兒聲音特徵並進行 聲音分類及利用表情、聲音分類結果進行情緒分類。第六章為實驗結果展示。最 後,第七章為結論和未來工作。

5