利用影像之相關性及 Cb 值分佈資訊之導盲磚 區域搜尋方法研究

82  Download (0)

Full text

(1)

中 華 大 學 碩 士 論 文

利用影像之相關性及 Cb 值分佈資訊之導盲磚 區域搜尋方法研究

The research of determining the guide-tile area by using image correlation and Cb value

distribution information

系 所 別:電機工程學系碩士班 學號姓名:M09901050 王偉存 指導教授:蘇建焜 博士

中 華 民 國 101 年 8 月

(2)

i

摘 要

根據內政部 101 年第一季通報統計,台灣有高達 56,318 的視障人口,因此針對 視障人口獨立行動的方便性與安全性也越來越受到重視。本論文即是針對導盲磚設置 路線正確選取,並且將它標示出來。研究過程是將彩色影像作為輸入,一張輸入影像 當中包含有導盲磚與非導盲磚部分。因為 RGB 彩色影像容易受到光線和陰影影響而 且顏色之間有高度關聯性,若欲使用此模型來做基礎門檻值分割,則須同時考慮三原 色相互之間的影響。所以首先做色彩空間轉換,使研究方便度與正確度提高,之後為 了降低影像複雜程度,利用 Otsu 法將影像分割為前景與背景。把影像分割為前景與 背景之後,接著統計前景部份中其 Cb 值落於預設區間內的像素總數。再來對前景區 塊內影像計算其相關性,最後再使用圓形偵測,以形狀相似程度來區分出非導盲磚形 狀之區塊。最後根據上述之 Cb 值分佈、影像相關性和圓形偵測結果,本系統可以自 動判斷出導盲路線區域與非導盲路線區域。本論文方法皆可正確的判斷出是否為導盲 磚路線,而導盲磚路線區域像素抓取正確率高達 93.3%。本論文所提出之導盲磚區域 搜尋方法,可以進一步發展成導盲系統,提供視障人士在行的方面一個有效的輔助裝 置,因而更加方便與安全。

關鍵字:色彩空間轉換、二值化、形態學、相關性、圓形偵測

(3)

ii

ABSTRACT

According to the first quarter statistics bulletin, in 2012, of the Interior Ministry of the Republic of China, there was a visually impaired population up to 56,318 in Taiwan.

Therefore, the convenience and safety issues of the independent motion and transportation of the visually impaired people are more and more important. In the thesis, a system is proposed to determine and highlight the guide-tile areas of an input image. A digital color image which contains guide-tile and non-guide-tile areas is used as the input of the proposed system. In RGB model, color images are very sensitive to lights and shadows and the correlation between each two colors is high. It is difficult to find a threshold for a RGB color image, so color model transformation to Y-Cb-Cr is used for the proposed system.

The Otsu method is applied for segmenting the foreground and background of an input image to reduce its complexity. The segmented foreground is used for determining the total pixel number that those pixels have Cb values in the predefined interval, and calculating the correlation. Finally, circle detection is applied for removing the rectangular or circular non-guide-tile regions. Based on the Cb distribution, correlation, and circle detection, the proposed system has the ability to determine the guide-tile areas in an input image. For the experimental results, the proposed method can find the guide-tile areas with probability one and find the correct guide-tile pixels up to 93.3%. The proposed system could be further extended to be a guiding system for visually impaired persons to improve the convenience and safety while they are walking.

Keywords:color space conversion, binary image, morphology, correlation, circle detection

(4)

iii

誌 謝

本研究論文能夠順利完成,首先必須感謝我的指導教授蘇建焜博士,在兩年的研 究生涯當中細心的指導以及指引正確的方向,還有在我進度停滯感到倦怠的時候給予 適當的鼓勵,並且分享許多他求學過程中的經驗,讓本篇論文能夠順利完成。

另外我也要特別感謝實驗室的同學昱均,在研究的過程當中與我交流了許多寶貴 的資訊與想法。還有實驗室的凱任、翔斌、翊修、泳翰、彥均時常陪我打籃球運動,

政霖、俊煌、嘉華、祈宏不管在課業上、生活中都幫助陪伴我許多。

最後我要感謝我的爸爸與姐姐,在我的求學生涯當中給予的支持、付出與勉勵,

我才能夠心無旁騖地專注在我的論文研究當中,並且將它完成。在此希望將研究的成 果與這份喜悅獻給教授、家人以及所有支持關心我的人,並且在此由衷地感謝他們!

(5)

iv

目 錄

中文摘要...i

英文摘要...ii

誌謝...iii

目錄...iv

表目錄...vi

圖目錄...vii

第一章 緒論...1

1.1 研究動機與背景...1

1.2 研究方法及目的...3

1.3 章節概要...4

第二章 導盲路線相關技術文獻...5

2.1 色彩空間...6

2.1.1 RGB 色彩模型...6

2.1.2 YIQ 色彩模型...9

2.1.3 YUV 與 YCbCr 色彩模型...10

2.1.4 HSV 色彩模型...11

2.2 抓取導盲磚區塊...13

2.2.1 灰階轉換...13

2.2.2 二值化...13

2.2.3 自動門檻二值化...15

2.2.3.1 百分比法...15

2.2.3.2 平均灰階法...15

2.2.3.3 歐蘇法...16

(6)

v

2.3 形態學...19

2.3.1 像素近鄰...20

2.3.2 膨脹與侵蝕...20

2.3.3 閉合與斷開...22

2.3.4 連通成分...23

2.4 相關性...24

2.4.1 影像之相關性...25

2.4.2 灰階相關性...26

2.5 模糊理論...28

2.5.1 模糊集合...28

2.5.2 隸屬函數與模糊化...31

2.5.3 α-截集...33

2.5.4 模糊集合之運算...34

2.5.5 解模糊化...35

2.5.6 模糊規則庫...36

2.5.7 模糊控制器...36

第三章 研究及實驗方法...38

3.1 影像前處理...40

3.2 色彩分布分析...49

3.3 判斷灰階相關性...51

3.4 圓形偵測...55

3.5 決策...57

第四章 實驗結果與討論...59

第五章 結論與未來展望...69

參考文獻...70

(7)

vi

表目錄

表 1.1 是否同意視障者不該獨自出門...2

表 3.1 灰階相關性之 r 與 p 值...54

表 4.1 光影實驗模擬之數據...63

表 4.2 髒污實驗模擬之數據...64

表 4.3 室內實驗模擬之數據...65

表 4.3(a) 一區域以上實驗模擬之數據#1...66

表 4.3(b) 一區域以上實驗模擬之數據#2...67

表 4.4(a) 非導盲磚實驗模擬之數據#1...68

表 4.4(a) 非導盲磚實驗模擬之數據#2...68

表 4.4(a) 非導盲磚實驗模擬之數據#3...68

表 4.5 正確像素抓取比較...69

(8)

vii

圖目錄

圖 1.1 感覺距離分類圖...1

圖 1.2 影像處理基本架構...3

圖 2.1 導盲路線實驗流程圖...5

圖 2.2 RGB 色彩座標模型圖...6

圖 2.3 RGB 色彩方塊...7

圖 2.4 RGB 加色模型...7

圖 2.5 全彩 RGB 與各分量影像圖(a) 原始影像...8

圖 2.5 全彩 RGB 與各分量影像圖(b) 紅色分量...8

圖 2.5 全彩 RGB 與各分量影像圖(c) 綠色分量...8

圖 2.5 全彩 RGB 與各分量影像圖(d) 藍色分量...8

圖 2.6 YIQ 色差模型...9

圖 2.7 灰階化後的 Lena 圖...10

圖 2.8 YCbCr 色差模型...11

圖 2.9 HSV 色彩模型...12

圖 2.10 門檻值示意圖...14

圖 2.11 影像灰階圖與其二值圖(a) 灰階圖...14

圖 2.11 影像灰階圖與其二值圖(b) 二值圖...14

圖 2.12 百分比法...15

圖 2.13 環境中有導盲磚影像圖...16

圖 2.14 自動二值化後影像...18

圖 2.15 像素近鄰...20

圖 2.16 影像膨脹與侵蝕(a) 原始影像...21

圖 2.16 影像膨脹與侵蝕(b) 3 × 3 正方形結構元素...21

(9)

viii

圖 2.16 影像膨脹與侵蝕(c) 膨脹後影像...21

圖 2.16 影像膨脹與侵蝕(d) 侵蝕後影像...21

圖 2.17 影像閉合...22

圖 2.18 影像斷開...23

圖 2.19 P 點與其 8 近鄰點...23

圖 2.20 二值化影像標記結果(a) 二值影像...24

圖 2.20 二值化影像標記結果(b) 標記過影像...24

圖 2.21 一顆球放大後擺於不同位置...25

圖 2.22 垂直方向導盲磚...26

圖 2.23 水平方向導盲磚...26

圖 2.24 導盲磚畫線灰階繪圖(a) 將盲磚等距等長劃線...27

圖 2.24 導盲磚畫線灰階繪圖(b) 灰階波形圖...27

圖 2.25 傳統集合表示圖...29

圖 2.26 模糊集合表示圖...30

圖 2.27 溫度舒適度感覺集合(a) 明確集合...30

圖 2.27 溫度舒適度感覺集合(b) 模糊集合...30

圖 2.28 集合模糊化表示圖(a) 單值模糊化...31

圖 2.28 集合模糊化表示圖(b) 梯形模糊化...32

圖 2.28 集合模糊化表示圖(c) 三角模糊化...32

圖 2.28 集合模糊化表示圖(d) 高斯模糊化...33

圖 2.29 梯形模糊化α-截集示意圖...34

圖 2.30 模糊控制器架構...37

圖 3.1 實驗研究總流程圖...39

圖 3.2 色彩空間轉換流程...40

圖 3.3 自訂之九種顏色深淺(a) 紅...41

(10)

ix

圖 3.3 自訂之九種顏色深淺(b) 橙...41

圖 3.3 自訂之九種顏色深淺(c) 黃...41

圖 3.3 自訂之九種顏色深淺(d) 綠...41

圖 3.3 自訂之九種顏色深淺(e) 藍...41

圖 3.3 自訂之九種顏色深淺(f) 青...41

圖 3.3 自訂之九種顏色深淺(g) 灰...41

圖 3.3 自訂之九種顏色深淺(h) 紫...41

圖 3.3 自訂之九種顏色深淺(i) 棕...41

圖 3.5 Cb 分量灰階值方圖(由左上至右下排列紅~棕) ...42

圖 3.6 色彩灰階化圖(a) RGB 轉灰階...43

圖 3.6 色彩灰階化圖(b) Cb 分量...43

圖 3.7 二值化(a) 原始影像...45

圖 3.7 二值化(b) 自動門檻二值化...45

圖 3.8 形態學步驟流程...46

圖 3.9 形態學處理(a) 原影像...47

圖 3.9 形態學處理(b) 自動門檻後影像...47

圖 3.9 形態學處理(c) 侵蝕後影像...47

圖 3.9 形態學處理(d) 膨脹後影像...47

圖 3.9 形態學處理(e) 面積篩選後影像...47

圖 3.10 計算區域導盲磚灰階出現機率之流程...48

圖 3.11 計算 C 值之範例圖(a) 原影像...49

圖 3.11 計算 C 值之範例圖(b) 灰階化後區塊...49

圖 3.12 計算相關性大小之流程...50

圖 3.13 3D 繪圖觀察(a) 可能為導盲磚區塊...51

圖 3.13 3D 繪圖觀察(b) 圖(a)向右旋轉 90°之 3D 圖...51

(11)

x

圖 3.14 對區域畫線(a) 水平畫線...52

圖 3.14 對區域畫線(b) 垂直畫線...52

圖 3.15 圖 3.14(a) 之畫線部分對應灰階波形...53

圖 3.16 圓形偵測之流程...54

圖 3.17 各情況之圓形偵測結果(a) 左為原影像,右為圓形偵測後...55

圖 3.17 各情況之圓形偵測結果(b) 長條形,左為原影像,右為圓形偵測後...55

圖 3.17 各情況之圓形偵測結果(c) T 形,左為原影像,右為圓形偵測後...55

圖 3.17 各情況之圓形偵測結果(d) 垂直形,左為原影像,右為圓形偵測後...56

圖 3.17 各情況之圓形偵測結果(e) 十字形,左為原影像,右為圓形偵測後...56

圖 3.18 自訂模糊決策之流程...57

圖 4.1 本實驗研究 100 張樣本影像(a) 圖組 1~30...59

圖 4.1 本實驗研究 100 張樣本影像(b) 圖組 30~75...60

圖 4.1 本實驗研究 100 張樣本影像(c) 圖組 75~100...61

圖 4.2 光影案例(a) 原影像...62

圖 4.2 光影案例(b) 輸出結果...62

圖 4.3 髒污案例(a) 原影像...63

圖 4.3 髒污案例(b) 輸出結果...63

圖 4.4 室內案例(a) 原影像...64

圖 4.4 室內案例(b) 輸出結果...64

圖 4.5 一區域以上案例(a) 原影像...65

圖 4.5 一區域以上案例(b) 輸出結果...65

圖 4.3 無導盲磚路線案例(a) 原影像...66

圖 4.3 無導盲磚路線案例(b) 輸出結果...66

(12)

1

第一章 緒論

1.1 研究動機與背景

在人類日常生活中所發生的事情,都是仰賴人們身上的各個感官所提供的訊息。

眼見為憑這句話往往被我們掛在口中,其理由是人們會將本身所接收到的外在訊息透 過“視覺”來做確認。視覺帶給人們對於自我存在的認知,提供給人安全感。因此,

當我們喪失視覺的時候,容易對周遭環境產生懷疑,不確定感也往往會造成自信心的 喪失。人類有 80%對環境認知來自視覺。而圖 1.1 所示,為 Skurnik 西元 1967[1]所 提出的感覺距離分類圖。

根據身心障礙者保護法及統計法規定,由內政部於「95 年身心障礙者生活需求 調查」之紀錄內容[2],其中在身心障礙者最近一個月外出頻率調查中顯示,關於視 覺障礙者的外出頻率總計 50167 件案例:其中「有外出者」的比率高達了 92.22%;

而在「有外出者之外出頻率」統計中,「幾乎每天外出」有 58.09%遠高於「每周 3、4 次」的 11.13%及「每周 1、2 次」的 12.85%還有「全月 1~2 次」的 17.92%(由於視覺 障礙者外出資料無更新所以採用 95 年 6 月份資料)。而在 101 年內政部通報第一季中 則顯示我國目前視覺障礙者有 56318 人。

圖 1.1 感覺距離分類圖[1]

(13)

2

中華民國無障礙科技發展協會(technology development association for the disabled)

「針對我國視覺障礙者就業現狀調查與就業輔導問題分析」中採分層隨機抽樣電訪或 面訪問卷[3],當中其表 4-29 是針對視障者所提出的問題,問題是:有人說「視力不 好的人沒有必要一個人獨自出門」請問你同不同意這種說法?結果如下表 1.1 所示。

大部分的視覺障礙者都非常不同意別人認為他們不該獨自出門。

表 1.1 是否同意視障者不該獨自出門

次數 百分比 非常不同意 370 22.7%

不同意 534 32.8%

同意 283 17.4%

非常同意 181 11.1%

無反應 259 16%

合計

說明:無反應包括:看情形、無意見、拒答。

而數位影像處理[4]是一個非常熱門且廣泛的被使用的一項技術:醫學方面可以 被用來觀察人體內是否有異常的細胞與組織,進而找出其病理,或者是檢查骨骼。運 用在太空科學,可以探測遙遠的星球及未知的影像事物。運用在地球科學,可以用來 觀察山高、海深甚至是水流速、地震脈波。運用在安全管理方面,可利用監視系統管 理居家安全或者是車牌監控還有槍刀武器管制。其中還有日常生活中都一定會碰到的 電腦視訊、手機等用品那些最後在人們面前的完整畫面都是經過一層層的影像處理之 後更美好的呈現在我們眼前。由上述可得知,在我們的生活周遭中,處處都是充滿著 影像處理的成果。下圖 1.2 是影像處理的基本架構。

(14)

3

圖 1.2 影像處理基本架構

1.2 研究方法及目的

視覺障礙的朋友在所處的環境當中,依照各種環境線索,如車聲、人聲方向或者 周遭特殊氣味等,來判斷其所在位置與安全,這就是定向(orientation)。而是在安全且 快速的原則下,到達想要前往的目的地去叫做動作(mobility)。但這對視覺障礙的朋友 卻又偏偏是最苛刻的考驗。而綜觀了上面的敘述我們發現了視覺對人類來說,絕對是 一個人體對外接收訊息最為重要的感官之一。而對於這些有視覺障礙的人,許多的機 構研究調查當中,發現大部分的人還是都希望能夠靠自己的力量去面對事情甚至是對 他們來說充滿了無數危機的“走出去”這件事情。

我們在學習的過程中發現了數位影像處理這項技術,可以對人類帶來許多方便與 應用。在盲人引導方面雖然有許多的儀器以及工具被提出,但是大部分的研究方向都 是靠 GPS 定位[5]或者是超音波感測障礙物[6]等方法,卻很少研究直接對影像做直接 的處理告訴他們該往哪裡前進,本文的出發點就是以此為目標,希望能為視障人士帶 來更多便利與安全。在本文研究即是聚焦在於如何有效地在影像中找出導盲磚並且標 記出它的影像。

研究的方法是使用數位相機在中華大學內各棟教室與宿舍,室內以及室外做導盲 知識庫

Knowledge base 影像擷取

Image acquisition

前處理 Preprocessing

分割 Segmentation

表示及描述 Representation and description

目標物辨識 Object recognition

(15)

4

磚與非導盲磚取樣的影像拍攝,拍攝的樣本大概有 100 張左右。

本文的研究是採用 MATLAB 這套軟體來模擬,從一開始的影像輸入到最後的影 像標記輸出,都是使用此軟體來完成。MATLAB 這個名字代表矩陣實驗室(matrix laboratory)是一款由美國 MathWork 公司出品的商業數學軟體。MATLAB 是專業技術 性計算的一種高效能語言。它整合計算、視覺化和程式編寫到一個易於使用的環境裡,

其中的問題和解答是以熟悉的數學符號標示來表示。典型的用途:數學和計算、演算 法發展、資料擷取、模型化、模擬和產生原型、資料分析、探索和視覺化、科學和工 程圖形、應用發展,包括建立圖形化的使用者界面此外 MATLAB 還可以調用其它語 言(包括 C,C++和 FORTRAN)編寫的程序。

1.3 章節概要

本論文一共分為五個章節,第一章是研究動機與背景和我在本文的實驗模擬目的 以及方法;第二章則是分為五個區塊來探討在本實驗會用到的相關辦法與觀念:第一

區為「色彩空間轉換」、第二區為「自動化門檻值」、第三區為「形態學」、第四區則

是針對導盲磚灰階前後相關性計算、最後第五區就是使用模糊系統(fuzzy logic)系統 對實驗的數據做決策;而第三章,也就是本文的重點則是針對本文所模擬的情況詳細 說明;第四章是實驗數據與影像輸出結果討論;第五章則是對未來的展望。

(16)

5

第二章

導盲路線相關技術文獻

圖 2.1 導盲路線實驗流程圖

本章節技術參考文獻將分五個小節做說明,每節將介紹在本實驗中使用到的理論與方 法還有其相關作用功能之理論與方法。

影像輸入

色彩空間轉化

自動化門檻值

形態學

灰階顏色符合程度 找出相關性 圓形偵測

判斷是否為導盲磚

結果輸出

(17)

6

2.1 色彩空間

色彩空間(color space)包含的顏色範圍稱為“色域”。色彩是光的一種特性,我 們之所以能說出“海是藍色”、“山是綠色”是因為光線照色在有顏色的物體上,物 體吸收一部分波長,並將剩下的光反射至我們的眼睛,而眼睛觀察到物體反射的光產 生有色彩的視覺感受。人眼能分辨出相當多種類的顏色,卻無法將色彩精確的命名,

而是用主觀的方式去描述它。有鑑於此,各種透過量化以數學形式來描述色彩的模型 就此被建立。色彩模型(color model)[7][8]也可叫做色彩空間(color space)或色彩系統 (color system)。在一般常用的色彩模型,主要有:RGB 色彩模型、YIQ 色彩模型、

HSV 色彩模型、HSI 色彩模型、YUV 色彩模型、YCbCr 模型等等..。在下面我們會 介紹幾個常被使用的色彩模型。

2.1.1 RGB 色彩模型

RGB 色彩模型[9]建立在直角座標系統之上,表示的影像是由紅色(red)、綠色 (green)和藍色(Blue)光之三原色所組成,如圖 2.2、2.3 所示。透過這三個色彩分量強 度不同加以混合可產生人眼可視的多種多樣顏色。因此又稱為加色模式 (additive model),如圖 2.4 所示。

圖 2.2 RGB 色彩座標模型圖

(18)

7

圖 2.3 RGB 色彩方塊[9]

圖 2.4 RGB 加色模型[9]

用來表示成分影像之像素數值的位元數決定了 RGB 影像的位元深度(bit depth),

在電腦視覺中,三原色若以 8 位元的像素深度來表示,有 256(0~255)種深淺程度,若 我們說相對應的 RGB 影像有 24 位元深,則能表現出 16777216(256 X 256 X 256)種顏 色,以 24 位元來描述像素色彩的方式,一般稱之為 RGB24。此模式常應用於電腦螢 幕、投影設備與電視等許多顯示設備,不同強弱的 R、G、B 混合在同一個點上時,

就能夠對應出各式各樣不同的顏色。

(19)

8

由於 RGB 色彩模型之三個分量顏色彼此之間有著高度的關聯性,若欲使用此模 型來做基礎門檻值分割,則須同時考慮三原色相互之間的影響,導致在設計演算法時 必須考慮更多的狀況因素,這將會大大地減少整體處理效能與辨識準確性。此外 RGB 色彩模型容易受到光線明亮度與陰影的干擾而降低對顏色的辨識率,所以一般在處理 彩色影像時較不會直接使用 RGB 色彩模型,而是會先做色彩空間轉換再做後續處理。

圖 2.5 為一張全彩影像與其 R、G、B 三個分量的表示圖。

(a) 原始影像 (b) 紅色分量

(c) 綠色分量 (d) 藍色分量 圖 2.5 全彩 RGB 與各分量影像圖

(20)

9

2.1.2 YIQ 色彩模型

YIQ 色彩空間[10]為 NTSC(national television system committee)協會所制定的一 個色彩模型,通常被北美的電視系統所使用。其目的是利用人眼對某些資訊不敏感之 生理特性,犧牲一些精確值以壓縮資料,達成在傳播系統中有效率地傳輸。YIQ 色彩 空間與 RGB 色彩空間為一個線性的轉換,其色彩空間之轉換方程式如(2-1)所示。

[ 𝑌

𝐼 𝑄

] = [

0.299 0.587 0.114 0.596 −0.275 −0.321 0.212 −0.523 0.313

] [ 𝑅 𝐺 𝐵

] (2 − 1)

在 NTSC 格式中,影像資料包括了三個成分:Y 代表顏色的照度(luminance)、I 色調(hue)以及 Q 飽和度(saturation)兩個分量則帶有彩色信息,I 分量代表以橙色到青 色的顏色變化,而 Q 分量則代表以紫色到黃綠色的顏色變化,如圖 2.6。

圖 2.6 YIQ 色差模型[10]

(21)

10

2.1.3 YUV 與 YCbCr 色彩模型

YUV 色彩空間[11]為西歐國家所制定 PAL(phase alteration line)的色彩模型。其目 的與 YIQ 一樣是為了人的眼睛對於亮度變化較為靈敏但是對於色彩變化較不靈敏的 特性開發而成的,也是一種壓縮資料的傳輸模式。其色彩空間之轉換方程式如(2-2) 所示。

[ 𝑌 𝑈 𝑉

] = [

0.299 0.587 0.114

−0.147 −0.289 0.436 0.615 −0.515 −0.100

] [ 𝑅 𝐺 𝐵

] (2 − 2)

YUV 色彩模型透過 RGB 三原色將色彩轉換利用三個分量來表示,其中 Y 表示 明亮度(luminance)、U 與 V 則是帶著色度、濃度(chrominance、chroma)的彩色信息。

如果忽略掉 U、V 的彩色信息,那麼剩下的 Y 為黑白亮度信息,即我們俗稱的灰階 圖,如圖 2.7 所示。

圖 2.7 灰階化後的 Lena 圖

YCbCr 色彩空間[12],是 YUV 壓縮和偏移的版本。在應用上非常廣泛,如 JPEG、

MPEG、DVD、攝影機還有大量的數位視訊中。儲存空間和數據頻寬有限時,因為利 用 RGB 格式處理圖像時,每個像素須由三個分別對應於三原色的 8 位元或其他位元 所組成,然而這不是一種最高效的處理方法。人類眼睛所觀察到的光亮度資訊有 60%

~ 70%來自綠色光,紅色和藍色通道實際上只是亮度資訊的複製,因此我們可以去除

(22)

11

掉這些重複性的資訊,因此發展了 YCbCr 色彩空間。其 RGB 色彩空間用來轉換為 YCbCr 的方程式為(2-3)所示。

[ 𝑌 𝐶𝑏 𝐶𝑟

] = [ 16 128 128

] + [

65.481 128.553 24.966

−37.797 −74.203 112.000 112.000 −93.786 −18.214

] [ 𝑅 𝐺 𝐵

] (2 − 3)

YCbCr 色彩模型亦是將影像分為三個分量,其中 Y 表示明亮度(luminance),Cb (blue-difference chroma components)是藍色成分與一參考值的差距,Cr (red-difference chroma components)則是紅色成分與一參考值的差距,其顏色模型如下圖 2.8 所示。

圖 2.8 YCbCr 色差模型[12]

2.1.4 HSV 色彩模型

Alvy Ray Smith 在 1978 年創立了 HSV 色彩模型[13],亦稱為 HSB 色彩模型。創 立此色彩模型的出發點是因為相較於上述介紹的幾種色彩模型中,若欲描述某一特定 的顏色時須同時考慮各分量互相加成的影響。而一般在我們做影像處理的時候會希望 影像中的色彩部分與亮度部分都可以是互相獨立的元素,如此便能針對各元素的特性 做處理,使處理的流程更為單純。其 RGB 色彩空間用來轉換為 HSV 色彩系統的方程 式如(2-4~2-8)。

(23)

12

H = {

(6 + 𝐺 − 𝐵

𝑚𝑎𝑥 − 𝑚𝑖𝑛) × 60,𝑖𝑓 𝑅 = 𝑚𝑎𝑥 (2 + 𝐵 − 𝑅

𝑚𝑎𝑥 − 𝑚𝑖𝑛) × 60,𝑖𝑓 𝐺 = 𝑚𝑎𝑥 (4 + 𝑅 − 𝐺

𝑚𝑎𝑥 − 𝑚𝑖𝑛) × 60,𝑖𝑓 𝐵 = 𝑚𝑎𝑥

(2 − 4)

S = {

0 ,𝑖𝑓 𝑚𝑎𝑥 = 0 𝑚𝑎𝑥 − 𝑚𝑖𝑛

𝑚𝑎𝑥 ,𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒 (2 − 5)

V = max (2 − 6) 其中

max = MAX(R, G, B) (2 − 7)

min = MIN(R, G, B) (2 − 8)

藝術家偏好使用 HSV 而不是選擇 RGB 色彩空間是由於此系統更為接近人類所體 驗與描繪的色彩感受。在此模型中 H 代表色調(Hue)是色彩的基本屬性,即是日常生 活中我們所提到的顏色名稱,如紅、綠、黃等,S 代表飽和度(saturation),指的是色 彩的純度,飽和度越高色彩越純,V 則是色深度(value),指的是色彩的明暗度,其色 彩模型如圖 2.9 所示。

圖 2.9 HSV 色彩模型[13]

(24)

13

2.2 抓取導盲磚區塊

在本實驗一張複雜的影像當中,我們想要找出可能為導盲磚的區域。但怎樣才能 有效率地將所需要的信息與大部分不需要的信息做區別,這時候我們就需要用到門檻 值(threshold value),在我們所定義的群集數據內(within-class value),影像就會被留下 來,而超過此群組的數據區塊將會被排除。這樣我們就能減少需判斷與計算的資訊。

門檻值的抓取又分為兩種:固定門檻值與自動門檻值。固定門檻值,顧名思義就 是由使用者規定一個數據範圍,範圍內的值即為所求;自動門檻值,則是我們丟入影 像讓系統做計算,自動產生一個數據範圍,範圍內的資料即為所求。自動化門檻值法 有:百分比法(p-tile method)、模式法(mode method)、平均灰階值法(mean-value method)、

疊代法(iterative method)、歐蘇法(otsu method)、矩量恆定法(moment-preserving)。在 本文是使用歐蘇法。

2.2.1 灰階轉換

灰階(gray scale)影像即為單色影像[14]。將輸入之彩色影像,轉為灰階影像,是 為了減少資料的複雜度,Hasan and Karam[15]提出彩色轉灰階方程式如(2-9)所示。

Y = 0.299R + 0.587G + 0.114B (2 − 9)

其中,Y 為經由 R、G、B 三種元素所轉換後的灰階影像。

2.2.2 二值化

二值化(binary thresholding),目的是將影像分成兩種灰階值,得到所謂的二值化 影像,以利於圖形的識別。我們可以設定一個門檻值,將灰階值大於門檻值的所有像 素點灰階值設為 255;灰階值小於門檻值的所有像素點灰階值設為 0,反之亦可,如 圖 2.10。圖 2.11 為灰階圖與其轉二值化影像。

(25)

14

圖 2.10 門檻值示意圖

(a) 灰階圖

(b) 二值圖 圖 2.11 灰階轉二值化

(26)

15

2.2.3 自動門檻二值化

自動門檻值,其目的在於讓系統自行計算出一個門檻範圍,以分割出所需要判斷 是否為所求的區塊。這樣可以替我們節省許多時間在手動一一檢測每張圖片的分割門 檻值。

2.2.3.1 百分比法

百分比法(p-tile method)是利用對欲分割物體的大小或面積的知識,對影像進行分 割,如下圖 2.12。這是一個基於灰度直方圖[16]抓取門檻值的方法。已知我們所要找 尋的物品面積占 P 個百分比,則利用這個資訊我們可以在灰階直方圖中,找到一個可 以讓物體所佔比率剛好是 P 個百分點的門檻值,利用此門檻值,即可將影像中我們所 想探討的區域分割出來。此方法不適合用來處理複雜的彩色影像,僅適合用來將單調 的影像處理分割。

圖 2.12 百分比法

2.2.3.2 平均灰階值法

平均灰階值法(mean-value method),在此方法中門檻值是影像中所有像素灰階值 的平均值。平均灰階值法計算速度相當快,但缺點是無法針對所要判別物體找出其門 檻值,也就是可能找出來是錯誤的門檻值,其數學式如下(2-10)。

(27)

16

𝑇0 =∑ ∑ 𝑓(𝑥, 𝑦)𝑥 𝑦

∑ ∑ 1𝑥 𝑦 (2 − 10)

其中,𝑇0為平均灰階門檻值;∑ ∑𝑥 𝑦𝑓(𝑥, 𝑦)為所有像素點灰階值總和;∑ ∑𝑥 𝑦1 為影 像的總像素數。

2.2.3.3 歐蘇法

歐蘇法(otsu method)是由 Otsu[17]於 1979 年時所提出。此方法可用來找出群組內 與群組間的相異性。在此算法中我們必須找出影像中的變異數(variance),變異數可用 來測量一個群組的同質性(homogeneity),一個群組的同質性越高其相異性就越低

;反之,一個群組的同質性越低,其相異性就越高。而此分割法有兩個準則:

1. Maximizing between-group variance:讓群組間的平均值差的平方合最大。此目 的在於強調群組間的相異性。

2. Minimizing within-group variance:讓群組內的變異數權重合最小。目的在於強 調群組內各個像素的高同質性。

基於上述兩個分個分割法則在觀察環境中有導盲磚的影像如圖 2.13

圖 2.13 環境中有導盲磚影像圖

(28)

17

觀察上圖 2.12 可發現導盲磚的鋪設特性是它是一群的而不是分開,所以它自己 會成為一個群組,而環境中的其它影像則是別的群組,此條件即為與別的群組的差異 性。而在只針對導盲磚顏色做觀察,當中發現在同一個區域的導盲磚,其顏色是一樣 的,換句話說,就是它群組內的差異性非常的小,性質相似度非常的高。所以在本文 判別導盲磚中使用的自動門檻值方法,就是使用了 otsu method。

下面為 otsu method 的推導數學式。為利用統計學的原理來找到一個合適的門檻 值 t,t 使得所有灰階分成兩個群集:𝑁1(𝑡)代表灰階值小於或等於 t 的那一個群組的 像素總數;𝑁2(𝑡)代表灰階值大於 t 的那一個群組的像素總數。下面為兩個群集分別 的出現機率:

𝑞1(𝑡) =𝑁1(𝑡)

𝑁 (2 − 11)

𝑞2(𝑡) =𝑁2(𝑡)

𝑁 (2 − 12)

其中,𝑞1(𝑡)代表灰階值小於或等於 t 的那一個群組的機率;𝑞2(𝑡)代表灰階值大於 t 的那一個群組的機率;𝑁則是代表影像中的像素總數。

兩群集的灰階平均值(mean)分別為:

𝜇1(𝑡) = ∑ 𝑖 𝑃𝑖 𝑞1(𝑡)

𝑡

𝑖=0

(2 − 13)

𝜇2(𝑡) = ∑ 𝑖 𝑃𝑖 𝑞2(𝑡)

255

𝑖=𝑡+1

(2 − 14)

其中,𝜇1(𝑡)與𝜇2(𝑡)分別代表第一個群組及第二個群組的灰階平均值;𝑃𝑖則是代表灰

(29)

18

階為 i 之像素出現的機率。

群集內的標準差為:

𝜎1(𝑡) = √∑ 𝑖 𝑃𝑖

𝑞1(𝑡)[𝑖 − 𝜇1(𝑡)]2

𝑡

𝑖=0

(2 − 15)

𝜎2(𝑡) = √ ∑ 𝑖 𝑃𝑖

𝑞2(𝑡)[𝑖 − 𝜇2(𝑡)]2

255

𝑖=𝑡+1

(2 − 16)

其中,𝜎1(𝑡)與𝜎2(𝑡)分別代表灰階值小於或等於 t 的那一群組的標準差與灰階值大於 或等於 t 的那一個群組的標準差。

群組內的標準差權重合之定義為:

𝜎𝜔(𝑡) = 𝑞1(𝑡)𝜎1(𝑡) + 𝑞2(𝑡)𝜎2(𝑡) (2 − 17)

最後透過 MATLAB 系統簡單的循序搜尋(0 ≤ t ≤ 255),當 t 可使群集標準差的加權 總合𝜎𝜔(𝑡)為最小時,t 值則為灰階影像二值化的門檻值,即:

Threshold = arg min

𝑡∈{0~255}𝜎𝜔(𝑡) (2 − 18)

下圖 2.14 為將圖 2.13 利用 otsu method 自動二值化之結果圖,其上的數字即為系 統計算後的門檻值。

(30)

19

Otsu 計算後門檻值

圖 2.14 自動二值化後影像

2.3 形態學

形態學(morphology)[18]是生物學的一門分之學科,通常表示處理動植物和微生 物的整體及其結構形狀。而在這裡我們所討論的是數學上的形態學 (mathematical morphlogy),是一門以拓樸學為基礎的基礎影像分析學科,形態學影像處理的基本理 論,經常使用在二值影像處理上。一張影像經過二值化後所留下來的資訊,可能有多 餘的雜訊或者是小區塊,也可能有些重要的資訊在經過二值化後遺失了,而我們就可 以使用型態學的方式,將雜訊濾掉,或者是將影像中不要的小區塊消除,亦可以將不 小心刪除掉的重要影像資訊補回。一般來說,畫面中物件的邊緣輪廓等,梯度變化量 大之地方屬於高頻成分,也是雜訊容易產生之地方,在 Gonazlez 和 Woods 所著作的 Digital Image Processing[19]介紹了許多消除高頻雜訊的方法,但使用濾波器來移除會 破壞到原本的影像。因此在本文是利用型態學的方式來處理這些雜訊等不必要的訊息

。其中相關的形態學處理包括:膨脹(dilation)、侵蝕(erosion)、閉合(closing)、斷開 (opening)。

(31)

20

2.3.1 像素近鄰

在座標(x,y)的像素 P,圍繞在其周圍的像素點即為 P 的近鄰(neighbor),其中又可 分為 4 近鄰(4-neighbors)與 8 近鄰(8-neighbors),如下圖 2.15 所示

(a) 4 近鄰 (b) 8 近鄰 圖 2.15 像素近鄰

由上圖可知其鄰接點。4 近鄰指的是像素 P 的 4 個水平及垂直方向像素點,其座標為:

(x,y+1)、(x-1,y)、(x+1,y)、(x,y-1)。8 近鄰則是指像素 P 點水平、垂直、左下、右下、

左上及右上的 8 個像素點,其座標為:(x-1,y+1)、(x,y+1)、(x+1,y+1)、(x-1,y)、(x+1,y)、

(x-1,y-1)、(x,y-1)、(x-1,y-1)。

2.3.2 膨脹與侵蝕

膨脹(dilation)是一種在二值影像中使物體增大或者變厚的運算;侵蝕(erosion)則 是使二值影像中的物件收縮或是便薄。膨脹與侵蝕是形態學處理的重要基礎,許多的 形態學演算法都建立在這兩個基本的運算上。而使二值影像增大或者縮小的特定方式 與程度是由一種稱為結構元素(structuring element)的形狀與大小變化,而此設定則可 透過使用者依照需求來控制。以下分別以數學式來表示膨脹與侵蝕,A 和 B 為 𝑍2中 的兩個集合(集合 B 為結構元素, 為空集合)。

(32)

21

A 藉由 B 的膨脹:

A B = { (𝐵) } (2 − 19) A 藉由 B 的侵蝕:

A ϴ B = { (𝐵) 𝑐 } (2 − 20)

下圖 2.16 為說明一張原始二值影像經由3 × 3正方形結構元素膨脹與侵蝕後的新影像

(a) 原始影像 (b) 3 × 3 正方形結構元素

(c) 膨脹後影像 (d) 侵蝕後影像 圖 2.16 影像膨脹與侵蝕

(33)

22

2.3.3 閉合與斷開

閉合(closing)與斷開(opening)是建立在膨脹與侵蝕的融合。閉合是使用相同結構 元素,先膨脹再做侵蝕;斷開則是使用相同結構元素,先侵蝕再做膨脹。在本文先後 有利用到閉合與斷開這兩個動作處理二值化影像。閉合的使用,在於先膨脹的動作可 以將所需區塊內沒抓取到的小區域空洞填補,而後的動作侵蝕可以將抓取到區域外型 過度向外擴張做一個收斂的動作;反之,斷開的使用,先侵蝕這個動作,可將於兩區 域間的錯誤連接部分區分出來,然後再利用膨脹的動作將過度侵蝕的部分作填充。

(2-21)與(2-22)為使用數學方式描述閉合與斷開 A 被 B 形態學上的閉合:

A ∙ B = (A B) ϴ B (2 − 21) A 被 B 形態學上的斷開:

A。B = (A ϴ B) B (2 − 22)

下圖 2.17 與圖 2.18 為實際二值化影像經閉合與斷開後得到的新影像

圖 2.17 影像閉合

(34)

23

圖 2.18 影像斷開

2.3.4 連通成分

所謂的連通成分(connected component)就是將影像標籤化(labeling),在本研究的 許多處理步驟中都有運用到此運算法,此法可將所要判別的同區塊作連結並且將不同 區塊標籤化為其它區塊,使在研究過程中可更方便的使用。連通元件標示法[20]

(connective component labeling)是一個相當重要的演算法,其目的是將影像二值化後 找出相鄰的像素視為同一元件,將互相連通的所有像素賦予同樣的標籤,代表這些像 素屬於同一個區域,即同一個物件。下圖 2.20,說明了 4 連通(4-adjacent connection area) 與 8 連通(8-adjacent connection area)兩種方法,兩種連通的差別在於 8 連通將斜對角 的鄰點也視為同一元件,4 連通則否。以下將針對標籤化流程做一個完整的說明,我 們假設偵測出來的前景像素為 1,而背景像素值為 0,所以我們將針對像素值為 1 的 前景物件進行連通標記,待標記的前景像素點為 P,而其相關 8 近鄰像素點表示如下 圖 2.19 所示。

圖 2.19 P 點與其 8 近鄰點

(35)

24

物件連通標籤化流程:(a)由左上至右下掃描影像,若發現沒有貼上標籤的前景像素點 P,給它貼上新的標籤號碼;(b)考慮前景像素點 P 八近鄰之 a、b、c、d、e、f、g、h 方向,若像素點 a、b、c、d、e、f、g、h 皆為前景物件則賦予該點與前景像素點 P 相 同的標號;(c)對於具有當前標號像素相連接著的所有像素,賦予同樣的標號;(d)一 直操作到沒有相連的像素出現為止;(e)找尋新的區塊前景 P 更新標籤號碼,返回(a) 處,重複(c)~(d);(f)對影像進行完整的掃描,掃描完畢即結束全部處理。圖 2.20 簡 單示意二值化影像標記後之結果。

(a) 二值影像 (b) 標記過影像 圖 2.20 二值化影像標記結果

2.4 相關性

相關性(correlation)的觀念相關運用非常的廣泛,可用來探討不同的事物是否有所 關連,例如:人在喝了酒之後與喝酒之前,喝酒前對事物的觀察敏銳度會高於喝下大 量酒精之後,喝酒與觀察敏銳度是不一樣的東西,但在你做了前面那個動作之後卻促 使下一個事件的發生。亦可用來探討兩個差不多的事物的其中關連,例如:水與冰,

將一杯水放入冰箱冷凍後結成了冰,雖然水與冰是不一樣的形態,但卻是同一樣東西。

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 1 1 0 0 0 0 0 0 0 0 20 20 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 20 20 20 20 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 20 20 20 20 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 20 20 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 1 1 0 0 0 0 0 1 0 0 21 21 0 0 0 0 0 22 0 0 1 1 0 1 1 1 1 1 0 0 21 21 0 22 22 22 22 22 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 22 22 22 22 22 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

(36)

25

在本文將相關性的觀念,用來當成一個判斷同樣的物品放在不同的位置上或者放大縮 小了,其中有什麼資訊可以用來幫助我們判斷它是同一個物品。如下圖 2.21 為一張 同樣的物品放大後放在不同位置

圖 2.21 一顆球放大後擺於不同位置

2.4.1 影像之相關係數

數位影像關係法是假設帶測物受力前、後所取得的影像,不會改變原有的灰度變 化規律,因此必須建立一個具有評斷性的指標來衡量變形前後子影像數值𝐼1與𝐼2兩陣 列的相似程度。在本實驗中我們利用此方法來看導盲磚影像,因為拍攝遠近的關係,

導盲磚排列方式如果為垂直方向,則會呈現類似梯形(trapezoidal)影像底部大於頂部之 情形,在此可以把它當成一種受力,導盲磚頂部受到壓縮之情形,而如果導盲磚排列 方式如是水平排列則幾乎沒變,如下圖 2.22、2.23。大體而言離散陣列的相依性可用 相關係數衡量𝐼1與𝐼2之間的關聯度,最常用的為最小平方相關係數(least squares correlation)公式如(2-23):

= ∑ {𝐼

1(𝑖, ) − 𝐼2(𝑖, )}2

2

𝑖, = 2

(2 − 23)

上式中, 為相關係數,代表變形前、後數位影像間之相關程度,𝐼1、𝐼2分別代表變 形前後子影像𝐶 與𝐶 的灰度值,當𝐼1與𝐼2完全相等時 值等於 0,若不為 0 則 值越低 表示其影像相似程度越高。導盲磚的內部有規律性的隆起,而其灰階值大小亦會隨著

(37)

26

規律性而有高低的變化。

圖 2.22 垂直方向導盲磚 圖 2.23 水平方向導盲磚

2.4.2 灰階相關性

在本文中想找出導盲磚與導盲磚之間的相關性,不用整個區域的影像當遮罩 (mask)而是在區域內不同位置,水平或垂直,同間隔畫三條線(劃線方式會在第三章作 解說),觀察畫線位置對應灰階值變化是否有高度相關性。圖 2.24 為將要探討區域劃 線圖與其相對灰階值大小變化。用來計算相關性的定義如(2-24)。

R(𝑖, ) = 𝐶(𝑖, )

√𝐶(𝑖)𝐶( ) (2 − 24)

其中,𝐶(𝑖, )為兩列變量的變異係數(coefficient of variation),即用於兩個變量的總體 誤差。𝐶(𝑖) 為兩個變量的 i 向量變化量,𝐶( )則是兩個變量的 j 向量變化量。R(𝑖, ) 為相關係數,其值介於-1~1 之間。值若為正數稱為正相關,指的是兩列變量變動方 向相同,一列變量由大到小或由小到大變化時,另一列變量亦由大到小或由小到大變 化;相反的,值若為負數稱為負相關,指的是兩列變量變動方向相反,一列變量由大 到小或由小到大變化時,另一列變量反由小到大或由大到小變化。但實際上計算相關 性時其灰階值可能會受到環境中許多雜訊:光影、落葉、缺角等所影響,所以數位影 像關係法無法完全理想的表示其相關性的大小,但是足以讓我們知道其中有一定的相 關程度。

(38)

27

(a) 將盲磚等距等長劃線

(b) 灰階波形圖

圖 2.24 導盲磚線上灰階繪圖

(39)

28

2.5 模糊理論

在本研究中模糊理論(fuzzy theorem)[21]被用來決定形狀相似度、色彩灰階符合度 以及區域內灰階值相關性還有最後的決策是否為正確資訊之應用。由此可見模糊理論 是一個非常方便被用來表達一件事情的方法,同時也是調適性網路模糊推論系統 (ANFIS)的建構基礎。因此在本章將會先紹模糊理論的一些基本概念,包括模糊的起 源、模糊集合、模糊關聯及模糊推論系統。

模糊(fuzzy)即為模糊不清、不精確的意思。該理論誕生於 1965 年,美國加州柏 克萊大學 L.A.Zadeth(札德)教授在資訊與控制(information and control)學術雜誌上,

「Fuzzy 集合」的論文[22]。雖然模糊理論一開提出受到相當多的質疑,但是經過時 間與成果的呈現,漸漸地越來越受到重視。在美國本土,fuzzy 的應用方面就屬 NASA(美國航空暨太空總署)最為積極,且已有一些具體成果[23]。日本則是目前世界 第一的 fuzzy 產品開發國家,以模糊理論結合自動控制,應用於家電產品上,表現非 凡,中國大陸則是模糊理論論文最多之國家。模糊理論提供一種邏輯系統用來處理人 類的邏輯推論過程,並可用來解析人類語意或分析描述性語言,解決了傳統集合或理 論所無法描述的現象與問題。在日常生活中常常可以發現這樣的概念,例如:現在幾 點鐘、開車快慢、西瓜甜不甜,都是模糊的概念。

模糊理論發展迄今已逾 40 年,而其應用包羅萬象,分別略述於下:

一、影像識別:應用於醫學病症的判別、手寫字體、印刷字體、語音、指紋識別等。

二、自動控制:各種家電控制、溫度控制、工業電力控制、機器人控制、地下鐵電車 起動及停站、汽車駕駛控制等。

三、其他如資料管理、教學評量、心理分析、財經管理、均為 Fuzzy 應用範圍。

2.5.1 模糊集合

集合概念又分為明確集合(Crisp Seys)與模糊集合(fuzzy sets)下面將會將此二概念 分開說明。明確集合(傳統集合),意指一個集合與一個元素在宇集合( universe of discourse or universal set)中,兩者之間的關係只有「屬於」與「不屬於」沒有模糊地

(40)

29

帶「可能屬於」,也就是明確集合的邊界必須是非常嚴格且明確的,其數學表式式如 下(2-25)。

A = {𝑥, 𝜇𝐴(𝑥) 𝑥 𝜖 𝑈}

𝜇𝐴(𝑥) = {1,𝑖𝑓 𝑥 ∈

0,𝑖𝑓 𝑥 ∈ (2 − 25)

其中𝑈為宇集合,𝜇𝐴(𝑥)表示 x 屬於或不屬於 A 集合的表示值。而下圖 2.25 為傳統集 合之表示圖。其中,1 代表屬於,0 代表不屬於,沒有別的數值了。

圖 2.25 傳統集合表示圖

模糊集合,由 Zadeh 主張將現實中所得到的模糊資訊以多值邏輯的觀念將其數值化,

說明模糊集合是一種明確集合的推廣,其定義為,某一集合中之元素隸屬於某一個集 合的程度。照上面敘述傳統集合的說法,模糊集合在兩個群組 A 與 B 當中,可以說

「可能屬於 A」,或者「可能屬於 B」或是「30%像 A70%像 B」種種說法。而其數學 表示式如(2-26)式。

A = {(𝑥, 𝜇𝐴(𝑥)) 𝑥𝜖𝑈},𝜇𝐴(𝑥) = 𝑓(𝑥),𝑥 𝜖 𝑈 (2 − 26)

其中,𝑓(𝑥)表示 0~1 之間的函數,𝜇𝐴(𝑥)表示 𝑥 屬於 A 集合的程度,也就是表示𝑥在

(41)

30

A 集合的隸屬度(degree of membership)。圖 2.26 為模糊集合表示圖,其邊界為模糊 邊緣而非明顯邊界。

圖 2.26 模糊集合表示圖

上圖中,A 集合越往中心點其值越接近 1,亦即歸屬度越高,而向外開始遞減至 0。

而下圖 2.27 為一溫度高低明確與模糊集合示意圖

(a) 明確集合

(b) 模糊集合

圖 2.27 溫度舒適度感覺集合

(42)

31

2.5.2 隸屬函數與模糊化

隸屬函數(membership function)又可稱為歸屬函數,是用以表示模糊集合中該元 素符合其隸屬於該模糊集合的程度。隸屬函數可以描述模糊集合的性質,隸屬函數是 模糊理論的最基本概念,透過隸屬函數對模糊集合進行量化,如此才能利用精確的數 學方法去分析和處理模糊性資訊。設在論域上有一個模糊子集 A,記為A ∈ f(x),對 於任意元素 x∈ X,給定一個μ(x)使得0 ≤ μ(x) ≤ 1,而μ(x)稱為模糊子集 A 的隸屬函 數,若μ(x)越接近 1,則 x 隸屬於 A 的程度越高。

隸屬函數乃表示全體集合中元素相對應於模糊子集之隸屬關係,一般的隸屬函數 可以用數值或函數的形式定義,用數值的方式定義稱為離散型(discretization)隸屬函數

,用函數來定義的稱為連續型(continuous)隸屬函數。隸屬函數的訂定可根據個人觀點 主觀的選擇適合分析資料的隸屬函數。典型的連續型隸屬函數有三角形、梯形、吊鐘 形與高斯型,而在眾多的型態中,目前相似度測量方法的應用最常見的為三角模糊數 與梯形模糊數。圖2.28分別為單值模糊化、三角型模糊化、梯形模糊化、與高斯模糊 化圖,而圖形下面(2-27~2-30)則為其對應函數。

(a) 單值模糊化

𝜇𝐴(𝑥) = {1,𝑥 = 𝑥

0,𝑜𝑡ℎ𝑒𝑟𝑠,𝑥 = [𝑥1, 𝑥2]𝜖𝑋 (2 − 27)

(43)

32

(b) 梯形模糊化

𝜇𝐴(𝑥) =

{

0 ,𝑥 < 𝑎 (𝑥 − 𝑎) (𝑏 − 𝑎),⁄ 𝑎 ≤ 𝑥 ≤ 𝑏 1 ,𝑏 ≤ 𝑥 ≤ 𝑐

(𝑎 − 𝑥) (𝑑 − 𝑐)⁄ ,𝑐 ≤ 𝑥 ≤ 𝑑 0 ,𝑥 > 𝑑

(2 − 28)

(c) 三角模糊化

𝜇𝐴(𝑥) = {

0 ,𝑥 < 𝑎 (𝑥 − 𝑎) (𝑏 − 𝑎),⁄ 𝑎 ≤ 𝑥 ≤ 𝑏

(𝑐 − 𝑥) (𝑐 − 𝑏)⁄ ,𝑏 ≤ 𝑥 ≤ 𝑐 0 ,𝑥 > 𝑐

(2 − 29)

(44)

33

(d)高斯模糊化

𝜇𝐴(𝑥) = 𝑒𝑥𝑝 (−(𝑥 − 𝑐)2

2𝜎2 ) (2 − 30)

圖 2.28 集合模糊化表示圖

2.5.3 α-截集

α-截集(α-cut)[21],在模糊集合與明確集合間扮演著一個很重要的角色,也可說 是模糊集合與明確集合之間的一座橋梁。為何是一個重要的角色,舉一個生活中的例 子,鄰居說我長得像爸爸,但他們不會說我有 60% 像爸爸,因為 60%是他們心中的 衡量標準超過該標準則認定"像"。同樣應用在集合上,α-截集,即是一個衡量標準,

其值是由使用者自訂,所以模糊集合之α-截集是"明確集合"而非模糊集合。

若有一模糊數 A,有α-截集,其定義為論域 U 中所有對模糊集合 A 之隸屬度大

於或等於α的元素𝑥所組成的集合即為 𝛼,稱為模糊集合 A 的α-截集。定義如下式

(2-29)。

𝛼= {𝑥 𝜇𝐴 ≥ 𝛼, 𝑥𝜖𝑈},0 ≤ 𝛼 ≤ 1 (2 − 29)

其中, 𝛼稱為糊糊數 A 的α-截集,如圖 2.29 所示。

(45)

34

圖 2.29 梯形模糊化α-截集示意圖

2.5.4 模糊集合之運算

在集合運算中,常見的有三種集合運算:聯集(union)、交集(intersection)與補 集(complement),下面將介紹其模糊運算。

交集:

模糊集合之交集(t-基準;t-norms)。兩個模糊集合 A 與 B 的交集,以 A B 表 示。定義如下(2-30)。

𝜇𝐴 𝐵(𝑥) = 𝑚𝑖𝑛[𝜇𝐴(𝑥), 𝜇𝐵(𝑥)] ≡ 𝜇𝐴(𝑥)˄𝜇𝐵(𝑥) (2 − 30)

其中,min 為取兩者之中最小者。

聯集:

模糊集合之聯集(t-反基;s-norms 或 t-conorms)。兩個模糊集合 A 與 B 的聯 集,以 A∪B 表示。定義如下(2-31)。

𝜇𝐴∪𝐵(𝑥) = 𝑚𝑎𝑥[𝜇𝐴(𝑥), 𝜇𝐵(𝑥)] ≡ 𝜇𝐴(𝑥)˅𝜇𝐵(𝑥) (2 − 31)

(46)

35

其中,max 為取兩者之中最大者。

補集:

模糊集合之補集。在宇集合中,可由任一集合 A 與其補集合(complement)A 所組成。其定義如下(2-32)

𝜇𝐴(𝑥) = 1 − 𝜇𝐴(𝑥) (2 − 32)

上述各式中符號說明:˄為取小運算符號;˅為取大運算符號。

2.5.5 解模糊化

解模糊化的過程剛好與模糊化相反。它是把一個模糊集合 B(y),y∈Y,轉化至 一個明確值y(𝑥)的過程。而解模糊化的三個準則如下[21]:

(1)合理性:至少在人的直覺上,y(𝑥)代表 B(y)是合理的,可被接受的。

(2)計算簡單:其目的在於模糊控制問題上方便使用。

(3)連續性:B(y)之形狀有稍許變化,𝑦之位置變化不會太大。

解模糊化常見的方法:

重心解模糊化方法(center of gravity defuzzifier):

y(𝑥) =∑𝑁𝑖=1𝑦𝑖𝜇(𝑦𝑖)

𝑁𝑖=1𝜇(𝑦𝑖) (2 − 33)

其中,𝜇(𝑦𝑖)為的 i 個規則輸出集合的歸屬度,𝑦𝑖為的 i 個規則之輸出值,N 是其規則 總數。

面積和之中心解模糊化法:

y(𝑥) =∑𝑁𝑖=1𝑦𝑖𝑁 =1𝜇 (𝑦𝑖)

𝑁𝑖=1𝑀 =1𝜇 (𝑦𝑖) (2 − 34)

(47)

36

其中,𝜇 (𝑦𝑖)為的 i 個輸出值的第 j 個集合之歸屬函數,𝑦𝑖為的 i 個規則之輸出值,N 則為規則總數。

中心平均值解模糊化法(center average defuzzificayion):

y(𝑥) =∑𝑁𝑖=1𝑝𝑖ℎ(𝐵𝑖)

𝑁𝑖=1ℎ(𝐵𝑖) (2 − 35)

其中,ℎ(𝐵𝑖)為模糊輸出函數𝐵𝑖的高度。𝑝𝑖為𝐵𝑖在未經矮化之前最中心點y值。此法又 稱為高度解模糊化法(heigth defuzzification)。

2.5.6 模糊規則庫

模糊規則庫模為糊推論系統(FIS)架構的主要核心,主要由資料庫及規則庫構 成。資料庫可經由專家提供、知識擷取或經由資料特性分類產生;而規則庫是由一組 以上模糊規則構成,其建立 IF-THEN 模糊規則庫,在 IF 部分的敘述為模糊規則的前 件部部分,而 THEN 部分的敘述則為的後件部部分,常見的模糊規則形式有:語意 式模糊規則(mamdani fuzzy rule)、函數式模糊規則(sugeno fuzzy rule)、Tsukamoto 式 模糊規則(tsukamoto fuzzy rule),此三種規則的主要差別只在於模糊規則的後件部有 所不同而已。一般來說有兩種取得模糊規則的方式:第一種方式也是最直接的方式,

就是由專家來提供所須的模糊規則;第二種方式是先收集一些量測資料後,再從量測 資料中萃取出模糊規則。第三種模糊規則與 Mamdani 模糊規則的差異性不多,是一 種語意式模糊規則的簡化。

2.5.7 模糊控制器

模糊控制器是構建於模糊集合理論上的邏輯系統,為提供一個近似推理方式來處 理自然語言中語意不明的模糊命題,進而完成對系統的控制。下圖 2.30 為模糊控制 器架構圖。

(48)

37

模糊變數 模糊變數 模糊規則庫

模糊化 推論引擎 解模糊化 輸出

模糊控制器

輸入

圖 2.30 模糊控制器架構

(49)

38

第三章

研究及實驗方法

此章節為本文之重心,下面內容將實驗過程中所用到的技術、方法詳細介紹,

並清楚標示且同步將其作用使用圖片或者是數據表示。在開頭先將整個實驗流程用文 字的方式粗略介紹並說明用意。在本章將實驗流程分為五個小節來說明。3.1 節為前 處理部分,裡面包括色彩空間轉換、自動門檻二值化與形態學。3.2 節內容是統計並 設定 RGB 空間轉 YCbCr 空間後導盲磚可能灰階值區間,並且將之視為是否為導盲路 線的第一個條件。3.3 節內容計算需判別區域內,在三條標線位置之灰階值變化是否 有相關性,並設定門檻值來判斷是否為必須考慮之相關或者是錯誤相關,此為是否為 導盲路線的第二個條件。3.4 節內容是利用形狀之圓形特徵為條件,將較為接近圓形 之機率值較大者作為非導盲磚之條件,而機率值較小者為導盲路線的第三個條件,其 中是否為圓之機率門檻值由本實驗觀察統計後自訂。最後 3.5 節之內容是將前面條件 使用模糊理論之決策方式定義出正確之導盲磚路線區塊。下圖 3.1 為本實驗之總流程 架構。

(50)

39

圖 3.1 實驗研究總流程圖

色彩空間轉換 目的:找尋可分離亮度

與色彩的方法

輸入影像

Rgb2ycbcr

其中以Cb分量為本實驗數據判斷

自動二值化門檻值:Otsu

形態學

斷開

閉合

面積法

mesh觀察

觀察其兩塊區域灰階圖

門檻灰階值並將區塊內符合門檻值 pixel與區塊總像素統計轉為機率值

(符合像素/總像素)*100%

圓形目標物 並且設立機率值

由系統決策區塊中是否有導盲 如有即標明何區有 如無則標示非導盲磚 相關性

各區域內各有3個R與P 值其中P<0.05及其波 形有重大相關性,找 出相對應最大R值

填充

結束 結束

(51)

40

3.1 影像前處理

在本文影像前處理包括了:色彩空間轉換、自動門檻二值化與形態學。介紹方法 將依實驗步驟順序介紹,首先介紹,色彩空間轉換。下圖 3.2 為色彩空間轉換之方法 與流程。

色彩空間轉換:

圖 3.2 色彩空間轉換流程

輸入RGB影像

RGB轉YCbCr轉換式

輸出YCbCr影像

(52)

41

在觀察顏色敏感度的實驗中,我們是用九種自訂的顏色,其中有紅、橙、黃、綠、藍、

青、灰、紫、棕這些環境中可能會遇到的顏色之深淺變化。如圖 3.3。

(a)紅 (b)橙 (c)黃 (d)綠 (e)藍 (f)青 (g)灰 (h)紫 (i)棕

圖 3.3 自訂之九種顏色深淺

(53)

42

圖 3.4 RGB 空間九種顏色對應灰階直方圖(由左上至右下 排列紅~棕)

圖 3.5 Cb 分量灰階值方圖(由左上至右下排列紅~棕)

(54)

43

上面之色彩灰階統計中,本實驗嘗試了 RBG、CMY、YIQ、HSI、HSV 與 YCbCr 六種空間模式。一般影像皆為 RGB 色彩,但此色彩空間容易受到亮度、陰影所影響,

而轉換色彩空間之目的就是為了減少這些環境因子所造成之影響。而在上述六種顏色 空間中,本文使用 YCbCr 色彩空間,此空間分為 Y(lminance)與 Cb(bueness)、Cr(rdness) 兩個彩度元素,對亮度的分離性較高,方便與彩度分開操作,在本文將不考慮 Y 分 量,而討論其 Cb 與 Cr 分量,當中發現 Cb 分量與 Cr 都有相當好的色彩收斂性,各 色彩之灰階分布也較為集中,可幫助分類需要討論之顏色與不需要之顏色,最後本實 驗選取 Cb 分量為後面對顏色灰階分布統計之應用。上圖 3.4 為 RGB 色彩空間對顏色 深淺之灰階直方分布圖;而圖 3.5 為 YCbCr 色彩空間對顏色深淺之灰階值方分布圖,

由此圖 3.5 可以觀察出此空間對於橙色與黃色之灰階分布與其它顏色有明顯之灰階值 分布區隔。在大部分情形下導盲磚顏色皆為此兩種顏色之組成,所以 YCbCr 色彩空 間確實適合用在本實驗中。在許多人臉偵測[24.25.26]之研究當中也是使用 YCbCr 色 彩空間,膚色大部分被歸類相似於本文之橙色與黃色色彩,也剛好與本色彩空間之使 用判斷相符合。當中 RGB 色彩空間轉 YCbCr 色彩空間之轉換式為(2-3)式。下圖 3.6 為 RGB 轉灰階與 YCbCr 之 Cb 分量顯示圖

(a) RGB 轉灰階 (b) Cb 分量 圖 3.6 色彩灰階化圖

(55)

44

自動門檻二值化:

自動門檻二值化,其目的在於讓系統自行將影像中可能為導盲磚之影像以二值化 之效果與背景區分出來,這可以節省許多時間在使用者檢視可能為導盲磚區域的動作 上,尤其在資料量大的時候,更可以凸顯出其優點。

本文所使用的自動門檻二值化之方法是歐蘇法。下面將歐蘇法分為四個步驟一一 說明:

(1)兩個群組分別出現之機率:

先將影像轉為灰階值(0 ~ 255)之間,先將區間之值設為兩個群組,假設此區隔區 域之門檻值為 t,將資料分成灰階值≤t 與灰階值> t,然後分別計算出灰階值小於或等 於 t 的那一個群組之機率𝑞1(𝑡)與灰階值大於 t 的群組之機率𝑞2(𝑡),計算兩個群組機率 之方法是使用(2-11)與(2-12)式。

(2)兩個群組之灰階平均值:

假設灰階值小於或等於 t 之群組灰階平均值為𝜇1(𝑡),計算𝜇1(𝑡)值的方法為將灰階 值小於或等於 t 之各像素出現之機率總和與其群組出現之機率相除在乘上各出現像素 之灰階值,將這些值相加即可得到灰階平均值,其算法如(2-13)與(2-14)式。

(3)設定群組內之標準差:

此標準差設定方式為找出 t 值使得其分群之灰階平均值與其群組內之所有灰階值 之相差總和為最小值,算式如(2-15)(2-16)式。

(4)計算出群組內之變異數權重合:

群組變異數之權重合算法是將各群組之出線機率與其群組內之標準差相乘。其算 法如(2-17)式。

統計所有結果找出 t 值的方法是透過 MATLAB 系統簡單的循序搜尋(0 ≤ t ≤ 255),

當 t 可使各群組之便異數總和為最小值時,t 值即為此算法之二值化門檻值。下圖 3.7 為一原始影像與經過歐蘇法後自動找出其區塊之二值化圖。

(56)

45

(a) 原始影像

(b) 自動門檻二值化 圖 3.7 二值化

其中,圖 3.7(b)圖上方紅色圈圈部分之值 125 即為系統計算出之 t 值。每張影像都有 使其相對之變異數總合為最小之輸入 t,系統將使用上述方法將 t 值找出。

Figure

Updating...

References

Related subjects :