• 沒有找到結果。

I-Shou University Institutional Repository:Item 987654321/18671

N/A
N/A
Protected

Academic year: 2021

Share "I-Shou University Institutional Repository:Item 987654321/18671"

Copied!
82
0
0

加載中.... (立即查看全文)

全文

(1)

資 訊 工 程 研 究 所

碩 士 論 文

運用機器學習辨識雲的種類

Cloud Types Identification by Using the

Machine Learning

研 究 生: 陳維楨

指 導 教 授 : 黃健興 博士

(2)

運用機器學習辨識雲的種類

Cloud Types Identification by Using the

Machine Learning

研究生

:陳維楨

Student

:WEI-ZHEN CHEN

指導教授 :黃健興 博士

Advisor

:Dr. Chien Hsiang Huang

義守大學

資訊工程研究所

碩士論文

A Thesis

Submitted to Department of Information Engineering I-Shou University

in Partial Fulfillment of the Requirements for the Master Degree

in

Information Engineering

June, 2015

(3)
(4)

運用機器學習辨識雲的種類

研 究 生 : 陳 維 楨

指 導 教 授 : 黃 健 興 博 士

義守大學資訊工程研究所

摘要

在天氣觀測中,日照、雨量、風與溫度等資訊可藉由儀器觀測獲 得,但雲的種類與雲的覆蓋量則需要使用肉眼觀測,本研究之目的是 藉由攝影機所拍攝的影像去估測雲量與辨識雲族。 在估測雲量的部分,取得影像後給予閥值,將其分割為雲和藍天 黑白兩部分,然而,不同天氣的情況,我們所提出的分割雲的方法是 最有效的,當影像的標準差在 0.04 到 0.1 之間時以 R/B 平均值作為閥 值,其他情況使用色彩空間 R 與 B 的差值作為選取條件,當差值介 於 30 到-30 之間,判斷此像素點為雲的部分。 在辨識雲族的部分,使用區域二元編碼(LBP)取得紋理特徵,也 運用 R/B 值正規化後之影像強度作為色彩特徵,接著使用主成分分析 (PCA)找出色彩與紋理特徵分佈維度,將降低維度的特徵帶入支撐向 量機(SVM)分類成高雲族、中雲族、低雲族與直展雲族。 混合 R/B 平均值作為閥值的方法與使用色彩空間 R 與 B 的差值 判斷出雲的方法,比單一種做法所分割出來的結果更好,能有效的分 割出雲的部分,在雲族分類的部分,SVM 分類測試的結果是有效的, 正確率為 96.7%。 關鍵字:雲的種類、區塊二元局部編碼、主成分分析、支撐向量機

(5)

Cloud Types Identification by Using the

Machine Learning

Student:WEI-ZHEN CHEN

Advisor:Dr. Chien Hsiang Huang

Department of Information Engineering

I-Shou University

Abstract

For observation of weather, we can observe the information of sunshine, rain, temperature and wind by instruments, but the amount of cloud and the cloud types must be obtained by human eyes. The purpose of this thesis is to measure the amount of cloud and to identify the cloud types by the technique of computer vision and machine learning.

In order to estimate of amount of cloud, the image segmentation is adopted to part the cloud and the sky as white and black partition by thresholding. However, there are many situation of weather, we propose the method to choice the best criteria for segmentation. While the standard deviation of image between 0.04 and 0.1, the average of R/B values is adopted as threshold, otherwise the intensity difference of the red and blue color between 30 and -30 is judged as cloud part.

For the identification of cloud types, the Local Binary Pattern (LBP) is adopted to obtain the texture feature vector, and the ratio of red to blue intensity in image is adopted to obtain the color feature vector after normalized. Then, the algorithm of principal components analysis (PCA) is used to reduce the dimension of the feature vector and then the support vector machine is adopted to classify the types of cloud.

There are two major contributions in this thesis. Firstly, our cloud segmentation combines two criteria which is better than the binarization using R/B=0.8 as the threshold and the judgment by the difference between red and blue intensity, and secondly, we speed up the classification of cloud using support vector machine by decision tree. The accuracy of classification is up to 96.7%.

(6)

致謝

在研究所這兩年,感謝黃健興老師在這兩年不厭其煩地教導,經 過教授的指導後,讓我發現問題並解決,也感謝林老師在修課上教導 與研究室的同學們互相學習,在研究期間一起討論程式設計與解決問 題的方法,雖然我們都是相關領域的研究,但是方法跟問題都不盡相 同,但還好研究都有相關性,所以在討論上很容易相互理解,也感謝 學長常提出程式設計的問題,讓我在程式方面有一定的進步,最後感 謝家裡的支持,讓我能順利完成學業。

(7)

目錄

摘要 ... I Abstract ... II 致謝 ... III 目錄 ... IV 圖目錄 ... VII 表目錄 ... IX 一、研究動機與背景 ... 1 1.1 問題與描述 ... 1 1.2 研究動機 ... 1 1.3 論文架構 ... 3 二、相關研究及文獻探討 ... 4 2.1 雲的觀測 ... 4 2.1.1 雲狀(cloud type) ... 4 2.1.2 雲量(cloud amount) ... 7 2.2 Red/Blue 值 ... 9 2.3 雲區域分割 ... 9

(8)

2.5 共現矩陣 ... 13 2.6 機器學習 ... 15 2.6.1 主成分分析 ... 15 2.6.2 K 平均演算法 ... 16 2.6.3 支撐向量機 ... 18 三、研究方法與步驟 ... 20 3.1 實驗樣本 ... 25 3.2 雲影像分割 ... 26 3.3 雲影像特徵選取 ... 30 3.3.1 色彩特徵 ... 30 3.3.2 紋理特徵 ... 31 3.4 特徵降階與分類 ... 33 3.4.1 特徵降階 ... 33 3.4.2 分類方式 ... 35 四、實驗結果... 40 4.1 數據庫 ... 40 4.2 實驗數據 ... 40 4.2.1 雲量的估測 ... 41 4.2.2 雲族辨識 ... 47

(9)

五、結論 ... 52 參考文獻 ... 53 附錄一 ... a 附錄二 ... f 附錄三 ... l

(10)

圖目錄

圖 1、日照的測量儀器 ... 2 圖 2、溫度與雨量測量儀器 ... 2 圖 3、高雲族 ... 5 圖 4、中雲族 ... 6 圖 5、低雲族 ... 6 圖 6、直展雲族 ... 7 圖 7、雲影像、色彩空間 R 與空間 B ... 9 圖 8、R/B 二值化分割之結果 ... 10 圖 9、Otsu 二值化分割之結果 ... 11 圖 10、LBP 計算方式 ... 12 圖 11、共現矩陣計算方式 ... 13 圖 12、PCA 投影示意圖 ... 16 圖 13、K-mean 示意圖 ... 17 圖 14、二維支撐向量機示意圖 ... 18 圖 15、雲量估測的步驟 ... 21 圖 16、色彩與紋理特徵抽取過程 ... 22 圖 17、雲族分類訓練步驟 ... 23

(11)

圖 18、雲族分類測試步驟 ... 24 圖 19、分割示意圖 ... 25 圖 20、不同 LBP 範圍的取樣 ... 31 圖 21、

3

3

範圍的 LBP:(a1)~(d1)不同雲族雲影像;(a2)~(d2). 不同雲族紋理出現次數統計圖 ... 32 圖 22、第一種方法的 SVM 分類 ... 36 圖 23、第二種 SVM 分類方法 ... 38

(12)

表目錄

表 1、各氣象的觀測方法 ... 3 表 2、四大雲族 ... 5 表 3、八分數雲量表 ... 8 表 4、不同雲影像與 R/B 之比較 ... 28 表 5、方法一的雲族編號 ... 37 表 6、第一次 SVM 分類正確率比較 ... 37 表 7、第二次 SVM 分類正確率比較 ... 38 表 8、方法二雲族編號 ... 39 表 9、碧空情況各方法比較 ... 42 表 10、少雲情況各方法比較 ... 43 表 11、疏雲情況各方法比較 ... 44 表 12、裂雲情況各方法比較 ... 45 表 13、密雲情況各方法比較 ... 46 表 14、各雲族 SVM 分類結果 ... 47 表 15、雲族個別 SVM 分類結果 ... 48 表 16、無法分類情況的雲族編號 ... 49 表 17、樹狀 SVM 第二次分類結果 ... 50

(13)

表 18、樹狀 SVM 第三次分類結果 ... 50 表 19、雲族樹狀 SVM 分類結果 ... 51

(14)

一、研究動機與背景

1.1 問題與描述

一般來說天氣的好壞與雲的種類是有關聯性的,在航空方面,飛 機在空中飛行,常會與雲相遇,對於飛行人員來說需要注意是否有積 雨雲與塔狀積雲的出現,在積狀雲之雲中或雲外附近,有時會遭遇亂 流、積冰、雷暴等顯著天氣,對飛航安全有重大的影響,這些雲的種 類與數量是我們可以用肉眼去判定,由雲的類型與數量來判定天氣的 好壞,如果能將攝影機所拍攝天空中天氣狀況影像傳送給電腦,是否 能夠由電腦來進行判斷,而電腦要如何去判斷是否為好天氣,可能從 雲的顏色或形狀來判斷,或當有兩張天氣的影像,電腦是否能分析出 是不是同種雲的可能性,有沒有可能有一個資料庫可以給電腦進行比 對,讓電腦能正確判斷天氣情況。

1.2 研究動機

在天氣觀測中是在指定的時間中對大氣進行觀測,編成一個天 氣報告,內容主要包含觀測溫度,風,能見度,天氣狀況,雲,雨量, 氣壓,這些資料對於天氣預測十分重要,所以在觀測天氣方面設立了 許多自動氣象站不停的收集資料,經由網路回即時傳回總部,以機場

(15)

為例,每半個小時就需要做一份例行性的天氣報告,需要在十分鐘完 成這份報告,傳送到需要資訊的單位去。 各個地區的自動觀測站在溫度,風,雨量,氣壓與日照方面的資 料收集各種氣象的觀察方式不同,大部分都有一些儀器輔助,藉由儀 器的輔助就能以正確數據送至天文台,所以成效不錯。 日照計 日射計量表 紫外線表 圖 1、日照的測量儀器 最低草溫 溫度表 土壤溫度 溫度表 蒸發皿 蒸散量測定 裝置 圖 2、溫度與雨量測量儀器 但是在觀測天氣狀況與雲的方面,還是需目前還是要以人力去做 觀察,才有辦法進行回報,如表 1 所示:

(16)

表 1、各氣象的觀測方法 表一參考於香港天文台的天氣觀測課程,使用電腦來代替人眼判 斷的情況下,再傳輸資訊方面比較快速,而且不用派人到實地觀察, 減少人力的消耗,如果能做到與資料庫比對天氣狀況的話,會比人眼 觀察的資訊客觀。

1.3 論文架構

在章節 2.1 說明了不同雲族的特性與不同雲量的觀測方式,並在 章節 2.2 提到色彩空間 R 與 B 與雲影像的關聯性,雲量的估測在章節 2.3 簡述了以往分割雲的幾種方法,並在第三章的章節 3.2 提出我們 的方法,在雲族辨識的部分,章節 2.4 與 2.5 介紹不同的紋理特徵擷 取方式,章節 2.6 談到了機器學習的分類方式,第三章的章節 3.3 說 明實驗中擷取特徵的方式,並在章節 3.4 將特徵降階並運用 SVM 分 類的過程,而第四章是雲量估測與雲族分類的實驗結果。

(17)

二、相關研究及文獻探討

2.1 雲的觀測

在氣象觀測實務上,雲的觀測的內容包含雲的形狀與類型的辨識、 範圍天空中雲量的之估測及使用儀器探雲燈照射雲的底部,測量雲到 地面的高度。

2.1.1 雲狀(cloud type)

科學上雲的分類最早是由法國博物學家讓-巴蒂斯特·拉馬克 (Jean-Baptiste Pierre Antoine de Monet, Chevalier de Lamarck,1744 年 8 月 1 日-1829 年 12 月 18 日)於 1801 年提出;國際氣象組織在 1929 年以英國科學家盧克·霍華德(Luke Howard)於 1803 年制定的 分類法為基礎,按雲的形狀、組成、形成原因等把雲分為十大雲屬。 以雲的分佈高度來看可分為四大類,在香港天文台的天氣觀測課 程中,將十大雲屬分類為高雲族、中雲族、低雲族與直展雲族,歸類 如表 2 所示。

(18)

表 2、四大雲族 雲族 雲屬 熱帶區高度 中緯度區高度 極區高度 高雲族 捲雲(Ci) 捲積雲(Cc) 捲層雲(Cs) 6000~18000m 5000~13000m 3000~8000m 中雲族 高積雲(Ac) 高層雲(As) 2000~8000m 2000~7000m 2000~4000m 低雲族 層雲(St) 層積雲(Sc) 雨層雲(Ns) 0~2000m 0~2000m 0~2000m 直展雲族 積雲(Cu) 積雨雲(Cb) 雲底在低雲族的範圍, 雲頂可伸展到中雲族與高雲族的範圍。 高雲族分成卷雲、卷層雲、卷積雲三種,在影像中雲是白色混點 藍色,而背景的天空是藍色的,薄而透明且透光度高,是典型好天氣 的天空。 (a)卷雲 (b)卷層雲 (c)卷積雲 圖 3、高雲族 中雲族有高積雲與高層雲,高積雲由灰白的塊狀雲組成常以魚鱗 或扁平瓦塊狀呈現;高層雲是灰色一大片的雲,此種雲可能出現連續 下雨的情況發生,也可能加厚雲層降低高度成為雨層雲。

(19)

(a)高積雲 (b)高層雲 圖 4、中雲族 低雲族有層雲,層積雲,雨層雲其中的層雲如果很接近地面,就 是俗稱為霧,基本上層雲式覆蓋整張影像,所以可能無法判斷天空的 部分;層積雲聚集了大量的水氣使雲底的顏色偏黑,一大片的雲塊, 排列成行 ; 雨層雲成暗灰色,雲底散亂,有高機率出現連續性下雨 的情況。 (a)雨層雲 (b)層雲 (c)層積雲 圖 5、低雲族 在直展雲族中,積雲大多是一塊塊的分開,並且可以清楚看見藍 天;積雨雲因上升氣流使積雲呈現塔狀結構,這類型的雲上半部是白 色的,但下半部水氣多所以偏黑,容易產生間歇性的暴雨。可能形成 龐大出現大驟雨的情況。

(20)

(c)積雲 (d)積雨雲 圖 6、直展雲族

2.1.2 雲量(cloud amount)

天氣觀測除了分析雲的種類之外,也需要觀察天空中雲量的分佈, 雲量的估計是以天空中被雲遮蔽的總面積來計算,航空上以八分數 (okta)表示,所謂的八分數是將天空面積為八等份。 舉例來說,如果天空有八分之五的面積被雲所覆蓋,則該的雲量 為 5/8(5 okat),在航空上,又以碧空、少雲、疏雲、裂雲與密雲來表 示雲量,其意義如下表 3,然而一般用人眼在觀察雲量時,可能會出 現比 1/8(1 okat)少但是也不是晴空無雲的情況,遇到這種情況以 1/8 的一半來表示,也就是 1/16 來表示目測的結果,所以在實驗中,目 測的結果是將雲分成十六等分來記錄。

(21)

表 3、八分數雲量表 名稱 雲量 示意圖 碧空(SKC) 0 少雲(FEW) 1/8~2/8 疏雲(SCT) 3/8~4/8 裂雲(BKN) 5/8~7/8 密雲(OVC) 8/8 而實驗中需要從影像中分析出天空中雲的種類與數量,藉由分析 影像中的色彩與紋理的資訊,分類出不同種類與數量的雲影像,根據 不同種類的雲,擷取出不同的色彩與紋理特徵,透過這些特徵的收集 與統計,可分類出不同種雲的模組,並且測試這些模組是否能正確分 類不同雲的種類。

(22)

2.2 Red/Blue 值

R/B 值是由 RGB 色彩空間取的影像 R 空間與 B 空間影像的比值, 這個方法是由 C. N. Long, J. M. Sabburg, J. Calbó, and D. Pagès, 在 2006 年提出一種分割天空中雲部分的方法[2],其中提到在晴天的情 況下,藍光散射的能力比紅光強,也就是在一張天空影像當中,藍天 的部分的影像 B 值會比影像 R 值還大,而雲的部分 B 值與 R 值較為 不明顯,也就是 R/B 值小能表示這個像素值可能為藍天的部分,R/B 值大代表示雲的部分。 (a)原圖 (b)色彩空間 R (C)色彩空間 B 圖 7、雲影像、色彩空間 R 與空間 B

2.3 雲區域分割

如何從一張圖片中,分割出我們所需要的部分,以二值化的角度 來看,就是給予一個閥值去分個出需要與不需要的區域,而如何去設 定這個閥值,有些方法是觀察目標物件的特性,並以此特性去分割出 需要的部分,另一種方式是使用統計式的方式去自動計算出閥值,並

(23)

以此閥值去進行分割。

A. Heinle, A. Macke , and A. Srivastav 在 2010 年提出改善 R/B 值 為閥值分割影像中雲的部分[3],在該論文中提到使用 RB 30值做 為雲影像分割的閥值,相減的值介於 30 到-30 都算雲的部分,與 R/B 值等於 0.8 當閥值作比較,將圖片二值化,分割出雲的部分,以白色 為雲,黑色為非雲的結果呈現,如圖 8 所示,由於閥值是固定為 R/B 值 0.8,所以常有例外的情況發生。 (a) 原圖 (b)R/B=0.8 (c) B-R=30 圖 8、R/B 二值化分割之結果 自動產生閥值的方法介紹 Otsu 二值化演算法,Otsu 演算法在 1975 由 N. Otsu 提出,從影像的灰階直方圖中分析出最佳閥值能夠將圖片 分成兩群,而這兩群的特性為群內最小差異,而群外最大差異,分割 出來的兩群就是前景與背景,一張圖片中只有雲跟天空的話,便可以 將雲的部分分割出來。 (1)

)

(

)

(

)

(

)

(

)

(

1 12 2 22 2

t

t

t

t

t

(24)

在(1)的公式中,

1為第一群像數點出現機率,

2為第二群像數 點出現機率,

為變異數,第一群的變異數為

1,第二群的變異數 為

2,Otsu 演算法基於群內差異最小的原理,當閥值

t

滿足 2 

為 最小時,

t

為最佳閥值。 (a)原圖 (b) Otsu 二值化 圖 9、Otsu 二值化分割之結果 運用二值化的方式求出雲的部分,再求出雲與天空的比例,計算 出天空雲的覆蓋率,以計算出來的比例值來判斷雲量,在天空與雲明 顯分離的影像有不錯的效果。

2.4 局部二元編碼

局部二元編碼(Local Binary Pattern, LBP)是一種常用的紋理特徵, 在 2002 年被 T.Ojala、 M.Pietikainen 與 T.Maenpaa.提出[10],將 LBP 所取得的紋理特徵使用在雲的紋理比較上,可以進一步從這些特徵分 析出有用的部分,進行接下來的訓練與分類。       center i center i i x x x x x S 1 0 ) ( (2)

(25)

) 2 )( ( 1 7 0  

i i S xi K (3) (a) LBP33矩陣表示 (b) LBP 矩陣加權運算表示 圖 10、LBP 計算方式 在取得紋理特徵方面,LBP 以目標像素範圍

N

N

為一單位,

N

的大小可以藉由測試中去選定出最佳的範圍大小,舉例來說,用

3

3

的範圍大小,比較中心周圍八個像素值與中心像素值的大小(圖 10.a), 以中心像素值為閥值,大於閥值設為 1,小於閥值設為 0,再使用權 重矩陣進行加權運算,總和即為目標像素點的特徵值 K(圖 10.b)。 此 K 值介於 0~255,每一種紋理都有屬於自己編號,不會出現不 同紋理出現相同編號的情況,所以可以使用 LBP 從影像中去取得不 同類型的雲的獨特紋理特徵,方便接下來使用機器學習進行分類的部 分。

(26)

2.5 共現矩陣

LBP 所計算出來的特徵值是沒有差異程度的特徵量值,只要大於 LBP 比較的中間值就可以標記為 1,但是大於的差異的多寡並沒有辦 法記錄下來,共現矩陣是由 R.M. Haralick, K. Shangmugam, I.Dinstein 在 1973 所提出[11]的一種觀察像素之間關聯性並記錄下來的方法,被 以字典的方式記錄像素與像素之間相同組合的出現次數,可以根據不 同方向以 0 度,45 度,90 度,135 度的方向做共現矩陣來做為紋理 特徵,被 Qingyong Li, Weitao Lu 在 2009 年用來記錄各種雲的紋理。

圖 11、共現矩陣計算方式

從圖 11 來看,可以從影像 f 中的像素與像素之間的出現次數,以 統計的方式去計算出共現矩陣 G,圖中這個共現矩陣 G 是記錄與目

(27)

情況發生一次,便在共現矩陣 G [4,2]的位置紀錄 1,目標像素 2 右邊 為 2 情況發生三次,共現矩陣 G [2,2]的位置便紀錄 3。 由於一般灰階影像像素都是 0~255,所以產生的共現矩陣大小為

255

255

,但是一個共現矩陣只能記錄一個方向的關聯性,當需要 幾個方向的關聯性,就要幾個關聯矩陣。

(28)

2.6 機器學習

機器學習是一種從資料中獲得規律性,使用統計學的方式加以分 析此規律性並進行預測的演算法,特別的地方在於機器學習能藉由經 驗學習去改善演算法的性能,在此使用不同機器學習的方式使用色彩 與紋理特徵進行訓練,選用的機器學習分為兩種,分別為監督學習與 非監督學習,在非監督學習的部分選用主成分分析(PCA)和 K 平均演 算法(K-mean),在監督學習的部分選用類神經網路(NN)與支撐向量 機(SVM),希望能有效的將不同雲的種類正確分類。

2.6.1 主成分分析

主成分分析(Principle Component Analysis, PCA)由Karl pearson於 1901 年提出[11],在 2005 年的時候被提出用來擷取雲影像的特徵[7], 進行特徵比對來分類不同種雲,主成分分析是一種分析數據並加以簡 化的技術,使用線性轉換將數據投影到新的座標系上,其主要的方法 是對共變異數矩陣進行特徵分解,保留變異數貢獻最大特徵,計算出 第一大變異數為第一主成分,第二大變異數為第二主成分,以累計的 方式達到一定比例做為門檻,在主成分分析中,有用的數據通常是對 變異數影響大的低階的主成分,所以往往在簡化數據時高階主成分會 被忽略。

(29)

圖 12、PCA 投影示意圖 圖 12 中把資料投影到新的座標系上,分別是 x’軸與 y’軸,從圖 中可以發現投影到 y’軸所包含的資訊量會比投影到 x’軸來的多,資 料投影到 y’軸上後資料量從二維降低成為了一維,只需要投影到 y’ 軸上的資料就能判斷出資料的差異性,達到降低維度的目的。

2.6.2 K 平均演算法

K 平均演算法也稱為 K-mean 演算法,K-mean 是一種分割式分 群演算法,使用時必須先給予預定的分群數量,藉由疊代運算直到收 斂為止,收斂的條件一般為目標函數降低到一個閥值,並且不再變化, 此時便達到分群的最後結果,在 2010 年 S. Oswalt Manoj、V. Kavitha

(30)

與 J. Sahaya Arul,運用 K-mean 將相同種類的雲分群,進一步分析雲 與降雨的關聯性。 K-mean 演算法需一開始就決定分群的數量,假設群集以 C 表示, 而分群數量為 k,隨機分配中心點,對於每一個資料點

x

會尋找離自 己最近的中心點而形成第一次分群,而每一群的元素數量不盡相同, k 個分群的表示為Ck

x1, x2,  , xn

,n 會隨著分群的元素數 量不同,並且計算每一群的平均值,便可計算該分群的平均誤差

e

n i 1

x

i

(4)

C x i i

x

e

(

)

2 (5) 藉由多次的疊代運算,當每一分群的平均誤差總和為最小時(6), 再進行疊代運算,如果平均誤差總合依然沒有改變,便可以判斷為收 斂,也是最佳分群的情況。

k i

e

i

E

1 (6) 以群中心分類 第一次分群 重算各群中心 第二次分群 圖 13、K-mean 示意圖

(31)

2.6.3 支撐向量機

支撐向量機(Support Vector Machine , SVM),是一種監督式的機器 學習,在 2014 年 Alireza Taravat、Fabio Del Frate、Cristina Cornaro 與 Stefania Vergari 提出使用色彩空間 RGB 當特徵使用 SVM 做分類, SVM 的概念是將資料映射至特徵空間,找出一個超平面能夠將不同 類別的資料分開,以二維空間的角度來看就是找出一條直線能夠分開 不同分群的資料,經過不斷的修正直到收斂,可以找出最佳的分類 器。 圖 14、二維支撐向量機示意圖 而 在 分 類 器 當 中 剛 好 落 在 支 撐 超 平 面 ,

w

T

x

w

0

1

1

0

w

x

w

T 上的資料,則稱之為支撐向量(support vector),有了之 支撐向量之後,就可以藉由支撐向量來判斷新加入的資料是屬於哪一 類的,決定是否要修正分類器。

(32)

假設分類器

H

1

:

w

T

x

w

0

1

H

2

:

w

T

x

w

0

1

,當資料

x

帶 入時,計算出來結果

w

T

x

w

0

1

則代表

x

是屬於

H

2

這一類的, 反之

w

T

x

w

0

1

則代表

x

是屬於

H

1

。    w0 1 x wT i if xiH1 (7)     w0 1 x wT i if xiH2 (8) 當訓練資料帶入運算的結果為

w

T

x

w

0

1

時,該筆資料為H1的 一 類 , 表 示 分 類 器 分 類 正 確 , 無 須 修 正 , 當 帶 入 運 算 的 結 果 為

1

0

w

x

w

T i ,但是該筆資料是為H2的一類時,分類器在滿足公式(7) 的情況下進行修正,盡可能修正

w

權重值到讓該筆資料帶入新分類器 達到

w

T

x

w

0

1

的結果或錯誤率達到最小的情況。 在訓練完 SVM 時,可以得到該分類器的支撐向量(support vector), 支撐向量的功能可以決定支撐超平面

w

T

x

i

w

0

1

w

T

x

i

w

0

1

, 由兩個支撐超平面計算出

w

T

x

i

w

0

0

分類超平面,也就是 SVM 分 類依據。

(33)

三、研究方法與步驟

由於天氣觀測中,觀測雲的重點有兩個,一個是雲量的觀測,一 個是雲的分類,因此論文研究的重點有兩個主要的議題。 在雲量的觀測上,是不分雲的種類,而是看遮蔽天空的雲量是天 空的幾分之幾,因此分割雲的部分將是研究重要的一部分,必須先分 割出雲的部分才能與整張圖計算面積比例才能進行雲量的估測,在不 同的雲量影像上,像素中色彩空間 R 與 B 的關係都不一樣,在實驗 中,比較了影像中雲量的多寡與 R/B 值的關係,發現不同雲量的影像, R/B 值的標準差也有所不同,運用 R/B 值的標準差在不同雲量的情況, 給予適合的方法進行分割,雲量估測的步驟如圖 15 所表示。

(34)

圖 15、雲量估測的步驟

在雲族的分類上,本研究的目的是將雲族分成四類,分別為高雲 族、 中雲族、低雲族與直展雲族 ,為了分成這四類,先從影像中 擷取色彩與紋理特徵,獲得色彩與紋理特徵的過程如圖 16:

(35)

圖 16、色彩與紋理特徵抽取過程

並將過多的特徵降低維度獲得特徵向量,將特徵向量作為特徵,使用 SVM 進行訓練與測試,訓練的目的是希望從訓練資料分佈中找到可 以成功將不同類別的資料分類的分類器,步驟如圖 17:。

(36)

圖 17、雲族分類訓練步驟

測試的目的是檢測訓練出來的分類器分類結果是否正確,訓練與測試 資料必須再使用分類器進行分類,才知道結果是否分類正確,本實驗 需要經過三個 SVM 將四種雲族分類,根據三個 SVM 所輸出的測試 結果,便可知道是否有正確分類,步驟如圖 18:。

(37)
(38)

3.1 實驗樣本

本實驗的樣本來自固定攝影機的鏡頭所拍攝,所拍攝的照片大小 為

720

405

的影像,對照片先進行前處理,去除建築物與標記部分 將影像分割為

520

200

的大小,分割完的圖片就是實驗樣本。 圖 19、分割示意圖 實驗分成雲量估算與雲種辨識兩個部分進行,雲量辨識的部分取 了 50 張不同雲量的照片進行測試,而雲種辨識的目標是要分類 4 種 雲,所以訓練資料的部分有 80 張訓練影像,測試用的雲影像有 40 張。

(39)

3.2 雲影像分割

在章節 2.3 的資料中顯示,雲的影像在色彩空間中紅色與藍色在 影像的顯示上較為明顯,還可以進一步的以紅色與藍色的比值去進行 分割雲影像的,證明可以用影像中紅色與藍色的影像來分析雲影像, 這種使用了紅色對藍色的比率做為判斷依據,稱之為 R/B 值,而另一 種分割雲的方式是計算像素中 R 空間與 B 空間的差值,當該像素所 計算出的差值介於 30 到-30 之間則判斷為雲的部分,除此之外,判斷 為藍天。 將彩色的雲影像分成 R,G,B 三種影像,取得 R 影像與 B 影像 並計算同一像素中的 R/B 值,藉由觀察值在不同雲量與雲種的雲影像 是否有不同的變化,在影像中選擇用 R/B 的平均值來分割雲與藍天的 部分,其公式如下: 0 , ) / (   



ij ij W i H j ij B H W B R  (9) ij

R

為紅色 R 影像中的像素點,

B

ij 為藍色 B 影像的像素點,

W

H

是影像的寬跟高,從計算出來的平均 R/B 值

可以從其範圍發 現,藍天中如果只有少量的雲,

值理論上會較低,如果是擴散範圍

(40)

的點出現比例較高,便可從實驗中的數據知道天空雲的覆蓋率極高, 所以將 R/B 的平均值

作為分個的閥值。 整片天空都是雲或都是藍天,使用 R/B 平均值做為閥值將無法分 類,這時候比較雲影像 R/B 值的標準差

差異,

可以有效的分別 出雲分佈較為平均的類型,其公式如下:



   W i H j ij X H W 2 1  (10) 公式中Xij為像素點所計算出的 R/B 值,而 是影像的 R/B 標準 差,而  值大,表示這張影像中的雲非常劇烈的顏色變化,如少雲、 疏雲與裂雲的情況,而  值小,表示影像中雲的色彩十分平穩,如 碧空與密雲的情況,由以上情況判斷, 可作為修正分割方法的變 數。 比較分割雲的幾種方法,第一種方法是運用 R/B 平均值作為閥值, 第二種方法是計算色彩空間 R 與 B 的差值,當差值介於 30 到-30, 判斷為雲,第三種方法是目測,以章節 2.1.2 提到的十六等分法式記 錄,三種方法分別計算出雲覆蓋天空的比例,以下表 4 表示。

(41)

表 4、不同雲影像與 R/B 之比較 不同雲量的影像 R/B 標 準差 第一種 方式 第二種 方式 目 測 0.0251 0.437 0 0 0.1243 0.313 0.281 0.25 0.0594 0.504 0.842 0.5 0.0622 0.651 1 0.75 0.0166 1 0.718 1 由表 4 可得知,不同雲量的標準差有所差異,與目測做比較時, 分割結果的好壞也有所差異,因此運用 R/B 的標準差 可對分割方法

(42)

       ij ij ij x if x if x f 0 1 ) ( (11)    otherwise B R if B R f ij ij ij ij 0 30 1 ) , ( (12) 當0.04 0.1的時候計算影像的 R/B 平均值做為閥值的效果 較佳,xij為像素點的 R/B 值,如公式(11),當 為範圍之外的情況, 使用影像像素中色彩空間 R 與 B 的差,當差值介於 30 到-30 之內, 則判斷該像素點為雲的部分,RijBij是色彩空間 R 與 B 的像素值, 如公式(12),所分割出來 1 的部分為雲的部分,0 為藍天的部分,統 計雲的部分所占面積為多少,計算出雲的覆蓋量。

(43)

3.3 雲影像特徵選取

雲族的分類是以雲所在高度來區分,但是直展雲族的高度分部卻 與高、中及低雲族重疊,所以根據雲與地面建築或海平面的相對位置 來比較雲的高度是通用的辨別方法,但是本實驗著重於雲的色彩與紋 理特徵,故不使用比較雲與建築物高低判斷雲族的種類,單純以天空 中的雲影像為樣本,抽取色彩特徵與紋理特徵來進行辨識雲族的實 驗。

3.3.1 色彩特徵

在章節 2.2 所表示,可以運用色彩空間 R 與 B 對雲與藍天的強度 程度不同,可以用色彩空間 R 與 B 的比值 R/B 值來表示這個現象, 所以決定使用影像中的 R/B 值來當色彩特徵的部分,以計算整張影像 得到一張,存放 R/B 值的二維陣列

x

ij,陣列

x

ij中的每個 R/B 值須先 經過正規劃的方法將內容值正規化到 0~1 之間。

)

min(

)

max(

)

min(

v

v

v

v

v

ij ij

(13) 將 R/B 值正規化的方式如公式(13)所表示,vij是陣列

x

ij中的 R/B 值,min( v)是

x

ij中最小的 R/B 值,max( v)是

x

ij中最大的 R/B 值,vij 為正規劃後的 R/B 值。

(44)

vij 乘上 255 並四捨五入到整數,以一張新的亮度影像IRB表示, 將IRB以直方圖的方式統計亮度值出現次數,直方圖所統計每種亮度 出現次數為本實驗的色彩特徵。

3.3.2 紋理特徵

在章節 2.4 的顯示,選用 LBP 的紋理特徵有容易設計的好處,計 算量與共現矩陣相比較小,實驗中 LBP 不同大小的範圍進行測試, 並且改用統計數量的方式,將 0~255 一共 256 種 LBP 紋理值進行統 計,統計的結果以 LBP 紋理直方圖表示,從直方圖中可以發現有些 LBP 值在不同種類的雲中,出現次數也有所變化,所以紋理特徵的部 分使用 LBP 直方圖中出現次數做為特徵,嘗試使用

3

3

5

5

的 LBP 直方圖進行統計,去計算出紋理特徵值

K

,比較特徵差異。 (a)

3

3

LBP 表示 (b)

5

5

LBP 表示 圖 20、不同 LBP 範圍的取樣

(45)

運用不同取樣範圍的 LBP 去製作訓練用的特徵,取出的特徵會 有些許的差異,有助於成為訓練時分類的依據。 (a1) (b1) (a2) (b2) (c1) (d1) (c2) (d2) 圖 21、

3

3

範圍的 LBP:(a1)~(d1)不同雲族雲影像;(a2)~(d2). 不同雲族紋理出現次數統計圖

(46)

3.4 特徵降階與分類

在訓練資料的雲影像中,色彩特徵以 R/B 值產生的直方圖作為特 徵並且取得了 LBP 的紋理直方圖,便可以給與機器學習特徵去進行 訓練,在進行訓練之前,須先進行正規化和降維度的動作,由於 LBP 直方圖產生的紋理特徵維度是 256 維,而色彩特徵維度也是 256 維, 在特徵選取比例上數量太多,所以要先對 512 維的紋理特徵作降維度 的動作,本實驗降維度的方法是使用主成分分析(PCA)。

3.4.1 特徵降階

在需要降維度的特徵當中,有 80 筆樣本數,每一筆樣本有 512 維特徵,80 筆樣本先做正規化矩陣 Z 的轉換,轉換公式如(14)。 p j N i S x x Z j j ij ij , 1,2,..., ; 1,2,...   (14)

N

x

x

N i ij j

1 (15) 1 ) ( 1 2 2   

N x x S N i ij j j (16) N 是樣本數,p是資料維度, _

x

是每個樣本第一個特徵的平均值, 計算方法如公式(15),有 512 維特徵就有 512 個特徵值的平均值,並 可計算出各維度的標準差 Sj 計算方法如公式(16),如此一來便可計算

(47)

出正規化矩陣 Z。 接下來求相關係數矩陣

R

,正規化矩陣 Z 的大小是 80x512 的矩 陣,Z 轉置矩陣與 Z 相乘運算轉換公式如(17)。

1

N

Z

Z

R

T (17) 正規化矩陣

R

的維度是

512

512

的維度,數據量是非常龐大的, 所以使用解特徵方程式計算特徵值,將計算出來的特徵,由大到小 排列,從累加計算出來的特徵值統計與總特徵值的比率來看,累加的 比率大於 0.90 的時候,如公式(19)所表示,便可以判斷現有的特徵維 度,能表示原的特徵維度

p

的百分之九十以上的資訊量。

0

|

|

R

I

p

(18)

9

.

0

1 1

  p j j m j j

(19) 取得降維度後的特徵值並重新計算出特徵向量b0j,使用特徵向量 0 j b 與標準化矩陣 Z 重新運算出新的主成分。

m

j

b

Rb

j 0j

,

1

(20) 0 j T i ij

Z

b

U

(21) 降低維度後的特徵維度是 3 維,便可做作為支撐向量機(support

(48)

vector machine, SVM)的訓練用特徵。

3.4.2 分類方式

如章節 2.6.3 所表示,SVM 的功能就是使用兩個支撐超平面將資 料分類,由於實驗的目標是分成四種,分別為高雲族、中雲族、低雲 族與直展雲族,由於 SVM 只能分兩類,只能一次將一種雲分開,所 以至少需要三次的 SVM 分類。 1  b x wTwTxb1是 SVM 的兩個支撐超平面,之間的 距離稱為 margin,決定決策超平面的條件則是錯誤率越低越好,其公 式表示如下: Minimize

   N i i C w w w J 1 2 0 2 1 ) , , (   (22) margin 的大小為 w 2 ,margin-error

是分類的錯誤率,SVM 取 得的 margin 越大越好,可是

也是考慮的一個要素,當 margin 越大, 發生錯誤分類的機率就越高,而 margin 小的時候,分類錯誤的機率 降低,但可能再測試時容易出現分類不佳的情況,因為分類器的 margin 過小,分類出結果的兩類的特徵是很相似的情況,在測試時 的容易出現錯誤分類,C 是一個參數,調整參數的大小以控制對 margin-error

的接受程度與 margin 之間的平衡,求得最佳得 SVM。

(49)

種方法運用四個 SVM 去進行分類的,分類類型為高雲族與其他,中 雲族與其他,低雲族與其他,直展雲族與其他以上四個分類器,分別 去訓練 SVM,並判斷四種分類的正確率,如圖 22 所示: 圖 22、第一種方法的 SVM 分類 第一種方法的 SVM 分類需要訓練四個分類器,將雲影像輸入做 訓練,SVM 如果分類正確輸出 0,分類錯誤輸出 1,每種雲族都用四 位元表示,高雲族以 0111 表示,中雲族以 1011 表示,低雲族以 1101 表示,直展雲族以 1110 表示,以表 5 所示。 在測試的部分,如果輸出編號所代表的雲族與目測相同,表示辨 識正確,反之則是辨識錯誤,輸出的結果可能會出現以上四種雲族以 外的編號,表示雲影像無法辨識,所以判斷為分類錯誤。

(50)

表 5、方法一的雲族編號 分類器 雲族 SVM1 結果 SVM2 結果 SVM3 結果 SVM4 結果 高雲族 0 1 1 1 中雲族 1 0 1 1 低雲族 1 1 0 1 直展雲族 1 1 1 0 第二種方式是使用第一種方式延伸,將第一種分類的結果最好的 SVM 分類的結果以樹狀方式繼續分類,一次進行三次分類,分類成 四種雲族,其分類的方式從分類結果來選擇,以分類的正確率決定由 哪一雲族先進行分類。 表 6、第一次 SVM 分類正確率比較 分類 高雲/其他 中雲/其他 低雲/其他 直展雲/其他 Training error 0 0 0.075 0.250 Test error 0.0250 0 0 0.175 從表 6 得知第一次的 SVM 分類裡,中雲族與其他雲族的分類結 果為最佳,所以第一次分類的對象是中雲族,接下來需要從其他的三 種雲族,高雲族、低雲族與直展雲族再分類出一種雲,進行第二次分

(51)

類。 表 7、第二次 SVM 分類正確率比較 分類 高雲/其他 低雲/其他 直展雲/其他 Training error 0.0167 0.0333 0.2833 Test error 0.0667 0.0667 0.1 從表 7 結果來看,第二次分類中,高雲在訓練正確率上比低雲高 所以選擇第二次分類的對象為高雲族,進行第二次分類後,剩下低雲 族與直展雲族進行第三次分類。 圖 23、第二種 SVM 分類方法

(52)

三次的 SVM 分類過程以圖 23 所表示,以不同雲影像訓練三個分 類器,第一個分類器是訓練將中雲族與其他雲族分成兩類的 SVM, 第二個分類器的訓練是高雲族分一類,低雲族與直展雲族分一類的 SVM,最後第三個 SVM 是訓練低雲族與直展雲族的 SVM,分類結 果方面,目標雲族以 0 紀錄,其他雲族以 1 紀錄,各種雲族有屬於自 己的編號,中雲族以 0 表示,高雲族以 10 表示,低雲族以 110 表示, 直展雲族以 111 表示,以表 8 所表示各雲族的編號。 表 8、方法二雲族編號 分類器 雲族 SVM1 結果 SVM2 結果 SVM3 結果 高雲族 1 0 中雲族 0 低雲族 1 1 0 直展雲族 1 1 1 測試方面,將測試雲影像帶入 SVM1 測試,當出現編號結果與目 測結果相同,則判斷正確,否則帶入 SVM2 做測試,如果是低雲族 或直展雲族的影像則須經過 SVM3 的測試才能知道測試結果是否正 確,選用樹狀 SVM 的分類方法的好處是不會出現第一種方法所產生

(53)

四、實驗結果

本研究實作的開發,雲量估測的實驗使用 C#語言開發,雲族辨識 的實驗使用 Matlab2014 開發,作業系統的環境為 Windows 7 作業系 統,Intel(R) Core(TM)2 i5 CPU M450 (2.4 GHz)處理器,6GB 記憶體, 完成實驗結果的執行與運算。

4.1 數據庫

實驗樣本來自香港氣象站,氣象站中的照片由早上五時至晚上九 時,每五分鐘拍攝一次,保留過去三小時的天氣照片,所取得照片大 小為 720

405,去除不屬於自然影像部分後,影像大小為 520

200, 雲量估測的測試影像有 50 張,雲族辨識分類共有 120 張影像, 80 張訓練用影像與用來測試分類的 40 張影像。

4.2 實驗數據

本實驗分成雲量估測,與雲族辨識兩部分,雲量估測的目的是觀 測天空中雲的數量,也就是有多少雲覆蓋天空的面積,稱為雲的覆蓋 量,並與目測的結果比較平均誤差 MSE 大小,雲族辨識的目的是藉 由取出雲影像中的色彩特徵與紋理特徵,能夠找出正確的辨識出不同 雲族的方法。

(54)

4.2.1 雲量的估測

雲量估測作法是將影像中雲的部分分割出來,比較雲部分與整張 影像的分佈面積比率,分割雲的方式提出以下幾種做法:

Method 1. 使用 Otsu 演算法分割雲與藍天的部分,運用 Otsu 演算法 群內最小差異分成兩群,找出最佳閥值對影像二值化,二 值化的結果白色為雲的部分,並計算白色面積與整張影像 的比例。 Method 2. R/B 值是計算影像中色彩空間 R 與 B 像素值的比值,以 R/B 值為 0.8 為閥值,大於 0.8 為雲的部分,並計算大於 0.8 的部分與整張影像的比例。 Method 3. 計算影像中像素點的色彩空間 R 與 B 的差,差值介於 30 到-30 之間為雲的部分,計算雲的部分與整張影像的比 例。 Method 4. 計算影像中 R/B 值的平均值,以 R/B 平均值作為閥值, R/B 值大於 R/B 平均值得像素點為雲的部分,並計算雲的 部分與整張影像的比例。 Our Method. 本實驗所提出的方法是以計算 R/B 值的標準差 , 的 值介於 0.04 到 0.1 之間,使用 Method 4 的方法,否則用

(55)

10 )] ( ) ( [ 10 2

  i j i E i M MSE (23) 測試 50 張雲量影像,五種不同雲量各 10 張,使用以上的五種方 法與目測方法計算不同雲量情況的平均誤差 MSE,Mj是第 j 個方法計 算出的雲覆蓋率,E 是目測結果的雲覆蓋率,其測量方法是將雲佔天 空中多少個十六等分來記錄,實驗結果如下: 表 9、碧空情況各方法比較 方法 樣本 R/B 標準差 Method 1 Method 2 Method 3 Method 4 Our Method 目測 q(1) 0.026 0.45 0 0 0.435 0 0 q(2) 0.025 0.439 0 0 0.437 0 0 q(3) 0.029 0.45 0 0 0.442 0 0.0625 q(4) 0.03 0.451 0.002 0.001 0.446 0.001 0 q(5) 0.028 0.441 0.001 0 0.43 0 0 q(6) 0.029 0.444 0.001 0 0.397 0 0 q(7) 0.031 0.44 0.002 0.001 0.43 0.001 0 q(8) 0.031 0.453 0.001 0 0.423 0 0 q(9) 0.032 0.444 0.005 0 0.443 0 0 q(10) 0.027 0.44 0.001 0 0.431 0 0.0625 與目測比較 MSE 0.1879 0.0008 0.0008 0.1762 0.0008 碧空樣本實驗的結果,本實驗所提出的方法在 R/B 標準差的值都 小於 0.04 的情況,使用色彩空間 R 與 B 的差值介於 30 到-30 之間則 判斷為雲的方法。

(56)

與目測比較雲量覆蓋率,Method 1 與目測結果的 MSE 為 0.1879, Method 2 與目測結果的 MSE 為 0.0008,Method 3 與目測結果的 MSE 為 0.0008,Method 4 與目測結果的 MSE 為 0.1762,Our Method 與目 測結果的 MSE 為 0.0008。 表 10、少雲情況各方法比較 方法 樣本 R/B 標準差 Method 1 Method 2 Method 3 Method 4 Our Method 目測 A(1) 0.101 0.379 0.34 0.271 0.353 0.271 0.125 A(2) 0.113 0.36 0.332 0.253 0.373 0.253 0.1875 A(3) 0.122 0.186 0.284 0.231 0.284 0.231 0.1875 A(4) 0.105 0.133 0.294 0.184 0.316 0.184 0.1875 A(5) 0.124 0.178 0.336 0.28 0.313 0.28 0.25 A(6) 0.101 0.103 0.205 0.155 0.259 0.155 0.1875 A(7) 0.077 0.05 0.144 0.099 0.248 0.248 0.125 A(8) 0.112 0.179 0.352 0.269 0.317 0.269 0.1875 A(9) 0.11 0.155 0.253 0.193 0.302 0.193 0.1875 A(10) 0.134 0.189 0.317 0.282 0.303 0.282 0.25 目測比較 MSE 0.0120 0.0132 0.0038 0.0169 0.0052 少雲樣本實驗的結果,本實驗所提出的方法在 R/B 標準差的值大 多大於 0.1 的情況,使用色彩空間 R 與 B 的差值介於 30 到-30 之間 則判斷為雲的方法,而樣本 A (7)的 R/B 標準差為 0.077,使用的方法 是 R/B 平均值為閥值分割的結果。 與目測比較雲量覆蓋率,Method 1 與目測結果的 MSE 為 0.0120,

(57)

Method 2 與目測結果的 MSE 為 0.0132,Method 3 與目測結果的 MSE 為 0.0038,Method 4 與目測結果的 MSE 為 0.0169,Our Method 與目 測結果的 MSE 為 0.0052,在少雲的樣本,Method 3 與 Our Method 較接近目測結果。 表 11、疏雲情況各方法比較 方法 樣本 R/B 標準差 Method 1 Method 2 Method 3 Method 4 Our Method 目測 B(1) 0.014 0.385 0.845 0.848 0.528 0.848 0.5 B(2) 0.059 0.367 0.997 0.84 0.504 0.504 0.5 B(3) 0.058 0.323 0.981 0.688 0.42 0.42 0.5 B(4) 0.14 0.249 0.451 0.395 0.373 0.395 0.4375 B(5) 0.137 0.315 0.515 0.454 0.404 0.454 0.4375 B(6) 0.061 0.256 1 0.986 0.516 0.516 0.5625 B(7) 0.129 0.421 0.726 0.658 0.572 0.658 0.5625 B(8) 0.111 0.407 0.935 0.85 0.619 0.85 0.5625 B(9) 0.138 0.404 0.772 0.726 0.574 0.726 0.5625 B(10) 0.07 0.468 0.745 0.597 0.532 0.532 0.5625 目測比較 MSE 0.0286 0.1038 0.0573 0.0019 0.0251 疏雲樣本實驗的結果,本實驗所提出的方法在 R/B 標準差的值來 判斷使用的方法,實驗在0.04 0.1的情況使用 R/B 平均值分割, 而其他情況是使用色彩空間 R 與 B 的差值介於 30 到-30 之間則判斷 為雲,將兩種方法混合使用。 與目測比較雲量覆蓋率,Method 1 與目測結果的 MSE 為 0.0286,

(58)

Method 2 與目測結果的 MSE 為 0.1038,Method 3 與目測結果的 MSE 為 0.0573,Method 4 與目測結果的 MSE 為 0.0019,Our Method 與目 測結果的 MSE 為 0.0251,在疏雲的,Method 4 與 Our Method 較接近 目測結果。 表 12、裂雲情況各方法比較 方法 樣本 R/B 標準差 Method 1 Method 2 Method 3 Method 4 Our Method 目測 C(1) 0.054 0.436 1 1 0.755 0.755 0.75 C(2) 0.042 0.414 1 1 0.802 0.802 0.875 C(3) 0.054 0.317 1 1 0.735 0.735 0.75 C(4) 0.06 0.338 1 0.986 0.573 0.573 0.625 C(5) 0.066 0.352 1 1 0.609 0.609 0.6875 C(6) 0.055 0.431 1 1 0.82 0.82 0.875 C(7) 0.071 0.34 0.983 0.956 0.653 0.653 0.8125 C(8) 0.062 0.354 1 1 0.65 0.65 0.75 C(9) 0.055 0.487 0.998 0.957 0.729 0.729 0.8125 C(10) 0.048 0.343 1 1 0.774 0.774 0.8125 目測比較 MSE 0.1597 0.0556 0.0523 0.0061 0.0061 裂雲樣本的實驗的結果,本實驗所提出的方法在 R/B 標準差的值 都介於0.04 0.1的情況,使用 R/B 平均值作為分割的方法。 與目測比較雲量覆蓋率,Method 1 與目測結果的 MSE 為 0.1597, Method 2 與目測結果的 MSE 為 0.0556,Method 3 與目測結果的 MSE 為 0.0532,Method 4 與目測結果的 MSE 為 0.0061,Our Method 與目

(59)

測結果的 MSE 為 0.0061,Method 4 與 Our Method 較接近目測結果。 表 13、密雲情況各方法比較 方法 樣本 R/B 標準差 Method 1 Method 2 Method 3 Method 4 Our Method 目測 D(1) 0.011 0.499 1 1 0.611 1 1 D(2) 0.012 0.558 1 1 0.563 1 1 D(3) 0.009 0.546 1 1 0.534 1 1 D(4) 0.018 0.674 1 1 0.564 1 1 D(5) 0.015 0.52 1 1 0.555 1 1 D(6) 0.017 0.399 1 1 0.481 1 1 D(7) 0.018 0.398 1 1 0.367 1 1 D(8) 0.016 0.463 1 1 0.718 1 1 D(9) 0.007 0.421 1 1 0.808 1 1 D(10) 0.023 0.379 1 1 0.458 1 1 目測比較 MSE 0.2722 0.0000 0.0000 0.2028 0.0000 密雲樣本實驗的結果,本實驗所提出的方法在 R/B 標準差的值都 小於 0.04 的情況,使用色彩空間 R 與 B 的差值介於 30 到-30 之間則 判斷為雲的方法。 與目測比較雲量覆蓋率,Method 1 與目測結果的 MSE 為 0.2722, Method 2 與目測結果的 MSE 為 0,Method 3 與目測結果的 MSE 為 0, Method 4 與目測結果的 MSE 為 0.2028,Our Method 與目測結果的 MSE 為 0。

(60)

與目測結果的 MSE 為 0.1511,Method 4 與目測結果的 MSE 為 0.2842, Our Method 與目測結果的 MSE 為 0.0863,本實驗對目測結果的 MSE 最小,表示對各種雲量的估測有最佳的效果。

4.2.2 雲族辨識

在雲族分類的部分,使用了 LBP 作為紋理特徵,以統計各紋理編 號出現次數的直方圖為特徵向量;將 R/B 值正規化到 0 ~ 255,並以 統計各強度出現次數直方圖為色彩特徵向量,結合此二特徵向量交由 PCA 主成分分析並降低維度之後,取得可代表 90%以上資訊的三個 特徵向量,最後採用 SVM 進行雲族分類,分類結果以表 14 所表示: 表 14、各雲族 SVM 分類結果 分類 高雲/其他 中雲/其他 低雲/其他 直展雲/其他 Training error 0 0/60 0/20 0 0/60 0/20 0.075 2/60 4/20 0.250 13/60 7/20 Test error 0.0250 1/30 0/10 0 0/30 0/10 0 0/30 0/10 0.175 1/30 6/10 Support vector 8 7 28 48 margin 0.8248 1.8098 0.8321 5.5105 由上表所統計的結果,120 張訓練與測試影像中,高雲族訓練影 像 80 張正確分類,測試影像 40 張有 1 張不是高雲族分類成高雲族, 在中雲族分類的部分,120 張訓練與測試的影像都正確分類,低雲族 訓練影像 80 張中有 6 張錯誤,2 張其他雲族錯誤分類成低雲族,而

(61)

應該分類為低雲族有 4 張錯誤分類,但是測試影像都有正確分類,直 展雲族的部分,直展雲族訓練影像 80 張中有 20 張錯誤,13 張其他 雲族錯誤分類成直展雲族,而應該分類為直展雲族有 7 張錯誤分類, 測試影像的分類也不理想,40 張影像中 1 張其他雲族錯誤分類成直 展雲族,而應該分類為直展雲族有 6 張錯誤分類,分類結果如表 15: 表 15、雲族個別 SVM 分類結果 測試 雲族 目標 雲族 高雲族 中雲族 低雲族 直展雲族 其他 高雲族 24 0 0 0 6 中雲族 0 30 0 0 0 低雲族 0 0 19 2 9 直展雲族 0 0 1 16 13 其他是一種無法分類的現象,代表該雲影像不屬於這四種雲族, 或是具備兩種以上的雲族特徵,以之高雲族有 6 筆樣本無法分類,低 雲族有 9 筆樣本無法分類,直展雲族有 13 筆樣本無法分類,以表 16 顯示無法分類的情況。

(62)

表 16、無法分類情況的雲族編號 雲編號 雲族 0110 0101 1100 1111 高雲族 6 0 0 0 低雲族 0 1 6 2 直展雲族 0 0 1 12 在 120 張影像中,有 31 張影像分類錯誤,第一種方法分類正確 率為 74.2%,正確率不高的原因是有許多雲影像被判斷不屬於這四種 分類,或是具有兩種雲族的特徵,為了改善這個問題,採用了第二種 分類方式。 第二種分類方法是使用樹狀二分法的方式分類,實驗中先分類出 中雲族,接著分類出高雲族,最後再由低雲族與直展雲族去分類,進 行了三次分類,第一次分類結果如表 14 所表示,中雲族的分類效果 最佳,分類出中雲族之後,對高雲族,低雲族與直展雲族做第二次分 類,第二次分類的結果以高雲族的分類效果較佳,實驗結果如表 17 表示。

(63)

表 17、樹狀 SVM 第二次分類結果 分類 高雲/其他 低雲/其他 直展雲/其他 Training error 0.0167 1/40 0/20 0.0333 1/40 1/20 0.2833 8/40 9/20 Test error 0.0667 2/20 0/10 0.0667 0/20 2/10 0.1 0/20 3/10 Support vector 13 12 34 margin 0.8547 0.7171 1.7985 高雲族的分類中,60 張訓練影像只有 1 張影像類錯誤,測試影像 30 張中有 2 張分類錯誤,低雲族的分類中,60 張訓練影像有 2 張影 像類錯誤,測試影像 30 張中有 2 張分類錯誤,直展雲族的分類中, 60 張訓練影像有 17 張影像類錯誤,測試影像 30 張中有 3 張分類錯 誤,以上結果中高雲族的分類較佳,分類出高雲族,讓低雲族與直展 雲族進行第三次分類,實驗結果為下表 18。 表 18、樹狀 SVM 第三次分類結果 分類 低雲/直展 Training error 0.025 0/20 1/20 Test error 0.05 0/10 1/10 Support vector 11 Margin 0.6775

(64)

在第三次分類,40 張訓練影像有 1 張影像類錯誤,測試影像 20 張中有 1 張分類錯誤,經過了三次 SVM 的分類,在 120 張訓練與測 試影像中,統計三次 SVM 分類的影像分類結果以表 19 所表示: 表 19、雲族樹狀 SVM 分類結果 測試 雲族 目標 雲族 高雲族 中雲族 低雲族 直展雲族 高雲族 30 0 0 0 中雲族 0 30 0 0 低雲族 1 0 28 1 直展雲族 2 0 0 28 在 120 張影像中,有 4 張影像分類錯誤,第二種方法分類正確率 為 96.7%,比第一種方法的正確率高而且不會出現無法辨識的情況。

(65)

五、結論

雲量估測的實驗中,不同雲量的影像上 R/B 的標準差 有不同的 變化,實驗中,當 介於 0.04 到 0.1 的情況,使用 R/B 值的平均值為 閥值分割雲的部分,否則使用色彩空間 R 與 B 的差值去判斷,當差 值介於 30 到-30 之間則判斷為雲,此方法與人眼觀測的結果比較,各 種雲量的覆蓋率的平均誤差(MSE)為 0.0863,與提出的其他四種方法 相比,本實驗與人眼觀測的結果較為相近。 實驗雲族的辨識中,提出兩種 SVM 的分類方法,第一種方法是 使用 SVM 個別分類的方法,運用四個分類器各別分類四種雲族,測 試的結果出現了無法分類的其他雲影像,分類四種族雲的效果不好, 使整體雲族辨識的正確率只有 74.2%,實驗提出的第二種方法是使用 樹狀 SVM 分類四種雲族,能有效改善第一種方法無法分類的情況, 並且使整體雲族辨識的正確率提高到 96.7%。

(66)

參考文獻

[1] J. Yang, W. T. Lv, Y. Ma, W. Yao, and Q. Y. Li, “An automatic groundbased cloud detection method based on adaptive threshold,” J. Appl.Meteorol. Sci., vol. 20, no. 6, pp. 713–721, 2009.

[2] C. N. Long, J. M. Sabburg, J. Calbó, and D. Pagès, “Retrieving cloud characteristics from ground-based daytime color all-sky images,” J. Atmos. Ocean. Technol., vol. 23, no. 5, pp. 633–652, May 2006. [3] A. Heinle, A. Macke, and A. Srivastav, “Automatic cloud

Classification of whole sky images,” Atmos. Meas. Technol., vol. 3, no. 1, pp. 557–567, May 2010.

[4] J. Malik, S. Belongie, T. Leung, and J. Shi, “Contour and texture analysis for image segmentation,” Int. J. Comput. Vis., vol. 43, no. 1, pp. 7–23, Jun. 2001.

[5] S. L. M. Neto, A. V. Wangenheim, E. B. Pereira, and E. Comunello, “The use of Euclidean geometric distance on RGB color space for the classification of sky and cloud patterns,” J. Atmos. Ocean. Technol., vol. 27, no. 7, pp. 1504–1517, Sep. 2010.

[6] Shuang Liu, Linbo Zhang, Zhong Zhang, Chunheng Wang, an Baihua Xiao“Automatic Cloud Detection for All-Sky Images Using Superpixel Segmentation,” IEEE Geoscience And Remote Sensing Letters, Vol. 12, No. 2, February 2015

[7] Qing Zhang and Chunxia Xiao, “Cloud Detection of RGB Color Aerial Photographs by Progressive Refinement Scheme,” IEEE Transactions On Geoscience And Remote Sensing, Vol. 52, No. 11, Pp. 7267–7269, November 2014

[8] Imran Sarwar Bajwa, Syed Irfan Hyder and PAF- Karachi , “ PCA based Image Classification of Single-layered Cloud Types,” IEEE 2005 Interntational Conference on Emnerging Technologies, September 2005

[9] S. Oswalt Manoj, V. Kavitha, J. Sahaya Arul, “ Recognising the Cloud Type and Estimation of Rainfall,” IEEE 2005 Interntational Conference on Emnerging Technologies, pp.178-183,December,2010 [10] T.Ojala, M.Pietikainen, T.Maenpaa. “Multiresolution Gray-scale and

Rotation Invariant Texture Classification with Local Binary Patterns”, IEEE Transactions on PAMI, 24(7): 971–987, 2002.

(67)

[11] Qingyong Li,Weitao Lu,“A Histogram Descriptor Based on Co-occurrence Matrix and its Application in Cloud Image Indexing and Retrieval”, 2009 Fifth International Conference, 2009.

[12] Pearson, K. “ On Lines and Planes of Closest Fit to Systems of Points in Space”, Philosophical Magazine. 1901.

[13] Alireza Taravat, Fabio Del Frate, Cristina Cornaro, and Stefania Vergari, “Neural Networks and Support Vector Machine Algorithms for Automatic Cloud Classification of Whole-Sky Ground-Based Images” IEEE Geoscience and Remote Sensing Letters Vol.12, No.3, March 2015

(68)

附錄一

碧空樣本: q(1) q(2) q(3) q(4) q(5) q(6) q(7) q(8) q(9) q(10)

(69)

少雲樣本: A(1) A(2) A(3) A(4) A(5) A(6) A(7) A(8) A(9) A(10)

(70)

疏雲樣本: B(1) B(2) B(3) B(4) B(5) B(6) B(7) B(8) B(9) B(10)

(71)

多雲樣本: C(1) C(2) C(3) C(4) 5 C(5) C(6) C(7) C(8) C(9) C(10)

(72)

密雲樣本: D(1) D(2) D(3) D(4) D(5) D(6) D(7) D(8) D(9) D(10)

(73)

附錄二

雲族訓練樣本:

(74)
(75)
(76)
(77)
(78)
(79)

附錄三

雲族測試影像

: 高雲族:

(80)
(81)
(82)

參考文獻

相關文件

Now, nearly all of the current flows through wire S since it has a much lower resistance than the light bulb. The light bulb does not glow because the current flowing through it

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =>

Using this formalism we derive an exact differential equation for the partition function of two-dimensional gravity as a function of the string coupling constant that governs the

Courtesy: Ned Wright’s Cosmology Page Burles, Nolette & Turner, 1999?. Total Mass Density

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most

• Children from this parenting style are more responsive, able to recover quickly from stress; they also have better emotional responsiveness and self- control; they can notice

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

• Instead of uploading and downloading the dat a from cloud to client for computing , we shou ld directly computing on the cloud ( public syst em ) to save data transferring time.