第五章 實驗結果
5.2 實驗平台
5.3.1 比較各演算法之辨識結果
在第一個實驗,我們比較四個演算法的結果:我們在環境中拍攝 11 個場景,每個場景拍攝 13 個角度,每個角度間隔 5 度,將此影像群做為 影像地標的資料庫;而測試部份,在同一個位置拍攝 62 個不同角度的影 像,每個角度相差1 度,所以測試影像與影像地標,本身就有些微的差異,
然後將統計分析這些辨識率:
表 2 各模型在同一位置不同角度的辨識率
演算法 辨識率
低通濾波器 98.8%
擴展直方圖 100%
主軸分析 97.3%
高斯混合模型 100%
此表所採用的參數分別是:低通濾波器是將原本的影像資料320 240× 個像 素點,變成40 30× 個像素點,而主軸分析採用前面 150 個特徵向量,而擴 展直方圖所採用的解析度為每個8bits 的像素值(即 0~255 的整數),為直方 圖的基本單位;而高斯混合模型採用 12 群;其中可以透過觀察,低通濾 波器和主軸分析這兩項的辨識率比較低一點,所以我們嘗試將低通濾波器 的模糊程度稍微提高,將影像資料分別變成:80 60× 、160 120× 甚至是
320 240× ,其辨識率分別為 99.4%、99.7%以及 99.4%,所以如果希望能夠
再提高此方法的辨識率,可以將影像的解析度維持在80 60× 個像素點以 上,但是其效果仍不夠好,同理,如果將主軸分析採用的特徵向量改成取 前 200 個特徵向量,其辨識率將變成 97.31%,僅僅提萬分之一,所以前 150 個特徵向量在此實驗應該足以表示此影像地標,至於擴展直方圖與高 斯混合,其效果不錯,所以以下的參數將延續上個實驗。
接著我們要嘗試將位置前後左右偏移分別為5cm、10cm 、15cm、20cm、
50cm,而角度仍然採用-30 到 30 度,每隔一度擷取一張影像,與 11 的影 像地標進行比對,其結果如下表所示:
表 3 各演算法在不同地標的辨識率
演算法
偏移距離 5cm 10cm 15cm 20cm 50cm 低通濾波器 99.7% 99.25% 98.89% 96.5% 74.07%
擴展直方圖 100% 100% 99.85% 98.65% 79.13%
主軸分析 95.3% 93.29% 89.26% 84.2% 61.3%
高斯混合模型 100% 100% 99.68% 98.77% 83.16%
其中,低通濾波器的部分透過上一個實驗,發現,至少保留80 60× 像素以 上的資訊其辨識率較高,所以這個實驗,就採用80 60× 像素做為特徵空間 中所描繪的分布;而擴展直方圖、主軸分析、高斯混合模型則同上採用同
向量,高斯混合群數為 12 群。而其效果,不言而喻的可以發現擴展直方 圖與高斯混合模型有比較優良的結果,但是觀察其它演算法發現,影像內 容物對於擴展直方圖有很直接的影響,所以如果影像地標中稍微有障礙物 進入阻隔,其受影響的程度會遠比高斯混合模型來的大,我們將利用影像 處理軟體,將障礙物玩偶,如圖 27 所示;放置在影像地標前面,來測試 其結果,而所選用的場景為建立影像地標的原點,每隔 1 度拍攝一張影像,
從-30 到 30 度,共 61 張影像,:
表 4 加入障礙物之後的辨識結果
障礙物 演算法
擴展直方圖 高斯混合模型 遮蔽 5% 90.46% 100%
遮蔽 10% 87.05% 100%
圖 27 置入卡通海賊王玩偶障礙物遮蔽影像
因此,當偏離影像地標近,而且影像地標不被遮蔽改變的情況下,擴展直 方圖,的確是比較佔優勢,但是擴展直方圖,對於雜訊的變異有比較大的 反應,對於有物體被改變時,也是有很大的反應,容忍度較低,而高斯模 糊則能夠辨識出自己該歸屬的影像地標資料庫,而較少誤判。
所以總結以上數個實驗的結果,可以分成數個考量面來分析:
第一、速度:
建立資料庫:以高斯混合模型與主軸演算法在建立資料庫時比較耗 費時間,而低通濾波器為最快。
影像地標認知測試:以低通濾波器與高斯演算法的辨識比較耗時,
而擴展直方圖為最快的比對。
第二、儲存空間:
以低通濾波器的結果為最耗費儲存空間,需要紀錄接近整張影像資料 大小的數量級,而其餘三者只需要紀錄特徵向量,或是紀錄模型參數 即可。
第三、精確度與容忍度:
透過之前種種的實驗,高斯的確在這方面有比較優良的結果,而且高 斯模糊化影像並不是將所有的影像資訊等份的濾除以降低資料量,而 是濾除比較不重要的局部區域變化,所以得到減低資料量的影像反而 更加銳利,如圖 28 所示,對於未來可以發展的空間,則有比較大的
衍生空間,來從事其他利用或更加準確定位。
(a)
(b)
(c)
圖 28 (a)空間中 11 個場景(b)高斯混合模型之分布(c)其模糊化後之影像