第三章 研究方法與步驟
3.3 影像與註解關聯對應
3.3.3 同分處理
若前述之方法發生群集權重同分之困境,則無法判定與影像群集最佳之註解群集關 聯對應,關聯無法建立便無法完成後續自動影像註解之目的。由於 GHSOM 具有可有效 將資料進行訓練與分群,且可依據資料關聯性而動態增長以達到最佳分群結果之特性,
因此本研究據此提出深度優先法與群集距離法兩種方法做為同分處理方法。
3.3.3.1 深度優先法
根據 GHSOM 之特性,資料在訓練過程中將不斷針對資料相關程度進行計算與比 較,相同或相似者歸類至相同群集,若分群結果尚未到達最佳分群狀態,則再進行訓練 直到最佳分群狀態完成,如下圖所示:
圖 3-3-3-1GHSOM 訓練流程示意圖
因此可認定階層較深之群集相較於階層較淺之群集內容應更為細膩與精確,故當有 多個群集之分數相同時,本研究以階層數最高者優先選擇做為影像群集之關聯對應。以 下圖為例:
資料 GHSOM
往下伸展
是 輸出結果
最佳群集
否
圖 3-3-3-2 深度優先法實例說明
上圖 3-3-3-2 在經過資料筆數法與資料權重法計算後將得到兩種不同之計算結果,將計算 所得知結果表列如下表 3-3-3 與表 3-3-4:
表3-3-3 圖 3-3-3-2 依資料筆數法計算結果
影像群集 註解群集 4 註解群集 6 註解群集 3
I1 1 0 0
I2 1 1 0
I3 1 1 1
表3-3-4 圖 3-3-3-2 資料權重法計算結果
影像群集(A,B) 註解群集 4 註解群集 6 註解群集 3 最短路徑途經 群集
(I1,I2) 1 1 0
2:1/3 5:1/3
(I1,I3) 2 1 1
2: 2/3 1:1/3
(I2,I3) 2 2 2
5:2/3 2: 11/12
1:7/12
由上表可得知採用資料筆數法與資料權重法之分數均為註解群集 3、群集 4 與群集 6 為最高,此時根據上圖得知群集 6 為三個群集資料中具有階層深度最深者,所分群之註 解資料相較階層較淺之群集註解更為精確,因此影像群集 6 所對應之註解群集即為註解 群集 6。
3.3.3.2 歐基里德距離法
根據前述,當資料群集出現同分狀況時,可先根據階層深度關係加以判定何群集為 較適合之影像對應註解群集,但若發生任兩群集在經由前述演算法計算後得到相同權 重,且註解群集之階層深度亦相同,此時便無法利用深度優先法進行判斷。由於 GHSOM 之訓練結果中,同一群集之內容十分相關,影像所對應之註解應亦為十分相關,且訓練 結果可得到一有效分群之分群結果,因此將各影像群集內容所對應之註解均視為十分相 關。若在同分且相同階層深度之情況下,由於 GHSOM 之特性,本研究提出一方法稱之 為歐基里德距離法來解決深度優先法無法解決之困境。歐基里德距離法之概念為註解與 註解所在群集越相似則表示該群集與正確註解之相似性越高。一般而言,資料分群後,
可利用群集中心點作為該群集之代表,因此選擇與註解所在群集最為相似之註解群集作 為影像群集所關聯之註解。其演算步驟如下:
步驟 1:計算影像群集中,影像原始註解所有文件之向量平均以求得群集中心點。
步驟 2:計算各影像所對應之註解特徵向量與註解所屬群集中心點之歐基里德距離。
步驟 3:重複步驟 1-2 直到所有影像對應之註解文件均計算完成。
步驟 4:比較所有影像所對應之註解與註解所屬之群集中心之歐基里德距離,並取 距離最小之群集為影像群集所對應之最佳註解群集。
以下圖 3-3-3-3 為例:
圖 3-3-3-3 歐基里德距離法實例
根據資料筆數法與資料權重法計算結果如下表 3-3-5 (a)與表 3-3-6 表3-3-5 圖 3.3.3.3 依資料筆數法計算結果
影像群集 註解群集 4 註解群集 3 註解群集 5
I1 1 0 0
I2 1 0 1
(I2,I3) 1 1 1
表3-3-6 圖 3.3.3.3 依資料權重法計算結果
影像群集(A,B) 註解群集 4 註解群集 3 註解群集 5 最短路徑途經群集 (I1,I2) 1 1 0 2:1/(3-1)=1/2 (I1,I3) 1+1=2 1 1 2:(1/2)+(1/(4-1))=5/6
1:1/(4-1)=1/3 (I2,I3) 2 1+1=2 1+1=2 2:(5/6)+(1/(4-1))=7/6
1:(1/3)+1/(4-1)=2/3
由上列資料筆數法與資料權重法計算結果可知註解群集 3、4 與 5 所得分數為所有群 集中最高且同分,此時根據本研究所提之深度優先法可取得群集 4、5 可能為最佳註解群 集,但此時無法決定最佳註解群集,因此利用歐基里德距離法以解決此一現況。現假設
影像I1、I2、各自對應之註解A1、A2註解特徵向量與各群集之特徵向量平均值分別如下表 3-3-7 與表 3-3-8,其中A1 Group平均值為將該群集中所有註解特徵向量相加並加以平均 所得。
表3-3-7 影像原始註解之特徵向量
註解階層群集 6
包含文件 影像對應之註解特徵向量
A1 110001011001011101011000010000000001
A2 000000000110110001010011000000000000 表3-3-8 註解群集特徵向量平均
對應之註解階層
群集 6 註解群集特徵向量平均
A1 Group 000001001110000000001011011100000000
A2 Group 111001001000000000000000000000000001
此時分別計算註解A1與所屬A1 Group平均值之歐基里德距離,與A2及A3之歐基里德 距離得到如下表 3-3-9
表3-3-9 註解群集計算結果 註解文件 計算結果
A1 4
A2 3
由上表可得知註解A2與其所屬群集中心之歐基里德距離為最小,表示註解A2與其所屬群 集最為相似,該群集所包含之註解正確性相較於A1為佳,因此A2群集所屬之註解即為影 像群集 6 之最佳註解,因此可得到影像群集 6 與註解階層之關聯對應。