• 沒有找到結果。

第四章 實驗結果與評估

4.4 實驗總結

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4.28 Flickr Popular Tags 資料 4.3.8 字詞共現實驗分析小結

在本節所討論的字詞共現實驗中,以 Flickr Tag Clusters 歸納法則將 Flickr 分析使用 者聯想到的 Tags 與照片的關連性去合併後分為 25 項,最後將這些字詞共現的 Tag 做為 分類,值得一提 emotion 代表很多情緒字詞,因此在一張照片中發現有正面及負面情緒;

此外而在照片中人像應該是旅遊中必定會留下的一種紀念,因此 travel 及 people 絕對是 照片中常常出現的 Tag 來做為呈現。

4.4 實驗總結

在本章節的實驗目的,主要分為四大部分來進行:首先透過分別觀察 POS 詞性中 名詞、形容詞、動詞、副詞等分析;接著將 Porter Stemming 實驗組與 Lovins Stemming 對照組做為分析詞頻變化,利用五個旅遊網站中 41 個城市的介紹各地城市的特色,經 由旅遊網站文章加權後 POS 詞性分析及斷詞系統算出 TF-IDF 數值,同時加上 TF-IDF weight 變化,並且探討加入權重後,排名較為後面的 Tag 能夠提昇名次;再來透過城市

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

字詞共現分析,將 Tag 共分為 25 項,計算出字詞共現指標方式,便可容易分析出各城 市的特色;最後透過各洲來分析各區域分群變化,利用此法分析 Top 100 之間的變化情 況及探討原 Flickr 標籤雲與實驗結果作為對照,完成本文所選定之 41 個城市的概念輪 廓。針對本章節所提出上述實驗數據,以下列舉出分析結果與探討相關所歸納出的綜合 結論:

(1)在探討英文字彙中Porter Stemming與Lovins Stemming是最多人研究、同時也是 最普遍使用的演算法之一;針對Porter Stemming及Lovins Stemming實驗比較結 果,Lovins最早在1968就已經發表,而Porter則在1980才出現。在過去研究中 顯示,一個具有準確性的Stemming比起寬鬆的Stemming更適合用於關鍵詞擷 取上,因此Lovins Stemmer比起Porter Stemmer對英文單字更具有準確性,這點 可由4.3.6節中,合併字詞Tag總數各為738個及755個看出,合併後相差17個Tag,

可能由於該合併Tag因演算法未能判斷出為同一字彙,才會低估數量。

(2)在Flickr Tag產出結果與利用五個旅遊網站中41個城市的介紹各地城市的特色 加入TF-IDF weight結果變化來看,原先未加入TF-IDF weight前是實質統計後 的結果,若使用者偏好某一種Tag時,相較於結果也會有些偏差,因此就加入 TF-IDF weight後,一些隱含在排名後面的Tag數便往前提升外,同時一些原本 顯著Tags更能凸顯其重要意義,故判斷實質權重有其必要性。

(3)觀察在Flick Tags詞頻統計中,利用了(表4.2 所有城市Porter(weight)及Lovins (weight) Tag總數)結果,再加以分析出此41個城市範圍,將所有城市的數量做 詞幹分析及權重分析,其結果為第一名的(night、street)、第二名的(street、

night)、第三名的(light)、第四名的(color、art),經過統計為night及street兩 個之熱門標籤為主,可見攝影者最常拿出相機拍照的動機是有關夜景及街景,

除了觀察出排名之外,還可利用各城市雷達圖上的差異,進而觀察出該城市的 特色。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(4)在探討各洲差異時一開始未將區域分群而造成無法解析,因此為了將相關連的 城市作為連結以地區性作為分群依據,將有關係的城市規模縮小及前10名門檻 做為設定,統計出(表4.3所有城市Top10 Tag分析)以頻率較高第一名的night

(129)次、第二名的light(127)次、第三名的color(121)次、第四名的street

(120)次及第五名的Art(90)次。由此可觀察出night與light對於使用者來說,

是較常下的Tags,而第三至第五名也有其關連性街景、藝術與色彩均有關連。

(5)原先將資料分為TOP 10、TOP 20、TOP 30去分析SNA結果,但由於Tag數量過 於龐大,若要分析結果相當不易,僅能看出重要Tag關連性,對於一些雜亂無 章的Tag來說,無法用肉眼直接判斷結果。因此運用城市字詞共現分析方式將 同類型或者有關連性的Tag歸類在一起,再將Tag共分為25項,以便於計算出字 詞共現指標及分析出各城市的特色,之後再將color、people、street、emotion 及travel作為America、Europe、Asia及Oceania字詞共現指標;另外值得探討是 emotion代表很多情緒字詞,因此在一張照片中發現有快樂、悲傷、憤怒、難 過等等情緒,這也是一般使用者所會下的關鍵字;此外而在照片中人像應該是 旅遊中必定會留下的一種紀念,色彩則代表那張照片所賦予的一種表態,鮮明 的代表熱情,而照片背後所代表的意義絕對能以簡單Tag做為呈現。

(6)最後透過各洲來分析各區域分群變化,利用此法分析Top 100之間的變化情況 及探討原Flickr標籤雲與實驗結果作為對照,Flickr Popular Tags網站所提供的 標籤雲與實驗結果有85%的結果相吻合。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y