照片中標籤字詞分析 - 實驗結果與評估 - 透過圖片標籤觀察情緒字詞與事物概念之關聯

第四章實驗結果與評估

4.4 照片中標籤字詞分析

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4.4照片中標籤字詞分析

針對抽樣照片進行分析比較，Flickr和our method的來源皆為Flickr，每張照片帶有文字標籤，可進行對等的標籤的比較，我們採用吳筱玫與周芷依[30]針對Flickr首頁照片的標籤內容分析方法，針對每張照片中的標籤進行歸類，將照片的標籤分為九大類：人時地物、事物描述、相機資訊、社群、相片集、個人分類、評價、感受、聯想，完整資料參見附錄B。

1 2 3 4 5 6 7 8 9

人時地物事物描述相機資訊社群相片集個人分類評價感受聯想

what where when who

1. 人時地物：若標籤能在照片中直接辨識出有關人名、地名、時間、主體為何 (who,where ,when,what)，這種能夠直接將內容與影像進行連結的標籤，將之歸類到人時地物的分類。

2. 事物描述：有關事物的形容，例如其特性、動作、顏色、形狀...等。例如藍色的天空會用blue、綠葉會用green形容葉子、用cute形容小狗或嬰兒。

3. 相機資訊：有關於相機品牌、型號、鏡頭焦段、片幅、底片規格與攝影周邊(濾鏡、 wide-angle)技巧(HDR、high key、sepia)。

4. 社群：某些社群會透過固定的關鍵字進行照片的串連與查詢關鍵字，例如TOP-V、abigfav、gettyimage，這類標籤皆為社群成員溝通與查詢的依據，無法直接解讀意義，也不會被字典查詢到意義。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

5. 相片集：某些標籤不直接指涉照片中的主體，是而是屬於個人照片分類別，但這類較容易與其他分類重疊，不易分辨。例如portrait、travel、scenery。

6. 個人分類：字典無法定義且完全屬於私人的分類，也無法從照片中直接找到關聯，也不和社群共享的標籤，完全專屬個人。例如：個人網址、著作權宣告。

7. 評價：主觀的比較與支持字眼，例如 the best photo、first class。

8. 感受：情緒描述的標籤，可能描述照片所傳達的感受，或是照片經過解讀後的感受，例如：love、happy、lonely。

9. 聯想：只有下標籤或照片作者才知道該標籤與照片的關聯，無法直接從照片解讀出來的意義，或是在照片中的弦外之音，例如dream、heaven、paradise。

比較「flickr的第一張」與「our method」兩種方法得到的flickr照片，透過我們的方法過濾得到照片有以下的特性：

4.4.1縮小範圍、凸顯主題

照片的標籤數量多則超過70個，少則不到十個，每個標籤在不具結構的標籤集合中，

彼此之間看似皆為平等，但其實有些標籤是用來指涉照片中的主題，有的標籤可能只是用來當作主題的形容與描述，例如wedding,lover,flower可能是照片中可辨識的題材，但white,red,colors,sweet則是針對照片內容的描述、評價、聯想。因此，標籤與照片的關聯與權重是無法單單從標籤本身進行推斷，不同的標籤對於該張照片中的意義是不均等的，若標籤與主題無關、屬於個人分類以及超出照片內容的標籤，便會被過濾不計。因此，透過詞頻與字典的過濾後，將會保留大多數人使用的高頻標籤，同時侷限在wordnet字典定義的範圍字詞。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4.4.2字詞變化合併

同一字詞在flickr的照片中常見有不同型態的變化，例如happy,happiness,kiss, kissing,scared,scary，作者會利用這種方式來提高照片被查詢命中的機會，但對於透過標籤來解讀照片意涵的過程，則可能變成意義重複的雜訊，將會造成判讀上的困難，由於flickr標籤的順序缺乏文法關係，沒有特別需要考慮某一種意思的詞性變化，

透過詞幹合併的方式，可以減少重複的困擾，讓訊息變得精簡。但由於僅只能判斷詞性變化，若是字根字首不一但意思相近的字詞，則不會被合併，例如：

dog,canine,dogbreed,dogs,puppy,puppies。

4.4.3主流語系

除了英語以外，就算是熱門點閱的照片中，常見英語以外的標籤，例如西班牙文、

德文、法文，本系列的照片中便有作者用了三種以上的語言表達同一個意思，這種語言變化的重複字詞，也會被過濾掉留下英文的版本，能夠節省標籤的使用，讓訊息更為精簡。

4.4.4 與主題相關、感受性的標籤會被保留

觀察過濾後的標籤可發現，大多數照片的標籤都用來描述照片內容，另外帶有評價與感受的標籤，都會在詞頻與字典比對的過程中保留，相機資訊、社群、個人分類則幾乎都會被過濾掉。

‧

兩個關聯規則詞組，透過三種查詢方式：Flickr單詞查詢第一筆、google image查詢單詞第一筆，以及透過綜合評比Flickr圖片的最高分，最後得到42張照片，成為一系列社群的關係，與整個網際網路的範疇仍有些差距，因此透過our method從flickr查詢

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

得到的影像，比google image得到的結果，影像內容較有想像空間，能夠解讀的空間也比較大，由此可知，透過社群的評比機制作以及PMI值為綜合參數所得到影像，可以兼顧標籤意義與社群過濾兩面向，得到「大多數人」特別感興趣，且帶有情緒偏向的照片。

下一章，目的是透過使用者問卷評量三種查詢來源得到的圖片，是否具備正負偏向與刺激強弱之分，第五章使用語意差異量表，進行受測者進行語意的偏向與強度測量，

看是否符合預期的偏向與強度。在下一章進行語意差異量表分析，驗證大多數人對於這些照片的觀感，是否能和所提出的偏向-強度座標吻合。

‧

法：Flickr、google image、our method，得到了42組照片（附錄B），假設情緒偏向和字詞的連結具備合理的支持度，透過這些字詞檢索得到的影像，用作為視覺刺激來源，

在文檔中透過圖片標籤觀察情緒字詞與事物概念之關聯 - 政大學術集成 (頁 86-91)

照片中標籤字詞分析

第四章 實驗結果與評估

4.4 照片中標籤字詞分析

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

4.4照片中標籤字詞分析

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

第四章實驗結果與評估

立政治大學

立政治大學

立政治大學

立政治大學