第四章 實驗結果與評估
4.4 照片中標籤字詞分析
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
4.4照片中標籤字詞分析
針對抽樣照片進行分析比較,Flickr和our method的來源皆為Flickr,每張照片帶 有文字標籤,可進行對等的標籤的比較,我們採用吳筱玫與周芷依[30]針對Flickr首 頁照片的標籤內容分析方法,針對每張照片中的標籤進行歸類,將照片的標籤分為九 大類:人時地物、事物描述、相機資訊、社群、相片集、個人分類、評價、感受、聯想,完整 資料參見附錄B。
1 2 3 4 5 6 7 8 9
人時地物 事物描述 相機資訊 社群 相片集 個人分類 評價 感受 聯想
what where when who
1. 人時地物:若標籤能在照片中直接辨識出有關人名、地名、時間、主體為何 (who,where ,when,what),這種能夠直接將內容與影像進行連結的標籤,將之 歸類到人時地物的分類。
2. 事物描述:有關事物的形容,例如其特性、動作、顏色、形狀...等。例如藍色的天 空會用blue、綠葉會用green形容葉子、用cute形容小狗或嬰兒。
3. 相機資訊:有關於相機品牌、型號、鏡頭焦段、片幅、底片規格與攝影周邊(濾鏡 、 wide-angle)技巧(HDR、high key、sepia)。
4. 社群:某些社群會透過固定的關鍵字進行照片的串連與查詢關鍵字,例如TOP-V、abigfav、gettyimage,這類標籤皆為社群成員溝通與查詢的依據,無法直接 解讀意義,也不會被字典查詢到意義。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
5. 相片集:某些標籤不直接指涉照片中的主體,是而是屬於個人照片分類別,但 這類較容易與其他分類重疊,不易分辨。例如portrait、travel、scenery。
6. 個人分類:字典無法定義且完全屬於私人的分類,也無法從照片中直接找到關 聯,也不和社群共享的標籤,完全專屬個人。例如:個人網址、著作權宣告。
7. 評價:主觀的比較與支持字眼,例如 the best photo、first class。
8. 感受:情緒描述的標籤,可能描述照片所傳達的感受,或是照片經過解讀後的 感受,例如:love、happy、lonely。
9. 聯想:只有下標籤或照片作者才知道該標籤與照片的關聯,無法直接從照片解 讀出來的意義,或是在照片中的弦外之音,例如dream、heaven、paradise。
比較「flickr的第一張」與「our method」兩種方法得到的flickr照片,透過我們的方 法過濾得到照片有以下的特性:
4.4.1縮小範圍、凸顯主題
照片的標籤數量多則超過70個,少則不到十個,每個標籤在不具結構的標籤集合中,
彼此之間看似皆為平等,但其實有些標籤是用來指涉照片中的主題,有的標籤可能只 是用來當作主題的形容與描述,例如wedding,lover,flower可能是照片中可辨識的題 材,但white,red,colors,sweet則是針對照片內容的描述、評價、聯想。因此,標籤與照 片的關聯與權重是無法單單從標籤本身進行推斷,不同的標籤對於該張照片中的意義 是不均等的,若標籤與主題無關、屬於個人分類以及超出照片內容的標籤,便會被過濾 不計。因此,透過詞頻與字典的過濾後,將會保留大多數人使用的高頻標籤,同時侷限 在wordnet字典定義的範圍字詞。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
4.4.2字詞變化合併
同一字詞在flickr的照片中常見有不同型態的變化,例如happy,happiness,kiss, kissing,scared,scary,作者會利用這種方式來提高照片被查詢命中的機會,但對於 透過標籤來解讀照片意涵的過程,則可能變成意義重複的雜訊,將會造成判讀上的困 難,由於flickr標籤的順序缺乏文法關係,沒有特別需要考慮某一種意思的詞性變化,
透過詞幹合併的方式,可以減少重複的困擾,讓訊息變得精簡。但由於僅只能判斷詞性 變化,若是字根字首不一但意思相近的字詞,則不會被合併,例如:
dog,canine,dogbreed,dogs,puppy,puppies。
4.4.3主流語系
除了英語以外,就算是熱門點閱的照片中,常見英語以外的標籤,例如西班牙文、
德文、法文,本系列的照片中便有作者用了三種以上的語言表達同一個意思,這種語言 變化的重複字詞,也會被過濾掉留下英文的版本,能夠節省標籤的使用,讓訊息更為 精簡。
4.4.4 與主題相關、感受性的標籤會被保留
觀察過濾後的標籤可發現,大多數照片的標籤都用來描述照片內容,另外帶有評價 與感受的標籤,都會在詞頻與字典比對的過程中保留,相機資訊、社群、個人分類則幾 乎都會被過濾掉。
‧
兩個關聯規則詞組,透過三種查詢方式:Flickr單詞查詢第一筆、google image查詢單 詞第一筆,以及透過綜合評比Flickr圖片的最高分,最後得到42張照片,成為一系列 社群的關係,與整個網際網路的範疇仍有些差距,因此透過our method從flickr查詢
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
得到的影像,比google image得到的結果,影像內容較有想像空間,能夠解讀的空間 也比較大,由此可知,透過社群的評比機制作以及PMI值為綜合參數所得到影像,可以 兼顧標籤意義與社群過濾兩面向,得到「大多數人」特別感興趣,且帶有情緒偏向的照 片。
下一章,目的是透過使用者問卷評量三種查詢來源得到的圖片,是否具備正負偏向 與刺激強弱之分,第五章使用語意差異量表,進行受測者進行語意的偏向與強度測量,
看是否符合預期的偏向與強度。在下一章進行語意差異量表分析,驗證大多數人對於這 些照片的觀感,是否能和所提出的偏向-強度座標吻合。