圖片情緒偏向排序，以社群參數進行過濾

第三章資料分析與模型建立

3.5 圖片情緒偏向排序，以社群參數進行過濾

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

完成基礎情緒字詞相關的照片資料建置後，資料庫內的資料表會有數以萬計的標籤與其相關的情緒字詞，透過wordnet進行內容分析，看其中的事物概念分佈組合為何，

可以作為Flickr社群中標籤使用的抽樣統計結果，該結果可能顯示人們對於帶有情緒字詞的影像，會有哪些其他相關文字標籤的使用習慣。

3.4 決定帶有情緒影像的候選照片

前一個階段得到大量的事物概念字詞與基礎情緒之間的相關係數，有了這項資訊，

便可計算文字標籤的照片，其情緒綜合係數為何，有了這項資訊，便可進行每張照片之間的情緒強弱排名，同時觀察排名是否能夠反映一般人們對於照片的情緒解讀，透過使用者的驗證報告進行評估。每張照片的情緒偏向，可以透過照片中的標籤，查詢我們已經計算得到的PMI值，過濾掉字典不存在、詞頻過低的標籤，把得到的標籤之PMI 數值加總，便得到候選照片的情緒偏向值。該數值可篩選比較照片之間可能的情緒偏向

3.5 圖片情緒偏向排序，以社群參數進行過濾

考慮單張照片中的tag，其含有情緒偏向的字詞與總字詞之間比值，作為最後計算 PMI的權重，為了避免照片中有過多不在本實驗的字詞列表中，若該照片具備情緒偏向的字詞與為帶有情緒字詞的比例過大，也有可能在這個權重機制下，將PMI分數拉的很低。如果該張照片被過濾掉的字詞過多、其比值相對會變小，將會降低最後綜合指標的權重後結果。

‧

Our method：

圖3.9：候選照片挑選流程

affective tag ratio= count (affective tags)

count (total tags of photo)

透過社群參數：瀏覽人次(views)、加入收藏(favorite)、留言(comments)數值，當作篩選條件，該照片必須超過平均值後，才會被列入後續的分數計算，原因是我們希望透過社群點閱與評論的多寡，來衡量一張照片是否備受關注，Flickr API提供了影像的評論字數、favorite次數與名單以及到訪人次、求得所有候選照片這三項參數的平均值後，

當作一個過濾門檻(圖3.9)。

photos Flickr

Filter by frequency 選取詞組

正向高強度*3 正向低強度*3 負向高強度*3 負向低強度*3

ratio factor

stemming

Count PMI by quadrant

Filter by views, favorite,comments

pmi index of photos

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

3.6 小結

回到最初的目的，我們希望透過影像經驗中，得到事物概念與情緒字詞之間的關係，

Flickr影像社群中有大量帶有標籤的影像，透過使用者主動加註、瀏覽點閱與收藏的過程中，排序出高度興趣的影像資料，成為本研究的實驗資料來源，透過共現計算與常用字詞篩選，挑選出重要且能夠與情緒字詞有顯著相關的字詞。相較與過去詞義相似度計算和情緒偏向偵測的研究，本研究從Flickr資料作為情感經驗的來源，得到情緒字詞與其他字詞的關聯。本研究期待最後能夠得到事物概念帶有情緒偏向的評量結果，作為其他情緒計算研究的的參考依據。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中透過圖片標籤觀察情緒字詞與事物概念之關聯 - 政大學術集成 (頁 58-61)

第三章 資料分析與模型建立

3.5 圖片情緒偏向排序，以社群參數進行過濾

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.4 決定帶有情緒影像的候選照片

3.5 圖片情緒偏向排序，以社群參數進行過濾

‧

affective tag ratio= count (affective tags)

count (total tags of photo)

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.6 小結

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章資料分析與模型建立

立政治大學

立政治大學

立政治大學