• 沒有找到結果。

圖片情緒偏向排序,以社群參數進行過濾

第三章 資料分析與模型建立

3.5 圖片情緒偏向排序,以社群參數進行過濾

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

完成基礎情緒字詞相關的照片資料建置後,資料庫內的資料表會有數以萬計的標籤 與其相關的情緒字詞,透過wordnet進行內容分析,看其中的事物概念分佈組合為何,

可以作為Flickr社群中標籤使用的抽樣統計結果,該結果可能顯示人們對於帶有情緒字 詞的影像,會有哪些其他相關文字標籤的使用習慣。

3.4 決定帶有情緒影像的候選照片

前一個階段得到大量的事物概念字詞與基礎情緒之間的相關係數,有了這項資訊,

便可計算文字標籤的照片,其情緒綜合係數為何,有了這項資訊,便可進行每張照片 之間的情緒強弱排名,同時觀察排名是否能夠反映一般人們對於照片的情緒解讀,透 過使用者的驗證報告進行評估。每張照片的情緒偏向,可以透過照片中的標籤,查詢我 們已經計算得到的PMI值,過濾掉字典不存在、詞頻過低的標籤,把得到的標籤之PMI 數值加總,便得到候選照片的情緒偏向值。該數值可篩選比較照片之間可能的情緒偏向

3.5 圖片情緒偏向排序,以社群參數進行過濾

考慮單張照片中的tag,其含有情緒偏向的字詞與總字詞之間比值,作為最後計算 PMI的權重,為了避免照片中有過多不在本實驗的字詞列表中,若該照片具備情緒偏向 的字詞與為帶有情緒字詞的比例過大,也有可能在這個權重機制下,將PMI分數拉的很 低。如果該張照片被過濾掉的字詞過多、其比值相對會變小,將會降低最後綜合指標的 權重後結果。

Our method:

圖3.9:候選照片挑選流程

affective tag ratio= count (affective tags)

count (total tags of photo)

透過社群參數:瀏覽人次(views)、加入收藏(favorite)、留言(comments)數值,當作篩 選條件,該照片必須超過平均值後,才會被列入後續的分數計算,原因是我們希望透 過社群點閱與評論的多寡,來衡量一張照片是否備受關注,Flickr API提供了影像的評 論字數、favorite次數與名單以及到訪人次、求得所有候選照片這三項參數的平均值後,

當作一個過濾門檻(圖3.9)。

photos Flickr

Filter by frequency 選取詞組

正向高強度*3 正向低強度*3 負向高強度*3 負向低強度*3

ratio factor

stemming

Count PMI by quadrant

Filter by views, favorite,comments

pmi index of photos

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.6 小結

回到最初的目的,我們希望透過影像經驗中,得到事物概念與情緒字詞之間的關係,

Flickr影像社群中有大量帶有標籤的影像,透過使用者主動加註、瀏覽點閱與收藏的過 程中,排序出高度興趣的影像資料,成為本研究的實驗資料來源,透過共現計算與常 用字詞篩選,挑選出重要且能夠與情緒字詞有顯著相關的字詞。相較與過去詞義相似度 計算和情緒偏向偵測的研究,本研究從Flickr資料作為情感經驗的來源,得到情緒字詞 與其他字詞的關聯。本研究期待最後能夠得到事物概念帶有情緒偏向的評量結果,作為 其他情緒計算研究的的參考依據。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

相關文件