第一章 緒論
第四節 名詞解釋
社會性標記意指使用者在社群性與科技性融合的情境下,為網路資源建立標 籤(tag)的動作、行為與過程 (卜小蝶,2007;Trant, 2009)。使用者將適當的詞彙或 關鍵字連結至資源物件,有利於分享、發現、搜尋、瀏覽、過濾相關資源,除此 之外,在標記過程中,使用者可直接利用標籤來組織、管理個人資源(Trant, 2009;
Guy & Tonkin, 2006;Noruzi, 2006;Golder & Huberman¸ 2006;Xu, Fu, Mao & Su, 2006)。
二、標籤 (Tag;label)
基本上,標籤是使用者為了描述資源內容所建立的詞彙,連結資源主題與使 用者,反映使用者對於資源內容的看法,可說是使用者標記資源後產出的結果(Guy
& Tonkin, 2006;Noruzi, 2006;卜小蝶,2007)。
其他使用者可藉由標籤詞彙的涵義,理解資源內容表述的概念與面向(Noruzi, 2006;Guy & Tonkin, 2006;Fu, Kannampallil & Kang, 2010)。然而,產生標籤的方 式可分為三種:使用者自行建立、仿用其他使用者的標籤,或是從資源內容中擷 取關鍵詞彙(Sen et al, 2006;Voβ, 2007)。
三、標記者 (Tagger)
自由建立標籤描述資源內容的使用者(Voβ, 2007),通常不限定性別、身分、年 齡,只要是了解標籤與標記意義的人皆可稱之,本研究中參與實驗之受試者也可 稱為標記者。
四、標籤雲 (Tag cloud)
標籤雲又稱詞彙雲(word cloud)或是視覺化設計的加權清單(weighted list in visual design),將使用者產出的標籤集合或是描述網站內容的關鍵詞彙,按字母順 序排列,並且以標籤的字體大小、粗細或顏色之視覺特徵,反映每一個標籤或關 鍵詞彙的重要性或熱門程度(Sinclair & Cardew-Hall, 2008;Wikipedia, 2011)。標籤 雲最主要的用途是讓使用者可以立即了解資源內容主旨,以及藉由詞彙的超連結 瀏覽、發掘與該標籤相關的資源(Friedman, 2007;Rivadeneira et al., 2007)。
五、視覺特徵 (Visual Features;Visual Properties;Visual Characteristics)
標籤詞彙藉由文字屬性的視覺特徵反映標籤的重要性或熱門程度,文字屬性 的視覺特徵包括:字體大小、字體粗細、字體顏色,尤其是字體大小最為常見,
其他像是字體顏色飽和度、字母數量與寬度、字母包含的像素多寡也都屬於視覺 特徵(Rivadeneira et al., 2007;Bateman et al., 2008)。
六、標籤品質 (Tag Quality)
標籤品質是一個抽象概念,沒有統一的定義,但是相關文獻中提出「好的標 籤(good tags)」需具備的五種特質:1.涵蓋多個層面 2.高熱門性 3.最小努力原則 4.
一致性 5.排除某些特定類型的標籤(Xu et al., 2006),從標籤具備的功能來看,一個 好的標籤必須有效率的幫助使用者瀏覽、搜尋、組織、分享、發掘相關資源,才 會是一個有意義(meaningful)、高品質的標籤(Noruzi, 2006;Guy & Tonkin, 2006;
Suchanek, Vojnovic & Gunawardena, 2008;Fu et al., 2010)。
在本研究中,以 TF-IDF 演算法計算標籤的權重,並假設權重越高的標籤其品 質也越高。
七、TF-IDF 演算法
TF-IDF(Term Frequency - Inverse Document Frequency)是一種常用於自動索 引與資訊檢索領域中的詞彙加權技術,是為一種統計方法。此演算法可分成兩個 部分。第一個部分是計算詞彙 k 在文件 i 內出現的次數,以公式 = 求得詞 彙之 TF 值;第二個部分則是計算在 N 個文件總數中,有詞彙 k 出現的文件數量,
帶入公式為 =log(
)求得詞彙之 IDF 值(Salton & McGill, 1983;Salton &
Buckley, 1988)。
一個完整的 TF-IDF 演算法是將 Term Frequency 與 Inverse Document Frequency 計算公式結合,以兩者個別獲得數值相乘的方式求得詞彙之 TF-IDF 值,也就是詞 彙權重來評估個別詞彙對於文件的重要程度。原則上,權重越高的詞彙僅在少數 文件內出現,具有區別文件內容的能力(Salton & McGill, 1983;Salton & Buckley, 1988)。
本研究運用 TF-IDF 演算法計算標籤的權重,並以標籤的權重決定標籤的字體 大小。