• 沒有找到結果。

第一章 緒論

第四節 名詞解釋

社會性標記意指使用者在社群性與科技性融合的情境下,為網路資源建立標 籤(tag)的動作、行為與過程 (卜小蝶,2007;Trant, 2009)。使用者將適當的詞彙或 關鍵字連結至資源物件,有利於分享、發現、搜尋、瀏覽、過濾相關資源,除此 之外,在標記過程中,使用者可直接利用標籤來組織、管理個人資源(Trant, 2009;

Guy & Tonkin, 2006;Noruzi, 2006;Golder & Huberman¸ 2006;Xu, Fu, Mao & Su, 2006)。

二、標籤 (Tag;label)

基本上,標籤是使用者為了描述資源內容所建立的詞彙,連結資源主題與使 用者,反映使用者對於資源內容的看法,可說是使用者標記資源後產出的結果(Guy

& Tonkin, 2006;Noruzi, 2006;卜小蝶,2007)。

其他使用者可藉由標籤詞彙的涵義,理解資源內容表述的概念與面向(Noruzi, 2006;Guy & Tonkin, 2006;Fu, Kannampallil & Kang, 2010)。然而,產生標籤的方 式可分為三種:使用者自行建立、仿用其他使用者的標籤,或是從資源內容中擷 取關鍵詞彙(Sen et al, 2006;Voβ, 2007)。

三、標記者 (Tagger)

自由建立標籤描述資源內容的使用者(Voβ, 2007),通常不限定性別、身分、年 齡,只要是了解標籤與標記意義的人皆可稱之,本研究中參與實驗之受試者也可 稱為標記者。

四、標籤雲 (Tag cloud)

標籤雲又稱詞彙雲(word cloud)或是視覺化設計的加權清單(weighted list in visual design),將使用者產出的標籤集合或是描述網站內容的關鍵詞彙,按字母順 序排列,並且以標籤的字體大小、粗細或顏色之視覺特徵,反映每一個標籤或關 鍵詞彙的重要性或熱門程度(Sinclair & Cardew-Hall, 2008;Wikipedia, 2011)。標籤 雲最主要的用途是讓使用者可以立即了解資源內容主旨,以及藉由詞彙的超連結 瀏覽、發掘與該標籤相關的資源(Friedman, 2007;Rivadeneira et al., 2007)。

五、視覺特徵 (Visual Features;Visual Properties;Visual Characteristics)

標籤詞彙藉由文字屬性的視覺特徵反映標籤的重要性或熱門程度,文字屬性 的視覺特徵包括:字體大小、字體粗細、字體顏色,尤其是字體大小最為常見,

其他像是字體顏色飽和度、字母數量與寬度、字母包含的像素多寡也都屬於視覺 特徵(Rivadeneira et al., 2007;Bateman et al., 2008)。

六、標籤品質 (Tag Quality)

標籤品質是一個抽象概念,沒有統一的定義,但是相關文獻中提出「好的標 籤(good tags)」需具備的五種特質:1.涵蓋多個層面 2.高熱門性 3.最小努力原則 4.

一致性 5.排除某些特定類型的標籤(Xu et al., 2006),從標籤具備的功能來看,一個 好的標籤必須有效率的幫助使用者瀏覽、搜尋、組織、分享、發掘相關資源,才 會是一個有意義(meaningful)、高品質的標籤(Noruzi, 2006;Guy & Tonkin, 2006;

Suchanek, Vojnovic & Gunawardena, 2008;Fu et al., 2010)。

在本研究中,以 TF-IDF 演算法計算標籤的權重,並假設權重越高的標籤其品 質也越高。

七、TF-IDF 演算法

TF-IDF(Term Frequency - Inverse Document Frequency)是一種常用於自動索 引與資訊檢索領域中的詞彙加權技術,是為一種統計方法。此演算法可分成兩個 部分。第一個部分是計算詞彙 k 在文件 i 內出現的次數,以公式 求得詞 彙之 TF 值;第二個部分則是計算在 N 個文件總數中,有詞彙 k 出現的文件數量,

帶入公式為 =log(

)求得詞彙之 IDF 值(Salton & McGill, 1983;Salton &

Buckley, 1988)。

一個完整的 TF-IDF 演算法是將 Term Frequency 與 Inverse Document Frequency 計算公式結合,以兩者個別獲得數值相乘的方式求得詞彙之 TF-IDF 值,也就是詞 彙權重來評估個別詞彙對於文件的重要程度。原則上,權重越高的詞彙僅在少數 文件內出現,具有區別文件內容的能力(Salton & McGill, 1983;Salton & Buckley, 1988)。

本研究運用 TF-IDF 演算法計算標籤的權重,並以標籤的權重決定標籤的字體 大小。