第三章 研究方法與步驟
第一節 研究方法與架構
在(Buldú et al., 2007)利用歌曲網絡分析音樂品味的研究中,對於音樂品味的 概念是共同出現在同一播放清單之歌曲可作為清單擁有者的音樂品味;同樣地,
在休閒閱讀中,出現在同一書櫃中之書籍集合也可視為該讀者的選書品味與閱讀 偏好。此外,於書目計量學的領域中,曾使用多樣性指標分析引用文獻,探究學 術研究的跨領域特性;於本研究中,使用者將閱讀的書籍加入網路書櫃的行為可 類比至書目計量學中使用多樣性指標的情境。因此,本研究即在嘗試透過相同的 概念,利用特定書籍共同出現在特定閱讀品味書櫃,與利用多樣性指標分析個別 書櫃中書籍的作者,進行非干擾式(non-obtrusive)方法分析讀者的偏好結構。
本研究將嘗試兩種方式:首先利用(Buldú et al., 2007)的研究概念,該作者利 用共同出現在同一播放清單作為歌曲間的連結,透過網絡分析播放清單間的關係,
了解歌曲間的相互連結與相關性。本研究亦嘗試探索採用相同的方式,希望透過 觀察書籍在書櫃間共同出現的網絡結構,建立書與書之間的連結關係,並依此關 係定義書籍的相似性,呈現單一使用者書櫃的偏好結構。然而,此研究仍於多處 與本研究有所差異。首先,(Buldú et al., 2007)於研究資料處理上,由於其研究希 望建立歌曲間關係,故從播放清單建立歌曲連結後,即著重在歌曲間的連結關係;
而本研究欲分析單一讀者之閱讀偏好結構,因此從整體書籍網路出發,利用共現 矩陣建立書籍間的相似關係,再依此書籍相似性來呈現個別書櫃的閱讀偏好多樣 性。在網絡分析中,首先應確立書櫃中書籍間的連結依據:利用共同出現在同一 書櫃(以下簡稱共現)的次數來代表書籍間關連的強度,並以共現矩陣表示,如 (林頌堅, 2010)之研究即是利用字詞間共同出現的頻率來建立共現矩陣,代表字 詞間的關聯。在建立連結關係後,採用 5 種相似性測量(Spertus et al., 2005)包含 Cosine Similarity 與常見的 Correlation Coefficient 來分析書籍間的相似性。依據連
結關係與書籍間相似性將可建立書籍間的連結網路。在連結網路中,本研究參考 (Henry Small, 2009)研究中依照巨大元件(giant component)變化與(林頌堅, 2010) 採用的網絡特性包含連結線數與所占成分比率做為選擇閾值的方式,協助釐清分 群(clustering)的適當位置。接著將於整體書櫃網路中取出之閾值套用至個別書 櫃進行分群,即可找出個別書櫃之組成,群集數量多寡即為書櫃多樣性高低。
另一方式,考慮讀者書櫃的書目可能包含多種類型,如推理小說、商業報導 等等,因此適合採用書目計量學的中計算研究跨領域的多樣性指標來分析讀者書 櫃的多樣性。然而,書目計量學中每篇研究的領域為事先指定;本研究的研究場 域—aNobii 中使用 41 種不同類型的標記(Tag),且為多重標記(multi-tagging),
一本書可被一個使用者標記最多三種標籤,使用者更可自訂其書櫃內的標記,因 此不僅一本書可能被不同讀者標記為不同類型,亦可能有只有某一使用者使用的 個人標記,而且 aNobii 預設之標籤可能屬階層關係如小說與文學、旅行、同性 戀等,因此不適合在此採用作為分類依據。
圖 3 aNobii 讓使用者建議該書分類之畫面
休閒閱讀讀者選書最重要的參考因素為作者(Mikkonen & Vakkari, 2012;
Tang et al., 2012),因此本研究在採用多樣性指標分類時將類型的定義回歸至最重 要的參考因素—作者,將同一作者視為同一類,不同作者視為不同類。採用與 (Rafols & Meyer, 2010)研究的相同指標分析書櫃的多樣性,將會計算 Simpson’s Diversity、Stirling’s Revised Diversity、Gini 與 Shannon’s Entropy。而該研究中 Stirling’s Revised Diversity 考慮到類別間的相似性,在此即為作者之間是否相似。
因此我們嘗試結合共現矩陣的概念,利用書籍所屬作者為單位,建立書籍作者的 共現矩陣,並依此建立作者相似性。並以作為 Stirling’s Revised Diversity 公式中 計算類別相似性程度的依據。統整上述兩項方式將分群數量與多樣性指標兩種結 果與使用者自我評量之閱讀多樣性做比較,分析何種方式最能夠代表使用者的偏 好結構。
在本研究之前並無利用非干擾式分析網路書櫃書並進行相似性測量與使用 者分析,因此本研究著重於探索此一方式的可能性。整體而言,在架構上系統面 需有社會網絡資料收集、共現網路建立、相似性計算、閾值選擇與分群。在使用
者面,量化分析包含完成問卷訪談、自我認知與多樣性比較。
系統面 使用者面
社會網絡分析
共現網路建立
相似性計算
閾值選擇
分群
多樣性分析
作者共現矩陣
多樣性計算
量化
問卷訪談
自我認知與多樣性比較
表 6 資料收集與研究結果比較架構
本研究希望能探索利用社群網絡之尋書工具資料分析呈現休閒閱讀的偏好 結構與多樣性,研究資料來源可分為兩部分,系統面與使用者面。系統面可直接 從 aNobii 網站取得,收集書籍共同出現在特定書櫃之連結關係,期望進一步分 析資料探索網路書櫃使用者之閱讀偏好結構。因此,系統面之資料收集上若採用 非干擾性之量化研究方式進行,較能保持研究的客觀性。使用者面資料收集,為 了在 50 個抽樣書櫃中深入了解使用者,採用便利抽樣問卷訪談。便利抽樣
(Convenience Sampling),又稱為「任意抽樣、偶遇抽樣法」,為以方便為主要 考量的抽樣方法,樣本的選擇只考慮方便取得或觀察。此種抽樣方法容易進行,
但必須了解樣本的特質才適合進行。將會調查使用者對偏好結構自我評量作為評 量系統面資料之標竿。並加以分析探討,因此質性與量化之研究方法均有採用。