• 沒有找到結果。

第四章 結果與討論

第一節 研究結果

本研究於 aNobii 網路書櫃服務中抽樣 50 個使用者,建立書籍共現矩陣作為 建構使用者閱讀偏好多樣性指標的依據。由於 aNobii 平台的限制,無法單次下 載全部抽樣使用者書櫃的資料,資料收集時間為民國 2010 年 8 月 20 日至 2011 年 8 月 8 日。研究中所需書櫃資料,由於時間差可能會有資料不一致的情形,因 此在收集完畢 50 個抽樣書櫃的書籍並建立書籍清單後,重新比對資料做書籍清 單的增加或刪減,並重新檢驗個別書籍被書櫃擁有的次數建立 book-owner 矩陣 而後利用書籍共現矩陣進行書籍間相似性的計算。

本研究進行資料收集前,使用問卷訪談對 50 個抽樣書櫃的使用者,針對其 基本資料與 aNobii 網路書櫃的使用習慣做調查。基本資料顯示(如表 8),男性 共 21 名,占整體受測者 42%,女性共 29 名,佔 58%,性別比例大致相近,女 性受測者較多;年齡分布從 20 到 34 歲,平均年齡為 23.98(SD = 3.485);書櫃 書籍總數最小值為 80 本,最大值為 3780 本,平均數為 563.28(SD = 703.19359),

顯示個書櫃間書籍總數差異大;閱讀偏好多樣性,於此為使用者自評之閱讀偏好 多樣性的值,此統計量為利用 SPSS 統計軟體轉換李氏 0~6 分七點量表的值,最 小值為-2.45,最大值為 1.75,平均數為 0(SD = .98974)。其中,書櫃編號 109 因未取得使用者自評閱讀偏好多樣性資料,後續作關聯性分析時去除此筆資料。

最小值 最大值 平均數 標準差

年齡 20 34 23.98 3.485

閱讀偏好多樣性 -2.45 1.75 .0000 .98974 書籍總數 80.00 3780.00 563.2800 703.19359

N = 50

表 8 抽樣書櫃統計資料

一、 書籍共現情形之多樣性指標

(一)最適閾值

研究中採用 3 種正規化方式與 2 種相似性計算方式建立抽樣書櫃中所有書籍的相 似性矩陣,接著以巨大組件大小減少比例為最適閾值判別依據,並輔以社會網絡 分析中的網絡密度(density)、平均連結線數(average link)作為輔助判斷指標。

本研究利用整體書籍網絡矩陣之閾值結果作為評斷最適閾值之依據,以下分述 5

大的變化;若從 0.4~0.5 閾值變化的數值來看,閾值在上升至 0.5 時,最大組件 Giant Component Size Decrease %

threshold

Giant Component Size…

由於分母為取兩本書之間被書櫃擁有次數的最小值,在多數常出現在多個書櫃

(譬如暢銷書)的書籍與其他書籍的相似性,會因為此種正規化方式分母的處理 方式,使得書籍間的相似值分布最平均的一種方式。因此,在閾值設定的逐步增 加下,最大組件大小也僅是以非常小的幅度逐漸減少(如表 10)。儘管如此,相 較之下閾值上升至 0.6 時,巨大組件的大小減少幅度最大,代表巨大組件的崩解,

此時大部分多餘的連結都經由閾值的篩選,若更進一步增加閾值,則可能進入下 一個分群的階層。因此,在巨大組件崩解前的網絡狀況最適合做分群,選擇 0.5 作為最適閾值。

圖 10 Inter 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

3. Interminus(Intersection (A, B)-1 / min(A, B)-1 )

區間的 2 倍。此外,density 於閾值 0.5 時,停頓於 0.001706,若進行至 0.6,density 將驟減至 0.000722。同時考量最大組件大小的變化與 density 變化的停頓點,選 擇 0.5 作為最適閾值。

圖 11 Interminus 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component Size Decrease %

4. Cosine

圖 12 Cosine 最適閾值

5. Correlation

閾值 最大組

Correlation 的計算方式與 Cosine 較相似,因此在設定閾值與組件大小變化的情況 也很類似。閾值大小在 0.8 時,組件大小的減少比例為 79.05%(如表 13),為閾

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

圖 13 Correlation 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

(二)書籍分群多樣性與使用者自評多樣性之關聯

將 5 種書籍相似性計算方式,依據前述研究結果套入最適閾值後,採用 UCInet 軟體內建的 3 種分群方式 Region、Block、Girvan Newman,3 種分群方式在閾值 為 0 時分群結果在 5 種相似性計算方式的任一書櫃分群數量皆為 1,表示在未設 定閾值的情形下,如果沒有自行設定個別書櫃的分群目標數,皆無法對個別書櫃 進行分群。以下依據不同分群方式,將套入最適閾值的 5 種相似性計算方式分群 結果與使用者自評之閱讀多樣性分數作雙變數相關性分析。

1. Region-binary graph

UCINet 執行程序:Network>Regions>Components>binary graphs>weak component UCINet 中用來區分 subgroup 的 region 若選擇 binary graph,則是單純計算一 個網絡中的組件數,weak component 為不考慮連結方向(undirected)計算組件。

本研究於選擇最適閾值後,個別書櫃的檔案則使用二分法(dichotomize)將書的 共現矩陣轉換為 0 與 1,意即網絡中的連結沒有程度上的差別。個別書櫃在套入 最適閾值後,網絡會去除一些連結,剩下的組件數則可視為個別書櫃擁有者的閱 讀偏好多樣性。

在排除缺乏使用者自評閱讀偏好多樣性資料的 109 號書櫃後,共計分析 49 個書櫃。描述性統計結果顯示(如表 14),Jaccard_0.5(意指在 Jaccard 的相似 性測量下,採用 0.5 作為網絡的最適閾值)、Cosine_0.7、Correlation_0.7 在敘述 性統計下的數值型態相似,組件數最小值在 60 左右,平均數則在 410 左右(標 準差約等於 510),顯示個別書櫃在以上相似性計算之下,組件數較多,同時差 異也大;Inter_0.5 與 Interminus_0.5 數值型態則是組件數較少,差異相對不大。

SPSS 執行程序:分析>敘述統計>描述性統計量

最小值 最大值 平均數 標準差

Jaccard_0.5 58.00 2873.00 413.9388 504.18409 Inter_0.5 1.00 349.00 27.2857 66.19164 Interminus_0.5 1.00 450.00 92.6122 84.06590 Cosine_0.7 66.00 2934.00 426.3469 520.43398 Correlation_0.7 61.00 2916.00 419.6327 516.18293 N = 49

表 14 Region 分群敘述性統計

下表(如表 15)為 5 種相似性測量,單純考量最適閾值之個別書櫃組件數,

與使用者自我評量多樣性間相關的表現,依據與使用者自評之閱讀偏好多樣性之 顯著性升冪排序。以使用者自評之閱讀偏好多樣性為標準,Interminus 在閾值 0.5 之下呈顯著正相關(r=.287, p=.046)。

2. Block (bi-component)

UCINet 執行程序:Network>Regions>Bi-component(Block)

Block 在移除網絡中的橋後,計算網絡內的組件數。其中,被移除的橋(bridge)

與其連結的點另外算為一個組件。此外,此種方法計算組件時,會排除沒有任何 連線的點(isolate),可能造成套入最適閾值之後產生多個獨立點的書櫃組件數 急遽減少,考量獨立點在個別書櫃中存在的比例,可能代表閱讀偏好較多樣。

由於排除獨立點的特性,於此分析方法中除了排除 109 號書櫃外,亦排除加 入最適閾值之後,最後只剩下獨立點而無任何組件數的 114、134 書櫃,共計分 析 47 個書櫃。敘述性統計結果顯示(如表 16),各種相似性測量的最大值相較 Region 計算組件少一半,平均數與標準差也一併減少。

SPSS 執行程序:分析>敘述統計>描述性統計量

最小值 最大值 總和 平均數 標準差 Jaccard_0.5 1 240 2016 42.89 52.660 Inter_0.5 1 93 627 13.34 24.262 Interminus_0.5 1 251 2687 57.17 45.421 Cosine_0.7 1 229 1985 42.23 51.369 Correlation_0.7 4 235 2122 45.15 52.584 N = 47

表 16 Block 分群敘述性統計

相關性分析結果顯示(如表 17),沒有任何一種方法接近顯著。

SPSS 執行程序:分析>相關>雙變數

使用者自評 r 使用者自評 p 書籍總數 r 書籍總數 p Inter_0.5 0.12 0.423 -0.205 0.167 Interminus_0.5 0.045 0.764 .331* 0.023 Correlation_0.5 0.03 0.839 .898** 0 Cosine_0.7 0.014 0.926 .892** 0 Jaccard_0.7 0.013 0.929 .896** 0

*P<.05, **P<.01

表 17 Block 分群相關性分析

3. Girvan-Newman

UCINet_Netdraw 執行程序:Analysis>Subgroups>Girvan-Newman

在 Girvan-Newman 中,其概念為在不斷移除 edge betweeness 值最高邊(edge)

過程中,計算網絡的品質(過程詳第三章 Girvan-Newman 分群),而本研究即在 求網路品質最佳化下計算個別書櫃的組件數,作為個別書櫃的閱讀偏好多樣性依 據。分析結果為成對的組件數與 Q 值(亦即網絡品質指標),研究中紀錄最佳 Q 值的組件數,然而分群數量在 Q 值極大化下不一定是特定的組件數,有時會有 多個或是一定範圍內的組件數(數值不一定連續)。然而,Q 值極大化的多個分 群數中,由於最佳組件數的數值不一定連續,不能採用平均數的方式計算最佳分 群數。因此,本研究在處理非單一最佳組件數的書櫃時,採用 Q 值最大化之最 大與最小的最佳組件數,下列結果亦分成最佳組件最小值與最大組件最大值作分 析。

在分析取樣上,去除缺乏使用者自評之閱讀偏好多樣性之 109 號書櫃。由於 此種組件計算方式必須計算 edge betweeness,計算較前兩種方式繁複,在本研究 中個別書櫃書籍總數超過 3000 的書櫃計算上無法負荷,必須去除 48、129 號 2 個書櫃;而在書籍總數過少的情形下,cosine、correlation 兩種相似性計算因其 最適閾值為 0.7,造成書櫃中所有書籍全部分離,網絡中皆為獨立點而無任何連 結的書櫃無法計算 edge betweeness,去除 114、134 號 2 個書櫃。此外,在 Inter_0.5 與 Interminus_0.5 兩種相似性計算下,個別書櫃書籍總數在 1000 以上亦無法正常 計算,去除 55、72、119、122、131 號 5 個書櫃。最終在去除 10 個書櫃的情況 下,不論是取組件數最大或最小值,取樣 40 個書櫃作分析。

(1) 最佳組件最小值

與 Interminus_0.5 在 Q 值的總和、平均數與標準差,可看出 Interminus 相似性計 算在本研究的案例中,的確可有效排除於研究方法所述之書籍共現特殊情形,改 善書籍共現的相似性計算。

SPSS 執行程序:分析>敘述統計>描述性統計量

最小值 最大值 總和 平均數 標準差

Jaccard_0.5 2.000 104.000 1048.000 26.20000 21.073984 Inter_0.5 1.000 646.000 3409.000 85.22500 112.229958 Interminnus_0.5 1.000 259.000 1518.000 37.95000 48.115220 Cosine_0.7 2.000 104.000 1026.000 25.65000 20.850567 Correlation_0.7 4.000 103.000 1011.000 25.27500 20.566325 N = 40

表 18 Girvan-Newman 最佳分群最小值分群數敘述性統計

最小值 最大值 總和 平均數 標準差

Jaccard_0.5 -.500 .948 18.631 .46577 .384341 Inter_0.5 -.095 .839 6.674 .16685 .245731 Interminnus_0.5 .000 .874 19.440 .48600 .215311 Cosine_0.7 -.500 .946 19.814 .49535 .370230 Correlation_0.7 -.088 .947 23.732 .59330 .296542 N = 40

表 19 Girvan-Newman 最佳分群最小值 Q 值敘述性統計

相關性分析結果顯示(如表 20),除 Inter_0.5 為不顯著正相關(r = 0.11 , p = .5)

外,其餘相似性計算皆為不顯著負相關。此外,依據顯著性做排序,Cosine、

Correlation、Jaccard 殿後的結果與前述兩種分群方式結果相似,相似性計算與使 用者自評相關顯著 p 值愈小,與書籍總數之相關顯著 p 值則愈大。

SPSS 執行程序:分析>相關>雙變數

使用者自評 r 使用者自評 p 書籍總數 r 書籍總數 p Interminus_0.5 -0.188 0.245 .483** 0.002 Inter_0.5 0.11 0.5 .420** 0.007 Cosine_0.7 -0.022 0.892 .776** 0 Jaccard_0.5 -0.013 0.938 .784** 0 Correlation_0.7 -0.013 0.938 .827** 0

*P<.05, **P<.01

表 20 Girvan-Newman 分群最小值相關性分析

(2) 最佳組件最大值

SPSS 執行程序:分析>敘述統計>描述性統計量

不論最佳組件選擇最小或最大值分析,皆取 Q 值最大化的結果,因此 Q 值在敘 述性統計下的結果一致(如表 22)。然而在不同相似性組件數值統計結果顯示,

在最佳組件最大值的情況下,各個相似性計算下的組件數標準差皆上升。

最小值 最大值 總和 平均數 標準差

Jaccard_0.5 2.000 116.000 1068.000 26.70000 22.379249 Inter_0.5 1.000 646.000 3460.000 86.50000 112.468799 Interminus_0.5 1.000 259.000 1583.000 39.57500 50.347962 Cosine_0.7 2.000 117.000 1043.000 26.07500 22.203473 Correlation_0.7 4.000 103.000 1015.000 25.37500 20.614518 N = 40

表 21 Girvan-Newman 最佳分群最大值分群數敘述性統計

最小值 最大值 總和 平均數 標準差 Jaccard_0.5 -.500 .948 18.631 .46577 .384341 Inter_0.5 -.095 .839 6.674 .16685 .245731 Interminus_0.5 .000 .874 19.440 .48600 .215311 Cosine_0.7 -.500 .946 19.814 .49535 .370230 Correlation_0.7 -.088 .947 23.732 .59330 .296542 N = 40

表 22 Girvan-Newman 最佳分群最大值 Q 值敘述性統計

相關性分析結果顯示(如表 23),除 Inter_0.5 為不顯著正相關(r = 0.112 , p = .492)

相關性分析結果顯示(如表 23),除 Inter_0.5 為不顯著正相關(r = 0.112 , p = .492)