研究結果

第四章結果與討論

第一節研究結果

本研究於 aNobii 網路書櫃服務中抽樣 50 個使用者，建立書籍共現矩陣作為建構使用者閱讀偏好多樣性指標的依據。由於 aNobii 平台的限制，無法單次下載全部抽樣使用者書櫃的資料，資料收集時間為民國 2010 年 8 月 20 日至 2011 年 8 月 8 日。研究中所需書櫃資料，由於時間差可能會有資料不一致的情形，因此在收集完畢 50 個抽樣書櫃的書籍並建立書籍清單後，重新比對資料做書籍清單的增加或刪減，並重新檢驗個別書籍被書櫃擁有的次數建立 book-owner 矩陣而後利用書籍共現矩陣進行書籍間相似性的計算。

本研究進行資料收集前，使用問卷訪談對 50 個抽樣書櫃的使用者，針對其基本資料與 aNobii 網路書櫃的使用習慣做調查。基本資料顯示（如表 8），男性共 21 名，占整體受測者 42%，女性共 29 名，佔 58%，性別比例大致相近，女 性受測者較多；年齡分布從 20 到 34 歲，平均年齡為 23.98（SD = 3.485）；書櫃 書籍總數最小值為 80 本，最大值為 3780 本，平均數為 563.28（SD = 703.19359），

顯示個書櫃間書籍總數差異大；閱讀偏好多樣性，於此為使用者自評之閱讀偏好多樣性的值，此統計量為利用 SPSS 統計軟體轉換李氏 0~6 分七點量表的值，最 小值為-2.45，最大值為 1.75，平均數為 0（SD = .98974）。其中，書櫃編號 109 因未取得使用者自評閱讀偏好多樣性資料，後續作關聯性分析時去除此筆資料。

最小值最大值平均數標準差

年齡 20 34 23.98 3.485

閱讀偏好多樣性 -2.45 1.75 .0000 .98974 書籍總數 80.00 3780.00 563.2800 703.19359

N = 50

表 8 抽樣書櫃統計資料

一、書籍共現情形之多樣性指標

（一）最適閾值

研究中採用 3 種正規化方式與 2 種相似性計算方式建立抽樣書櫃中所有書籍的相似性矩陣，接著以巨大組件大小減少比例為最適閾值判別依據，並輔以社會網絡分析中的網絡密度（density）、平均連結線數（average link）作為輔助判斷指標。

本研究利用整體書籍網絡矩陣之閾值結果作為評斷最適閾值之依據，以下分述 5

大的變化；若從 0.4~0.5 閾值變化的數值來看，閾值在上升至 0.5 時，最大組件 Giant Component Size Decrease %

threshold

Giant Component Size…

由於分母為取兩本書之間被書櫃擁有次數的最小值，在多數常出現在多個書櫃

（譬如暢銷書）的書籍與其他書籍的相似性，會因為此種正規化方式分母的處理方式，使得書籍間的相似值分布最平均的一種方式。因此，在閾值設定的逐步增加下，最大組件大小也僅是以非常小的幅度逐漸減少（如表 10）。儘管如此，相較之下閾值上升至 0.6 時，巨大組件的大小減少幅度最大，代表巨大組件的崩解，

此時大部分多餘的連結都經由閾值的篩選，若更進一步增加閾值，則可能進入下一個分群的階層。因此，在巨大組件崩解前的網絡狀況最適合做分群，選擇 0.5 作為最適閾值。

圖 10 Inter 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

3. Interminus（Intersection (A, B)-1 / min(A, B)-1 ）

區間的 2 倍。此外，density 於閾值 0.5 時，停頓於 0.001706，若進行至 0.6，density 將驟減至 0.000722。同時考量最大組件大小的變化與 density 變化的停頓點，選擇 0.5 作為最適閾值。

圖 11 Interminus 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component Size Decrease %

4. Cosine

圖 12 Cosine 最適閾值

5. Correlation

閾值最大組

Correlation 的計算方式與 Cosine 較相似，因此在設定閾值與組件大小變化的情況也很類似。閾值大小在 0.8 時，組件大小的減少比例為 79.05%（如表 13），為閾

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

圖 13 Correlation 最適閾值 0.00000%

10.00000%

20.00000%

30.00000%

40.00000%

50.00000%

60.00000%

70.00000%

80.00000%

90.00000%

100.00000%

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Giant Component Size Decrease %

threshold

Giant Component SizeDecrease %

（二）書籍分群多樣性與使用者自評多樣性之關聯

將 5 種書籍相似性計算方式，依據前述研究結果套入最適閾值後，採用 UCInet 軟體內建的 3 種分群方式 Region、Block、Girvan Newman，3 種分群方式在閾值為 0 時分群結果在 5 種相似性計算方式的任一書櫃分群數量皆為 1，表示在未設定閾值的情形下，如果沒有自行設定個別書櫃的分群目標數，皆無法對個別書櫃進行分群。以下依據不同分群方式，將套入最適閾值的 5 種相似性計算方式分群結果與使用者自評之閱讀多樣性分數作雙變數相關性分析。

1. Region-binary graph

UCINet 執行程序：Network>Regions>Components>binary graphs>weak component UCINet 中用來區分 subgroup 的 region 若選擇 binary graph，則是單純計算一個網絡中的組件數，weak component 為不考慮連結方向（undirected）計算組件。

本研究於選擇最適閾值後，個別書櫃的檔案則使用二分法（dichotomize）將書的共現矩陣轉換為 0 與 1，意即網絡中的連結沒有程度上的差別。個別書櫃在套入最適閾值後，網絡會去除一些連結，剩下的組件數則可視為個別書櫃擁有者的閱讀偏好多樣性。

在排除缺乏使用者自評閱讀偏好多樣性資料的 109 號書櫃後，共計分析 49 個書櫃。描述性統計結果顯示（如表 14），Jaccard_0.5（意指在 Jaccard 的相似性測量下，採用 0.5 作為網絡的最適閾值）、Cosine_0.7、Correlation_0.7 在敘述性統計下的數值型態相似，組件數最小值在 60 左右，平均數則在 410 左右（標準差約等於 510），顯示個別書櫃在以上相似性計算之下，組件數較多，同時差異也大；Inter_0.5 與 Interminus_0.5 數值型態則是組件數較少，差異相對不大。

SPSS 執行程序：分析>敘述統計>描述性統計量

最小值最大值平均數標準差

Jaccard_0.5 58.00 2873.00 413.9388 504.18409 Inter_0.5 1.00 349.00 27.2857 66.19164 Interminus_0.5 1.00 450.00 92.6122 84.06590 Cosine_0.7 66.00 2934.00 426.3469 520.43398 Correlation_0.7 61.00 2916.00 419.6327 516.18293 N = 49

表 14 Region 分群敘述性統計

下表（如表 15）為 5 種相似性測量，單純考量最適閾值之個別書櫃組件數，

與使用者自我評量多樣性間相關的表現，依據與使用者自評之閱讀偏好多樣性之顯著性升冪排序。以使用者自評之閱讀偏好多樣性為標準，Interminus 在閾值 0.5 之下呈顯著正相關（r=.287, p=.046）。

2. Block （bi-component）

UCINet 執行程序：Network>Regions>Bi-component(Block)

Block 在移除網絡中的橋後，計算網絡內的組件數。其中，被移除的橋（bridge）

與其連結的點另外算為一個組件。此外，此種方法計算組件時，會排除沒有任何連線的點（isolate），可能造成套入最適閾值之後產生多個獨立點的書櫃組件數急遽減少，考量獨立點在個別書櫃中存在的比例，可能代表閱讀偏好較多樣。

由於排除獨立點的特性，於此分析方法中除了排除 109 號書櫃外，亦排除加入最適閾值之後，最後只剩下獨立點而無任何組件數的 114、134 書櫃，共計分析 47 個書櫃。敘述性統計結果顯示（如表 16），各種相似性測量的最大值相較 Region 計算組件少一半，平均數與標準差也一併減少。

SPSS 執行程序：分析>敘述統計>描述性統計量

最小值最大值總和平均數標準差 Jaccard_0.5 1 240 2016 42.89 52.660 Inter_0.5 1 93 627 13.34 24.262 Interminus_0.5 1 251 2687 57.17 45.421 Cosine_0.7 1 229 1985 42.23 51.369 Correlation_0.7 4 235 2122 45.15 52.584 N = 47

表 16 Block 分群敘述性統計

相關性分析結果顯示（如表 17），沒有任何一種方法接近顯著。

SPSS 執行程序：分析>相關>雙變數

使用者自評 r 使用者自評 p 書籍總數 r 書籍總數 p Inter_0.5 0.12 0.423 -0.205 0.167 Interminus_0.5 0.045 0.764 .331* 0.023 Correlation_0.5 0.03 0.839 .898** 0 Cosine_0.7 0.014 0.926 .892** 0 Jaccard_0.7 0.013 0.929 .896** 0

*P<.05, **P<.01

表 17 Block 分群相關性分析

3. Girvan-Newman

UCINet_Netdraw 執行程序：Analysis>Subgroups>Girvan-Newman

在 Girvan-Newman 中，其概念為在不斷移除 edge betweeness 值最高邊（edge）

過程中，計算網絡的品質（過程詳第三章 Girvan-Newman 分群），而本研究即在求網路品質最佳化下計算個別書櫃的組件數，作為個別書櫃的閱讀偏好多樣性依據。分析結果為成對的組件數與 Q 值（亦即網絡品質指標），研究中紀錄最佳 Q 值的組件數，然而分群數量在 Q 值極大化下不一定是特定的組件數，有時會有多個或是一定範圍內的組件數（數值不一定連續）。然而，Q 值極大化的多個分群數中，由於最佳組件數的數值不一定連續，不能採用平均數的方式計算最佳分群數。因此，本研究在處理非單一最佳組件數的書櫃時，採用 Q 值最大化之最大與最小的最佳組件數，下列結果亦分成最佳組件最小值與最大組件最大值作分析。

在分析取樣上，去除缺乏使用者自評之閱讀偏好多樣性之 109 號書櫃。由於此種組件計算方式必須計算 edge betweeness，計算較前兩種方式繁複，在本研究中個別書櫃書籍總數超過 3000 的書櫃計算上無法負荷，必須去除 48、129 號 2 個書櫃；而在書籍總數過少的情形下，cosine、correlation 兩種相似性計算因其最適閾值為 0.7，造成書櫃中所有書籍全部分離，網絡中皆為獨立點而無任何連結的書櫃無法計算 edge betweeness，去除 114、134 號 2 個書櫃。此外，在 Inter_0.5 與 Interminus_0.5 兩種相似性計算下，個別書櫃書籍總數在 1000 以上亦無法正常計算，去除 55、72、119、122、131 號 5 個書櫃。最終在去除 10 個書櫃的情況下，不論是取組件數最大或最小值，取樣 40 個書櫃作分析。

(1) 最佳組件最小值

與 Interminus_0.5 在 Q 值的總和、平均數與標準差，可看出 Interminus 相似性計算在本研究的案例中，的確可有效排除於研究方法所述之書籍共現特殊情形，改善書籍共現的相似性計算。

SPSS 執行程序：分析>敘述統計>描述性統計量

最小值最大值總和平均數標準差

Jaccard_0.5 2.000 104.000 1048.000 26.20000 21.073984 Inter_0.5 1.000 646.000 3409.000 85.22500 112.229958 Interminnus_0.5 1.000 259.000 1518.000 37.95000 48.115220 Cosine_0.7 2.000 104.000 1026.000 25.65000 20.850567 Correlation_0.7 4.000 103.000 1011.000 25.27500 20.566325 N = 40

表 18 Girvan-Newman 最佳分群最小值分群數敘述性統計

最小值最大值總和平均數標準差

Jaccard_0.5 -.500 .948 18.631 .46577 .384341 Inter_0.5 -.095 .839 6.674 .16685 .245731 Interminnus_0.5 .000 .874 19.440 .48600 .215311 Cosine_0.7 -.500 .946 19.814 .49535 .370230 Correlation_0.7 -.088 .947 23.732 .59330 .296542 N = 40

表 19 Girvan-Newman 最佳分群最小值 Q 值敘述性統計

相關性分析結果顯示（如表 20），除 Inter_0.5 為不顯著正相關（r = 0.11 , p = .5）

外，其餘相似性計算皆為不顯著負相關。此外，依據顯著性做排序，Cosine、

Correlation、Jaccard 殿後的結果與前述兩種分群方式結果相似，相似性計算與使用者自評相關顯著 p 值愈小，與書籍總數之相關顯著 p 值則愈大。

SPSS 執行程序：分析>相關>雙變數

使用者自評 r 使用者自評 p 書籍總數 r 書籍總數 p Interminus_0.5 -0.188 0.245 .483** 0.002 Inter_0.5 0.11 0.5 .420** 0.007 Cosine_0.7 -0.022 0.892 .776** 0 Jaccard_0.5 -0.013 0.938 .784** 0 Correlation_0.7 -0.013 0.938 .827** 0

*P<.05, **P<.01

表 20 Girvan-Newman 分群最小值相關性分析

(2) 最佳組件最大值

SPSS 執行程序：分析>敘述統計>描述性統計量

不論最佳組件選擇最小或最大值分析，皆取 Q 值最大化的結果，因此 Q 值在敘述性統計下的結果一致（如表 22）。然而在不同相似性組件數值統計結果顯示，

在最佳組件最大值的情況下，各個相似性計算下的組件數標準差皆上升。

最小值最大值總和平均數標準差

Jaccard_0.5 2.000 116.000 1068.000 26.70000 22.379249 Inter_0.5 1.000 646.000 3460.000 86.50000 112.468799 Interminus_0.5 1.000 259.000 1583.000 39.57500 50.347962 Cosine_0.7 2.000 117.000 1043.000 26.07500 22.203473 Correlation_0.7 4.000 103.000 1015.000 25.37500 20.614518 N = 40

表 21 Girvan-Newman 最佳分群最大值分群數敘述性統計

最小值最大值總和平均數標準差 Jaccard_0.5 -.500 .948 18.631 .46577 .384341 Inter_0.5 -.095 .839 6.674 .16685 .245731 Interminus_0.5 .000 .874 19.440 .48600 .215311 Cosine_0.7 -.500 .946 19.814 .49535 .370230 Correlation_0.7 -.088 .947 23.732 .59330 .296542 N = 40

表 22 Girvan-Newman 最佳分群最大值 Q 值敘述性統計

相關性分析結果顯示（如表 23），除 Inter_0.5 為不顯著正相關（r = 0.112 , p = .492）

在文檔中以網絡書櫃資料建構讀者閱讀偏好多樣性之指標研究 (頁 67-84)

第四章 結果與討論

第一節 研究結果

一、 書籍共現情形之多樣性指標

（一）最適閾值

3. Interminus（Intersection (A, B)-1 / min(A, B)-1 ）

4. Cosine

5. Correlation

（二）書籍分群多樣性與使用者自評多樣性之關聯

1. Region-binary graph

2. Block （bi-component）

3. Girvan-Newman

(1) 最佳組件最小值

(2) 最佳組件最大值

第四章結果與討論

第一節研究結果

一、書籍共現情形之多樣性指標