第四章 研究結果與討論
第五節 小結
本研究以 TF-IDF 演算法計算出標籤的權重,作為推薦標籤字體大小的依據,
探討標籤字體大小是否會影響受試者的標記行為?導致不同介面裡的標籤被選用 次數分佈有差異,在實驗組介面裡的標籤被選用次數分佈較為不均。為了探討上 述的假設是否成立,本研究採用 Gini 係數、H(X)值評估在不同介面裡標籤被選用 次數之分佈狀況,結果發現實驗組介面裡的標籤被選用次數分佈較集中,而控制 組介面裡的標籤被選用次數分佈較分散。此現象證明標籤字體大小會影響標籤被 選用次數分佈,進而推論標籤字體大小會影響受試者的標記行為。
以全部書籍的標籤字體大小和標籤被選用次數之間的相關性來看,檢定結果 顯示在實驗組介面裡,受試者選用的標籤字體大小和標籤被選用次數相關性顯著 (r=.392, p=.000)。但是在控制組介面裡,受試者選用的標籤字體大小和標籤被選用 次數相關性也是顯著(r=.215, p=.000)。雖然實驗組介面下的相關係數高於控制組介 面下的相關係數,但是兩者的相關性皆顯著,本研究無法判定是因為標籤字體大 小的引導,還是受試者判斷標籤品質的能力影響了標籤被選用次數,為了釐清「標 籤字體大小(A 因素)」和「受試者判斷標籤品質的能力(B 因素)」,這兩者對於標籤 被選用次數分佈的影響,本研究以多元迴歸來分析這兩者的影響力。
因為本研究是在探討標籤字體大小(A 因素),也是本實驗所設定的自變項對於 受試者標記行為的影響。所以必須先控制其他影響受試者標記行為的因素(B 因素)。
在控制 B 因素之後,A 因素仍然有顯著的影響力,代表 A 因素的確影響到標籤被 選用次數(參見圖 4-8)。
圖 4-8 分析模型
承接上述本研究對於 A 因素影響力的疑問,本研究將實驗組介面裡標籤被選 用次數作為因變項,依序以「控制組介面裡標籤被選用次數」、「館員選用標籤的 名次」、「標籤字體大小」三個會影響標籤被選用次數分佈的自變項進行多元迴歸 分析。
分析結果如表 4-15,本研究控制了「控制組介面裡標籤被選用次數」和「館 員選用標籤的名次」這兩個自變項,代表不管是在有控制組介面裡的 B 因素都被 控制了,排除所有情況下的 B 因素後,A 因素預測標籤被選用次數的解釋量還有 17%,統計上達到顯著水準,表示標籤字體大小的確會影響受試者的標記行為。
標籤被選用次 數之分佈狀況 以及選用的標
籤品質 標籤字體大小
變化 (A)
使用者對於標 籤品質的判斷
能力 (B)
表 4-15 以標籤字體大小預測標籤被選用次數之多元迴歸分析摘要表
變項順序 R F F change
1.控制組介面裡標
籤被選用次數 .73 .54 .54 107.62*** 107.62***
2.館員選用標籤的
名次 .77 .60 .06 67.33*** 13.00**
3.標籤字體大小 .87 .76 .17 95.87*** 62.28***
*p<.05, **p<.01, ***p<.001
除此之外,本研究驗證館員選用的標籤是否為高品質的標籤。為此,本研究嘗 試以獨立樣本 T 檢定館員選用與沒選用的標籤之間的 TF-IDF 值,結果顯示館員選 用標籤的 TF-IDF 值之平均數比沒選用的標籤高,達顯著水準。代表館員選用的標 籤是高品質(權重高)的標籤,可以作為評估不同介面裡受試者選用的標籤品質的基 準。
本研究以館員在無任何提示下所選用的標籤為標籤品質的基準,分別以館員 與受試者之間選用標籤個數的交集程度和選用標籤名次的相關性,評估不同介面 裡受試者選用的標籤品質。結果顯示實驗組介面裡的數值顯著高於控制組介面裡 的數值高,代表受試者在實驗組介面裡所選用的標籤和標籤名次,接近館員在無 任何提示下所選用的標籤和標籤名次。因此,本研究推論實驗組介面裡受試者選 用的標籤品質較高。