第五章 研究結論與建議
第一節 研究結論
本節以研究結果和訪談內容,回答研究問題並且找出研究假設成立或是不成立 的原因,最後提出關於受試者標記結果的其他發現。
假設一:標籤字體大小會影響使用者的標記行為,導致不同介面裡使用者選用標 籤次數之分佈狀況有差異,在實驗組介面裡使用者選用標籤次數之分佈狀況較為 不均。
本研究採用經濟學中衡量所得分配平均程度的 Gini 係數,以及測量整個系統 的平均資訊量的 H(X)值,評估標籤被選用次數之分佈狀況。結果顯示實驗組介面 裡的標籤被選用次數分佈較不均,而控制組介面裡的標籤被選用次數分佈較平均。
由此推論在標籤字體大小的影響下,不同介面裡的標籤被選用次數分佈確實有差 異。
另一方面,藉由「選用標籤數量」、「相異標籤個數」、「單次選用之標籤個數與 比例」這三個項目評估不同介面裡的標籤基本統計量,如果不同介面裡的標籤基 本統計量有差異,則代表有其他因素也在影響受試者的標記行為。然而經過配對 樣本 T 檢定分析後,顯示不同介面裡的標籤基本統計量沒有差異。也就是說,標 籤字體大小的影響力超越了其他因素的影響力,使得標籤字體大小確實會影響受 試者的標記行為,導致不同介面裡的標籤被選用次數分佈有差異的假設更有說服 力。
假設二:在實驗組介面裡,使用者選用字體大的標籤的機會較高。
從「受試者選用標籤個數比例」、「標籤字體大小與標籤被選用次數之相關性」
兩個項目,探討實驗組介面裡,使用者選用字體大的標籤的機會是否較高。
本研究從「受試者選用標籤個數比例」觀察到字體大的標籤被受試者選用的 比例很高,字體小的標籤被受試者選用的比例較低。為了更深入探討標籤字體大 小是否會影響受試者的標記行為,增加字體大的標籤被選用的機會?以 Spearman 等級相關係數檢定受試者選用的標籤字體大小與標籤被選用次數之間的相關性。
結果顯示實驗組介面的相關係數略高於控制組介面的相關係數。但是就全部書籍 而言,不同介面裡的標籤字體大小與標籤被選用次數之間皆呈現顯著相關。若以 訪談內容來看,除了標籤字體大小的因素之外,受試者判斷標籤品質的能力也會 影響標籤被選用的次數。例如:以個人見解和主觀感受去選用標籤,或是考慮標 籤語意的精確性是否有助於辨識或搜尋特定書籍。
由於標籤字體大小與受試者判斷標籤品質的能力皆存在,使得本研究無法判 斷是標籤字體大小,還是受試者判斷標籤品質的能力影響標籤被選用次數。
以下是訪談內容佐證:
我會被大字體的標籤吸引,但是我未必會選大字體的標籤。我會以個人角度去選 擇標籤。字體大小對標記的幫助有限。像「六弄咖啡館」我會從大字體的標籤中去 挑兩三個,但是如果我覺得標籤內容不是我想要的,我就會看小字體的標籤(受試 者編號:ESAW)
它會把我引導到某一個思考的方向去,但是真正在做選擇的時候,並沒有那麼決 定性的因素。一開始的方向也許有抓對了,可是講的夠不夠直接或正確,要好好 的想一想,並不是說完全沒有用,只是在一開始吸引你的目光後,後來你會發現 它講得不夠準確或確切,你可能需要其他的形容詞或名詞。小標籤我還是會全部 看完,我會注意語意的精確性,排序才會精確或符合。(受試者編號:FLZ0)
所以本研究以多元迴歸方法分析標籤字體大小和受試者判斷標籤品質的能力,
對於標籤被選用次數的影響力,從多元迴歸分析的解釋量來看,控制受試者在控 制組介面裡的選擇和受試者的判斷能力之後,標籤字體大小預測標籤被選用次數 達顯著水準。因此,本研究推論標籤字體大小的確會影響標籤被選用次數。
由數據顯示在實驗組介面裡,字體大的標籤容易被受試者所選用。實際觀察 不同介面裡選用次數前 10 名的標籤,在實驗組介面裡的前 10 名標籤大多是六、
七號字體;在控制組介面裡的前 10 名標籤則包含了三到五號字體(相對而言為小字 體)。
以「理查費曼」這個標籤為例,在受試者在實驗組介面下選用 14 次。但是在 控制組的介面下,受試者只選用 5 次。顯示受試者會因為標籤字體大小的影響,
增加「理查費曼」這個標籤被選用的機會。
以下是訪談內容佐證:
字體大對我標記有幫助,如果剛好有相關,就會點選進來(受試者編號:MOZW) 大字對標記有幫助,一開始會先看大字,會覺得它們就是已經被篩選過,比較有 用的一些資訊,可能就會優先考慮,通常它們也是最直覺的,就是書名或作者名 之類的(受試者編號:B5CY)
另外以「科幻文學」這個標籤為例,經過 TF-IDF 公式計算之後,標籤的權重 降低,館員也沒有選用此標籤,代表「科幻文學」這個標籤的品質不高,當然此 標籤的字體也相對較小。然而在控制組介面下,此標籤被受試者選用 2 次。在實 驗組介面下則沒有被受試者選用,可能是因為標籤字體大小的影響而忽略這個標 籤。因此,也顯示標籤字體大小的視覺化使得「科幻文學」這個標籤較不顯著,
因而未被使用實驗組介面的受試者所採用。
綜合量化與質化資料後,本研究推論實驗組介面裡,使用者選用字體大的標 籤的機會較高。
假設三:以 TF-IDF 演算法作為字體大小變化依據的介面裡,使用者選用的標籤品 質較高。
本研究以館員依據其專業能力所選用的標籤,評估不同介面裡的受試者選用 的標籤品質。並以獨立樣本 T 檢定驗證館員選用的標籤的確是高品質(權重高)的標 籤。
從訪談內容得知,館員們表示在標記非小說時因為主題明確,學科性強,即 使沒看過也可以從書名或書後標題辨識書籍的主題。反觀標記小說時必須要先了 解書籍內容後才能進一步選用標籤,所花的時間會比標記非小說來的多。
館員們認為標記過程中最大的困難是沒看過指定書籍,如果是標記看過的書 籍,例如:「大騙局」和「別鬧了,費曼先生」,可以很快找到適合的標籤。另一 方面,館員表示在標記過程中會受到工作習性的影響來選用標籤。通常會選擇與 書上一樣的詞彙,或是選用名詞屬性的標籤,再者不選用形容詞或是太過主觀、
情緒性的標籤。
驗證館員選用的標籤是高品質的標籤之後,本研究以館員選用的標籤為標籤 品質的基準,分別以館員與受試者之間選用標籤個數的交集程度,以及選用標籤 名次的相關性,評估不同介面裡的受試者選用的標籤品質。結果顯示實驗組介面 裡受試者選用的標籤品質較高。
另外,觀察受試者在不同介面裡選用的前 10 名標籤,受試者在實驗組介面裡 選用次數前 10 名的標籤,幾乎都會被館員所選用。而且館員給予這些標籤的名次 在前 3 名的範圍內,加上本研究觀察到這些標籤多為六、七號字體,可見受試者 在實驗組介面裡選用的標籤,接近館員選用的標籤。因此,本研究推論以 TF-IDF 演算法作為字體大小變化依據的介面裡,使用者選用的標籤品質較高。
以下將研究結果做一個整理,以表格方式呈現如下:
表 5-1 研究結果總整理
研究問題與假設 是否會影響、是否成立
Q1:在標籤字體大小的影響之下,使用者在不
同介面裡的標記行為是否有差異? 有
H1:標籤字體大小會影響使用者的標記行為,
導致不同介面裡使用者選用標籤次數之分佈狀 況有差異,在實驗組介面裡使用者選用標籤次 數之分佈狀況較為不均。
成立
H2:在實驗組介面裡,使用者選用字體大的標
籤的機會較高。 成立
Q2:在標籤字體大小的影響之下,使用者在不
同介面裡選用的標籤品質是否有差異? 有
H3:以 TF-IDF 演算法作為字體大小變化依據
的介面裡,使用者選用的標籤品質較高。 成立
非研究目的之其他發現
從受試者的訪談內容得知,大多數的受試者會依自己的原則選用標籤。本研 究歸納出受試者會因應書籍類型而選用不同性質的標籤,例如:標記小說時會考 慮作者、書名、作品主題類別、作品系列、同作者的書籍、作者得過的獎項、出 版社、版次,甚至會選用書中角色、事件名稱或發生地點、書中的時空背景等標 籤,以方便未來的使用者可藉由上述標籤找到特定書籍。
標記非小說時則是以作品主題、類別為主,偶爾會增加與書籍內容相關的議 題,或是書籍排版上的特色,在標記非小說時通常不會選擇書名與作者標籤,因 為使用非小說類書籍是為了特殊的目的,例如:獲取知識、解決問題等,很少會 注意作者是誰,除非作者的知名度非常高。
除此之外,受試者也會依自己的原則排序標籤,大致上分為兩種策略。第一 種是以最快可以找到這本書的目的排序標籤,通常以作者、書中角色名稱或書名 給予前面的名次。第二種是以推薦他人為目的,將最引人興趣的標籤給予前面的 名次,例如:作者得過的獎項、作者的稱號、作者其他有名的書籍或是有名的推 薦人。
以下是訪談內容佐證:
書的作者大家都知道,就會擺前面。有的作者我自己都不知道是誰,就不會把他
書的作者大家都知道,就會擺前面。有的作者我自己都不知道是誰,就不會把他