中華大學

(1)

中華大學碩士論文

以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使用者查詢績效的影

用者查詢績效的影用者查詢績效的影用者查詢績效的影響響響響

系所別：資訊管理學系碩士班

學號姓名：M09510036 黃莉婷

指導教授：李之中博士

(2)

摘要摘要摘要摘要

本研究的主要目的為探討資料庫系統中資料表示式與任務複雜度對使用者查詢績效以及更新查詢績效的影響。在資料表示式方面，我們在關連式資料庫中分別使用水平式資料表綱要與垂直式資料表綱要作為本研究的資料表示式。在任務複雜度方面，則透過使用者撰寫查詢敘述的困難度來表示。查詢績效及更新資料庫查詢績效則是由正確性、時間、信心度三個構面來表示。本研究使用實驗法探討資料表示式與任務複雜度對使用者查詢績效以及更新資料庫查詢績效的影響。在查詢績效實驗結果顯示不同的資料表示式，除了時間之外，在正確性與信心程度存在顯著的差異。而在不同的任務複雜度，使用者查詢績效(正確性、時間、信心程度)均存在顯著的差異。而在更新資料庫查詢績效實驗結果顯示不同的資料表示式，除了正確性的微觀錯誤之外，其他正確性與信心程度存在顯著的差異。而在不同的任務複雜度，除了正確性之外，使用者更新資料庫查詢績效(時間及信心程度)均存在顯著的差異。

關鍵詞：資料表示方式、任務複雜度、查詢績效、垂直式綱要

(3)

ABSTRACT

In this thesis, the effects of data representation and task complexity on user performance to develop SQL queries and updates were examined. This research examined two schemas – the horizontal data schema and the vertical data schema as the data representation of this research. This research also examined the difficulty of the queries as the task complexity. Performance was measured by the accuracy, time and confidence. An experimental method has been undertaken to measure the user performance. The results showed that accuracy and confidence were significantly associated with data representation, but time was not. Another result was that accuracy, time and confidence were significantly related to task complexity.

keyword：data representation、task complexity、performance、vertical data schema

(4)

誌謝

三年的碩士研究生涯，在跌跌撞撞、忙忙碌碌中逐漸的告了段落，在指導教授李之中博士的細心指導下，竭盡所能細心、耐心的討論給予學生明確的研究方向，使得學生在面對未知的領域和挑戰不會恐慌。老師對於研究嚴謹的態度和客觀的批判，令學生受益匪淺。研究的過程，從最初的茫然未知，在經過與老師、

學長、同學的討論之後，逐漸摸索出方向，以至完成，這個過程是美好且值得回憶的。

在論文口試期間特別感謝本校應鳴雄博士、龍華科技大學馬芳資博士在百忙之中撥冗參與學生的碩士論文口試，對於文章內容給予詳細的審閱與批示，

並於口試時詳加指正與不吝建議，使本論文的內容更加詳實與嚴謹，在此致上學生最誠摯的謝意。

本論文能順利完成亦要感謝研究所同學政傑、芃安、名豐、冠傑、學長鼎元和學弟澄宇、鈞毅、學駿、峻維、昇岳及學妹宜真，與你們一起度過這三年快樂且充實的時光，彼此之間不論是在課業或是學術研究上皆能互相勉勵，互相督促，而在日常生活上也都對彼此付出了相當的體諒和關心。在此由衷的感謝諸位。

最要感謝我的父母與姐弟，謝謝你們的鼓勵跟體諒，讓我能夠專心致力於我的研究，有你們的支持我才能順利完成碩士學業。感激之情溢於言表，僅以本文獻給我最親愛的雙親和家人，以及曾經幫助過我的朋友們，希望這份成果，能使他們感到榮耀。

黃莉婷謹識于中華大學資管所中華民國九十八年七月

(5)

表 1-1 水平式綱要查詢結果 ...2

表 1-2 垂直式綱要查詢結果 ...3

表 2-1 水平式綱要查詢結果 ...10

表 2-2 垂直式綱要查詢結果 ...12

表 3-1 水平式綱要資料表 ...17

表 3-2 垂直式綱要資料表 ...18

表 4-1 問題回收情形統計表 ...27

表 4-2 相關矩陣 ...28

表 4-3 變異數分析表 ...29

表 4-4 更新資料庫查詢變異數分析表 ...30

表 4-5 資料表示式與任務查詢複雜度在巨觀錯誤之迴歸分析結果 ...31

表 4-6 資料表示式與任務查詢複雜度在微觀錯誤之迴歸分析結果 ...33

表 4-7 資料表示式與任務查詢複雜度在時間之迴歸分析結果 ...36

表 4-8 資料表示式與任務查詢複雜度在信心度之迴歸分析結果 ...38

表 4-9 本研究結果整理表 ...40

(7)

圖 1-1 水平式綱要 ...1

圖 1-2 垂直式綱要 ...3

圖 1-3 研究架構流程圖 ...8

圖 3-1 研究架構流程 ...16

圖 3-2 本研究架構模型 ...17

圖 4-1 資料表示式與複雜度之巨觀型的估計邊緣平均數 ...31

圖 4-2 複雜度與資料表示式之巨觀型錯誤的估計邊緣平均數 ...32

圖 4-3 資料表示式與複雜度之微觀錯誤的估計邊緣平均數 ...34

圖 4-4 任務查詢複雜度與資料表示式之微觀錯誤的估計邊緣平均數 ...35

圖 4-5 資料表示式與任務查詢複雜度之使用時間的估計邊緣平均數 ...36

圖 4-6 任務查詢複雜度與資料表示式之使用時間的估計邊緣平均數 ...37

圖 4-7 資料表示式與任務查詢複雜度之信心度的估計邊緣平均數 ...38

圖 4-8 資料表示式與複雜度之任務查詢複雜度的估計邊緣平均數 ...39

(8)

第一章第一章第一章

第一章緒論緒論緒論緒論

本章主要分為研究背景與動機、研究目的、研究範圍以及研究流程四大部分。首先說明本研究之研究背景以及研究動機，再透過研究目的的設立，訂定出本研究之研究範圍，完成上述研究步驟後，再制定出整體的研究流程，以對本研究有完整的說明。

第一節第一節第一節

第一節研究背景與動機研究背景與動機研究背景與動機研究背景與動機

對資料庫應用開發人員而言，資料庫系統中提供了一個抽象化的資料表示式，因此透過此一資料表示式資料庫應用開發人員在擷取或維護資料庫中的資料時，無需處理實體(Physical)上的細節。因此，資料庫中的資料表示式，將直接影響資料庫應用開發人員撰寫查詢時的績效 Chan 等人(1993)。在資料庫學界的研究議題中，學者 Agrawal 等人(2001)為了處理將近 5000 個屬性的稀疏資料(Sparse Data)，提出將資料庫系統中的資料表綱要(Table Schema)，從傳統的水平式調整成垂直式。而此一議題在近三年持續受到資料庫學界的討論 Acharya 等人( 2008a;

2008b) Chu 等人( 2007) Beckmann 等人( 2006 )。然而，這些討論多集中在查詢撰寫 (Beckmann et al., 2006)、資料儲存結構與索引設計等 Acharya 等人(2008a;

2008b) Chu 等人(2007)系統面上的議題。就我們能力範圍所及，未曾見過資料表綱要從水平式調整成垂直式之後，對資料庫應用開發人員查詢績效的影響進行討論。本研究的第一個議題即為討論資料表綱要從水平式調整成垂直式之後，對資料庫應用開發人員查詢績效的影響。

例如，生產線接獲一批路由器生產工單，透過工單號碼可以得知產品的料號，再透過產品料號可以得知產品的生產路徑(rouing)，其中包含生產所需要的產測程式資訊。每一支產測程式有不同的測試項目，依照水平式設計，每一個測試項目都需要一個欄位。接著開始測試該產品是否為良品，PcbaNo 為產品的製造序號，Domain 為產品的出貨國別，FwVer 為產品的韌體版本(firmware

(9)

version)，Result 為產品的測試結果(Pass / Fail)，路由器產品測試資料，記錄在資料庫水平式綱要的橫式表示架構。如圖 1-1 所示，一支產測程式對應一個資料表，

圖中 TestRecord、MAC_Assign 與 Download 為儲存生產過程所產生的測試紀錄，

而 MAC_Assign 與 Download 亦為產測程式名稱，資料表中的欄位都是為了滿足實體屬性而設計。(為便於舉例，僅列出 Mac_Assign 與 Download 產測程式，實際在生產時所用的程式不只這兩支。)

圖 1-1 水平式綱要

表 1-1 水平式綱要查詢結果

PcbaNo Domain FwVER Result S1.123 USA a.bin Pass S1.123 US b.bin Pass S1.123 Japan c.bin Fail S1.123 TW d.bin Pass S1.123 TW d.bin Pass

(10)

變更資料庫綱要設計將水平式綱要改為富有彈性的垂直式綱要，假使實體屬性有變動，資料表綱要並不需要隨之變動。圖 1-2 為路由器產品產測紀錄儲存在資料庫的垂直式綱要表示方式，圖中的製程結果為垂直式設計，TestPrgID 記錄程式編號；TestItemID 記錄測試項目編號；Value 則記錄測試值，無論產測程式為何、測試項目的數量有多少，一個資料表就足以滿足實體儲存的需要。

圖 1-2 垂直式綱要

表 1-2 垂直式綱要查詢結果

PcbaNo PrgID ItemID Value S1.123 MAS Domain USA S1.123 MAS FwVer a.bin S1.123 MAS Result Pass S1.123 DL Domain US S1.123 DL FwVer b.bin S1.123 DL Result Pass

(11)

而當資料表綱要從水平式調整成垂直式之後，資料庫應用開發人員根據不同的資料表綱要所撰寫滿足使用者需求的查詢命令也隨之不同 Beckmann 等人 (2006)，撰寫不同的查詢命令(特別是合併)對資料庫應用開發人員撰寫查詢的任務複雜度有顯著的影響 Chan 等人(1997)。因此，討論資料表綱要從水平式調整成垂直式之後，資料庫應用開發人員任務複雜度對查詢績效的影響，則是本研究另一個重要的議題。

本論文使用實驗法討論資料表示式與任務複雜度對使用者撰寫查詢績效的影響。在資料表示式方面主要討論因應資料綱要頻繁變動將資料由傳統水平表示方式轉成垂直資料表示方式對使用者撰寫查詢的影響。在任務複雜度方面，則是討論高、低兩種任務複雜度對使用者撰寫查詢績效的影響。

(12)

第二節第二節第二節

第二節研究目的研究目的研究目的研究目的

隨著產業的變化，企業的多元化經營讓越來越多的工廠生產模式從早期的單純少樣的產品逐漸轉變為多樣化模式。從資料庫的角度來看，產品多樣化勢必有許多實體，而在水平式綱要設計上就需要有許多的屬性才能描述真實世界所發生的事件，完整儲存實體資料。

但是，隨著市場的需求越來越複雜而多元，要能滿足客戶與市場需求，生產除了趨向多樣化，製程也必須要能夠彈性靈活(flexible)以及滿足未來的擴充性 (extensibility)。就水平式綱要而言，要能滿足這樣的製程就必須不斷增加屬性並且保留欄位以應付未來的擴充。可是這樣的綱要設計在長期運作之下就會產生寬 (wide)的資料表與稀疏資料集合(sparse data sets)。要解決這個問題可以不斷的增加資料表並正規化(normalization)，但是這樣會造成資料庫綱要不斷改變，就效能的影響是個變數且也造成 DBA 在維護上的負擔(loading)，故就有學者提出垂直式綱要的設計方式，此種方式的確可以達到彈性以及擴充性的需求。不過，對於垂直式綱要的設計卻很少有研究探討它的效能問題。

本研究主要在針對新竹科學園區某家公司的真實案例，對於資料表示式與任務複雜度為出發點，探討以實驗法探討資料表示方式與任務複雜度對使用者查詢績效的影響。本研究以實驗的方式，研究假說模型架構，並利用統計軟體 SPSS 分析所獲得之數據，藉以了解企業內部流程的改善，是否可以提升使用者查詢績效的影響，本研究之研究目的如下：，

1. 以實驗法探討資料表示方式與任務複雜度對使用者查詢績效其相關矩陣是否具有影響。

2. 以實驗法探討資料表示方式與任務複雜度對使用者查詢績效是否有具有影響。

3. 以實驗法探討資料表示方式與任務複雜度對使用者查詢績效探討找出其因素間之交互影響關係。

(13)

第三節第三節第三節

第三節研究範圍研究範圍研究範圍研究範圍

本研究為了提升公司內部資料庫查詢效能達到最大化。本研究透過文獻的資料以及學者的評選，設計出測驗用之資料庫個案，以利探討各個影響的程度。而研究對象主要是針對自新竹某大學資管系資料庫課程的學生，以完成本研究之實驗分組。

第四節第四節第四節

第四節研究流程研究流程研究流程研究流程

一、研究動機與目的

首先了解公司概念模型領域查詢效能的狀態後，將問題具體化以供研究進行與操作，並確定本研究之目的方向。

二、相關文獻探討

經由研究動機與目的確認收集資料表示方式與任務複雜度之國內外相關文獻，以作為假設與實驗之依據。

三、建立模型與假說

依據相關文獻探討，建立本研究不同的影響因素，最終形成本研究模型，並提出問題假說與確定研究對象。

四、實驗設計與修正

依照相關文獻、研究模型與假說，設計本研究測驗題目初稿，並確定測驗題目，形成最終測驗用之資料庫個案。

五、實驗

根據研究範圍與對象，正式發放測驗用之資料庫個案。

(14)

測驗用之資料庫個案回收後，將其回收之數據資料經由統計軟體之分析。

七、結論與建議

根據資料分析之結果來驗證本研究所得出之假說與研究結果，並提出本研究結論與建議。

(15)

本研究流程目標如圖 1-3，研究步驟說明如下:

圖 1-3 研究架構流程圖

(16)

第五節第五節第五節

第五節論文架構論文架構論文架構論文架構

本研究共分為五章，簡述如下：

第一章緒論

說明研究背景與動機、研究目的、研究範圍、研究流程與論文架構等部份。

第二章文獻探討

此章節主要在探討如下：

1. 水平式綱要之相關特色與應用等文獻討論，並整理國內外專家學者目前對水平式綱要應用於資料庫模型之研究。

2. 垂直式綱要之相關特色與應用等文獻討論，並整理國內外專家學者目前對垂直式綱要應用於資料庫模型之研究。

3. 使用者查詢績效之相關文獻討論，並整理國內外專家學者目前對使用者查詢績效之研究。

4. 任務複雜度之相關文獻討論，並整理國內外專家學者目前對任務複雜度之研究。

5. 正規化影響查詢複雜度與績效之相關文獻討論，並整理國內外專家學者目前對正規化影響查詢複雜度與績效之研究。

第三章研究方法

根據文獻探討建立本研究的研究模型與假說，包含研究模式、研究變數、研究假說之導出、研究樣本以及實驗工具之設計。

第四章資料分析與結果。

分析本研究之研究結果，最後將本研究之主要結果與結論建議列於第五章中。

(17)

第二章第二章第二章

第二章文獻探討文獻探討文獻探討文獻探討第一節

第一節第一節

第一節水平式綱要水平式綱要水平式綱要水平式綱要

水平式綱要是在資料庫中一種非常常見的設計方式，此種設計方式直覺而且容易設計。它的特性是所有可能用來描述實體屬性都包含在該 table 的欄位中(如表 2-1) 所示，然而這樣的設計可能會有下列問題存在：

1) 當屬性過多時會形成一個寬(Wide)資料表

2) 寬資料表可能形成稀疏資料集(Sparse Data Sets)。

表 2-1 水平式綱要查詢結果

PcbaNo Domain FwVER Throughput Result S1.123 USA a.bin Null pass S1.123 US b.bin 22.5 pass S1.123 Japan c.bin Null Fail S1.123 TW d.bin Null pass S1.123 TW d.bin 20.13 pass

為了解決上述問題，學者 Daniel (2007) 在 Column-Stores For Wide and Sparse Data 研究中指出，水平式綱要當屬性非常多的時候，可能會造成效能上的問題。

例如，有一個電子商務市集含有 1000 家製造廠商，每一家廠商至少有 500 項產品分類，每一項分類有 4000 種產品，故總共有 2,000,000,000 種可能，那麼不難想像排序一個具有 4000 種屬性的寬資料表是一件多麼恐怖的事情。而當使用者查詢這個寬資料表時，業界經驗告訴我們使用者所利用到的屬性常常僅佔有所有屬性中少的百分比。另外，從磁碟讀取一筆資料時，其所佔的 block 數遠大於一個屬性所佔的 block。再者如果只是需要從中讀取一個屬性在水平式綱要的設計之下勢必連同旁邊周圍的卻用不到的屬性要一併讀進來，便造成磁碟頻寬的浪費。

(18)

第二節第二節第二節

第二節垂直式綱要垂直式綱要垂直式綱要垂直式綱要

除了 Agrawal 等(2001)的論文外，垂直式綱要的議題在近三年持續受到學界 Chu 等人(2007) Beckmann 等人(2006)與業界 Acharya 等人(2008a; 2008b)的討論。

學者 Agrawal 等人(2001)提出可將資料自垂直式資料表中取出然後以水平式資料表展現的關連式代數，Agrawal 等人同時也對這些代數式相對應 SQL 敘述的語法提出建議。學者 Beckmann 等人(2006)則整理出在垂直式資料表擷取資料 SQL 敘述的一般式，同時也提出使用解釋格式的來儲存垂直式資料表的觀點。學者 Chu 等人(2007)則提出將稀疏資料儲存至多個資料表的限制，並提出如何使用一個垂直式資料表儲存稀疏資料的建議。學者 Acharya 等(2008a)則對儲存垂直式資料表的檔案結構與索引設計進行討論。

Daniel(2007)在 Column-Stores for Wide and Sparse Data 提到垂直式導向設計 (vertical-oriented)資料庫不同於水平式綱要，垂直式綱要雖然也是將所有實體屬性描述全部儲存在一個資料表中且每個實體屬性是分開的，卻又是以像連續的資料一樣儲存在資料表中(如表 2-2)，一個實體有多少屬性就會在這個資料表存在有多少筆的資料。(水平式綱要乃是各個屬性值儲存在同一列紀錄(tuple))。對於垂直式綱要的設計有以下的優點：

1)增進磁碟頻寬的利用率 2)增進資料密度

3)降低 Table Schema 維護成本 4)降低應用端程式維護成本 5)滿足實體特性多變的彈性 6)增進快取的局部性

下列為垂直式綱要設計的缺點：

1) 增加磁碟搜尋時間 2) 增加 inserts 的成本

(19)

3) 增加查詢績效的成本 4) 漏失屬性型態

表 2-2 垂直式綱要查詢結果

PcbaNo PrgID ItemID Value S1.123 MAS Domain USA S1.123 MAS FwVer a.bin S1.123 MAS Result Pass S1.123 DL Domain US S1.123 DL FwVer b.bin S1.123 DL Result Pass

資料來源：本研究

第三節第三節第三節

第三節使用者查詢績效使用者查詢績效使用者查詢績效使用者查詢績效

學者 Chan 等人(1999)結合學者 Reisner(1981)與 Chan 等人(1993)的研究模式提出影響使用者查詢績效(正確性、時間以及信心度)的因子應包含資料表示式(資料模型 ) 、任務複雜度、查詢表達方式 (Expressive ease) 、使用者特性 (User characteristics)與系統特性等五個因子。在上述 5 個影響使用者查詢績效的因子中，資料表示式(資料模式)對使用者查詢績效的影響被最多學者討論。資料模式一般可分成概念資料模式與邏輯資料模式，因此有關資料模式對使用者查詢績效的影響的研究，可分為概念性資料模式彼此之間比較的比較 Chan 等人(2005) Bowen 等人(2005)、邏輯性資料模型彼此之間比較的研究 Borthick 等人( 2001a)，

以及概念性資料模式與邏輯性資料模型之間的比較研究 Allen 等人(2006) Chan 等人( 1993) Siau 等人(2004) Jih 等人(1989)。上述的研究工作中與本研究最接近的為學者 Borthick 等人(2001b)以實驗法針對關連式資料模型中的未正規化、第一階正規化形式與第三階正規化形式三種資料表示方式對使用者的查詢錯誤進行討論。實驗結果顯示，查詢錯誤發生的情況，隨著不同的正規化形式而有所不同，第一階正規化形式的查詢錯誤次數，相較於未正規化與第三階正規化形式來

(20)

第第第

第四四四四節節節節任務複雜度任務複雜度任務複雜度任務複雜度

另一個與本研究相關的因子則為任務複雜度。雖然有關任務複雜度對查詢績效的討論，早在學者 Reisner(1981)與學者 Chan 等人(1993)的研究工作中出現，

但是學者 Topi 等人(2005)指出任務複雜度在學界仍未對有一通用的定義。學者 Topi 等人(2005)的研究工作是目前對任務複雜度進行比較深入討論的文獻。在組織行為領域學者 Wood(1986)將任務複雜度區分成元件複雜度、協調複雜度與動態複雜度。學者 Topi 等人(2005)將使用者撰寫查詢的工作，應對至 Wood 所提出的任務複雜度中的元件複雜度與協調複雜度中。學者 Topi 等人同時建議如需對任務複雜度進行深入的討論可從學者 Wood(1986)的研究工作開始。此外，學者 Topi 等人(2005) 也對四個主要的查詢運算－投影、簡單選擇、複雜選擇與合併的複雜度進行複雜度排序，由簡單至難依序為投影、簡單選擇、複雜選擇與合併。

學者 Borthick 等人(2001a)的研究中作者也同步驗證了任務複雜度對查詢錯誤的影響。其結果顯示任務複雜度愈複雜的查詢其發生錯誤的次數愈高。

第五節第五節第五節

第五節正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效

在 Borthick 等人(2001b)指出，資料庫依規則轉換正規化時，第一正規化語義的錯誤會少於未正規化或第三正規化，而第三正規化語義的錯誤會少於未正規化。設計出新的資料庫綱要時，我們首先要將資料庫綱要正規化，一般來說，資料分別存放在多個關聯表時，執行效率會比放在少數幾個關聯表來得差。

越高的正規化會分割成更多小型的表格和屬性，資料庫綱要會隨著結構的特性而細微改變，此時關聯表會分割表格的數量，同時關聯表格也會增加重覆的資料和屬性，造成資料的重覆性，所以，我們利用功能相依性避免發生資料庫產生重覆的現象。

使用者在查詢時，因為系統所使用的合併運算越多，而合併運算是一個很花時間的運算動作，所以也會增加查詢複雜，越高的正規化會產生越複雜的查詢。

(21)

除了做正規化之外，我們還要考慮到資料的更新異常現象以及查詢效率，我們稱為反正規化。在本研究中不同的綱要模型設計也經過正規化與反正規化的過程，

期望能達到較理想的效能。至於在水平式綱要與垂直式綱要之間怎麼權衡至今仍在學界與業界探討研究(explore)中。

(22)

第三章第三章第三章

第三章研究方法研究方法研究方法研究方法

本章將針對本研究的研究方法做出逐一的說明，其中包含研究流程、其實依研究模式之研究變數，敘述各研究變數之內容與關係、然後再依據前述研究問題導出本研究之研究假說、最後描述本研究之研究對象、實驗工具設計、初步測試、

測試以及實驗結果。而本研究採用以下實驗法如下：

一、文獻分析法

文獻分析法主要是蒐集查詢正確性、使用時間、查詢信心度相關主題之期刊論文、研討會資料、學術研究報告等專業資料將其歸納分析，以作為本研究之理論基礎架構以及構面設計的重要依據。

二、實驗法

本研究經由新竹科學園區某公司潛在改進方案，所有內容經由該公司相關人員確認以為專家審核過，另外也經由初步測試之過程做部份修正，力求產生最低之偏誤。

第一節第一節第一節

第一節研究流程研究流程研究流程研究流程

經過了研究動機的探討，確定了研究方向的可行性以及研究目的的建立之後，根據研究方法，建立出以實驗法探討資料表示方式與任務複雜度對使用者查詢績效的影響之研究流程，本研究的研究流程如下：

流程一：蒐集過去曾經探討資料表式方式與任務複雜度等相關文獻資料。

流程二：透過資料之整理，建立本研究之研究架構以及鎖定合適的研究方法，並建立出研究架構中的關鍵假設以及利用流程圖之表現方法呈現研究模型。

流程三：從研究架構當中提出測驗用之資料庫個案，利用專家學者的意見以

(23)

題，並經過整理後進行測試。

流程四：將其回收之數據資料經由統計軟體之分析，呈現研究結果並探討其涵義。

流程五：實證本研究所出之研究假說以及研究模式。

本研究之研究流程如圖 3-1 所示。

圖 3-1 研究設計流程圖

(24)

第二節第二節第二節

第二節研究變數內容與關係研究變數內容與關係研究變數內容與關係研究變數內容與關係

本研究使用的研究模式如圖 3-2 所示，影響使用者查詢績效的因素包括資料表示方式與任務複雜度，而查詢績效則由正確性、時間以及信心度等三個構面所構成。

圖 3-2 本研究架構模型

依上圖研究模型可以觀察本研究各個研究變數之間關係，本研究所使用的自變數為資料表示式(水平式綱要、垂直式綱要)以及任務複雜度(Halstead’s 難度衡量子(Difficulty Measurement) Borthick 等人(2001))，因變數為查詢績效由三個構面－正確性、時間以及信心度所構成。

一一一

一、、、、研究變數間之關係研究變數間之關係研究變數間之關係研究變數間之關係

1. 自變數

(1) 資料表示方式

表 3-1 水平式綱要資料表 H ID A1 A2 A3 A4

1 Null Null b c

2 Null c Null Null

3 c Null d Null

4 Null Null d Null

資料來源：Agrawal et al., 2001

資料表示方式任務複雜度

查詢績效

-正確性

-時間 -信心度

(25)

本研究的資料表示式分為水平式綱要與垂直式綱要。水平式綱要為資料庫傳統的綱要設計方式。表 3-1 為一個使用水平式綱要資料表的例子。儘管水平式綱要普遍應用於現今多數的資訊系統中，但是水平式綱要並非適用於所有應用環境。學者 Agrawal 等人(2001)舉例出使用水平式綱要資料表來儲存屬性數目龐大 (超過 5000 個)的電子零件資料時，造成以下的四個問題：

(1)資料表中具有龐大數量的屬性 (2)資料表中稀疏的資料

(3)資料表綱要頻繁的異動 (4)不理想的實體效能

為了解決上述的四個問題，學者 Agrawal 等人(2001)將資料庫中的資料表綱要由水平式改成垂直式。垂直式綱要僅由三個屬性構成，表示如下：

V(ID, ATTR, VAL)

其中 V 為垂直式綱要資料表的名稱，ID 為辨識子，ATTR 為屬性名稱，VAL 為 屬性值。我們將表 1 中的水平式資料表 H 以垂直式綱要表示，其結果如表 3-2 中的資料表 V。

表 3-2 垂直式綱要資料表 V ID ATTR VALUE

1 A3 b

1 A4 c

2 A2 c

3 A1 c

3 A3 d

4 A3 d

(26)

比較表 3-1 與表 3-2 中的資料表 H 與資料表 V，在儲存相同資料的條件下，使用垂直式綱要的資料表 V 其屬性數目較使用水平式綱要的資料表 H 來的少，且資料表 V 沒有虛值(Null)。此外，使用水平式綱要資料表如果需要更新帶有新屬性的資料時，需要修改資料表綱要，才能將此資料儲存至表格 H 中，而使用垂直式綱要資料表則不需要修改資料表綱要而能儲存新的屬性與屬性值。例如，使用者需要更新一筆<ID:5, A5:b>的資料至表 1 中的資料表 H 中。其步驟為在資料表 H 更新屬性 A₅，才能將資料<ID:5, A₅:b>更新至資料表 H 中。然而若將同樣資料更新至資料表 V 中，則直接更新資料<ID:5, ATTR:A5, VAL:b>至資料表 V 即可，

無需修改資料表 V 的綱要。

本研究的其中一個議題即為討論資料表示方式從水平式綱要調整成垂直式綱要之後，對使用者查詢績效的影響。因此，將水平式綱要與垂直式綱要納入比較的資料表式方式之中。

(2)任務複雜度

在過去的數年中，已經有許多學者進行有關任務複雜度對使用者查詢績效的影響的研究 Topi 等人(2005) Lia 等人(2000) Chan 等人(1999)。在本研究中使用者的主要任務即為撰寫能夠擷取使用所需資料的查詢敘述。因此查詢的複雜度即為本研究中的任務複雜度(請參照附錄六，P.63 有詳細說明)。為了計算查詢的複雜度本研究使用常被學界使用來衡量查詢複雜度的 Halstead’s 難度衡量子 (Difficulty Measurement) Borthick 等人(2001)來衡量查詢的複雜度，研究人員會分別計算出前 15 題查詢問題的任務複雜度，再以兩組的綱要算出 1-12 題之平均數，以 12 為中介值以方便後續之研究流程。

* 2

n log n

n D = Nlog

其中 N 為為 N₁ (查詢敘述中運算子的個數)與 N₂ (查詢敘述中運算元的個數)的

(27)

加總，n 為 n₁ (查詢敘述中相異運算子的個數)與 n₂ (查詢敘述中相異運算元的個 數)的加總，n*為最短查詢敘述的 n，其值為 5，因為最短的 SQL 命令為

SELECT * FROM table;。

本研究的第二個議題即為討論高、低兩種任務複雜度對使用者撰寫查詢績效的影響。因此，將高、低兩種任務複雜度納入比較的任務複雜度之中。

二二二

二、、、、因變數因變數因變數因變數

本研究之因變數為使用者撰寫查詢敘述時的查詢績效以及撰寫查詢敘述時的更新查詢績效，學者 Chan 等人(1993)認為查詢績效可以分成三個構面－正確性、時間與信心程度 Chan 等人(1993)，學者 Vessey 等人(1991)認為討論查詢績效議題時應該同時討論此三個構面。我們透過使用者撰寫查詢敘述時所發生的巨觀錯誤(Macro Errors)與微觀錯誤(Micro Errors)錯誤來表示使用者所撰寫查詢敘述的正確性。巨觀錯誤為使用者查詢敘述的查詢結果與使用者所期待的結果不同，包含橫行(Row)、直列(Column)與聚合(Aggregation)三種錯誤。微觀錯誤為將無法取得使用者所期待查詢結果的使用者查詢敘述修正為能夠取得使用者所期待查詢結果的最少修正次數。學者 Borthick 等人(2001)提供了一個討論查詢敘述正確性的範例。時間為查詢績效的第二個構面，我們透過使用者完成每一個查詢敘述，從開始到結束所花費的時間來衡量。查詢績效的第三個構面為信心度，

我們以 0-10 分為標準，當使用者每完成一個查詢，我們請使用者自我評估所完成的查詢敘述能夠正確取自資料庫中取得所需資料的程度，使用者自我評估越高分，則該使用者的信心度越高。

(28)

第三節第三節第三節

第三節研究假研究假研究假研究假說說說說與研究模型與研究模型與研究模型與研究模型

依據前述研究模式、以及各研究變數間的關係，可導出本研究之研究假說。

假說以虛無假說的型式表現。

一一一

一、、、、資料表示方式的影響效果資料表示方式的影響效果資料表示方式的影響效果資料表示方式的影響效果

假說 1-3 陳述自變數資料表示方式的主要影響效果。根據學者 Ogden(1986) 提出認知模式(Cognitive Model)，使用者完成一個查詢敘述的撰寫，需要經過查詢形塑(Formulation)、查詢轉換(Translation)與查詢撰寫(Writing)三個階段。在查詢形塑階段中使用者將決定它需要哪些資料。在查詢轉換階段中，使用者根據查詢形塑的結果，決定如何利用當前的資料表示方式(資料模型、資料結構)搭配合適的資料庫操作(Operation)以滿足查詢形塑的需求。查詢撰寫則是使用資料庫所提供的查詢語言(SQL)將查詢轉換階段的想法實作出來。根據學者 Odgen(1986) 的結果，使用者完成一個查詢敘述時，在查詢轉換階段，資料表示方式對使用者需要使用哪些操作將有重要的影響，而使用者所使用的操作對其查詢績效亦有一定的影響。例如，學者 Borthick 等人(2001)的研究顯示使用者根據 1NF 綱要撰寫的查詢敘述其正確性比根據 3NF 綱要撰寫的查詢敘述為高。其原因為在 3NF 綱要的表格上撰寫的查詢相對於 1NF 綱要可能需要較多的合併運算，而較多的合併運算可能導致較差的使用者查詢績效 Topi 等人(2005)。

在本研究中，使用者根據垂直式綱要所寫的查詢敘述相較於根據水平式綱要所寫的查詢敘述，可能使用較多的合併運算。

例如，我們想要在表 3-1 中的資料表 H 中找出屬性 A3 等於 b 的 A4 屬性值。其 SQL 敘述為

SELECT A4 FROM H WHERE A3='b';

(29)

同樣的查詢若在表 3-2 中的資料表 V 上查詢，其 SQL 敘述為 SELECT V1.ATTR, V1.VALUE

FROM V V1, V V2

WHERE V1.ID = V2.ID AND V1.ATTR='A4' AND V2.ATTR = 'A3' AND V2.VALUE = 'b';

根據資料表 V 所寫的查詢需要使用合併運算，而根據資料表 H 所寫的查詢則沒有使用合併運算的必要。

學者 Chan 等人(1997)與學者 Topi 等人(2005)提出在查詢敘述中如果使用愈多的合併運算，則使用者查詢績效可能愈差。本研究希望驗證可能需要使用較多合併運算才能完成查詢敘述的垂直式綱要，其查詢績效相對可能使用較少合併運算的水平式綱要來的差。以下為假說 1-3：

H1: 根據垂直式綱要撰寫的查詢敘述其正確性比根據水平式綱要撰寫的查詢敘述為低。

H1a:根據垂直式綱要撰寫的查詢敘述其巨觀錯誤比根據水平式綱要撰寫的查詢敘述多。

H1b:根據垂直式綱要撰寫的查詢敘述其微觀錯誤比根據水平式綱要撰寫的查詢敘述多。

H2: 根據垂直式綱要撰寫的查詢敘述其時間耗費比根據水平式綱要撰寫的查詢敘述多。

H3: 根據垂直式綱要完成查詢敘述撰寫後的信心度比根據水平式綱要完成查詢敘述後的低。

二二二

二、、、、任務複雜度的影響效果任務複雜度的影響效果任務複雜度的影響效果任務複雜度的影響效果

學者 Topi 等人(2005)認為當使用者執行較為複雜的工作時，相對執行較為簡單的工作，使用者需要更多的資訊線索，嘗試更多的行動，並且進行更多的且更複雜的協調來完成此一較為複雜的工作的執行。將以上的敘述套用至使用者撰寫查詢的

(30)

行為時，需要更多的資訊線索意味著複雜查詢需要牽涉較多的表格、屬性，嘗試更多的行動意味著需要更多的運算(投影、簡單選擇、複雜選擇或合併)，進行更多的且更複雜的協調則意味著如何將運算與表格、屬性作一個適當的結合。愈複雜的查詢其所牽涉的表格、屬性與操作愈多，所需操作與表格、屬性之間協調也愈多，因此使用者犯錯的機會相對應該較高，因為參與的操作、表格與屬性愈多，因此撰寫查詢敘述的時間愈長。本研究希望驗證撰寫高度任務複雜查詢敘述的查詢績效，比低度任務複雜的低。以下為假說 4-6：

H4: 撰寫高度任務複雜查詢敘述的正確性，比低度任務複雜的低。

H4a: 撰寫高度任務複雜查詢敘述的巨觀錯誤，比低度任務複雜的多。

H4b: 撰寫高度任務複雜查詢敘述的微觀錯誤，比低度任務複雜的多。

H5: 撰寫高度任務複雜查詢敘述的時間耗費，比低度任務複雜的多。

H6: 撰寫高度任務複雜查詢敘述後的信心度，比低度任務複雜的低。

本研究認為有撰寫查詢的敘述，也應該有更新資料庫的敘述，所以我們希望驗證可能需要使用較多合併運算才能完成更新資料庫敘述的垂直式綱要，其更新績效相對可能使用較少合併運算的水平式綱要來的差，以及驗證撰寫更新資料庫高度任務複雜查詢敘述的查詢績效，比低度任務複雜的低。以下為假說 7-12：

H7：根據垂直式綱要撰寫的更新查詢敘述其正確性比根據水平式綱要撰寫的更新查詢敘述為低

H7a：根據垂直式綱要撰寫的更新查詢敘述其巨觀錯誤比根據水平式綱要撰寫的更新查詢敘述多。

H7b：根據垂直式綱要撰寫的更新查詢敘述其微觀錯誤比根據水平式綱要撰寫的更新查詢敘述多。

H8：根據垂直式綱要撰寫的更新查詢敘述其時間耗費比根據水平式綱要撰寫的更新查詢敘述多。

H9：根據垂直式綱要完成更新查詢敘述撰寫後的信心度比根據水平式綱要完成更新查詢敘述後的低。

H10：撰寫高度任務複雜更新查詢敘述的正確性，比低度任務複雜的低。

(31)

H10a：撰寫高度任務複雜更新查詢敘述的巨觀錯誤，比低度任務複雜的多。

H10b：撰寫高度任務複雜更新查詢敘述的微觀錯誤，比低度任務複雜的多。

H11：撰寫高度任務複雜更新查詢敘述的時間耗費，比低度任務複雜的多。

H12：撰寫高度任務複雜更新查詢敘述後的信心度，比低度任務複雜的低。

第四節第四節第四節

第四節實驗實驗實驗實驗問問問問題題題設計題設計設計設計

本研究測驗用之資料庫個案參考 Borthick 等人(2001a)與 Bowen 等人(2006) 等學者以及任務複雜度相關資料，所形成之測驗用之資料庫個案並請專家分析確認資料庫個案形成初始測驗用之資料庫個案。

首先以水平組與垂直組的同學回答初步測試，初步測試主要目的是為了驗證正式實驗之程序性問題，如測驗時間多長等等，另外實驗工具之正確性，如測驗個案是否語意不清，是否對於使用者過於困難等。

本研究之初步測試於正式實驗進行之前，首先研究人員與指導教授與專業人士商討設計資料庫個案，針對實驗問題題目得內容適切性、用字措辭等方面加以討論，

於初步測試時，授課教師詳細介紹此案例，並且將查詢任務對使用者解釋，以減少解讀問題時來自語言或文字的偏誤。此次之初步測試除了修正前述程序性及實驗工具之問題外，資料模式之表達與進度控制技巧，實驗者也從此次之測試獲得有用之資訊，最後與指導教授與專業人士商討，針對實驗問題題目得內容適切性、用字措辭等方面加以討論，以修正問題題目架構及內容，最後得出適合本研究測驗用之資料庫個案。

第五節第五節第五節

第五節研究對象與樣本研究對象與樣本研究對象與樣本研究對象與樣本

本研究採用實驗法來收集資料，以驗證研究假說。實驗的案例來自臺灣新竹科學園區某網路卡廠商的產品測試程序，該程序潛在的改進方案，與本文研究問題一致。根據真實案例的需要，我們設計出二個資料綱要，即水平與垂直式綱要，用以記錄網路卡的測試結果；這二個綱要均經過案例廠商的相關工程師確認。研究人員再根據綱要設計出 12 個使用 SQL 語言的查詢問題，以及 3 個使用 SQL 語言更新資

(32)

料庫查詢的問題，並經過 SQL Server 實機查詢，確認正確的 SQL 答案，並查詢問題，恰巧為本課程的重要單元，因此學生被告知此次測試為學期成績的一部分，以確保使用者會盡力回答。使用者 52 人依照前一門課程的成績排序，平均地分成水平組及垂直組，以避免能力上的偏誤，但是兩組都必須回答相同的 15 個查詢問題。

本次實驗採用筆試回答，時間限制為 2 小時，每回答一題之後，除了書寫 SQL 查詢答案之外，使用者需記錄每一題查詢時開始及結束完成時的時間，以及回答對本題答案正確性的信心程度 0-10 分，自我評估越高，則該使用者的信心程度越高，

如此才進行下一題。實驗結束後，接下來研究人員批改受試者的答案，批改的程序與學者 Borthick 等人(2001)所建議的方法相同，根據難度衡量子來衡量查詢的複雜度，研究人員會分別計算出前 15 題查詢問題的任務複雜度，根據兩組的綱要算出 1-12 題查詢之平均數，以 12 為中介值以方便後續之研究流程，以獲得查詢正確性的分數(參照附錄三、四)。

第六節第六節第六節

第六節資料分析與方法資料分析與方法資料分析與方法資料分析與方法

本研究使用 SPSS 13.0 作為統計分析工具，資料分析方式如下所示:

一、Pearson 相關分析(Pearson Correlation Analysis)

運用 Pearson 相關檢定以檢視各個自變數與因變數之相關性與顯著性，在顯著水準下各變數是否有相關性，本研究將對自變數(資料表示式與任務複雜度)與因變數(正確性、時間以及信心度)相關性之比較，以了解各項因子之間是否有相關性。

二、迴歸分析(Regression Analysis)

進行迴歸分析時，首先研究者會先提出一個迴歸模式，包含自變數(資料表示式與任務複雜度)對於依變數(正確性、時間以及信心度)具有相對的影響性，因此，本研究將於實證部份，加入迴歸分析法，藉以驗證資料表示式與任務複雜度對於正確性、時間以及信心程度，是否具有一定之關係影響，因此，我們使用迴歸分析來預測未來的變動。

(33)

三、共變數分析（ANCOVA）

本研究將受測者 52 人排序分為 2 組實驗，將一組分為一般我們正常所見的水平式綱要；另一組分為我們在本研究中主要研究一組垂直式綱要之因子，按計劃進行初始測試。初始測試時使用變異數分析(ANOVA)，所獲得的依變數之變異可以分為下面兩部份(1)可由依變數(資料表示式與任務複雜度)加以解釋(2)無法解釋(誤差)的部份。在這種情況下，兩組之差異被視為無法解釋變異。在研究中我們能發現根據不同綱要和受測者的受測結果有相關，所以使用共變數分析(ANCOVA)較變異數分析佳。

利用共變數(ANCOVA)分析，就是兩個依變數(資料表示式與任務複雜度)，資料表示式為類別變數，任務複雜度為連續變數，資料表示式有關分數之變異減少，為了相伴任務複雜度而調整成共變數開始測量達到校正開始資料表示式的差異。各組接受不同處理之後，依變數有顯著差異，除了歸因不同實驗組外，水平式綱要與垂直式綱要對受測者來主要變數就是不相等也可能也是原因之後。我們希望使用共變數分析可針對這些變項而調整依變數，以校正開始時水平式綱要及垂直式綱要之間的差異。這方式的設計能減少額外的誤差變異和產生精確的假設。

(34)

第四章第四章

第四章第四章資料分析與結果資料分析與結果資料分析與結果資料分析與結果

根據第三章研究模式的描述與應用，本研究採用實驗法，來對本研究所提出之研究模式進行實證性分析，本章第一節針對回收之樣本進行基本資料分析，第二節假說的驗證。本節主要以問題回收情形以及各敘述性統計說明。

第一節第一節第一節

第一節問問問問題題題回收情形題回收情形回收情形回收情形

本節主要以問題回收情形與基本資料統計。問題回收情形，本研究問題回收方式，相關資料整理如表。由於本研究必須對 SQL 有所認知與了解，使得研究對象較為狹隘，本研究主要以本校資訊管理學系三、四年級之大學生做為研究對象。紙本問題共發放 52 份，回收 52 份問題，回收率為 100%，有效問題為 100%，總計問題回收共 52 份。

表 4-1 問題回收情形統計表

項目分類紙本

發出量 52

回收量 52

有效問題 52

無效問題 0

有效回收率 100%

資料來源:本研究

第二節第二節第二節

第二節 Pearson 相關分析相關分析相關分析相關分析

本研究採用 Pearson 相關分析，將所有因變項（正確性、使用時間以及信心度）

以及自變項（資料表示式與任務查詢複雜度）進行分析檢視，以瞭解各變項之間的相關程度及顯著水準，除了巨觀錯誤與使用時間呈無相關，其餘變相皆呈部份相關或顯著相關。結果如表 4-2。

(35)

表 4-2 相關矩陣

1 2 3 4 5

1.資料表示式

2.任務複雜度 .23**

3.巨觀錯誤 .26** .50**

4.微觀錯誤 .16** .37** .74**

5.使用時間 .11** .22** -.04 .14**

6.信心度 -.20** -.43** -.52** -.43** -.20**

**表相關顯著水準為 p < .01

資料來源: 本研究

1. 資料表示式與信心度呈現負相關(P<.01)，即使用者撰寫題目時，資料表示式越簡單信心程度越高。

2. 任務複雜度與信心度呈現負相關(P<.01)，任務複雜度越低信心程度越高。

3. 巨觀錯誤與信心度呈現負相關(P<.01)，即使用者撰寫題目時，巨觀錯誤越少信心程度越高。

4. 微觀錯誤與信心度呈現負相關(P<.01)，即使用者撰寫題目時，微觀錯誤越少信心程度越高。

5. 使用時間與信心度呈現負相關(P<.01)，即使用者撰寫題目時，使用時間越少信心程度越高。

第三節第三節第三節

第三節變異數分析變異數分析變異數分析變異數分析

假說驗證使用 SPSS 13.0 軟體進行 ANCOVA 統計檢定；因子一為資料表示式 (垂直與水平式)，共變數為任務複雜度，依變數則包括了正確性 (巨觀與微觀錯誤)、

撰寫 SQL 查詢的時間、和信心度。表格 N 為所有雙尾檢定(two-tailed)的彙總報表，

而本研究的假說的單尾檢定(single-tailed)顯著水準為 α=.05，(如表 4-3)。

(36)

表 4-3 變異數分析表

Panel A：正確性-巨觀錯誤

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .272 1 1540.27 17.59 .000 H1a 支持任務複雜度 1 15427.00 176.17 .000 H4a 支持

殘差 621 87.57

Panel B：正確性-微觀錯誤

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .144 1 2.129 3.774 .053 H1b 不支持任務複雜度 1 48.963 86.810 .000 H4b 支持

殘差 621 .564

Panel C：使用時間

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .053 1 35.512 2.473 .116 H2 不支持任務複雜度 1 381.793 26.590 .000 H5 支持

殘差 621 14.358

Panel D：信心度

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .192 1 42.187 7.564 .006 H3 支持任務複雜度 1 657.634 117.906 .000 H6 支持

殘差 621 5.578

表 4-3-A 巨觀錯誤顯示，自變項「資料表示式」可解釋 27.2%的變異量(R²=0.272, F=17.59, P<0.05)，自變項「任務複雜度」(F=176.17, P<0.05)，皆達顯著水準；表 4-3-B 微觀錯誤顯示，自變項「資料表示式」可解釋 14.4%的變異量(R²=.144, F=3.774, P<0.05)，自變項「任務複雜度」(F=86.81, P<0.05)，皆達顯著水準；表 4-3-C 使用時間顯示，自變項「資料表示式」可解釋 53%的變異量(R²=0.53, F=2.47, P>0.05)，使用時間與資料表示式並無顯著關係，而使用時間表示與自變項「任務複雜度」

(F=26.59, P<0.05)，達顯著水準；表 4-3-Ｄ信心度顯示，自變項「資料表示式」可解釋 19.2 的變異量(R²=0.192, F=7.56, P<0.05)，自變項「任務複雜度」(F=117.91, P<0.05)，皆達顯著水準。檢定結果顯示除了 H1b 及 H2 之外，所有假說都被支持。

(37)

表 4-4 更新資料庫查詢變異數分析表

Panel A：正確性-巨觀錯誤

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .409 1 40.09 .029 .000 H7a 支持任務複雜度 1 32259.77 23.13 .866 H10a 不支持

殘差 153 1394.53

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .064 1 .078 .191 .663 H7b 不支持任務複雜度 1 .55 1.35 .248 H10b 不支持

殘差 153 .41

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .046 1 115.37 7 .009 H8 支持任務複雜度 1 111.13 6.74 .010 H11 支持

殘差 153 16.49

Panel D：信心度

變異來源

R

²

df Mean Square F value

Sig. 對應結果資料表示式 .253 1 309.23 42.94 .000 H9 支持任務複雜度 1 132.8 18.44 .000 H12 支持

殘差 153 7.20

表 4-4-A 巨觀錯誤顯示，自變項「資料表示式」可解釋 40.9%的變異量(R²=0.409, F=.029, P<0.05)，達顯著水準，但巨觀錯誤與自變項「任務複雜度」(F=23.13, P>0.05)，

巨觀錯誤與任務複雜度並無顯著關係；表 4-3-B 微觀錯誤顯示，自變項「資料表示式」可解釋 6.4%的變異量(R²=0.064, F=.19, P>0.05)，自變項「任務複雜度」(F=1.35, P>0.05)，微觀錯誤與兩項自變項「資料表示式與任務複雜度」兩者並無顯著關係；

表 4-4-C 使用時間顯示，自變項「資料表示式」可解釋 4.6%的變異量(R²=.046, F=7, P<0.05)，自變項「任務複雜度」(F=6.74, P<0.05)，皆達顯著水準。表 4-4-Ｄ信心度顯示，自變項「資料表示式」可解釋 25.3%的變異量(R²=0.253, F=42.94, P<0.05)，

自變項「任務複雜度」(F=18.44, P<0.05)，皆達顯著水準。檢定結果顯示除了 H7b、

H10a、H10b 之外，所有假說都被支持。

(38)

第四節第四節第四節

第四節資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析

表 4-5 資料表示式與任務查詢複雜度在巨觀錯誤之迴歸分析結果 Panel A：正確性-巨觀錯誤

變異來源 R² df Mean Square 標準化係數

Beta 分配 F value Sig.

資料表示式 .276 1 1683.16 .148 19.259 .000 任務複雜度 1 3789.41 .467 43.36 .000

complh 1 4.22 .048 .826

Model*Complh 1 275.37 3.151 .076 殘差 619 87.39

圖 4-1 資料表示式與任務查詢複雜度之巨觀錯誤的估計邊緣平均數資料來源：本研究

圖 4-1 為資料表示式與任務查詢複雜度之巨觀錯誤的估計邊緣平均數，任務查詢複雜度為 0 即任務查詢複雜度小於 12，複雜度為 1 即任務查詢複雜度大於 12，從

水平式綱要垂直式綱要

資料表示式資料表示式資料表示式資料表示式

3 4 5 6 7 8 9

估估估估計計計計邊邊邊邊緣緣緣緣平平平平均均均均數數數數

複雜度

0 1

巨觀錯誤巨觀錯誤

巨觀錯誤巨觀錯誤的估計邊緣平均數的估計邊緣平均數的估計邊緣平均數的估計邊緣平均數

(39)

圖 4-1 可以了解資料表示式、查詢複雜的程度以及巨觀型錯誤之間的關係，垂直式綱要查詢複雜程度比水平式綱要查詢複雜程度更高。當垂直式綱要複雜度較高時，

使用者在查詢時的巨觀型錯誤也相對的多，比起水平式綱要查詢複雜度查詢更困難，垂直式綱要的巨觀型錯誤會隨著 x 軸快速上升；反之當垂直式任務查詢複雜度小於 12 時，使用者查詢的時候巨觀型錯誤仍然比水平式綱要多一點，圖型以緩慢上升。因此在資料表示方式垂直式綱要的巨觀型錯誤比水平式綱要的巨觀型錯誤多，

並且兩者有交互作用。

圖 4-2 任務查詢複雜度與資料表示式之巨觀型錯誤的估計邊緣平均數資料來源：本研究

從圖 4-2 為任務查詢複雜度及資料表示式巨觀型錯誤的估計邊緣平均數之間的關係，0 代表任務查詢複雜度小於 12，反之 1 則代表任務查詢複雜度大於 12。任務

0 1

複雜度複雜度複雜度複雜度 3

4 5 6 7 8 9

資料表示方式

巨觀型錯誤的估計邊緣平均數巨觀型錯誤的估計邊緣平均數巨觀型錯誤的估計邊緣平均數巨觀型錯誤的估計邊緣平均數

(40)

查詢複雜度小於 12 時垂直式綱要的巨觀型錯誤比水平式綱要的巨觀型錯誤多；當任務查詢複雜度大於 12 時，水平式綱要的巨觀型錯誤複雜度呈直線下降，反正垂直式綱要巨觀型錯誤呈直線上升，因此任務查詢複雜度及資料表示式巨觀型錯誤的估計邊緣平均數兩者並沒有交互作用，我們可以看出，水平式網要複雜度越高，巨觀錯誤越少，我們可以解釋為水平式綱要為我們平時所看到的資料表示式，所以使用者執行答案時巨觀錯誤自然的就降低。

表 4-6 資料表示式與任務查詢複雜度在微觀錯誤之迴歸分析結果

資料表示式 .162 1 1.72 .074 3.10 .079 任務複雜度 1 1.864 .356 3.37 .067

complh 1 7.38 13.33 .000

Model*Complh 1 1.35 2.49 .12

殘差 619 .55

(41)

圖 4-3 資料表示式與任務查詢之微觀錯誤的估計邊緣平均數資料來源：本研究

從圖 4-3 資料表示式與任務查詢複雜度之微觀錯誤的估計邊緣平均數之間的關係，

垂直式綱要查詢複雜程度比水平式綱要查詢複雜程度更高。當任務查詢複雜度大於 12 時，使用者在查詢垂直式綱要的微觀錯誤比水平式綱要還多；而任務查詢複雜度小於 12 時，水平式綱要與垂直式綱要幾乎呈直線平行，即複雜程度相同。因此在資料表示式以及任務查詢複雜的程度之間的關係微觀錯誤的估計邊緣平均數兩者並沒有交互作用。

0.2 0.4 0.6 0.8 1

複雜度

0 1

微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數

(42)

圖 4-4 任務查詢複雜度與資料表示式之微觀錯誤的估計邊緣平均數資料來源：本研究

從圖 4-4 為查詢複雜度及資料表示式微觀錯誤的估計邊緣平均數之間的關係，0 代表任務查詢複雜度小於 12，反之 1 則代表任務查詢複雜度大於 12。任務查詢複雜度小於 12 時，水平式綱要的微觀錯誤與垂直式綱要的微觀錯誤幾乎相同，當任務查詢複雜度大於 12 時，兩者皆呈 x 軸直線上升，但垂直式綱要的微觀錯誤已經遠遠超越水平式綱要的微觀錯誤，所以在任務查詢複雜度及資料表示式微觀錯誤的估計邊緣平均數兩者有交互作用。兩種資料表示式的前 2 題回答問題的答案都幾乎相同，

在資料表示式方面也是雷同的，所以在微觀錯誤方面資料表示方式複雜度小於 12 時，它的錯誤率也幾乎重疊在一起。

0 1

0.2 0.4 0.6 0.8 1

資料表示方式

水平式綱要垂直式網要

微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數微觀錯誤的估計邊緣平均數

任務查詢複雜度任務查詢複雜度任務查詢複雜度任務查詢複雜度

(43)

表 4-7 資料表示式與任務查詢複雜度在時間之迴歸分析結果

變異來源 R² df Mean Square 標準化係數 Beta 分配

F value Sig.

資料表示式 .06 1 28.7 .063 2 .158

任務複雜度 1 22.91 .207 1.6 .21

complh 1 44.61 3.11 .08

Model*Complh 1 2.24 .16 .693

殘差 619 14.33

圖 4-5 資料表示式與任務查詢複雜度之使用時間的估計邊緣平均數資料來源：本研究

從圖 4-5 為資料表示式與任務查詢複雜度之使用時間的估計邊緣平均數之間的關係，垂直式綱要查詢複雜程度比水平式綱要任務查詢複雜程度更高。當垂直式綱要任務查詢複雜度大於 12 時，使用者在查詢時的時間也相對的多。而當垂直式綱要

資料表示方式資料表示方式資料表示方式資料表示方式

3.5 4 4.5 5 5.5 6

複雜度

0 1

使用時間的估計邊緣平均數使用時間的估計邊緣平均數使用時間的估計邊緣平均數使用時間的估計邊緣平均數

(44)

綱要會隨著複雜度越高花費的時間更多，相反的水平式綱要執行的時間 x 軸只是微微的成長。因此在資料表示式以及任務查詢複雜度之間的關係使用時間的估計邊緣平均數兩者並沒有交互作用。

圖 4-6 任務查詢複雜度與資料表示式之使用時間的估計邊緣平均數資料來源：本研究

從圖 4-6 為任務查詢複雜度及資料表示式以及使用時間的估計邊緣平均數之間的關係，0 代表平均任務查詢複雜度小於 12，反之 1 則代表平均任務查詢複雜度大於 12。查詢複雜度小於 12 時，垂直式綱要的執行時間比水平式綱要多了一些，當任務複雜度大於 12 時，垂直式綱要的執行時間已經超越水平式綱要。因此在查詢複雜的程度以及資料表示式之間的關係時間的估計邊緣平均數兩者並沒有交互作用。

0 1

任務查詢複雜度任務查詢複雜度任務查詢複雜度任務查詢複雜度

4 4.25 4.5 4.75 5 5.25 5.5

資料表示方式

使用時間的估計邊緣平均數使用時間的估計邊緣平均數使用時間的估計邊緣平均數使用時間的估計邊緣平均數

(45)

表 4-8 資料表示式與任務查詢複雜度在信心度之迴歸分析結果

Panel D：信心度

資料表示式 .19 1 39.76 -.102 7.11 .008 任務複雜度 1 191.09 -.403 34.16 .000

complh 1 .041 .007 .932

Model*Complh 1 .72 .129 .72

殘差 619 5.594

圖 4-7 資料表示式與任務查詢複雜度之信心度的估計邊緣平均數資料來源：本研究

從圖 4-7 了解資料表示式與任務查詢複雜度之信心度的估計邊緣平均數之間的關係，垂直式綱要任務查詢複雜度的信心程度比水平式綱要任務查詢複雜度的信心程度更低。垂直式綱要任務查詢複雜度大於 12 時，使用者執行查詢的信心程度比水平式綱要少。當垂直式綱要任務複雜度小於 12 時，使用者執行查詢的信心程度卻比

6 6.1 6.2 6.3 6.4 6.5 6.6 6.7

複雜度

0 1

信心度的估計邊緣平均數信心度的估計邊緣平均數信心度的估計邊緣平均數信心度的估計邊緣平均數

(46)

水平式綱要少。因此在資料表式以及任務查詢複雜的程度之間的關係與信心度估計邊緣平均數兩者有交互作用。

圖 4-8 資料表示式與複雜度之任務查詢複雜度的估計邊緣平均數資料來源：本研究

從圖 4-8 為任務查詢複雜度及資料表示式以及信心度的估計邊緣平均數之間的關係，0 代表任務查詢複雜度小於 12，反之 1 則代表任務查詢複雜度大於 12。任務查詢複雜度小於 12 時，水平式綱要的信心度比垂直式綱要的多，當任務查詢複雜度大於 12 時，垂直式綱要的信心度仍然比水平式綱要少。所以在任務查詢複雜度及資料表示式信心度的估計邊緣平均數並無交互作用。

0 1

複雜度複雜度複雜度複雜度

6 6.1 6.2 6.3 6.4 6.5 6.6 6.7

資料表示方式

信心度的估計邊緣平均數信心度的估計邊緣平均數信心度的估計邊緣平均數信心度的估計邊緣平均數

(47)

第第第

第五五五五節節節假說檢驗節假說檢驗假說檢驗假說檢驗

針對本研究所提出的 6 個假說，檢定結果顯示除了 H1b、H2、H7a、H10、H10a、

H10b 以外，所有假說都被支持。

表 4-9 本研究結果整理表

假說代號研究假說內容本研究分析結果

H1

根據垂直式綱要撰寫的查詢敘述其正確性比根據水

平式綱要撰寫的查詢敘述為低。支持

H1a

根據垂直式綱要撰寫的查詢敘述其巨觀錯誤比根據

水平式綱要撰寫的查詢敘述多。支持

H1b

根據垂直式綱要撰寫的查詢敘述其微觀錯誤比根據

水平式綱要撰寫的查詢敘述多。不支持

H2

根據垂直式綱要撰寫的查詢敘述其時間耗費比根據

水平式綱要撰寫的查詢敘述多。不支持

H3

根據垂直式綱要完成查詢敘述撰寫後的信心度比根

據水平式綱要完成查詢敘述後的低。支持

H4

撰寫高度任務複雜查詢敘述的正確性，比低度任務

複雜的低。支持

H4a

撰寫高度任務複雜查詢敘述的巨觀錯誤，比低度任

務複雜的多。支持

H4b

撰寫高度任務複雜查詢敘述的微觀錯誤，比低度任

H5

撰寫高度任務複雜查詢敘述的時間耗費，比低度任

H6

撰寫高度任務複雜查詢敘述後的信心度，比低度任

務複雜的低。支持

H7

根據垂直式綱要撰寫的更新查詢敘述其正確性比根

據水平式綱要撰寫的更新查詢敘述為低。支持

(48)

表 4-9 本研究結果整理表(續)

假說代號研究假說內容本研究分析結果

H7a

根據垂直式綱要撰寫的更新查詢敘述其巨觀錯誤比

根據水平式綱要撰寫的更新查詢敘述多。支持

H7b

根據垂直式綱要撰寫的更新查詢敘述其微觀錯誤比

根據水平式綱要撰寫的更新查詢敘述多。不支持

H8

根據垂直式綱要撰寫的更新查詢敘述其時間耗費比

根據水平式綱要撰寫的更新查詢敘述多。支持

H9

根據垂直式綱要完成更新查詢敘述撰寫後的信心度

比根據水平式綱要完成更新查詢敘述後的低。支持

H10

撰寫高度任務複雜更新查詢敘述的正確性，比低度

任務複雜的低。不支持

H10a

撰寫高度任務複雜更新查詢敘述的巨觀錯誤，比低

度任務複雜的多。不支持

H10b

撰寫高度任務複雜更新查詢敘述的微觀錯誤，比低

度任務複雜的多。不支持

H11

撰寫高度任務複雜更新查詢敘述的時間耗費，比低

度任務複雜的多。支持

H12

撰寫高度任務複雜更新查詢敘述後的信心度，比低

度任務複雜的低。支持

中 華 大 學

中 華 大 學 碩 士 論 文

以實驗法探討資料表示方式與任務複雜度對使 以實驗法探討資料表示方式與任務複雜度對使 以實驗法探討資料表示方式與任務複雜度對使 以實驗法探討資料表示方式與任務複雜度對使 用者查詢績效的影

用者查詢績效的影 用者查詢績效的影 用者查詢績效的影響 響 響 響

系 所 別：資訊管理學系碩士班

學號姓名：M09510036 黃莉婷

指導教授：李之中 博士

摘要 摘要 摘要 摘要

ABSTRACT

誌謝

目 錄

表目錄 表目錄 表目錄 表目錄

圖目錄 圖目錄 圖目錄 圖目錄

第一章 第一章 第一章

第一章 緒論 緒論 緒論 緒論

第一節 第一節 第一節

第一節 研究背景與動機 研究背景與動機 研究背景與動機 研究背景與動機

第二節 第二節 第二節

第二節 研究目的 研究目的 研究目的 研究目的

第三節 第三節 第三節

第三節 研究範圍 研究範圍 研究範圍 研究範圍

第四節 第四節 第四節

第四節 研究流程 研究流程 研究流程 研究流程

第五節 第五節 第五節

第五節 論文架構 論文架構 論文架構 論文架構

第二章 第二章 第二章

第二章 文獻探討 文獻探討 文獻探討 文獻探討 第一節

第一節 第一節

第一節 水平式綱要 水平式綱要 水平式綱要 水平式綱要

第二節 第二節 第二節

第二節 垂直式綱要 垂直式綱要 垂直式綱要 垂直式綱要

第三節 第三節 第三節

第三節 使用者查詢績效 使用者查詢績效 使用者查詢績效 使用者查詢績效

第 第 第

第四 四 四 四節 節 節 節 任務複雜度 任務複雜度 任務複雜度 任務複雜度

第五節 第五節 第五節

第五節 正規化影響查詢複雜度與績效 正規化影響查詢複雜度與績效 正規化影響查詢複雜度與績效 正規化影響查詢複雜度與績效

第三章 第三章 第三章

第三章 研究方法 研究方法 研究方法 研究方法

第一節 第一節 第一節

第一節 研究流程 研究流程 研究流程 研究流程

第二節 第二節 第二節

第二節 研究變數內容與關係 研究變數內容與關係 研究變數內容與關係 研究變數內容與關係

資料表示方式 任務複雜度

查詢績效

-正確性

-時間 -信心度

n log n

n D = Nlog

第三節 第三節 第三節

第三節 研究假 研究假 研究假 研究假說 說 說 說與研究模型 與研究模型 與研究模型 與研究模型

第四節 第四節 第四節

第四節 實驗 實驗 實驗 實驗問 問 問 問題 題 題設計 題 設計 設計 設計

第五節 第五節 第五節

第五節 研究對象與樣本 研究對象與樣本 研究對象與樣本 研究對象與樣本

第六節 第六節 第六節

第六節 資料分析與方法 資料分析與方法 資料分析與方法 資料分析與方法

第四章 第四章

第四章 第四章 資料分析與結果 資料分析與結果 資料分析與結果 資料分析與結果

第一節 第一節 第一節

第一節 問 問 問 問題 題 題回收情形 題 回收情形 回收情形 回收情形

第二節 第二節 第二節

第二節 Pearson 相關分析 相關分析 相關分析 相關分析

第三節 第三節 第三節

第三節 變異數分析 變異數分析 變異數分析 變異數分析

R

df Mean Square F value

R

df Mean Square F value

R

df Mean Square F value

R

df Mean Square F value

R

df Mean Square F value

R

df Mean Square F value

R

df Mean Square F value

R

中華大學

中華大學碩士論文

以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使以實驗法探討資料表示方式與任務複雜度對使用者查詢績效的影

用者查詢績效的影用者查詢績效的影用者查詢績效的影響響響響

系所別：資訊管理學系碩士班

指導教授：李之中博士

摘要摘要摘要摘要

目錄

表目錄表目錄表目錄表目錄

圖目錄圖目錄圖目錄圖目錄

第一章第一章第一章

第一章緒論緒論緒論緒論

第一節第一節第一節

第一節研究背景與動機研究背景與動機研究背景與動機研究背景與動機

第二節第二節第二節

第二節研究目的研究目的研究目的研究目的

第三節第三節第三節

第三節研究範圍研究範圍研究範圍研究範圍

第四節第四節第四節

第四節研究流程研究流程研究流程研究流程

第五節第五節第五節

第五節論文架構論文架構論文架構論文架構

第二章第二章第二章

第二章文獻探討文獻探討文獻探討文獻探討第一節

第一節第一節

第一節水平式綱要水平式綱要水平式綱要水平式綱要

第二節第二節第二節

第二節垂直式綱要垂直式綱要垂直式綱要垂直式綱要

第三節第三節第三節

第三節使用者查詢績效使用者查詢績效使用者查詢績效使用者查詢績效

第第第

第四四四四節節節節任務複雜度任務複雜度任務複雜度任務複雜度

第五節第五節第五節

第五節正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效正規化影響查詢複雜度與績效

第三章第三章第三章

第三章研究方法研究方法研究方法研究方法

第一節第一節第一節

第一節研究流程研究流程研究流程研究流程

第二節第二節第二節

第二節研究變數內容與關係研究變數內容與關係研究變數內容與關係研究變數內容與關係

資料表示方式任務複雜度

第三節第三節第三節

第三節研究假研究假研究假研究假說說說說與研究模型與研究模型與研究模型與研究模型

第四節第四節第四節

第四節實驗實驗實驗實驗問問問問題題題設計題設計設計設計

第五節第五節第五節

第五節研究對象與樣本研究對象與樣本研究對象與樣本研究對象與樣本

第六節第六節第六節

第六節資料分析與方法資料分析與方法資料分析與方法資料分析與方法

第四章第四章

第四章第四章資料分析與結果資料分析與結果資料分析與結果資料分析與結果

第一節第一節第一節

第一節問問問問題題題回收情形題回收情形回收情形回收情形

第二節第二節第二節

第二節 Pearson 相關分析相關分析相關分析相關分析

第三節第三節第三節

第三節變異數分析變異數分析變異數分析變異數分析

第四節第四節第四節

第四節資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析資料表示式與任務查詢複雜度之迴歸分析

第第第

第五五五五節節節假說檢驗節假說檢驗假說檢驗假說檢驗