標準化空間能力測驗之建模與驗證

(1)

標準化空間能力測驗之建模與驗證

摘要

本研究針對大學入學考試中心所發展的標準化空間能力測驗常模樣本資料，進行試題探索與模式驗證，以瞭解此測驗中的試題品質與因素結構。

本研究樣本為台灣地區公私立高中1838位高一學生，以隨機方式分割為建模

（或探索）樣本與驗證樣本。研究中使用項目分析、內部一致性分析、探索性因素分析以及驗證性因素分析等統計方式進行分析。

本研究結果顯示，探索後的建議版測驗不但具有良好的信度與效度，

測驗的測量模式與觀察資料獲得適配，也能以更少的試題獲致更好的測量精確度。本研究的測驗建模與驗證程序可為後續相關測驗發展的參考程序。

關鍵詞：空間能力測驗、空間能力、結構方程模式。

鄭海蓮

國立臺灣科技大㈻技術及職業教育研究所副教授

陳世玉

國立臺灣科技大㈻技術及職業教育研究所研究生

(2)

Abstract

The study explored and confirmed the measurement model of the standardized spatial ability test developed by the College Entrance Examination Center (CEEC) to understand the test’s item quality and factor structure. The norming sample consisted of 1838 10th graders from Taiwan public and private high schools, and was randomly divided into calibration (exploration) sample and validation sample in the study. Item analysis, internal consistency analysis, exploratory factor analysis and confirmatory factor analysis were used in data analysis.

Research results showed that the suggested version of the spatial ability test can improve test reliability and validity with fewer test items, and the measurement model fits well. The model exploration and validation steps implemented in the study can provide a referential procedure for future similar test constructions for the purpose of model reduction.

Keywords: Spatial ability test, spatial ability, structural equation modeling.

Hi-Lian Jeng

Associate Professor, Graduate School of Technological and Vocational Education, National Taiwan University of Science and Technology

Model Exploration and Validation of the Standardized Spatial Ability Test

Shih-Yu Chen

Graduate student, Graduate School of Technological and Vocational Education, National Taiwan University of Science and Technology

(3)

壹、緒論

空間能力與人類的生活息息相關，故空間能力的相關測驗之重要性與需求應用漸增，但空間能力雖是備受公認的重要心智技能之一，它卻又是相當難解釋又難以描述的一種能力，因此空間能力的理論建構不易，影響所及，其測驗編製或試題設計也相當困難，雖然空間能力研究已累積一些成果，但與其他心智技能研究相較，以空間能力為對象的研究仍然較少，其主要原因之一即為缺乏適切可靠的、與時俱進的空間能力評量工具。

一、研究動機

空間能力測驗之發展雖已有一段不短的歷史，但從研究文獻上可見，

學者們對空間能力的定義與構面各有創見，言人人殊。透過文獻評閱，可知空間能力中至少包括了知覺、想像、旋轉與操弄等各種心智運作，各能力運作之間既係相對獨立，又是相互依賴。雖然學者們所界定的空間能力構面看來類似，但其實對於構面內容之闡釋卻又不盡相同。根據Lohman的看法，

這種現象可能歸因於現存的空間能力測驗無法對空間能力進行有效的測量，

可見諸於不同的研究中，相同的測驗內容常有不同的名稱，抑或是相同的測驗名稱卻有不同的測驗內涵的情形，而且學者們所用因素萃取與轉軸的方式不同，所以對空間能力定義與構面的詮釋也就不同（Lohman, 1979）。

空間理論建構的困難，直接影響到空間能力測驗的編製，可由表1進一步闡釋之。表1為Lohman（1988）整理前人研究文獻後，所提出的十種空間能力類型，各有其定義測驗，也指明許多空間能力之間難以清楚區分；

Lohman進一步認為其中最重要的因素有三，即空間視覺、空間定位和空間關係。但不論是Lohman的三因素論，或是McGee（1979）的二因素論與 Linn and Petersen（1985）的三因素論，這些因素架構並未經過實證，後人也不易據以編製出一個符合三因素或二因素構面的空間能力測驗，標準化的空間能力測驗更為少見。較常見的應用是如表1中所見的，根據各類型空間能力的定義所編製的單一形式測驗。

(4)

表1 Lohman空間理論之因素與定義測驗一覽表

Factor name Factor label 定義測驗難分離的因素

空間視覺 Visualization or

General Visualization Vz or Gv

Paper Folding Paper Form Board Surface Development Block Design

Shepard-Metzler Mental Rotations Mechanical Principles

Reasoning ( or Gf) SO Cf

空間定位

Spatial orientation SO Aerial Orientation

Chair Window Test Vz 形狀變通

Flexibility of closure Cf Embedded Figures Test Gf or Vz 完形速度

Closure speed Cs Street Gestalt Close Ups 空間關係/旋轉速度

Spatial relation/

Speeded rotation

SR

Cards Flags Figures

Gv

空間掃瞄

Spatial scanning Ss Maze Tracing Choosing a Path 知覺速度

Perceptual speed Ps Identical Forms Vz Cf 系列統整

Serial integration SI Successive Perception III Picture Identification 視覺記憶

Visual memory Vm Memory for Designs Vz 肢動能力

Kinesthetic K Hands

Bolts SO

資料出處：整理自Lohman（1988）

(5)

我國大學入學考試中心（以下簡稱大考中心）歷經兩個研究專案（何榮桂，簡茂發，鄭海蓮，區雅倫，卓沛勳，蕭孟莛，陳世玉，2007；襲充文、李明燕、吳家怡、朱惠文、區雅倫，2003）的研發後，於2007年推出了三因素、七種題型的空間能力測驗，並建立起全國性的常模，就本土的標準化空間能力測驗而言，實屬創舉。大考中心的空間能力測驗之命題主要係依據Lohman的空間視覺與空間定位，以及Linn and Petersen的空間知覺等三個構面分別命題，嘗試綜整各家的觀點，提出一個較具兼容性的空間能力測量模式，期望能夠較周延地評量受試者的空間能力。

此測驗歷經初試、預試和正式測驗，以迄常模建立，在修編試題過程中，以古典測驗理論的項目分析（item analysis）進行題目的篩選，尚未做進一步的效度考驗，以驗證測驗的因素結構。但是在組成正式試卷之後，原有的測驗題型、構面與題數已有不小的變動，可能會影響到原有的因素結構與試題品質，而且測驗結果是否能夠確切地反應學生的空間能力，仍須繼續探究。因此，本研究經由大考中心同意，以此測驗的常模樣本資料進行因素結構的探索，並檢驗試題品質，期望能為此測驗建立一個具良好信、效度的測量模式，此為本研究動機之一。在探索並建立一個具良好信、效度的測量模式之後，本研究考驗此測量模式與觀察資料間的適配度，以驗證此模式的適當性與推論性，此為本研究的動機之二。

二、空間能力測驗

本文所指的空間能力測驗為大考中心所編製的標準化「大考中心學業性向測驗」分量表之一。大考中心為協助高一學生瞭解其性向，以利探索與選擇適合的大學組別和科系，自2005年起，開始編製標準化「大考中心學業性向測驗」，已逐年完成語文、數學與圖形等三個分量表，其中的「圖形分量表」測量學生的空間推理能力或空間關係，本研究將之簡稱為「空間能力測驗」，測驗中之因素構面與題型分配如表2所示。由表2可見，原命題編製是以三因素構面與七種題型為基礎，但歷經初試、預試以及項目分析後的編修，題型六已於最後的正式試卷中刪除（何榮桂等人，2007）。

(6)

表2 空間能力測驗因素構面與題型分配

空間能力測驗之構面測驗題型備註

空間視覺（visualization）

題型一（積木平面）

題型二（積木立體旋轉）

題型三（積木立體插入）

題型七（圖形推理）

空間定位（spatial orientation）題型四（空間定位）

題型五（迷津）

空間知覺（spatial perception）題型六（圖形辨識）正式試卷已刪除

上述空間視覺題型的設計是根據Lohman對空間視覺的定義，是指能否在腦中形成有關刺激的心像，並做必須的轉換。Lohman認為歸類為空間視覺的測驗之內容特徵較為複雜，且指出空間視覺是最普遍的因素，然而卻也是最不容易被定義的因素，因為許多的研究結果顯示這個因素與推理因素是難以分離的。

空間定位題型的設計是根據Lohman對空間定位的定義，是指能設想從不同角度去觀察物件的能力。歸類為空間定位的測驗內容以「鏡像」為代表，要求受試者由不同的角度判斷物件或景物。

空間知覺題型的設計是根據Linn and Petersen對空間知覺的定義，是指個體能運用自己的身體，定義出空間關係的能力，即能正確辨識空間圖形，

並且強調能回應符合視覺的圖形刺激物。其題型設計內容係要求受試者利用自己的身體以判斷物件的空間關係，兼有場獨立或場依賴的情境。但如表2 所示，空間知覺的題型（題型六）最後於正式試卷中刪除。

三、空間能力的意義與內涵

（一）空間能力的定義

空間能力的定義因研究者所持的觀點、分析角度或層次之不同，而有不同的定義與詮釋。早期Spearman的智力二因論與Thurstone的基本心能論均包含空間能力在內（張春興，1996）。Piaget and Inhelder認為空間能力是圖

(7)

畫式思考能力和操作性思考能力，前者是指辨認靜止圖形型態的能力，後者是指移動或操作圖形與物件的能力（蔣家唐，1995）。同一時期的Gardner 也以多元智能的觀點，定義空間能力是在腦中想像事物，包含想像摺疊和旋轉物體的能力、由描繪二維（2D）空間的物體視覺化（想像）三維（3D）空間的物體，以及分辨由不同角度觀看同一物體的能力（吳文如，2003）。

綜觀而言，空間能力係立基於一般的認知能力之上，對外在刺激產生內在心像，進而操控心像以解決問題之能力。質言之，空間能力係指個體能夠正確觀察、辨識物體，並根據視覺所吸收的圖像記憶於腦中，且進一步透過思維想像的方式，在2D平面與3D立體之間任意的移動、旋轉或翻轉，展現出再認、保留與回憶圖像的思考能力。

（二）空間能力的構面

Lohman（1988）歸納出十種不同的空間能力類型如表1所示，其中以空間視覺、空間關係和空間定位為主要因素。「空間視覺」是指能在腦中形成有關刺激的心像並做轉換的能力，其測驗內容特徵較為複雜。「空間關係」

是指能將眼前的刺激物，在腦中做快速旋轉的能力，屬於心智旋轉項目，試題特徵較為簡單，係屬速度測驗。「空間定位」是指能設想從不同角度去觀察物件的能力，測驗內容以「鏡像」為代表，亦經常要求受試者由不同的角度判斷物件或景物。

McGee（1979）綜整過去空間能力因素研究，認為空間能力可分為空間視覺（spatial visualization）與空間定位（spatial orientation）。前者是指能將2D或3D的外在刺激物進行心理操作、轉動、翻轉的能力；後者則是涉及一個視覺刺激物形式中成分重排後的理解，亦係能正確辨識刺激物，即使物件或圖形改變方位後仍能保持清晰不亂的能力。

Linn and Petersen（1985）則將空間能力分為空間知覺（spatial perception）、心智旋轉（mental rotation）與空間視覺（spatial visualization）

等三項。「空間知覺」指個體能辨識空間關係之能力；「心智旋轉」指個體能想像旋轉空間中圖像之能力；「空間視覺」指個體能操作一連串複雜影像折疊與移動之能力。Linn and Petersen將「心智旋轉」定義為空間能力中的

(8)

一項，與「空間視覺」分屬不同能力，後續學者也多參考此定義進行研究。

綜觀Lohman、McGee以及Linn and Petersen的研究論點，空間視覺（

visualization）以及空間關係與定位（spatial relation∕orientation）兩大類似乎是三位學者之間較有共識之處，然仍須注意學者們對於空間構面範疇的界定並不太相同。Lohman（1979）指出「空間視覺」與「空間關係」的不同，他是由「解題速度」與「測驗複雜度」兩種向度進行測驗的分析比較，

認為空間視覺測驗相較於空間關係測驗而言，內容較為複雜，解題強調正確性而非速度，也就是說，空間關係測驗內容較為簡單，強調快速解題的能力，因此「空間視覺」係強調複雜的心智運作能力，「空間關係」則是強調簡單快速的心智旋轉能力。McGee（1979）認為空間能力至少包含空間視覺與空間方位，其空間視覺能力成分類似於Lohman對空間視覺的闡釋，強調複雜的心智運作，但空間方位則是包括能知覺物體且能由不同角度覺察物體。Lohman與McGee兩者對空間視覺的界定與詮釋相當類似，但在空間關係與空間定位上，兩者的觀點卻是不同，即McGee將空間關係與空間定位視為相同的能力成分，Lohman則將之分離；也就是說，Lohman認為簡單的心智旋轉是獨立於空間視覺與空間定位之外，強調快速且簡單的內容特徵，此能力稱為空間關係，但Lohman也發現若是複雜的旋轉問題則應含括於空間視覺之中。

Linn and Petersen（1985）則將空間能力分為空間視覺、空間知覺與心智旋轉。Lohman和Linn and Petersen對空間視覺的闡釋不盡相同，因為Linn and Petersen係將心智旋轉定義成為空間能力構面中的一項，與空間視覺分屬不同能力；對於空間知覺，Linn and Petersen則認為係個體能辨識空間關係之能力，也就是Lohman所提的「知覺速度」，即快速回應符合視覺刺激物之能力。質言之，Lohman將空間知覺定義為知覺速度，係屬靜態、較小空間的知覺能力，常見於辨識測驗（identical forms），而Linn and Petersen是將RFT（the rod-and-frame test）及WLT（the water level test）歸類為空間知覺之代表性測驗作業，它係要求受試者利用自己以判斷物件的空間關係，因之，Lohman的空間知覺強調的是知覺不同測驗之不同作業及難度的速度，

(9)

而Linn and Petersen則是重視場獨立與否的情境知覺部份。

大考中心的空間能力測驗基本上是想整合各家的觀點，提出一個較具兼容性的空間能力測量模式。然而最後版本的測驗構面似乎呈現刪減為空間視覺與空間定位兩個構面的局面，因之較為傾向以Lohman為主的因素結構，而Linn and Petersen的空間知覺則消失。

貳、研究方法

本研究針對大考中心的空間能力測驗進行測量模式的建模（或探索）

與驗證，以下分別就研究對象、研究工具與資料分析模式進行說明。

一、研究對象

本研究的研究對象為大考中心於2007年空間能力測驗之常模建置過程中的樣本，此樣本資料以全國高一學生為母群體，採分層叢集抽樣方式，將全國高中依照地域分為北區、桃竹苗區、中區、南區、高屏區、東區以及離島區，然後依據每間學校學生的平均素質（能力表現）以立意抽樣的方式，

挑選可配合施測的學校與班級。

願意配合施測學校的分佈為北區十所、桃竹苗區四所、中區五所、

南區四所、高屏區五所、東區三所與離島區二所，共計選取三十三所學校六十二個班級，總學生人數為2790人。實際回收的測驗題本與答案卡是2459 份，回收率為88％。有26位受試者因未答題數過多（超過13題以上）、且超過三個以上的題型，故予以剔除，並且有358位受試者因作答時間的差異也予以剔除。另外，由於大考中心的後續其他處理考量，有一所學校的施測班級達十班之多，故刪除其中人數較少的六個班級，總計剔除了237位受試者，總計最後的有效樣本數為1838。

表3顯示1838位學生之各區域樣本性別分佈情形，可知男女的比率大約各佔一半；其中由於北區與桃竹苗區各有一位學生未填答性別，故表3的總計人數為1836。但由於未填答性別的資料不影響後續的分析，故本研究仍採

(10)

1838位受試學生資料，將之隨機分割為建模（或探索）樣本（919人）與驗證樣本（919人），前者作為建立（或探索）理想的測量模式之用，後者則作為驗證此模式的適當性與推論性之用，分割之後，不論是建模（或探索）

樣本與驗證樣本，在各區域樣本的性別分佈情形，男女的比率仍約各佔一半。

表3 全體有效樣本的各區域性別分佈

區域男女總計

北區 330 365 695

桃竹苗區 154 83 237

中區 128 140 268

南區 47 103 150

高屏區 128 167 295

東區 58 61 119

離島區 33 39 72

總計 878 958 1836

百分比 47.82% 52.18% 100%

二、研究工具

本研究採用大考中心的空間能力測驗，其初試卷以三因素、七種題型命題，共有48題，分成難度相當的A、B兩卷進行初試。每個題目都有四個選項，為單選題，計分方式為選擇「正確選項」給1分，選擇「錯誤選項」

給0分，累加所有得分即得測驗總分，得分越高表示受試者的空間能力越高，反之則越低。

依據初試的項目分析結果進行選題，共組成預試卷（一卷）36題，仍為七種題型。再經預試的項目分析，36題中有6題的鑑別度較差、難度較為極端，必須刪除，另有1題因整個題組僅剩一題，也予以刪除；然而被刪除的7題中，有4題屬同一題型即「題型六：圖形辨識」，因此預試中原有七個題型、36題，在正式卷中剩下六個題型、29題，其中屬於空間視覺的題目有 19題，屬於空間定位的題目有10題。

(11)

三、資料分析模式

本研究將常模樣本資料隨機分割成建模（或探索）樣本和驗證樣本。

建模（或探索）樣本以「試題分析軟體MicroCAT」中的ITEMAN，提供古典測驗項目分析，並使用「統計套裝軟體SPSS 13.0」進行測量模式的建模

（或探索），包括內部一致性分析以及探索性因素分析，篩選出適當的題目；驗證樣本則以「統計套裝軟體LISREL 8.72」進行結構方程模式之測量模式的檢驗，茲分述如下。

（一）測量模式的建模（或探索）

由於此空間能力測驗的目的旨在辨別學生空間能力的高低，作為學生大學選組與性向探索的參考依據，故此測驗應該重視題目的鑑別力（

L

H

P

D

� � ），亦即題目是否能正確區別學生空間能力的高低。因此本研究首先以「建模（或探索）樣本」資料進行項目分析，檢視每題的難度及鑑別度，剔除鑑別力低、難度太高或太低的題目；緊接著進行內部一致性分析，

挑選出會降低信度的題目，並考量其因素負荷量的變化。

若根據項目分析的難度與鑑別度刪題，則刪除某一題目並不會影響其他題目的難度及鑑別度。但是內部一致性與探索性因素分析則是根據分數的變異量來計算，若刪除某一題目必會影響其他題目的信度表現及因素負荷量。所以在選題過程中，項目分析階段可一次刪除所有品質較不佳的題目，

但內部一致性與因素分析階段則須逐次刪題（一題），視整體變化情形，再決定下一次要刪除的題目。

（二）測量模式的驗證

測量模式建模（或探索）以後，即以「驗證樣本」資料進行測量模式的驗證，並根據基本適配指標、整體模式適配指標、比較適配指標、精簡適配指標及內在適配指標等進行評鑑，以確認此測量模式的穩定，各項檢定標準如表4至表8所示。

(12)

表4 基本適配指標

適配指標判斷規準及詮釋

誤差變異數（θδ, θε）無負值，且必須達顯著。

因素負荷量（Λy, Λx）介於0.50到0.95之間為理想值，且須達顯著。因負荷量至少必須大於 0.33才具實質意義。若大於0.95以上表示可能具有多元共線性。

參數間相關的絕對值不能太接近1，若接近1即表示具多元共線性。

資料來源：整理自余民寧（2006：111~134）。

表5 整體模式適配指標

卡方考驗（χ²） χ²越小越好。當卡方考驗未達顯著時，表示資料與模式是適配

的。卡方考驗最常被使用，但它易受大樣本影響而達顯著，

此時則須檢視其他整體模式適配指標。

適配度指標（GFI）＞0.90，即表示有良好適配程度。

修正的適配度指標（AGFI）＞0.90，即表示有良好適配程度。

標準化均方根殘差（SRMR）殘差越小越好。

SRMR＜0.08，是適配的門檻。

SRMR＜0.05，表示殘差很小，具良好適配。

均方根漸進誤差（RMSEA）＜0.05，即表示良好適配程度。

＜0.08，即表示合理適配程度。

＜0.10，即表示普通適配程度。

＞0.10，即表示不良適配程度。

期望交叉驗證指標（ECVI） ECVI值須小於飽和模式與獨立模式的ECVI標準，亦ECVI <

Saturated ECVI與Independence ECVI，即表示模式在不同樣本上的適配是理想的。

資料來源：整理自余民寧（2006：111~134）。

(13)

表6 比較適配指標

非正規化適配指標（NNFI）＞0.90，即表示有較良好適配程度。

比較適配指標（CFI）＞0.90，即表示有較良好適配程度。

增值適配指標（IFI）＞0.90，即表示有較良好適配程度。

相對適配指標（RFI）＞0.90，即表示有較良好適配程度。

資料來源：整理自余民寧（2006：111~134）。

表7 精簡適配指標

精簡的適配指標（PGFI）數值較高較好。無絕對的固定數值可供判斷依據之用。

Akaike的訊息效標（AIC）理論模式的AIC須小於飽和與獨立模式的AIC標準，亦Model AIC < Saturated AIC與Independence AIC。

穩定的Akaike訊息效標（CAIC）理論模式的CAIC須小於飽和模式與獨立模式的CAIC標準，

亦Model CAIC < Saturated CAIC與Independence CAIC。

適當樣本數（CN）實際樣本數與估計參數個數的比值，至少 CN＞200。

正規卡方值（NC）

1＜NC＜3，表示有精簡適配程度。

NC＜1，表示模式可能過度辨識。

NC＞5，表示模式需要修正。

資料來源：整理自余民寧（2006：111~134）。

表8 內在結構適配指標

所有估計的自由參數達顯著水準。

個別項目的信度值（R²） R²越高越好，即表示各觀察變項能反應出其潛在變項的信度

值越好。

組合信度（Pc） Pc指標值應大於0.60以上，即表示一組觀察變項具有測量某個

潛在變項的理想組合信度。

變異數的平均解釋量（Pv） Pv指標值應大於0.50以上，即表示某潛在變項能解釋到所屬觀察變項的變異量，高於測量誤差解釋到的變異量。

資料來源：整理自余民寧（2006：111~134）。

(14)

參、結果與討論

一、測量模式的建模（或探索）

（一）項目分析與選題

本研究以鑑別度0.20以上、難度以0.40~0.85之間為挑選試題的標準。從表9中可看出，以上述標準進行檢視，有5題（1、3、16、17、20）可以考慮捨棄，但其中第16題雖難度值偏低，但其鑑別度（

D

�

P

_H �

P

_L）達0.33，故決定保留第16題而僅刪4題，共得25題，待內部一致性與探索性因素分析之後，再決定是否刪除其他題目。

表9 空間能力測驗之項目分析摘要表

題號難度鑑別度題目取捨題號難度鑑別度題目取捨

1 0.88 0.15 捨棄 16 0.18 0.33 保留

2 0.57 0.36 保留 17 0.93 0.19 捨棄

3 0.67 0.16 捨棄 18 0.83 0.36 保留

4 0.64 0.31 保留 19 0.75 0.45 保留

5 0.72 0.48 保留 20 0.92 0.17 捨棄

6 0.81 0.38 保留 21 0.85 0.32 保留

7 0.82 0.34 保留 22 0.75 0.31 保留

8 0.81 0.36 保留 23 0.80 0.39 保留

9 0.67 0.57 保留 24 0.45 0.67 保留

10 0.60 0.58 保留 25 0.60 0.72 保留

11 0.77 0.46 保留 26 0.57 0.70 保留

12 0.78 0.47 保留 27 0.58 0.64 保留

13 0.72 0.40 保留 28 0.56 0.48 保留

14 0.77 0.36 保留 29 0.44 0.65 保留

15 0.64 0.23 保留

(15)

（二）內部一致性與探索性因素分析

內部一致性分析係採Cronbach’s α係數檢驗，篩選出會降低信度最大的題目，接著進行探索性因素分析，以瞭解此題目是否可以確實歸類到適當構面之中，及此題目是否具有足夠的因素負荷量，並刪除因素負荷量小於0.33的題目；而本研究的探索性因素分析，採用主軸法（principal axis factoring）抽取二個因素，並以最小斜交法（oblimin）進行斜交轉軸。此階段的刪題步驟是一次刪除一題，視整體變化情形，再決定下一個要刪除的題目。

1.空間視覺測驗的內部一致性與探索性因素分析

首先針對前述保留題目25題，分別進行空間視覺與空間定位的內部一致性分析，發現「空間視覺」之內部一致性較低的題目為最多，因此從其進行刪題。由表10可知「空間視覺」題目刪題前的信度是0.755，若刪除第15 題，信度可提升至0.763，且該題得分與總分的點二系列相關為0.134，相關程度相對於其他題目來的低，即表示第15題在空間視覺題目中最為異質，可能不是測量同一特質，故考慮刪除第15題。再進行25題的探索性因素分析，

交互進行比對發現第15題的因素負荷量僅0.124（小於0.33），因此決定刪除第15題。

表10 空間視覺測驗之內部一致性與探索性因素分析摘要表

分析順序

測驗題號

空間視覺的α變化試題得分

與總分相關

因素負荷量

題目

刪題前刪題後取捨

1 15 0.755 0.763 0.134 0.124 捨棄

2 2 0.763 0.769 0.187 0.157 捨棄

3 4 0.769 0.772 0.226 0.278 捨棄

4 16 0.772 0.767 0.288 0.264 捨棄

根據篩選後的題目（24題），進行第二次內部一致性分析，由表10可知「空間視覺」題目此時（刪題前）的信度是0.763，若刪除第2題，信度可提升至0.769，但信度差距並不多，故再檢視該題得分與總分的點二系列相

(16)

關為0.187，相關程度相對於其他題目來的低，這也表示第2題在「空間視覺」題目中較為異質，故考慮刪除第2題。同時進行24題的探索性因素分析，發現第2題的因素負荷量僅0.157（小於0.33），因此決定刪除第2題。

繼續進行第三次的內部一致性分析，由表10可知此時「空間視覺」題目的信度是0.769，若刪除第4題，信度可提升至0.772，且該題得分與總分的點二系列相關為0.226，相關程度較低，即表示第4題在空間視覺題目中較為異質，故考慮刪除第4題。同時根據23題的探索性因素分析，發現第4題的因素負荷量是0.278（小於0.33），因此決定刪除第4題。

繼續進行第四次內部一致性分析，由表10可得知此時信度是0.772，並未發現較為異質的題目，且每個題目的得分與總分的點二系列相關頗高，這亦是一種鑑別度的展現。但仍須進一步瞭解這些題目是否可確實歸類到適當構面中，以及是否具有足夠的因素負荷量，故進行22題的探索性因素分析，

如表10與表11所示，發現第16題的因素負荷量只有0.264（小於0.33），因此決定刪除第16題。

2.空間定位測驗的內部一致性與探索性因素分析

至此「空間視覺」題目已達純淨化，故接續對「空間定位」題目進行第五次的內部一致性分析，從表12中可發現「空間定位」題目的信度是 0.796，發現若刪除第22題，信度可提升至0.806，檢視該題得分與總分的點二系列相關為0.231，其相關程度較低，表示第22題在空間定位題目中較為異質，故考慮刪除第22題。同時，也進行21題的探索性因素分析，發現第22 題原屬因素二（0.148），但卻落入因素一（0.166），且因素負荷量皆小於 0.33，因此決定刪除第22題。

(17)

表11 第四次探索性因素分析摘要表

測驗題號

因素負荷量

共同性

空間視覺空間定位

5 0.437 -0.006 0.194

6 0.430 0.014 0.180

7 0.403 -0.012 0.167

8 0.503 0.075 0.225

9 0.547 0.014 0.292

10 0.501 -0.039 0.270

11 0.606 0.076 0.332

12 0.539 0.016 0.284

13 0.474 0.048 0.207

14 0.381 0.030 0.136

16 0.264 -0.130 0.117

18 0.415 -0.025 0.182

19 0.344 -0.151 0.188

21 0.250 -0.198 0.146

22 0.168 -0.146 0.072

23 0.244 -0.237 0.167

24 0.001 -0.667 0.445

25 0.019 -0.767 0.601

26 -0.001 -0.745 0.554

27 -0.035 -0.668 0.427

29 -0.017 -0.481 0.224

29 -0.023 -0.666 0.430

可解釋總變異量的百分比 32.534 %

取樣適切性量數(KMO) 0.891

註：此部分為空間能力測驗刪除第1、2、3、4、15、17、20題後的因素分析結果。

(18)

表12 空間定位測驗之內部一致性與探索性因素分析摘要表

分析順序

測驗題號

空間定位的α變化試題得分

與總分相關

因素負荷量

題目

刪題前刪題後取捨

5 22 0.796 0.806 0.231 0.148(0.166) 捨棄

6 21 0.806 0.811 0.294 0.199(0.248) 捨棄

7 23 0.811 0.824 0.288 0.228 捨棄

8 28 0.824 0.828 0.436 0.481 保留

根據篩選後的「空間定位」題目進行第六次內部一致性分析，由表12 可知此時信度是0.806，若刪除第21題，信度可提升至0.811，且該題得分與總分的點二系列相關為0.294，相關程度較低，故考慮刪除第21題，進而由探索性因素分析的結果發現第21題原屬因素二（0.199），但卻落入因素一

（0.248），且因素負荷量皆小於0.33，因此決定刪除第21題。

進行第七次的內部一致性分析，由表12可知此時信度是0.811，若刪除第23題，信度竟可提升至0.824，且該題的鑑別度之反應與總分的點二系列相關為0.288，相關程度較低，亦即鑑別度較差，故考慮刪除第23題；接著，由剩餘19題的探索性因素分析顯示，第23題的因素負荷量僅0.228（小於0.33），因此決定刪除第23題。

進行第八次內部一致性分析，由表12可知「空間定位」題目此時信度是0.824，若刪除第28題，信度可提升至0.828，雖所增加信度並不多，且檢視第28題的題目得分與總分之點二系列相關為0.436，其相關程度頗高，故考慮保留第28題，由探索性因素分析的結果交互進行比對如表12與表13所示，第28題的因素負荷量是0.481（高於0.33），因此決定保留第28題。

綜上所述，於項目分析階段一次刪除4題不佳題目，為第1、3、17與20 題；於內部一致性與因素分析階段則進行七次的篩選，一次刪除一題，共刪除了七題，為第2、4、15、16、21、22及23題。原先29個題目經刪除4題與 7題之後，剩下18題，由最後一次的探索性因素分析結果所示（如表13），

(19)

可知轉軸後之組型負荷量絕對值介於0.332到0.760之間，共同性介於0.131到 0.601之間，解釋量為36.986%，且所有題目皆落入所屬因素上。

表13 第八次探索性因素分析摘要表

測驗題號

因素負荷量

共同性

空間視覺空間定位

5 0.433 -0.022 0.196

6 0.437 -0.003 0.192

7 0.405 -0.025 0.173

8 0.488 0.062 0.217

9 0.548 -0.004 0.302

10 0.492 -0.055 0.267

11 0.610 0.056 0.348

12 0.538 -0.002 0.290

13 0.457 0.034 0.197

14 0.370 0.021 0.131

18 0.408 -0.034 0.179

19 0.332 -0.155 0.177

24 0.015 -0.663 0.448

25 0.036 -0.760 0.601

26 0.016 -0.739 0.556

27 -0.021 -0.663 0.429

28 -0.009 -0.481 0.228

29 -0.007 -0.663 0.436

可解釋總變異量的百分比 36.986 %

取樣適切性量數(KMO) 0.887

註：此部分為空間能力測驗刪除第1、2、3、4、15、16、17、20、21、22、23題後的因素分析結果。

(20)

二、信度分析

計算刪題後的信度，以建模（或探索）樣本（919人）資料進行信度分析，採用Cronbach’s α係數檢驗因素與測驗內容的內部一致性，得到總測驗α 係數為0.819，空間視覺與空間定位題目的α係數分別為0.767，0.824。

表14 空間能力測驗之信度分析（N = 919）

測驗題數 α值

空間視覺 12 0.767

空間定位 6 0.824

空間能力總測驗 18 0.819

在測量模式的建模（或探索）過程中，本研究從空間能力性向測驗正式卷之29題中，刪除了第1、2、3、4、15、16、17、20、21、22與23題，總共11題，篩選後為18題，能以較少的題目獲得較大的解釋量，本測驗之測量模式修正為圖1。

(21)

��

�

^��

��

�

^��

�y51

�5

Y

5

Y

6

Y

7

Y

8

Y

9

Y

10

Y

11

Y

12

Y

13

Y

14

Y

18

Y

19

Y

24

Y

25

Y

26

Y

28

Y

27

Y

29

�6

�7

�8

�9

�10

�11

�12

�13

�14

�18

�19

�24

�25

�26

�₂₇

�₂₈

�29

�1

�2

�21

�y61

�y71

�y81

�y91

�y10 1

�_{y11 1}

�_{y12 1}

�y13 1

�_{y14 1}

�y18 1

�_{y19 1}

�_{y24 2}

�y25 2

�y26 2

�y27 2

�y28 2

�_{y29 2}

圖1 空間能力測驗之測量模式圖

(22)

三、測量模式的適配性評鑑

（一）觀察變項之檢視

首先針對測量模式之觀察變項進行常態分配檢驗。Kline（1998）認為當偏態的絕對值小於3，峰度的絕對值小於10 時，可視為符合常態分配。表 15顯示， 18題（觀察變項）的偏態絕對值介於0.138與1.903之間，峰度絕對值介於0.081與1.985之間，故可知觀察變項資料屬常態分配。

表15 測量模式中觀察變項之峰度與偏態的常態分配考驗表

觀察指標偏態峰度

Y5 -1.115 -0.758

Y6 -1.653 0.736

Y7 -1.892 1.583

Y8 -1.442 0.081

Y9 -0.895 -1.201

Y10 -0.338 -1.890

Y11 -1.281 -0.361

Y12 -1.273 -0.379

Y13 -0.977 -1.047

Y14 -1.231 -0.487

Y18 -1.903 1.626

Y19 -1.039 -0.923

Y24 0.235 -1.949

Y25 -0.468 -1.785

Y26 -0.271 -1.931

Y27 -0.213 -1.959

Y28 -0.138 -1.985

Y29 0.213 -1.959

(23)

由於本研究觀察變項的測量屬性是屬於次序變項，而非連續變項，

因此使用對角線加權最小平方法（DWLS）進行參數的估計及模式適配度考驗，輸入多分差相關係數（polychoric correlation）與漸進共變數矩陣（

asymptotic covariance matrix）。

（二）違犯估計之檢驗

違犯估計之檢驗在於檢視變項間是否具有線性依賴或共線性，因為若某一個變項是其他變項的線性整合時，作反矩陣時可能會出現非正定 (positive definite)的問題（余民寧，2006）。從表16內的數值可知，觀察變項之相關係數絕對值介於0.01與0.83之間，並未大於0.90，故可以研判觀察變項不會產生多元共線性的問題，而進入模式參數檢定。

表16 觀察變項之多分差相關矩陣表（N = 919）

Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 Y14 Y18 Y19 Y24 Y25 Y26 Y27 Y28 Y29 Y5 1

Y6 .40 1 Y7 .32 .53 1 Y8 .27 .41 .38 1 Y9 .37 .37 .45 .40 1 Y10 .32 .39 .38 .43 .52 1 Y11 .24 .48 .37 .34 .53 .47 1 Y12 .35 .43 .42 .44 .50 .49 .62 1 Y13 .24 .27 .26 .23 .35 .32 .33 .30 1 Y14 .27 .27 .24 .15 .39 .39 .41 .36 .36 1 Y18 .22 .23 .22 .28 .32 .29 .37 .28 .26 .41 1 Y19 .30 .23 .17 .26 .25 .30 .34 .36 .37 .36 .53 1 Y24 .27 .34 .21 .18 .28 .37 .25 .25 .31 .33 .29 .33 1 Y25 .30 .31 .16 .12 .25 .38 .25 .29 .26 .30 .22 .31 .76 1 Y26 .30 .29 .17 .18 .27 .35 .31 .20 .26 .29 .25 .28 .71 .83 1 Y27 .17 .21 .06 .20 .01 .30 .15 .11 .18 .14 .19 .29 .51 .62 .64 1 Y28 .07 .19 .07 .08 .04 .15 .13 .11 .11 .12 .11 .15 .49 .52 .46 .57 1 Y29 .25 .18 .06 .15 .19 .21 .17 .16 .20 .18 .16 .25 .54 .64 .61 .60 .57 1

(24)

依據基本適配指標可知，誤差變異數（ε）不可以有負值，且需達顯著 水準。因素負荷量（

�

_y_{）至少必須大於}0.33才具實質意義。若介於0.50到 0.95之間則為理想值，且須達顯著。從表17、表18以及表19 的數據顯示，所有的標準化參數估計值皆小於1，無負值的誤差變異數存在，且所有的參數估計值皆達顯著水準，符合基本適配標準，接著進入模式適配評鑑。

表17 測量模式之潛在變項對觀察變項的參數估計

參數非標準化

參數估計值標準誤 t值標準化

參數估計值

λy51 0.52 0.040 12.97* 0.52

λy61 0.64 0.040 15.97* 0.64

λy71 0.54 0.044 12.33* 0.54

λy81 0.53 0.044 11.97* 0.53

λy91 0.66 0.036 18.22* 0.66

λ_y101 0.70 0.036 19.44* 0.70

λy111 0.70 0.035 19.97* 0.70

λy121 0.70 0.034 20.64* 0.70

λ_y131 0.52 0.044 11.65* 0.52

λy141 0.57 0.042 13.57* 0.57

λy181 0.53 0.045 11.76* 0.53

λy191 0.57 0.043 13.16* 0.57

λy242 0.82 0.028 29.65* 0.82

λy252 0.92 0.019 47.20* 0.92

λy262 0.88 0.021 42.21* 0.88

λ_y272 0.72 0.031 22.98* 0.72

λy282 0.61 0.036 16.85* 0.61

λy292 0.73 0.032 22.99* 0.73

註：*p<0.05

(25)

表18 測量模式之觀察變項的測量誤差

參數非標準化參

數估計值標準誤 t值標準化

參數估計值

ε5 0.73 0.080 9.09* 0.73

ε6 0.60 0.082 7.29* 0.60

ε7 0.70 0.086 8.20* 0.70

ε8 0.72 0.085 8.49* 0.72

ε9 0.56 0.081 6.94* 0.56

ε10 0.51 0.080 6.39* 0.51

ε11 0.51 0.084 6.04* 0.51

ε12 0.52 0.077 6.69* 0.52

ε13 0.73 0.080 9.21* 0.73

ε14 0.68 0.076 8.89* 0.68

ε18 0.72 0.078 9.19* 0.72

ε19 0.68 0.078 8.72* 0.68

ε24 0.33 0.082 4.01* 0.33

ε25 0.15 0.076 2.03* 0.15

ε26 0.22 0.075 2.93* 0.22

ε27 0.48 0.080 6.09* 0.48

ε28 0.63 0.076 8.27* 0.63

ε29 0.47 0.079 5.94* 0.47

註：*p<0.05

(26)

表19 測量模式之潛在變項與潛在變項間的參數估計

參數非標準化參

數估計值標準誤 t值標準化參

數估計值

β21 0.47 0.04 12.04* 0.47

註：*p<0.05

（三）模式適配之評鑑

本研究之測量模式的整體適配評鑑指標包含三類：整體模式適配指標、比較適配指標、精簡適配指標。表20顯示，在「整體適配指標」方面，測量模式的卡方值（

x

²）達顯著，表示資料與模式不適配，但因

x

²^易受

大樣本影響而達顯著，而本研究驗證樣本人數高達919人，故必須進一步檢視其他整體模式適配指標。此測量模式的GFI與AGFI皆大於0.90的門檻，

表示適配程度很好；且SRMR為0.067，小於0.08，RMSEA為0.032，低於 0.05，顯示殘差量低，誤差量也低，故此模式適配度理想。期望交叉驗證指標ECVI是0.36，小於飽和模式ECVI（0.37）與獨立模式ECVI（18.06），即表示同一模式被應用到同一母群體的不同樣本上時，模式的適配仍是理想的。

在「比較適配指標」方面，NNFI、CFI、IFI與RFI等指數需大於0.90才可視為具有理想的適配度，本測量模式中，NNFI（0.99）、CFI（0.99）、

IFI（0.99）與RFI（0.98）皆超過0.90的門檻，即表示此模式適配度理想。

在「精簡適配指標」方面，此模式的PGFI（0.77）高於0.50；理論模式的AIC（331.13），小於飽和模式AIC（342.00）與獨立模式AIC

（16580.47）；以及理論模式的CAIC（546.59），小於飽和模式CAIC（

1337.78）與獨立模式CAIC（16685.29）；同時，NC值是1.92，介於1.0到3.0 之間，係理想的適配值，均表示此模式具精簡的適配程度。若以適當樣本數來看，CN（625.78），高於200的門檻，顯示統計檢定的數值合乎最低樣本數的要求，其結論是可靠的。

(27)

表20 測量模式之整體適配考驗摘要表

適配指標判斷規準測量模式之適配度數據

整體模式適配指標

x² ^不顯著的 257.13（134）（P=0.0）

GFI ＞0.90 0.98

AGFI ＞0.90 0.98

SRMR ＜0.08 0.067

RMSEA ＜0.05 0.032

ECVI ECVI < Saturated ECVI與 Independence ECVI

ECVI（0.36）

Saturated ECVI （0.37）

IndependenceECVI（18.06）

比較適配指標

NNFI ＞0.90 0.99

CFI ＞0.90 0.99

IFI ＞0.90 0.99

RFI ＞0.90 0.98

精簡適配指標

PGFI 較高較好 0.77

AIC Model AIC < Saturated AIC與 Independence AIC

Model AIC（331.13）

Saturated AIC（342.00）

Independence AIC（16580.47）

CAIC Model CAIC < Saturated CAIC 與Independence CAIC

Model CAIC（546.59）

Saturated CAIC（1337.78）

Independ CAIC（16685.29）

CN CN＞200 625.78

NC 1＜NC＜3 1.92

(28)

（四）內在結構適配之評鑑

內在結構適配評鑑主要是對模式的內在品質做檢定，包括觀察變項的信度檢核，可由觀察變項之多元相關係數的R²值來衡量。同時，也需檢定潛在變項的組合信度（

P

c）與變異數的平均解釋量（

P

v），

P

c指標值應大於 0.60以上，

P

v指標值應大於0.50以上。

個別項目信度（R²）值係表示各觀察變項能反應出其潛在變項的信度值。表21顯示，個別項目的信度值介於0.27到0.85之間，此結果符合單一變項信度的要求，顯示所有的觀察變項具有信度。

表21 個別項目信度及潛在變項組合信度、變異數平均解釋量之摘要表

變項個別項目信度值（R²）組合信度（Pc）變異數平均解釋量（Pv）

空間視覺 0.87 0.36

Y5 0.27

Y6 0.40

Y7 0.30

Y8 0.28

Y9 0.44

Y10 0.49

Y11 0.49

Y12 0.48

Y13 0.27

Y14 0.32

Y18 0.28

Y19 0.32

空間定位 0.91 0.62

Y24 0.67

Y25 0.85

Y26 0.78

Y27 0.52

Y28 0.37

Y29 0.53

(29)

潛在變項的組合信度與變異數的平均解釋量也是評鑑測量模式內在品質的重要指標。由表21可知，兩個潛在變項的組合信度值皆大於0.60，表示兩組觀察變項對此兩個潛在變項能夠提供可信賴的建構測量，符合潛在變項的組合信度應達0.60 以上之模式內在結構適配標準。

在變異數的平均解釋量上，表21顯示，「空間定位」的變異數平均解釋量為0.62，高於0.50，顯示潛在變項能解釋到所屬觀察變項的變異量，高於測量誤差解釋到的變異量，符合潛在變項變異數平均解釋量應達0.50 以上之模式內在結構適配標準。但「空間視覺」的變異數平均解釋量是0.36，卻小於0.50，顯示來自於此潛在變項所解釋的變異量較低，故此測量模式之潛在變項（空間視覺），未能符合潛在變項變異數平均解釋量應達0.50 以上之模式內在品質適配標準。

本研究以驗證樣本進行測量模式的適配性檢驗之後，空間能力測驗之標準參數估計模式如圖2所示。

(30)

1.00

��

0.52

0.73

Y

5

Y

6

Y

7

Y

8

Y

9

Y

10

Y

11

Y

12

Y

13

Y

14

Y

18

Y

19

Y

24

Y

25

Y

26

Y

28

Y

27

Y

29 0.60

0.70 0.72 0.56

0.51 0.51 0.52 0.73 0.68 0.72 0.68

0.33 0.15

0.22 0.48 0.63 0.47

0.47 0.64

0.54 0.53 0.66

0.70

0.70 0.70 0.52

0.57 0.53

0.57

0.82 0.92

0.88 0.72 0.61

0.73

圖2 空間能力測驗之標準參數估計模式

(31)

肆、結論與建議

一、結論

本研究之主要結論分由下列四項闡釋之：

（一）空間能力測驗的試題品質

本研究以空間能力測驗之建模（或探索）樣本進行測驗試題的評估，

由原正式卷中的29題刪除11題，其中包括7題空間視覺試題，有3題因鑑別度較低、有4題較為異質且效度不佳；在4題空間定位試題中，有1題是鑑別度較低、有3題則較為異質且效度不佳。

最後建議保留的18題（以下簡稱建議版），測量模式優良，其外在品質（整體模式適配考驗）相當理想，但在內在品質（內在結構適配考驗）

中，「空間視覺」的變異數平均解釋量只有0.36，但其個別觀察變項（試題）的因素負荷量皆顯著，組合信度也達0.60標準，仍可以做出潛在變項的聚合效度是適當的結論（引自黃芳銘，2004），因此本測驗的「空間視覺」

仍具有建構效度。

建議版的測驗內部一致性Cronbach’s α係數為0.819，其中12題空間視覺 題目的內部一致性Cronbach’s α係數是0.767，6題空間定位題目的內部一致性 Cronbach’s α係數是0.824，建議版的測量模式與試題具有良好的信度。

建議版的效度分析方面，經由探索性因素分析，抽得兩個因素，經由檢視原試題設計的構面，確定最後所保留的18題試題所歸屬的構面未變動，

仍分別命名為空間視覺與空間定位兩個構面。轉軸後之組型負荷量絕對值介於0.332到0.760之間，共同性介於0.131到0.601之間，兩個因素共可解釋總變異量的36.986%。

綜合上述試題品質的分析結果可知，建議版的18題空間能力測驗品質良好，且相對於正式卷的29題而言，建議版能以較少的題目，獲得更大的解釋量，亦即能在更短的測驗時間內，獲得更精確的測量結果。

（二）空間能力測驗之測量模式驗證

本研究所提出的建議版之測量模式，另以驗證樣本進行測量模式的評

(32)

鑑，結果在「基本適配考驗」上，所有的標準化參數估計值皆小於1，無負值的誤差變異數存在，因素負荷量均介於0.50到0.95之間，且所有的參數估計值皆達顯著水準，符合基本適配標準。

在「整體模式適配考驗」上，檢驗整體適配指標的GFI、AGFI、

SRMR、RMSEA與ECVI，比較適配指標的NNFI、CFI、IFI與RFI，以及精簡適配指標的PGFI、AIC、CAIC、NC與CN等整體適配評鑑指標，皆顯示了此測量模式係可以適配的。因此，建議版之測量模式的「整體模式適配考驗」皆合乎評鑑標準，測驗的外在品質相當理想。

在「內在結構適配考驗」上，此測量模式所要估計的參數全部達顯著水準，符合內在結構適配標準；就個別項目信度、組合信度與變異數平均解釋量而言，僅「空間視覺」的變異數平均解釋量未達0.50 的標準。除此之外，其餘的內在結構評鑑都合乎標準。因此，可知此測量模式的內在品質雖然不如外在品質那麼理想，但仍能大致符合模式內在結構的標準。

綜上而述，本研究進行空間能力測驗之測量模式驗證，經基本適配考驗、整體模式適配考驗、內在結構適配考驗等歷程，此測量模式皆能夠獲得研究結果的支持；也就是說，此測量模式與觀察資料是適配的。

（三）空間能力測驗的因素結構

本測驗原以三因素、七種題型為命題基礎，歷經初試與預試的編修，

形成二因素、六種題型的29題正式卷定案，並建立常模。本研究利用常模樣本資料，進一步探究試題品質與因素結構，發現仍有11題品質較不佳而予以刪除外，其餘試題品質良好，且因素結構穩定，並且刪題之後整體信度反而提升。本測驗原嘗試綜合Lohman的空間視覺與空間定位構面，以及Linn and Petersen的空間知覺構面，然最後空間知覺試題被刪除，形成本測驗最後以 Lohman的二因素為主的局面。

（四）空間能力測驗的試題編製與測驗對象

檢視所刪除之試題，大概都是試題難度不佳（試題過於簡單）或鑑別度不佳，也有「空間知覺」整個題型被刪除的情形，表示幾乎都是簡單的題目被刪除（空間知覺的定義和試題也是偏簡單的）。這個結果除顯示試題之

(33)

編製不易，對於各因素定義之掌握有待加強；但由於本測驗對象是高一學生，對現階段常接觸電腦動畫相關媒體的青少年而言，他們的空間能力也許超乎過去的研究文獻結論所能推論，也進一步顯示空間能力的理論與相關測驗需要更新。

二、建議

根據所獲致的研究結論，本研究針對未來的測驗編製歷程與後續測驗的效標關聯效度考驗提出下列建議。

（一）空間能力測驗的編製歷程

檢視大考中心發展空間能力測驗的歷程，主要係根據古典測驗理論的項目分析，針對初試與預試樣本資料，檢驗試題難度、鑑別度與內部一致性分析，立場保守而穩健，試題與測驗構面的保留或刪除都能在掌控之中。

但有鑑於全國性的大量施測、取得樣本資料之不易，本研究試圖挑戰更具建議性的效度分析，進一步檢驗此測驗試題與構面，以為將來測驗編修方向的建議。

本研究的分析、檢驗歷程表示測驗的編製應考量測驗試題的評鑑結果，除項目分析與內部一致性分析外，尚可包括探索性因素分析與驗證性因素分析，藉以篩選出較為異質的題目，以提高測驗的鑑別度、信度，以及確認因素結構等測驗品質的要求。

本研究前已經由文獻評閱，發現空間能力的意涵尚無定論，學者們對於空間構面之範疇的界定並非一致，更增加空間能力測驗試題編製的困難度。異言之，由於空間構面的範疇並不明確，題型的選擇不易，大考中心仍勇於挑戰三因素、七種題型的空間試題編製，已屬創舉。然若能繼續審慎進行各種考驗，不但更能提高測驗品質與應用價值，也能提升吾人對於空間能力與理論之瞭解。本研究也建議空間能力測驗應持續發展題目，增加試題類型，並建立題庫，以資後續相關空間能力測驗的研發與使用。

（二）空間能力測驗的效標關聯效度

其實完全以量化資料為考量的建議版，也有部分問題，即在空間定位

(34)

題型中僅剩「迷津」題型，形成以單一題型（迷津）作為空間定位的評量。

至於「空間知覺」題型（圖形辨識）則早在組正式卷時，已將整個題型刪除，「空間知覺」構面消失，最後形成二因素、六種題型的測驗結構，是否還能測量到所欲測量的能力，則若不經效標關聯效度的考驗，則無由得知，

這將是未來研究的重點。

尤其空間能力的意涵言人人殊，學者們對於空間構面之範疇的界定又不明確，空間能力也是影響數學、科學、化學、天文、資訊、音樂、體育等職業、學習及表現的重要因素，故未來應建立空間能力測驗之效標關聯效度的證據，以瞭解測驗分數與外在效標的關係。另外，由於本測驗欲作為協助高一學生進行選組科系的參考依據，若能建立後續的追蹤資料，包含同時效度與預測效度方面的考驗，將有助於空間理論的進展與實務應用的價值。

參考文獻

左台益、梁勇能（2001）。國二學生空間能力與van Hiele幾何思考層次相關性研究。師大學報：科學教育類，46（1、2）, 1-19。

余民寧（2006）。潛在變項模式：SIMPLIS的應用。台北：高等教育。

吳文如（2003）。國中生空間能力與數學成就相關因素之研究。國立台北師範學院

數理教育研究所碩士論文，未出版，台北。

吳明郁（2003）。國小四年級學童空間能力學習的研究：以立體幾何展開圖為例。

國立台北師範學院數理教育研究所碩士論文，未出版，台北。

何榮桂、簡茂發、鄭海蓮、區雅倫、卓沛勳、蕭孟莛、陳世玉（2007）。空間

性向測驗（二）（以空間關係和推理能力為主）結案報告。（計畫編號：

研-95-007）。台北市：大學入學考試中心。

康鳳梅、鍾瑞國、劉俊祥、李金泉（2002）。高職機械製圖科學生空間能力差異之

研究。師大學報：科學教育類，47（1）, 55-69。

張春興（1996）。教育心理學：三化取向的理論與實踐。台北：東華。

陸偉明（1999）。空間能力測量之效度分析。中國測驗學會測驗年刊，46（2）, 101-111。

黃芳銘（2004）。社會科學統計方法學：結構方程模式。台北：五南。

(35)

廖焜熙（1999）。有機立體化學成就影響因素及解題模式之研究。國立臺灣師範大學科學教育研究所博士論文，未出版，台北。

廖焜熙、邱美虹（1999）。有機立體化學學習成就影響因素研究。中華民國第二

屆化學教育學術研討會會議手冊（Proceedings of 2nd Conference for Chemical Education），41-48。

劉俊祥（1999）。機械製圖科學生空間能力與立體圖成就表現之相關研究。國立臺

灣師範大學工業教育研究所碩士論文，未出版，台北。

蔣家唐（1 9 9 5 ）。視覺空間認知能力向度分析暨數理 — 語文資優學生視覺空間認知能力差異研究。國科會補助研究論文(NSC83-0111-S018-019、

NSC84-2511-S-018-003），未出版。

襲充文（1994）。三度空間表徵動態與鑑別動態空間能力（Ⅰ）。行政院國家科學

委員會專題研究計畫成果報告（計畫編號NSC83-0111-S-194-002），未出版。

襲充文、李明燕、吳家怡、朱惠文、區雅倫（2003）。空間推理能力測驗研究第一

期計畫研究報告（計畫編號：研-91-028）。台北市：大學入學考試中心。

Kline, R. B. (1998). Principles and practice of structural equation modeling. New York:

The Guiford Presws.

Linn, M. C., & Petersen, A. C. (1985). Emergence and characterization of sex differences in spatial ability: a meta-analysis. Child development, 56(6), 1479-1498.

Lohman, D. F. (1979). Spatial ability: individual differences in speed and level. Stanford, CA: Stanford University.

Lohman, D. F. (1988). Spatial abilities as traits, processes, and knowledge. In R. J.

Sternberg’s (Ed.), Advances in the psychology of human intelligence, 181-248.

Hillsdale, NJ: Lawrence Erlbaum Associates.

McGee, M. G. (1979). Human spatial abilities: Psychometric studies and environmental, genetic, hormonal, and neurological influences. Psychological Bulletin, 86(5), 889~918.

Smith, G. G., & Olkun, S. (2005). Why Interactivity Works: Interactive Priming of Mental Rotation. Journal of educational computing research, 32(2), 93-111.

(36)

標準化空間能力測驗之建模與驗證