• 沒有找到結果。

第三章 研究方法

第一節 分析向度架構

本研究採用內容分析法,分析近年來師範院校科學教育相關系所之量 化碩士論文,統計論文研究工具發展狀況、研究工具信效度檢驗方式及統 計考驗方式的數量狀況,並探討量化科學教育碩士論文易犯之缺失。內容 分析雖是一種量化的過程,但並不表示是一種純粹的「量的分析」,它是 以傳播內容「量」的變化來推論「質」的變化,因此是一種「質」「量」

並重的的研究方法(歐用生,1993)。林瑞榮(1999)與王文科(2002)

都曾提到內容分析是一種特別適合分析長期趨勢的方式。

本研究試圖將 2001 年至 2003 年台灣地區師範院校之量化科學教育碩 士論文一一回顧,期將研究工具發展方式、研究工具信效度檢驗方式與統 計考驗方式加以區分而統計其數量,並組織、歸納研究結果;用以分析並 尋找出量化科學教育研究之趨向。而根據本研究之目的四,本研究試圖分 析並歸納量化科學教育研究可能出現的缺失,試圖提出建議與啟示為科學 教育之研究發展略盡心力。

本章分為以下四節:一、分析向度架構。二、樣本選擇與方法。三、

研究工具。四、資料處理方法。分別呈現本研究方法之內容。

第一節 分析向度架構

研究分析向度部分,首要在於分析類目的設定,分析類目係指內容歸 類的標準。其建構原則通常需具備下列特質:1.符合研究目的;2.反應研 究問題;3.窮盡全部範圍;4.類目間互斥;5.類目彼此獨立;6.單一分類 原則;7.功能性;8.可操縱性;9.合乎信效度(王石蕃,1993)。本研究 之量化學位論文內容分析分為五大向度:研究工具發展方式、研究工具信 度檢驗方式、研究工具效度檢驗方式、統計考驗方式與量化研究的可能缺 失。茲將本研究之分析向度圖示如下:

2001 至 2003 年師範院校 research)、或相關研究(correlational research)進行研究時,研究 工具都是不可或缺的。本研究的第一個分析向度即是對所分析的量化科學

(二) 修改他人研究工具。

在本研究中所指的是,所分析之論文作者宣稱為「大部分參考某某」

或是「修改自某某」所發展而成的研究工具。其修改他人已編製的成分較 多,自行發展的成分較少。

(三) 沿用他人研究工具不加修改。

在本研究中所指的是,所分析之論文作者宣稱為「引用某某」或是「採 用某某」已經發展完成的研究工具。此類方式即是對研究工具的內容不加 修改,而直接予以套用。

本研究以上述三類向度來進行數量統計,並檢核是否有進行相關信、

效度考驗以了解近年來量化科學教育研究之研究工具發展狀況。

二、研究工具信度檢驗方式之類型:

一種測驗工具的信度,即在於不論在什麼時候測量,所得結果前後的 一致性程度;此種品質在任何一種測量中,均具有重要性(王文科,2002)。 研究工具的信度係數越高,研究工具所測驗的誤差便會越低。本研究的第 二個分析向度即是對所分析的量化科學教育碩士論文其研究工具的信度 檢驗方式來進行數量統計,以了解近年來量化科學教育研究之研究工具的 信度檢驗狀況。分別扼要說明如下:

1.再測信度(test-retest reliability):

即對同意組受試者在兩個不同時間測得的分數後,求其相關,藉此種 程序求得的相關係數,謂之再測信度係數(test-retest reliability coefficient)(vockell,1983)。

2.複本信度(equivalent-forms reliability):

把同一測驗的甲式對某組施測,然後把同一組測驗的乙式對同一組測 試。兩次的得分相關係數高,表示受試者在兩種測驗的表現相同;亦即測 驗的樣式如是相等的,即是一致的表徵(vockell,1983)。

3.再測與複本信度(test-retest wish equivalent forms reliability):

把同一測驗的甲式對某團體施測,過些時間,再把同一測驗的乙式對 該團體測試之。側得之相關係數若高,即表示該測驗甲乙兩式均極穩定測 得某些特徵。此種技術即是結合前述兩種方式而得(vockell,1983)。

4.折半信度(split-half reliability):

折半信度係指將測驗對一組受試者施測,然後把題目分成兩半計分,

依每個人在兩半所得的分數,算出相關係數即為折半信度。若每個受試者 在兩半上的得分,極為相似,則該測驗的信度高,反之則低(vockell,

1983)。

5.庫李信度(Kuder-Richardson reliability):

如果顧及測驗的完整性,或因折半計分有所不便,而不採用折半法 時,則可改用庫李公式計算測量題目的內部一致性,作為信度的指標。庫 李公式有兩種,分別是 K-R 20 與 K-R 21,前一個公式計算的結果較精 確,後一個公式的計算程序則較為簡便(郭生玉,1996)。

6.α係數(Cronbach α):

庫李公式適用於答題有對錯性質之測驗,但一般態度或意見量表均無 對或錯的答案,故不適用。在此情況下,可採用史丹福大學(Stanford University)柯隆巴克(Lee J. Cronbach)教授所發展的α係數,依一定公 式估量測驗的內部一致性,作為信度的指標(郭生玉,1996)。

7.評分者間信度(interscorer reliablity):

王文科(2002)說明此種方式是將相同測驗交予不同兩人以上評分,

再將兩項分數進行比較。如果相關係數高,表示眾人對該測驗的評定分數 類似。但是如有差異,其原因不在於受試者真正的差異,而是眾人的記分 方式有所出入。

8.其它信度檢驗方式:

無法歸類於上述 1 至 7 種方式者,則列名其信度檢驗方式歸為其它信 度檢驗方式,並進行數量統計。

三、研究工具效度檢驗方式之類型:

效度係指一種測量技術是否能真正測量它所要測量的問題,而為達成 研究目的設計與實施任何研究工具的測量時,效度最為重要。(王文科,

2002)。習慣上,測量學者常將「效度」分為三類,即:內容效度(content validity)、構念效度(construct validity)、與效標關聯效度(criterion related validity)。美國心理學會(American Psychological Association) 於 1985 年修訂出版的「教育與心理測驗標準」(Standards for Educational and Psychological Testing) 中 , 一 反 傳 統 的 觀 點 , 而 以 效 度 證 據 (evidences of validity)來代替效度的分類。換言之,如欲確定測量工 具的效度,那就必須蒐集足以說明效度的證據(即資料)。因此,郭生玉

(1996)的研究指出:習慣上稱為內容效度者,宜改稱為「內容關聯的效 度證據」(content-related evidence of validity),而構念效度及效標 關聯效度兩者,亦宜改稱為「構念關聯的效度證據」與「效標關聯的效度 證據」。以下即以本研究判定效度檢驗方式的性質與蒐集方法加以說明:

1.內容關聯的效度證據:

這一類效度證據係從測量工具的內容來檢查,看看是否符合測量目標 所預期的內容。若是請學者專家檢視稱為專家效度而自行檢視則稱為表面 效度。譬如說,一個學科成就測驗的預期內容是一學期的教材,但測驗題 目所涵蓋的範圍卻只有第一課至第五課,其餘十五課的教材在測驗題目中 都付之闕如。這樣的測驗顯然缺乏效度,因為測量的內容未盡周延完整,

故測量的結果無法有效推論全學期的學習成就。

2.構念關聯的效度證據:

一般而言,構念(construct)是一種假設性的實體,是學者或研究者 基於學術的目的,為說明一個假設存在的屬性或特徵,而精心創造或借用 的名稱。譬如「智力」、「焦慮」、「動機」等都是心理學的構念;而「地心 引力」則是物理學的構念。因此,構念可視同一般概念,但卻是抽象的、

假設性的存在,無法直接觀察或測量,而必須藉間接的指標來推論。譬如

上述「地心引力」是由蘋果(或其他物體)落地的現象推論其存在;而「智 力」則藉個體的學習行為與表現來推論其存在。

通常,學者提出一個「構念」時,都有一套相關的理論或原理來支持,

因此,如果我們研究的變項或特徵是一個構念,則在應用測量時,須將測 量的內涵與結果,與此一構念的相關理論及其衍生的現象相比較,藉以推 論測量結果能否適切有效的解釋此一構念的性質與特徵。譬如,針對「智 力」這個構念進行測量時,因智力理論提示智力隨年齡而發展的原則,故 智力測量的結果應顯示測量分數隨年齡遞增的現象,始符合智力的理論。

唯其如此,才能確定此一智力測驗適切有效。換言之,欲從構念的分析來 考驗測量工具的效度時,須以相關的理論為分析檢驗的架構和依據。本研 究對於構念關聯效度證據的認定,以是否對研究工具使用「因素分析法」

進行分析為主。

3.效標關聯的效度證據:

此類效度證據之蒐集係以其他測量為標準(習稱效標),將測量結果 與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。如果 這種比較係以受試者受測一段期間後的實際行為表現為效標,則稱為「預 測性效度證據」(predictive evidence of validity);如果以受測時的 其他資料(含測驗)為效標,則稱為「同時性效度證據」(concurrent evidence of validity)。舉例來說,對一群兒童實施創造力測驗,測定 每名兒童創造力的高低,經過一段期間(也許是幾個月,甚至是好幾年),

看看這些受試的兒童有何具體的創造性行為表現。如果兒童的測驗分數與 創造行為表現有密切相關,顯示測驗結果足以預測創造行為,因此效度 高;若測驗分數與創造行為毫不相關或相關很小,那麼效度就低。這樣的 資料就是「預測性效度證據」。至於「同時性效度證據」,通常係以受試兒 童的其他測驗分數、學業成績、教師評定等當前資料為效標。譬如編製一 份學業成就測驗後,將測驗結果與受試者當時之學業成績來比較,求得兩 者的相關,即為「同時性效度證據」。若相關程度高,當然成就測驗結果

的推論就適切有效。

4.其他效度證據:

無法歸類於上述 1 至 3 種方式者,則列名其效度檢驗方式歸為其他效

無法歸類於上述 1 至 3 種方式者,則列名其效度檢驗方式歸為其他效