• 沒有找到結果。

第三章 研究方法

第四節 量化取向--調查法

根據研究目的以及研究問題,期望發展我過社會學科碩士研究生之研究準備 度評量,並檢驗其信度與效度分別如何,本研究主要採取量化取向的調查法,透 過網路管道發放線上版研究準備度評量以及填答感受意見調查問卷,蒐集受試者 測驗資料,以利進行研究準備度評量的適切性分析,所採用之研究工具即為本研 究發展之研究準備度評量,進行量化取向研究主要可分為評量編製、測驗實施與 資料分析三個階段。以下分別詳述。

一、 研究準備度評量的標準編製程序

陳柏熹(2011)認為生活中現存的各類社會學科測量工具,不論以考試、量 表、或檢核表等形式呈現,其本質皆相同,皆為潛在特質的測量亦即心理測驗;

葛樹人(2001)彙整國內外心理學者對心理測驗定義,發現學者們皆認為「心理 測驗是一種行為取樣的程序和工具,通常具有客觀化、系統化、計量化和標準化

合併為「研究基本概念」

之特徵」,心理測驗定義之涵蓋範圍廣泛,其中在教學過程中使用的測驗習慣上 也稱作評量,若依據在教學過程中不同階段使用的情形來進行評量的分類,共可 分為五類,包含準備度評量、安置性評量、形成性評量、診斷式評量和總結式評 量,依照測驗欲預測量的潛在特質來分類,可分為能力類型測驗和性格類型測驗 兩種,不同類型之測驗應採用不同量表類型進行施測,將欲測驗的潛在特質,透 過標準化之量表轉換方式進行計量統計(陳柏熹,2011),由上述可知本研究欲 發展之研究準備度評量也屬於心理測驗的範疇之中,因此應採用標準化測驗編製 方式進行研究準備度評量發展。

標準且有系統的編製過程是控制評量工具品質的重要關鍵,陳柏熹(2011)

綜合各類型測驗編製程序提出之測驗標準編製流程,共包含「決定評量目標」、「規 劃雙向細目表」、「選擇適當題型」、「編製題目」、「審查修改題目」、「預試實施」、

「試題分析」、「建立題庫」、「組合題本」等個步驟。本研究以陳柏熹(2011)提 出之測驗標準編製流程為依據,依照本研究準備度評量編制與測驗實施情形進行 調整,擬定研究準備度評量標準編製程序(如圖 3-4 所示)。首先要決定明確的 評量目標,依照評量目標考慮欲評量之內容、題數、施測環境、受測對象等因素,

進行雙向細目表之規劃,並選擇合適題型後,依照雙向細目表之規劃進行試題編 製,接著進入審查與修改步驟,修改與審查階段是針對試題的內容由編製者反覆 檢視,並邀請測驗及學科專家進行審查,提出修改意見後進行題目的修改,目的 在完成預試評量卷以作為預試實施階段之研究工具,而預試實施之目的在於針對 試題的品質提供客觀的量化資料,幫助檢視試題是否適切,以利再次進行評量試 題內容之修正及調整,最後一個步驟則視測驗性質與規模而有所不同,若屬於規 模較大之正式測驗,如全國學力測驗、全民英語檢定考試等,則應建立題庫,若 屬於一般測驗可省略建立題庫之步驟,直接形成正式評量題本,根據本研究發展 之研究準備度評量之規模與性質,以及研究範圍之限制,較適合採試題分析後直 接形成碩士研究生之研究準備度評量。

圖 3- 4 測驗編製標準流程

二、 研究測驗樣本選取與施測方式

本研究測驗實施,將上一階段編製之我國社會學科碩士研究生研究準備度評 量對本研究樣本進行施測,根據研究目的在探究研究生進行研究時應具備之準備 度為何,因此本研究所探討之研究母群為修習社會學科碩士學位研究所,並預備 獨立進行學術研究及論文撰寫之學生,包含各年級碩士學生以及碩士在職專班學 生,依照教育部統計處公告 101 學年度統計就讀社會學科碩士生人數共有 59,370 人(教育部統計處,2012b)。本研究正式研究測驗實施的目的,是期望透過較大 量且可以反映出母群體特性的豐富樣本,來檢視研究準備度評量工具的適切性,

因此,本研究採分層抽樣方式,依照社會學科中六大學門碩士研究生人數建立抽 樣架構,目標抽樣人數 150 人,如表 3- 4。

評量目標與內容確立

雙向細目表規劃

評量格式選擇

試題編製

審查修改試題

預試實施與試題分析篩選

表 3- 4 正式研究測驗抽樣架構

六大學門 研究生人數 (比例) 目標抽樣人數 (比例) 民生 5090 (0.09) 13 (0.09) 法律 5651 (0.10) 14 (0.10) 社會及行為科學 13211 (0.22) 33 (0.22) 社會服務 1976 (0.03) 5 (0.03) 商業及管理 30468 (0.51) 77 (0.51) 傳播 2974 (0.05) 8 (0.05) 總計 59370 (1.00) 150 (1.00)

資料來源:整理自教育部統計處(2012b)。大專校院各校科系別學生數。2013 年 11 月 7 日,檢 自:https://stats.moe.gov.tw/files/detail/101/101_students.xls

施測方式因應數位時代趨勢,且考量本研究人力、時間與成本限制,線上評 量之優點在於受試者填答較不受時空限制,可在較短時間內獲取豐富樣本,因此 本研究採線上評量方式進行正式測驗實施,線上評量選擇 SurveyMonkey 平台,

因為其試題版面配置清晰,且具有網路安全加密機制 (SSL/HTTPS 協定),能保 護試題安全,減少試題不當外流之疑慮,同時該測驗平台記錄受試者填答時間、

填答 IP 位址,避免有受試者重複作答而影響評量分析結果。

三、 評量適切性分析

本研究透過網際網路作進行測驗實施,測驗結束後將線上測驗平台紀錄之原 始資料以 Excel 試算表格式匯出,採用 Microsoft Excel 2010 資料處理軟體進行 原始資料保存、編碼等工作,接著以 IBM SPSS Statistics 19 統計軟體為主要資料 分析工具,採用必要的統計方式,進行評量之試題分析、信度與效度效度等工作。

試題分析目的在於檢視整體評量是否具有鑑別度,其難易度是否適當,是判 斷試題品質的重要依據,同時也可做為評量信度與效度之佐證,信度與效度的檢 測是為了提供評量具有可行性的證據,信度代表評量工具具有可靠性、穩定性與 一致性,意指當在同樣或相似的條件之下使用評量工具測量的結果是可以重複或 再次發生的;而效度則是代表評量工具的真實性,指的評量中研究者所欲測量的 構念與實際可測量出的狀況契合度,Neuman (2000/2002)認為信度與效度無法達 到完美,而是研究者致力達到的理想,本研究期望透過信度與效度的分析作為量

表工具改進的指引,而信度與效度的評估方法甚多,研究者依照研究需求與限制 選擇合適的信效度評估方式,將本研究具體採取的分析項目,包含試題難易度與 鑑別度分析、內部一致性信度分析、表面效度、內容效度與建構效度分析,將分 析檢測方法與標準分別說明如下。

試題難易度與鑑別度分析

本研究發展之評量試題屬於二元計分題,試題難易度以該題的答對率來表示,

計算方法為答對該題的人數除以總受測人數,根據陳柏熹(2011)提出的測驗難 易度指標,可依照各個試題的答對率將之分為困難題、中等難度題或容易題三種,

而一份理想的評量應包含各種不同難易度的題目,才能對不同能力的受試者發揮 測量功能,題數比例建議困難、中等與容易試題分別為 25%、50%、25%為佳。

試題鑑別度是指題目是否能有效區分不同能力高低者,檢測方法為求出評量 極端組樣本在每個題項平均分數的分的差異,極端組樣本選取通常取成績於前後 33%至 25%者(吳明隆、涂金堂,2005),由於本研究樣本數較少,因此極端組 取成績於前後 25%之樣本,計算方式以評量總得分的高分組和低分組在每一題得 分的平均數相減,所得數值即為其鑑別度,根據陳柏熹(2011)整理各家學者提 出的鑑別度指數判斷標準,通常鑑別度 0.2 以下代表題目不佳,很可能需要修改;

0.2 以上未達.03 表示試題尚可;0.3 以上未達 0.4,表示試題優良可用;而 0.4 以 上表示試題非常優良試題。

內部一致性信度分析

內部一致性是指同一份評量中所有試題的相關程度,本研究發展研究準備度 評量工具,因此評量中的試題都應具備檢測研究準備度相關知識技能之潛在特質,

若本評量內部一致性越高,則表示各試題所具備的潛在特質一致,也符合當初設 計評量的目的,測驗內部一致性指標有很多種,常見的有採折半法和Cronbach’s α 係數作為計算其內部一致性的方法,通常兩者所算出的信對質會十分相似,可 相互作為驗證,判定量表內部一致性之優劣標準(陳柏熹,2011),因此本研究 採取兩種檢驗方法同時進行,以折半信度與Cronbach’s α 係數作為交互參考。

折半信度之實施方法是將一分測驗分為兩個分測驗(奇數題一組、偶數題一 組),分別計算受測群體在這兩分半測驗中的得分,接著再求出兩組半測驗分數 的積差相關係數,但由於此積差相關的題數僅為原來的一半,因此還要再根據史 比校正(Spearman-Brown)公式,來計算原測驗題數的信度;Cronbach’s α 係數是 考量所有題目彼此間之相關係數,實施方法為計算所有題目兩兩間的相關係數,

算出其平均值,再根據史比校正(Spearman-Brown)公式,來計算原測驗題數的信 度,DeVellis (1991/1999)認為 α 係數如果在 0.60 至 0.65 之間為不佳,係數值介 於 0.65 至 0.70 間為可接受,係數值介於 0.70 至 0.80 之間為相當好;係數值介於 0.80 至 0.90 之間非常好。

表面效度、內容效度與建構效度分析

效度的類型有很多,依照其代表的意義和應用情形而有所不同,常見的有四 種,包含表面效度、內容效度、效標效度(陳柏熹,2011)。由於效度的類型有 很多,依照其代表的意義和應用情形而有所不同,其中表面效度是最基本的效度,

效度的類型有很多,依照其代表的意義和應用情形而有所不同,常見的有四 種,包含表面效度、內容效度、效標效度(陳柏熹,2011)。由於效度的類型有 很多,依照其代表的意義和應用情形而有所不同,其中表面效度是最基本的效度,