• 沒有找到結果。

第三章 研究方法

第四節 研究工具

壹、 兒童語料庫

本研究使用之文本資料來源為廖晨惠(2010)國科會「閱讀研究議題八:以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置」計畫(編號:

100-2420-H-142-001-MY3)所建置的國小語料庫,挑選國小一至六年級課文中國

3 (A) (Vi)(N)(T)

此系統採用機率式無語境規律的模型(Probabilistic Context-free Grammar)為 基本剖析架構並加入結構中詞彙搭配關係機率解決結構歧義。在結構決定之後,

估的方法,從無數的剖析歧義結構中找到最佳結構。

1. 中心語主導原則

中文句子的語法結構常常有歧義的現象。如果只是表達詞和詞的語法結構,不 足以解決中文這種相當程度的歧義現象。因此為了解決這種歧義性,採取中心語 主導原則 ( Head-Driven Principle )。中心語主導原則是指每一個句子或詞組結構 皆有一中心語(Head),詞組結構由中心語及論元(argument)或附加成分(adjunct) 組成,並由中心語決定詞組的詞類,例如:句子(S)和述詞詞組(VP)的中心語 皆為述詞(V);名詞詞組(NP)的中心語為名詞(N);介詞詞組(PP)的中心 語為介詞(P);方位詞詞組(GP)的中心語為方位詞(Ng);對等連接詞的中心 語為連接詞(C)。在剖析中文句子的時候,藉由中心語指導原則,不但可以決定 每一個中心語的詞組類型,並且利用中心語和其他成分所記載的語法和語意訊 息,將句子中詞和詞之間的語法和語意的限制關係清楚的表達出來。

2. 詞組結構:

S:表示結構樹為句子(S);以述詞為中心語;此外當主詞和述詞的賓語或 補語的型式為句子或子句的時候,詞組結構標記為 S,不為 NP。

VP:述詞詞組;中心語為述詞(V)。 NP:名詞詞組;中心語為名詞(N)。

GP:方位詞詞組;中心語為方位詞(Ng);所帶論元角色為 DUMMY。

PP:介詞詞組;中心語為介詞(P);所帶論元角色亦為 DUMMY。

XP:連接詞詞組;中心語為連接詞(C);X 代表一個變數,XP 的真正詞類由連 接成分決定,例如:連接成分為述詞詞組(VP),則為述詞詞組(VP),連接成 分為名詞詞組,則為名詞詞組(NP)。DM:定量詞詞組(陳鳳儀、蔡碧芳、陳克 健、黃居仁,1999)。

肆、 中高年級閱讀文本理解測驗

本測驗題本 24 篇主要由郭伯臣、廖晨惠、楊裕貿、陳文蘭、陳建宏、蔡筱倩、

蔡亞韋、黃勇媜、倪雅真、張琇涵等 10 人所編製而成並結合「中高年級文本理 解測驗」之八篇文章,詳細內容參閱「中高年級文本理解測驗技術報告」(郭伯 臣等,2013)及碩士論文「兒童文本詞類指標分析系統建置與應用」(陳建宏,

2013),共 32 篇。測驗模仿 PIRLS 的閱讀理解層次而命題,相關概況如下所述:

一、文本的選擇:本測驗文本選擇取材自民國 78 年國立編譯館之國語科四、

六年級教科書,根據文本指標計算出結果,按照年級、文章長短及文體等選 出文章,其中四年級記敘文 13 篇與非記敘文 3 篇、六年級記敘文與非記敘文 各占 8 篇是 16 篇,總共 32 篇文章。

二、試題的編製:本研究之測驗題本依照國際閱讀素養研究 PIRLS 中四項閱讀 理解層次所編製,包含:提取訊息、推論分析、詮釋整合以及比較評估。

測驗題本總共 32 篇 192 題,組卷成 A、B、C、D 四份題本來進行施測,每 一份題本各有四年級文章四篇、六年級的記敘文及非記敘文各兩篇共八 篇,文章的題目依照四項閱讀理解層次的順序由易到難編排,為四選 一的單選題,預試試題類型、題數分布及信度分析如表 3-4 所示。

表 3-4

預試題本各層次的題數及信度

直接提取 直接推論 詮釋整合 比較評估 總題數 信度 題本 A 16 13 11 8 48 0.878 題本 B 16 14 10 8 48 0.892 題本 C 15 14 11 8 48 0.839 題本 D 16 15 9 8 48 0.818

合計 63 56 41 32 192

三、正式題本的編制:本測驗經預試後,以 Tester 3.0 分析其難度和鑑別度,通 過率超過 90%的題目及鑑別度低於 0.2 的題目進行刪題或修題,參考每一題 作答選項的百分比,對於沒有誘答力的選項進行修改,讓試題達到更完善,

正式施測試題類型、題數分布及信度分析如表 3-5 所示,正式施測後以 IRT 單參進行分析發現有 3 題不良試題,刪除這三題,總題數為 189 題。

表 3-5

正式施測題本各層次的題數及信度

直接提取 直接推論 詮釋整合 比較評估 總題數 信度 題本 A 15 13 11 7 46 0.819 題本 B 15 13 11 8 47 0.853 題本 C 15 14 11 8 48 0.850 題本 D 16 15 9 8 48 0.897

合計 61 55 42 31 189

四、效度與信度分析:評量工具是否優良適當,可透過信度與效度的檢驗,作為 改善修正的依據。本測驗題本採專家效度,邀請三位臺中教育大學教授、八 位平均年資達10年以上現職國小教師及一位研究生共同編審,具有良好的內 容效度。本測驗各題本預試信度係數Cronbach α值均達 0.8以上,正式施測 刪除3題不良試題後,其信度也達0.8以上,表示信度高,具有穩定性及一致 性的特性。

五、試題分析:信度與效度是偵測試題品質優劣的二項重要特徵,而試題可藉由 分析而提高品質。本測驗依「古典測驗理論」以及「 Rasch Model」兩種方 式來做試題分析,依這兩種測驗理論所得的測驗通過率分析探討指標文本分 數對於閱讀理解各層次通過率的預測度:

(一) 古典測驗理論(Classical test theory, CTT) 1. 古典測驗理論的假定

古典測驗理論又稱為古典真分數理論,其假定在界定觀察分數、真分 數及誤差分數三者間的關係。

X(觀察分數)=T(真分數)+E(誤差分數) (公式 9) 2. 古典測驗的題目分析

(1) 難度

題目難度就是答對某題目人數的百分比,也就是題目通過率,

難度常以 P 表示之,其中 Pi是答對題目 i 的百分比,N 是所有 受試人數,ni是答對題目 i 的人數,如(公式 10)所示:

N

Pi

ni (公式 10)

P 值介於 0 與 1 之間,P 值越高題目越容易,P 值越低題目越難,

P=0.5 表示一半的人通過。

(2) 鑑別力

高分組的受試者答對某題的機會比低分組的受試者答對某題的 機會高,表示該題能鑑別出受試者的能力差異。鑑別力是高分 組的通過率減去低分組的通過率,以 D 表示:

D=PH-PL (公式 11)

D 值範圍介於-1 與 1 之間,D 值越大表示鑑別力越好,D 值大 於 0.4 表示該題優良,有很好的鑑別力,D 值介於 0.3~0.39 表示 題目良好,D 值介於 0.2~0.3 之間表示題目尚可,D 值小於 0.2 的題目表是鑑別力不好,需要修題或刪題(王寶墉,1995)。

(二) Rasch Model 理論

試題反應理論(Item Respose Theory, IRT) 的單參數對數形模式,假定猜測參 數 c=0 及鑑別力參數 a=1,為三參數對數模式的特例,相通於 George Rasch (1960) 所建構的模式,因此又有「Rasch 模式」之稱。Rasch 模式不同於古典測驗理論,

對於測驗的解釋是同時包含了能力與難度。答對和答錯的比率取決於能力和難 度,當能力大於難度時,答對機率就大於答錯機率。這表示我們將 Rasch 能力 值取代原始分數當作報告分數,也就是不受測量工具的影響,即是客觀的測量。

1. 單參數對數形模式(one-parameter logistic model):這個模式的數學公式如下所 示:

)

bi:試題難度(difficulty)參數。

e:底為 2.718 的指數。 3.0、Bilog-MG 和 SPSS for windows18 進行資料的分析。

一、 MATLAB 程式撰寫工具

本研究使用 MATLAB 程式撰寫工具來建置句子結構相似度及最小編 輯距離指標,以計算文本在指標上分析的特徵值。

二、 Tester for windows3.0 試題分析軟體

文本的閱讀理解測驗的作答結果以 Tester for windows3.0 來分析試題的 信度、難度、鑑別度及通過率。

相關文件