國立臺灣師範大學特殊教育學系、特殊教育中心 特殊教育研究學刊,民88,18期,151-172頁
以文章寫作和造句測驗評估 作文能力之效度研究
葉靖雲
國立彰化師範大學
本研究為以效度為核心,主旨在於發展適用於國小中、高年級學習障礙學生的形 成性作文能力評量工具。所發展的測量方式包括由兩種文體(記敘文和說明文)和四 種題目類型(主題句、故事開頭、單圖、四個格連環圖)所組成之文章寫作作文能力 測驗,使用總數字數及相異字數兩種評分方法。所探究的效度包括以作文和國語文學 期成績為效標的效標關聯效度,以及比較不同年級(四、五、六)、能力(學習障礙 與一般能力)組別學生表現差異的建構效度。除上述之文章寫作作文能力測驗外,本 研究也同時檢驗三種造句測驗分數(意義正確的句子數、成語數、非常用字數)與作 文能力效標間的關係,並比較不同年級、作文能力學生在這些造句測驗上的表現。本 研究之樣本包括建立效標關聯效度之普通班學生樣本,以及發展建構效度之學習障礙 樣本。結果顯示上述文章寫作作文能力測驗的總字數和相異字數與效標間皆有顯著的 連結關係,除四年級外,效度係數大致在中度相關的範圍內。各種文章寫作作文測驗 的分數也大多能夠有效區分不同年級、作文能力學生。造句測驗中意義正確的句數和 非常用字數的效標關聯效度大致在中到高度相關的範圍內,這兩種造句測驗的計分結 果能夠清楚鑑別不同年級、能力的學生。
關鍵字:小學、作文評量、文體、題目類型、學習障礙、造句、效度、總字數、相異 字數、不同用字數
緒論
一、研究動機與目的
作文與閱讀、數學並列為重要基本學科能 力。相關研究指出國小中、高年級以後,隨著 年級的升高,作文能力對於學業成就的影響愈
來愈大(Montague & Graves, 1993)。作文又 與說話同為自我表達的溝通技能,在人際與社 會適應上佔有重要地位。根據學生的表現來調 整 教 學 的 內 涵 是 有 效 教 學 的 基 本 原 則 之 一
(Goodman, 1985; Hoffman & Rutherford, 1984;
Rieth, Polsgrove & Semmel, 1981),基於作文
能力對於學業學習和語言發展的重要性,教學 者宜透過作文能力的持續監控以儘早發現問題 並及時進行補救。作文是語文科目中技巧最複 雜的一種,對於學習障礙學生而言更是最感困 難的基本能力之一,多位研究者指出寫作學習 障礙學生之作文成品不論在質和量上都較一般 學生落後,作文技巧的缺陷也較一般學生顯著
( 參 見 Isaacson, 1988 的 文 獻 回 顧 ) 。 所 幸 Christenson 、 Thurlow 、 Ysseldyke 和 Vicar
(1989)以及Mastropieri 和 Scruggs(1994)的 研究都顯示學習障礙學生的作文能力可以透過 有效教學和形成性監控而提昇。然而,監控作 文能力的改變需要穩定、可靠的工具。缺乏有 效的作文評量工具,教師無法獲得學生作文表 現進步與否以及成長幅度方面的明確回饋,也 難以客觀的判斷各種作文教學法對於團體或個 別學生的有效性。
本研究的主旨在於發展穩定、有效性的形 成性作文能力測量工具。發展出來的測驗如果 能夠明確區分不同能力的寫作者,則亦可用於 寫作學習障礙學生的篩選。作文能力的評量有 直接與間接、質與量、主觀與客觀層面的分 野。研究者的興趣在於形成性測驗的發展,由 於此類測驗需經常性實施,在編製、施測、計 分和結果的解釋上必須符合便利和經濟的原 則,故本研究所探究的測量方式偏重在客觀、
量化的評量層面上。近年來,作業評量(per- formance assessment)日漸受到重視,已成為教 室內評量的主流(Wiggins, 1989, 1993)。此種 評量系統強調瞭解學生技能發展的最佳方法就 是讓學生從實作中表現此種技能,例如從學生 的朗讀表現來評定其認字技巧、以學生的文章 寫作成品來評定其作文能力。本研究所發展的 形成性作文測驗也採取此種直接評量的方式。
研究者預期達成的目標有以下四項:一、
發展五種文章寫作作文能力測驗,包括故事開 頭、單圖、四格連環圖片之記敘文寫作,以及
比較性、問題解決性之說明文寫作,學生在這 五種作文測驗上的表現以「總字數」和「相異 字數」來計分;二、發展用以評估作文能力之 造句測驗,學生之表現以三種方式來評定,分 別是計算「意義正確的句數」、「成語數」和
「非常用字數」;三、比較各種作文能力測驗 所得結果鑑別學習障礙與一般能力學生的效 果;四、比較不同造句測驗評分方式所得結果 鑑別學習障礙與一般學生之效果。
上述目標中,目標一的部分已在先前的研 究(葉靖雲,民88)中探究過,此次複製的用 意在於確認各種作文能力測驗和計分方式效標 關聯效度資料。葉靖雲(民88)的研究顯示,
整體而言,文章寫作的測量結果可以有效反映 五、六年級學生之作文能力,四年級部分的效 度係數較為偏低,可能與文章寫作對於此一年 級的學生難度較高有關。在目前的研究裡,研 究者在待檢驗之作文能力指標中加入了造句測 驗。造句為作文之先備技巧之一,雖然此種技 巧僅限於句子組成的層次,複雜程度不若文章 寫作高,但造句和文章寫作之表現皆與寫作三 元素(認知、語言學、形式)有密切關係。研 究者假設作文與造句測驗的結果皆能夠反映學 生真實的作文能力,但兩者適用的年級或能力 水準可能不同。對四年級的學生而言,造句可 能較文章寫作測驗適合作為作文能力的指標。
先前的研究以年級間和高、低作文能力學生間 的比較來發展建構效度資料,本研究除持續年 級間的比較外,又加入了學習障礙與一般能力 學生的比較以建立此種效度資料。透過先前與 本研究對於數種作文能力指標效度的探討,結 果作為發展形成性作文能力評量工具與寫作學 習障礙篩選工具的依據。
二、待答問題
根據前面之陳述,研究者提出下列之研究 問題:
(一) 各種自編文章寫作作文能力測驗之「總
字數」與效標之間有沒有顯著關係?
(二) 各種自編文章寫作作文能力測驗之「相 異字數」與效標之間有沒有顯著相關?
(三) 各種自編文章寫作作文能力測驗之「總 字數」與「相異字數」之效標關聯效度有沒有 顯著差異?
(四) 任兩種自編文章寫作作文能力測驗之效 標關聯效度間有沒有顯著差異?
(五) 各種造句測驗分數與效標之間有沒有顯 著關係?
(六 )各種造句測驗分數之效標關聯效度有沒 有顯著差異?
(七) 學生在文章寫作作文測驗上的表現是否 因年級的不同而有差別?
(八) 學生在造句測驗上的表現是否因年級的 不同而有差別?
(九) 學習障礙與一般能力學生在各種文章寫 作作文能力測驗的表現上有沒有明顯不同?
(十) 學習障礙與一般能力學生在各種造句測 驗的分數表現上有沒有明顯的不同?
三、名詞詮釋 (一) 記敘文
記敘文是指根據事情發展的時間順序來組 織情節,並有明確的故事發展的一種文章體 裁,它不但在日常生活中廣泛應用,也是國內 外作文研究最常使用的文體之一(施錚懿,民 86;Newcomer & Barenbaum, 1991)。本研究使 用「故事開頭」和「圖片」(包括單幅和四格 連環)兩種刺激方式來誘發記敘文的寫作成品。
(二) 說明文
說明文是指客觀的呈現或分析事理的一種 文章體裁,具有說服和傳遞知識的功用,與記 敘文同為國內外作文研究最常使用的文體(施 錚懿,民86;Newcomer, et.al., 1991)。本研究 以「比較性」和「問題解決性」兩種題目類型 為刺激來引發出說明文的寫作成品。
(三) 總字數
計算文章中所寫出的字之總數,包括用注 音符號所替代的字,標點符號則不計算在內。
此種分數為作文流暢性指標之一。
(四) 相異字數
將文章中重覆出現的字刪掉,計算剩下的 字數,所得結果即為相異字數。相同的字不論 出現多少遍,皆以一來計數。此種分數為測量 作文中字彙變化的指標之一。
(五) 非常用字數
句子寫作中出現不在「中文五百個常用 字」上之字的總數。所採用之字表源自林寶 貴 、 黃 瑞 珍 、 彭 千 紅 ( 民 86 ) 的 附 錄 中
(pp120-123)。這些研究者所使用之字表由國 立編譯館(民58)和柯華威、吳敏而等(民 79)之研究統整而來。非常用字如果出現一次 以上,僅以一次紀錄。此種分數為作文中字彙 變化性的指標之一。
研究方法
本研究的主旨在於發展適用於寫作學習障 礙學生篩選以及形成性評鑑之作文能力測量工 具,以效度的建立與比較為核心。測量採用實 作的方式,換言之,從學生直接寫作的表現來 評定其作文能力。經過檢驗後所推薦的測驗皆 須符合以下之條件:一、分數之穩定性高;
二、與其它可接受的作文和國語文能力效標有 中度或中度以上的相關;三、能區別不同作文 能力的學生。研究方法將依研究設計、樣本選 取、研究工具、實施步驟及資料處理等部份陳 述於下。
一、研究設計
本研究中有待比較者,在文章寫作方面涵 蓋故事開頭、單圖、四格連環圖片之記敘文與 主題句、故事開頭之說明文,共計五種作文能 力測驗。這些文章寫作作文測驗共同的特色是 採取直接、客觀、量化的評量,且皆以總字數
相異字數兩項計分結果作為各項比較的依變 項。在造句測驗方面,皆以三種評分方式的分 數(計算所寫出意義正確的句數、成語數與非 常用字數)作為各項比較之依變項,除意義正 確的句數牽涉部分之主觀判斷外,都採取直 接、客觀、量化之評量。研究的樣本為中部地 區小學四、五、六年級學生。發展的重點在於 建立文章寫作作文能力測驗及造句測驗之效標 關聯效度和建構效度資料。相關的設計分別說 明如下。
(一) 效標關聯效度的建立
效標為學期末之作文和國語科學期成績。
在五種文章寫作作文能力測驗方面,除了分別 建立各種作文能力測驗所得分數與上述效標之 間的相關係數外,不同作文能力測驗的效度也 兩兩比較以檢驗是否有差異存在。以造句測驗 來預測作文能力之效標關聯效度方面,除建立 三種評分方式之分數與效標的相關係數外,不 同造句測驗分數之效度也雙雙進行比較,以瞭 解其間是否有差異存在。
(二) 建構效度的呈現
目的在檢驗各種作文和造句測驗分數能否 鑑別不同年級或寫作能力的學生。首先,比較 不同年級學生在五種文章寫作作文能力測驗和 造句測驗之表現。其次,分年級來比較學習障 礙與一般能力學生在五種文章寫作作文能力測 驗和造句測驗上的表現。
二、樣本選取
本研究包括預試和正式施測兩個階段的樣 本。預試樣本為臺中巿省三國小和北屯國小高 年級普通班學生,研究者請班級導師推薦高、
低作文能力學生各5人參加預試的活動,扣除 流失與資料不全者,共計有158人,抽樣和測試 的工作已於八十六年完成。正式施測的樣本包括 兩個部分:一是中部地區國小四、五、六年級普 通班學生,研究者先自彰化縣、臺中縣、臺中 市、南投縣各選取一所學校,依序為南郭、
塗城、大鵬與敦和國小,接著從前述合作學校 的四到六年級各隨機抽取一個班級進行正式的 施測,樣本資料整理於表一,總人數為524 人。四到六年級受試樣本接受研究者自編之文 章 寫 作 作 文 能 力 測 驗 時 的 平 均 年 齡 分 別 是 10.16、11.17和12.11歲。另一為學習障礙樣 本,這一部份之樣本蒐集由本研究所屬之國科 會整合計畫「國小輕度障礙學生作文錯誤類型 分析及有效學習策略之研究」之總主持人來主 導,過程如下:首先請彰化縣民生、臺中縣大 雅、臺中市忠孝、南投縣南投國小全體四、
五、六年級級任老師推薦該班國語科表現落在 全班最後三名者;接著集中被推薦的學生,實 施「羅桑二氏非語文智力測驗」(黃國彥、鍾 思嘉、傅粹馨,民66)與「國民小學國語文成 就測驗」(周台傑,民81);每一位學生之智 力測驗分數皆代入八十六年總計畫根據中彰投 四縣市936位四到六年級普通班學生常模所發 展之迴歸公式中。四至六年級的迴歸公式依序 為 Y = . 3 4 X + 1 9 . 5 5 , Y = . 4 7 X + 1 6 . 8 5 , Y = .31X+17.55,皆以智力為預測變項、成就為依 變項(周台傑,民86)。受試學生中,國語文 成就測驗分數的實際表現落在預測值 1.5 個測 量標準誤以下者,即被納入本研究之學習障礙 樣本中。為了對照學習障礙學生之表現,研究 者敦請每一位學障樣本就讀班級之導師推薦同 班級中另一名與樣本同性別、作文能力在班級 平均表現以上的學生,作為一般能力學生樣 本。由於學障與一般能力學生除班級和性別外 未進行其他條件之配對,故兩者在依變項上的 表現僅以獨立樣本t考驗來進行組別間的比較。
學習障礙與一般能力學生樣本資料摘要整理於 表二。學習障礙學生接受測驗之年齡依四、
五 、 六 年 級 順 序 分 別 為 10.06 、 11.17 、 12.28 歲 ; 一 般 能 力 學 生 則 為 10.21 、 11.13 、 12.15 歲。在每一年級中,學障與一般學生之年齡差 異皆未達顯著水準。
表一 普通班樣本的地區、年級、性別和人數資料
縣市 四年級 五年級 六年級
男 女 小計 男 女 小計 男 女 小計 總數
彰化縣 26 23 49 22 24 46 23 25 48 144 臺中縣 23 25 48 21 21 42 20 22 42 131 臺中市 26 23 49 18 22 40 22 19 41 132 南投縣 19 23 42 21 17 38 18 21 39 117 總數 94 94 188 82 84 166 83 87 170 524 表二 學習障礙學生的地區、年級、性別和人數資料
縣市 四年級 五年級 六年級
男 女 小計 男 女 小計 男 女 小計 總數
彰化縣 4 1 5 4 1 5 17 4 21 31 臺中縣 3 2 5 4 1 5 7 1 8 18 臺中市 3 1 4 4 3 7 12 1 13 24
南投縣 2 1 3 4 2 6 6 1 7 16
總數 12 5 17 16 7 23 42 7 49 89
三、研究工具
本研究所使用的工具包含作為效標的評量 資料以及研究者自編之文章寫作與造句測驗。
效標包括國語科和作文學期成績,原始資料取 自八十七學年度上學期末學生成績單上國語科 及作文分數。研究者檢視每一個班級國語和作 文分數的分佈狀況,發現老師間給分範圍以及 平均數差異頗大,為使班級間的分數得以直接 比較,研究者將每一位受試學生的國語及作文 成績先轉換成其就讀班級內的 T 分數,再以此 分數作為效標。自編測驗包括文章寫作和造句 兩部分,皆採直接、客觀、量化的評量方式,
將分別說明於下。
(一) 文章寫作作文能力測驗
本研究所發展之作文測驗涵蓋兩種文體,
分別是記敘文和說明文寫作,記敘文之下包括 三篇文章,另兩篇則屬於說明文寫作。作文題 目類型採用文獻上最常用在記敘文和說明文的
方式:記敘文方面包括故事開頭、單幅圖片以 及連環圖片;說明文則是問題解決性與比較性 兩種性質的主題句。每一種題目類型之下有數 個備選試題,經過31位三年以上教學經驗的國 小教師及兩位大學語文科系教師審核,決定預 試的題目。選題的主要標準為:題目的明確 性、具有可發揮的空間、符合一般小學生的生 活經驗、和能區別不同作文能力的學生。經大 部分老師審核通過的題目,接著在臺中市省三 和北屯兩所國小高年級的普通班進行預試,藉 此修正試題與說明不夠明確的地方,調整施測 時間,並以最能刺激流暢的寫作表現和區別高 低作文能力學生的試題作為正式施測的題目。
經過預試後,以班為單位團體實施五種文章寫 作作文能力測驗,實施的方式如下:在說明指 導語後,每篇文章先提供三分鐘的時間構思,
接著給予十分鐘的時間寫作,以相同的方式完 成五篇文章。為平衡文體和題目類型呈現順序
所造成的影響,試卷上不同類型文章出現的次 序是隨機排列的。包括寫作指導語的說明以及 試卷的收發時間在內,完成五種文章寫作作文 能力測驗約需一小時二十分鐘的時間。計分方 式選用代表寫作流暢性的「總字數」以及標示 字彙變化性的「相異字數」。普通班學生樣本 於八十七學年度上學期結束前一個多月開始實 施作文測驗,寒假前完成施測的工作。學習障 礙與一般能力學生的部分,於八十七學年度下 學期開學後實施,一個月內完成施測的工作。
(二) 造句測驗
造句題目中的詞、成語和句型皆選自國立 編譯館出版之國小四、五、六年級國語課本。
原包括35個題目,經過與文章寫作測驗類似的 專家審核程序後,保留了20題。專家包含27位 三年以上教學經驗的國小教師及兩位大學語文 科系教師。審核過的題目再經過預試的淘汰 後,選擇了14個正式的題目。正式的造句測驗 中,有6題為雙字詞、5題為四字成語、3題為 牽涉到關係連接詞使用之句型(因為……所 以 … … 、 不 是 … … 就 是 … … 、 雖 然 … … 但 是……)。測量的時間為十五分鐘。造句測驗 的評分方式有三種:意義正確的句數、成語 數、非常用字數。「意義正確的句數」計算受 試者適切的將詞彙或句型擴展成完整句子的題 數,重點在意義的合理性,文法、標點、寫字 的正確性等因素非主要的考量,此種評分方式 乃 參 考 Hammill 和 Larsen 在 Test of Written Test-3(1996)中字彙分測驗(Vocabulary)的 計分法。「成語數」為計算在所有的題目中,
受試者一共使用多少個成語或俗語,題目中所 給的成語不計算在內。「非常用字數」的算法 為對照林寶貴等人(民86)所匯整之中文500 個常用字,然後計算在十四題當中用了多少不 在此常用字表中的字,重複出現的字只算一 次。本測驗與作文測驗同時實施,兩種類型的 測驗間給予學生十分鐘的休息時間。
五種文章寫作作文能力測驗和造句測驗皆 由彰化師大特殊教育系碩士級研究生及大學部 高年級學生來執行,國語科和作文學期成績則 是由合作學校教務處傳真給研究者,再轉換成 班級內的 T分數。
四、實施步驟
本研究的施行步驟含括試題編製、預試、
正式施測、資料分析等部分綜合說明如下。研 究者從小學課本及坊間兒童文學及作文相關書 籍中找出有關於說明文和故事開頭的作文題目 十三則,圖片題目則是參考 Engelmann 和 Silbert
(1983)以及坊間漫畫圖書,選出十一幅單幅 圖片以及七幅四格連環圖片。發展出來的試題 先請彰化師大特教系三年級一個班的學生進行 初步篩選的工作,然後由31位三年以上教學經 驗的國小教師及兩位大學語文科系教師審核這 些題目,每種作文能力測驗方式各選出兩個題 目。造句測驗的題目選取自國立編譯館之小學 四、五、六年級國語課本,參酌專家們的意見 後,初步選定了二十題。
藉由前述程序發展出來的試題接著在臺中 市省三和北屯國小進行預試,參與的16個班級 由導師推薦高、低作文能力學生各5名,以兩 種能力學生在各題目上的整體表現以及相對差 異的大小和方向來修正指導語、調整施測時 間、選擇正式施測的題目和評分的方式。預試 時文章寫作表現以四種客觀、量化的評分方式 來計算,分別是「總字數」、「成熟字數」、
「相異字數」和「校正後相異字比例」,其中
「總字數」是流暢性的指標,後面三項標示字 彙的表現。由於「成熟字數」、「相異字數」
和「校正的種類–符號比率」三者對於高、低 作文能力學生的區別效果很接近,故正式施測 時,只以其中最容易計算的「相異字數」作為 代表字彙變化性的計分方式。造句測驗則從原 有之題目中選擇鑑別度較佳的十四個題目。八 十七學年度上學期開學後開始進行正式的施
測,取樣的地區包括彰化縣、臺中縣市、和南 投縣。文章寫作和造句測驗皆建立有評分者間 一致性信度,評分者為三位彰化師大特教系高 年級學生,經過兩小時的訓練和討論後,從正 式樣本之測驗卷中抽出三十份作文和造句測 驗,結果如下:文章寫作測驗中「總字數」和
「相異字數」的一致性係數分別為1.00與 .99,
造句測驗之「意義正確的句數」、「成語數」
和「非常用字數」的係數為 .87、.96與 .99。信 度分析的結果顯示作文和造句測驗的結果相當 穩定。
測驗與相關資料經過整理、編碼、校對後 透過 Excel 7.0 軟體登錄在 電腦上,統計分析的 工作則是藉由 SPSS 7.0 英文視窗版套裝軟體來 進行,大學四年級學生助理處理資料登錄的工 作,統計分析與報告撰寫乃由研究者自行完 成。
五、資料分析
本研究採用的統計方法除了以平均數和標 準差為主的描述統計外,尚包括以下幾種推論 統計的類型:
(一) 檢驗任何兩元素間的連結關係:由皮爾 遜積差相關(Pearson product-moment correla- tions)的統計方式來考驗。
(二) 探討任何兩相關係數之間是否有差異存 在:以非獨立樣本相關係數差異性考驗(Test- ing the difference between two nonindependent rs)的方法來驗證(Howell, 1987)。
(三) 比較不同年級學生之表現:各以單因子 變異數分析(one-way ANOVA)來進行。
(四) 比較學習障礙與一般能力學生在文章寫 作和造句測驗表現上的差異性:以獨立樣本 t 考驗來進行。
以上的統計考驗都以 p < .05為達到顯著性 的標準。
研究結果
本研究從測驗發展的技術層面切入,主要 目標在於建立自編之文章寫作作文能力測驗與 造句測驗的效標關連效度,以及判斷測量之結 果是否能夠鑑別不同年級和作文能力的學生。
本章將從以下五個部分來呈現客觀數據分析的 結果:首先呈現的是五種文章寫作作文能力測 驗得分與效標間相關性考驗,以及效度係數間 差異比較的結果;其次檢驗造句測驗不同評分 方式的結果與效標間的關係,並比較效度係數 間的差異;接下來呈現不同年級學生在文章寫 作和造句測驗表現上比較的結果;然後是學習 障礙和一般能力學生在文章寫作和造句測驗上 的比較結果;最後為研究結果摘要。
一、五種文章寫作作文能力測驗的效標 關聯效度比較
研究者自編之文章寫作作文能力測驗包括 故事開頭、單圖、四格連環圖片三種記敘文以 及比較性和問題解決兩種說明文。表三、四分 別陳列有各種測驗之「總字數」和「相異字 數」的平均數和標準差。這兩張表上較顯著的 趨勢為:學生在故事開頭之記敘文與單圖記敘 文所寫之總字數與相異字數,皆隨年級增高而 增加。
在推論統計方面,首先進行的是五種文章 寫作作文能力測驗上的表現與效標之間的相關 性考驗,本研究所採用的效標包括八十七學年 度上學期作文和國語科學期成績,兩種學期成 績皆先轉換成班及內的 T 分數,再進行相關性 考驗以及其他統計分析的工作。文章寫作作文 能力測驗與效標相關性考驗的結果陳列於表五 到六。由這些表中可看出五種文章寫作作文能 力測驗或其加總後的分數與效標間的連結關係 全都具有統計上的顯著性(除一項係數的顯著 水準達 .05外,其他所有的相關係數皆達到 .01 的顯著水準),而且除了四年級以及其他少數
表三 四到六年級學生在五種文章寫作作文能力測驗上「總字數」的平均數與標準差
文章寫作作文能力測驗 四年級 五年級 六年級
平均數 標準差 平均數 標準差 平均數 標準差 比較性說明文 104.77 41.13 121.37 41.26 117.25 48.38 故事開頭之記敘文 105.93 45.14 133.86 47.33 137.85 55.20 單圖之記敘文 89.98 40.55 102.12 44.78 119.56 54.23 四格連環圖片記敘文 92.96 31.83 84.06 39.01 91.12 46.30 問題解決性說明文 147.71 53.24 138.12 50.33 165.27 55.17 五種測驗的總和 541.34 170.46 579.53 173.57 631.05 198.07
表四 四到六年級學生在五種文章寫作作文能力測驗上「相異字數」的平均數與標準差
文章寫作作文能力測驗 四年級 五年級 六年級
平均數 標準差 平均數 標準差 平均數 標準差 比較性說明文 63.03 23.38 74.13 25.40 75.99 30.54 故事開頭之記敘文 66.60 26.96 84.73 30.37 93.65 32.98 單圖之記敘文 60.09 24.21 70.73 29.37 82.26 34.87 四格連環圖片記敘文 57.20 19.87 54.61 25.43 62.71 28.86 問題解決性說明文 57.81 21.04 54.83 25.25 67.79 30.17 五種測驗的總和 304.72 97.78 339.05 108.60 382.39 140.57
表五 五種文章寫作作文能力測驗之總字數與效標間的相關係數摘要表
文章寫作作文 能力測驗
效 標
四年級 五年級 六年級
作文 學期成績
國語文 學期成績
作文 學期成績
國語文 學期成績
作文 學期成績
國語文 學期成績 比較性說明文 .21** .17** .40** .41** .54** .55**
故事開頭之記敘文 .37** .32** .38** .35** .49** .52**
單圖之記敘文 .30** .22** .41** .37** .56** .57**
四格連環圖記敘文 .22** .21** .38** .33** .52** .50**
問題解決性說明文 .25** .31** .46** .43** .62** .56**
五種測驗的總和 .32** .30** .50** .47** .65** .63**
*p < .05 **p < .01;四、五、六年級人數分別為188、166、170人
表六 五種文章寫作作文能力測驗相異字數與效標間的相關係數摘要表
文章寫作作文 能力測驗
效 標
四年級 五年級 六年級
作文 學期成績
國語文 學期成績
作文 學期成績
國語文 學期成績
作文 學期成績
國語文 學期成績 比較性說明文 .27** .30** .43** .42** .55** .57**
故事開頭之記敘文 .40** .39** .47** .46** .53** .55**
單圖之記敘文 .42** .39** .53** .47** .57** .56**
四格連環圖記敘文 .29** .30** .50** .44** .58** .54**
問題解決性說明文 .21** .29** .49** .43** .64** .57**
五種測驗的總和 .38** .40** .61** .55** .66** .64**
*p < .05 **p < .01;四、五、六年級人數分別為188、166、170人
例外,係數多在中度相關的範圍內。各種文章 寫作測驗總字數和相異字數的效標關聯效度有 隨年級的提升而增高的趨勢。
為了瞭解總字數和相異字數兩種分數類型 的效度有沒有差別,接著進行兩非獨立樣本相 關係數差異性考驗的程序。由表五和六的格子 數可算出每一個年級需進行12組比較(兩項效 標乘以六項文章寫作測驗分數,格子中相關係 數下畫橫線者表示在此測驗項目上,總字數與 相異字數之效標關聯效度間有顯著差異。四、
五、六年級各12組比較中,兩種分數之效度係 數間存有顯著差異(至少達到 .05之水準)的組 數依序為 9、8、3組,且這些差異的方向皆為
相異字數的效度優於總字數。整體來說,在 四、五年級階段,相異字數預測作文能力的效 果要比總字數來的好,這種現象在六年級較不 明顯。
為瞭解五種文章寫作作文能力測驗與加總 後的表現兩兩之間在效標關聯效度上是否有差 異存在,研究者再次以兩非獨立相關係數差異 性考驗之統計方法來作比較。由於之前以國語 文和作文學期成績為效標之統計分析結果差異 不大,為簡化比較的內容,此項分析僅以作文 學期成績為比較的標的,結果摘要於表七和八 中。綜合這些資料可以歸納出一些趨勢:一、
單一實施任何作文能力測驗之效度皆不及所有 表七 文章寫作作文能力測驗間的效標關聯效度係數差異性考驗結果摘要表--以總字數為
依變項的比較1
文章寫作作文能力測驗間的配對比較
效標:作文學期成績
四年級 五年級 六年級 比較性說明文 vs. 故事開頭記敘文 **
比較性說明文 vs. 單圖記敘文 * 比較性說明文 vs. 四格連環圖片記敘文
比較性說明文 vs. 問題解決性說明文 *
故事開頭記敘文 vs. 單圖記敘文 *
表七 文章寫作作文能力測驗間的效標關聯效度係數差異性考驗結果摘要表--以總字數為 依變項的比較1(續)
文章寫作作文能力測驗間的配對比較 效標:作文學期成績
四年級 五年級 六年級 故事開頭記敘文 vs. 四格連環圖片記敘文 **
故事開頭記敘文 vs. 問題解決性說明文 * **
單圖記敘文 vs. 四格連環圖片記敘文 單圖記敘文 vs. 問題解決性說明文
四格連環圖記敘文 vs. 問題解決性說明文 **
比較性說明文 vs. 五種測驗的總和 ** ** **
故事開頭記敘文 vs. 五種測驗的總和 * ** **
單圖記敘文 vs. 五種測驗的總和 ** **
四格連環圖記敘文 vs. 五種測驗的總和 ** ** **
問題解決性說明文 vs. 五種測驗的總和 *
格內的符號標示「兩非獨立樣本相關係數差異性考驗」的結果,*表示 t 值的p<.05,**表示 t 值的 p < .01。
表八 文章寫作作文能力測驗間的效標關聯效度係數差異性考驗結果摘要表--以相異字數 為依變項的比較1
文章寫作作文能力測驗間的配對比較 效標:作文學期成績
四年級 五年級 六年級 比較性說明文 vs. 故事開頭記敘文 **
比較性說明文 vs. 單圖記敘文 ** *
比較性說明文 vs. 四格連環圖片記敘文
比較性說明文 vs. 問題解決性說明文 *
故事開頭記敘文 vs. 單圖記敘文
故事開頭記敘文 vs. 四格連環圖記敘文 *
故事開頭記敘文 vs. 問題解決性說明文 ** **
單圖記敘文 vs. 四格連環圖片記敘文 **
單圖記敘文 vs. 問題解決性說明文 ** *
四格連環圖記敘文 vs.問題解決說明文 *
比較性說明文 vs. 五種測驗的總和 ** ** **
故事開頭記敘文 vs. 五種測驗的總和 ** **
單圖記敘文 vs. 五種測驗的總和 ** **
四格連環圖記敘文 vs. 五種測驗的總和 ** ** **
問題解決性說明文 vs. 五種測驗的總和 ** **
格內的符號標示「兩非獨立樣本相關係數差異性考驗」的結果,*表示t值的p<.05,**表示 t 值的 p < .01。
測驗同時實施後之效度;二、在四年級階段,
故事開頭記和單圖記敘文之效度優於其他兩種 說明文體以及四格連環圖片;三、在五年級階 段,各種測驗的效度多無顯著差異;四、到了 六年級階段,問題解決性說明文之效度顯著優 於其他四種作文測驗的效度。
二、造句測驗不同評分方式的效標關聯 效度比較
研究者以自編的造句測驗來預測學生作文 能力的表現。普通班學生樣本所造出之意義正 確的句子數、句子中所使用的成語數,以及寫 出之非常用字的平均數與標準差陳列於表九,
明顯的趨勢為各種分數之平均數都有隨年級升 高而增加的狀況。從四到六年級成語數的使用 次數來看,學生自發性的在句子中使用成語的 狀況仍不普遍,即使到了六年級,在十四個句 子中出現的成語數平均還不足0.3 個。由於一般
人所說或所寫的句子中極少出現一個以上的成 語,扣掉四題成語題,剩下的十個句子中成語 出現的比例仍然很低,可能的原因成語的意涵 較一般詞彙豐富,由於造句測驗將寫作的框架 侷限在句子的層次,不利於誘發成語的表達。
三種造句分數與作文和國語文學期成績之 相關性考驗整理陳列於表十。除了成語數之效 度係數偏低外,意義正確之句數與非常用字數 之效度係數皆相當顯著,令人意外的是比作文 測驗之效標關聯效度還要高。接著進行各種分 數類型的效度差異性比較,採用非獨立樣本相 關係數差異性考驗的統計方法來進行,結果顯 示成語數之效度係數皆不如其他兩種分數。依 年級來看,意義正確的句數與非常用字數適用 的階段不盡相同,前者在四年級的效度明顯優 於後者,非常用字的評分方法在六年級超越前 者,兩者在五年級階段沒有差別。
表九 四到六年級學生在造句測驗三種分數上的平均數與標準差
造句測驗分數類型 四年級 五年級 六年級
平均數 標準差 平均數 標準差 平均數 標準差 意義正確的句數 7.93 2.53 9.10 2.70 11.07 3.14
成語數 0.01 0.10 0.10 0.62 0.29 0.61
非常用字數 21.91 7.02 26.71 9.14 35.53 11.20 表十 造句測驗三種評分方式與效標間的相關係數摘要
造句測驗分數類型
效 標
四年級 五年級 六年級
作文 學期成績
國語 文學期成績
作文 學期成績
國語 文學期成績
作文 學期成績
國語 文學期成績 意義正確的句數 .63** .61** .70** .72** .52** .57**
成語數 .08** .01** .19** .13** .24** .24**
非常用字數 .37** .31** .72** .74** .72** .71**
*p < .05 **p < .01;四、五、六年級人數分別為188、166、170人
三、不同年級學生在文章寫作作文能力 測驗和造句測驗表現上的比較 為建立文章寫作和造句測驗之建構效度資 料,以下將以年級為自變項,各種類型的測驗 分數為依變項,進行單因子變異數分析,藉此 來檢驗本研究所發展的文章寫作作文能力測驗 結果能否正確區別因年級所形成之作文能力差 異群體。各種文章寫作與造句測驗分數之平均 數與標準差已呈現於表三、四和九之中,表十 一直接摘要單因子變異數分析的結果,如果變
異數分析之 F 值達到顯著水準,接著以 Scheffé 的事後考驗比較年級間的差異。
表十一的摘要顯示在本研究所發展之作文 能力相關分數類型中,僅有計算總字數之四格 連環圖片記敘文測驗未達到顯著水準。從事後 分析的結果整體看來,以相異字數計分之文章 寫作測驗與造句測驗鑑別各年級學生的能力較 總字數計分之測驗來的好。造句測驗的各種分 數多能明確的區分不同年級的學生。
表十一 年級與作文、造句測驗分數之變異數分析暨事後比較摘要表
分數類型
One-way ANOVA 事後比較摘要 F值 顯著性 四年級vs.
五年級
五年級vs.
六年級
四年級vs.
六年級
比較性說明文-總字數 27.04 .00 * *
故事開頭記敘文-總字數 21.88 .00 * *
單圖記敘文-總字數 17.45 .00 * *
四格連環圖片記敘文-總字數 22.47 .09
問題解決性說明文-總字數 26.03 .00 *
五種作文測驗總和-總字數 27.89 .00 *
比較性說明文-相異字數 12.63 .00 * *
故事開頭記敘文-相異字數 35.20 .00 * * *
單圖記敘文相異字數 23.14 .00 * * *
四格連環圖片記敘文-相異字數 24.27 .01 *
問題解決性說明文-相異字數 29.39 .00 * *
五種文章寫作測驗總和-相異字數 18.44 .00 * * *
意義正確的句數 56.48 .00 * * *
成語數 15.57 .00 * *
非常用字數 98.36 .00 * * *
四、學習障礙與一般能力學生在文章寫 作作文和能力測驗造句測驗表現上 的比較
本單元與上一節的目的相似,皆為建立文 章寫作和造句測驗之建構效度資料而進行相關 的分析。所要鑑別者仍為不同能力學生,樣本 包括學習障礙與一般作文能力學生。在文章寫
作測驗部分依變項為學生在各種測驗上所寫出 之總字數和相異字數,造句測驗比較之標的則 包括意義正確的句數、成語數與非常用字數。
學障與一般學生在文章寫作作文能力測驗上的 平均數和標準差依年級順序陳列於表十二、十 三。綜合比較這兩張表和表三中的數字,可以 觀察到以下現象:
表十二 四到六年級學習障礙與一般能力學生在「總字數」的平均數與標準差
文章寫作作文能力測驗 四年級 五年級 六年級
學障 一般 學障 一般 學障 一般 比較性說明文 64.12
(36.71)
100.94 (134.89)
70.91 (34.98)
163.78 (142.40)
91.04 (40.94)
164.24 (139.54) 故事開頭之記敘文 49.82
(18.92)
117.53 (136.30)
74.74 (45.32)
168.30 (143.61)
89.16 (42.21)
180.96 (139.61) 單圖之記敘文 35.18
(16.28)
101.71 (136.63)
62.61 (38.59)
142.91 (148.80)
66.94 (32.38)
154.67 (139.38) 四格連環圖記敘文 42.12
(11.96)
196.94 (132.95)
59.04 (28.73)
125.78 (141.48)
58.37 (23.78)
123.20 (136.97) 問題解決性說明文 42.88
(22.41)
186.41 (134.85)
52.61 (39.01)
135.39 (134.03)
46.12 (26.38)
139.33 (143.60) N=17 N=17 N=23 N=23 N=49 N=49
*括弧中的數字為標準差
表十三 四到六年級學習障礙與一般能力學生在「相異字數」的平均數與標準差
文章寫作作文能力測驗 四年級 五年級 六年級
學障 一般 學障 一般 學障 一般 比較性說明文 31.24
(14.52)
61.53 (19.75)
44.96 (42.68)
85.70 (20.82)
46.80 (19.23)
194.04 (119.15) 故事開頭記敘文 29.53
(13.79)
75.06 (21.97)
40.22 (26.03)
93.83 (28.22)
52.08 (23.10)
112.84 (124.97) 單圖之記敘文 21.94
(11.01)
65.71 (19.16)
41.04 (21.76)
82.57 (29.21)
43.76 (16.21)
100.14 (127.29) 四格連環圖記敘文 22.88
(12.08)
57.47 (19.17)
36.30 (20.02)
71.87 (26.01)
36.00 (10.60)
178.71 (126.14) 問題解決說明文 21.65
(29.72)
58.94 (24.00)
30.83 (24.32)
78.35 (18.04)
28.22 (12.54)
185.22 (128.49) N=17 N=17 N=23 N=23 N=49 N=49
*括弧中的數字為標準差
首先,學習障礙學生在各項文章寫作作文能力 測驗上的分數皆遠不及一般能力學生或該年級 的平均表現;其次,不同年級學習障礙學生在 各種文章寫作作文能力測驗上的差距皆小於普
通學生年級間的差異,這項資料提供了間接的 證據,顯示學習障礙學生在作文能力上的成長 較一般學生緩慢;三、學習障礙學生作文能力 發展落後的情形非常嚴重,即使六年級的學生
在各種文章寫作作文能力測驗所得分數還遠不 如四年級普通班學生的平均表現。另外值得一 提的是學習障礙學生之老師所推薦的一般作文 能力學生,其寫作表現與年級平均數相比,有 偏高的現象,應稱之為高能力組較恰當。此 外,表十二與十三資料顯示不論寫作者能力的 高低,說明文和記敘文體中最能夠刺激寫作者
流暢反應的作文形式分別為比較性說明文和故 事開頭記敘文。接著,以獨立樣本 t 考驗來比 較學習障礙和一般能力學生在各種文章寫作作 文測驗上的表現,表十四、十五呈現比較的結 果,顯示五種文章寫作作文能力測驗之總字數 和相異字數都能夠明確區辨學習障礙者與一般 作文能力學生。
表十四 四到六年級學習障礙與一般能力學生在「總字數」t 考驗之摘要表
文章寫作作文能力測驗 四年級 五年級 六年級
t 自由度 p t 自由度 p t 自由度 p 比較性說明文 -3.00 32 .00 -8.10 44 .00 -18.99 96 .00 故事開頭之記敘文 -6.82 32 .00 -7.14 44 .00 -11.10 96 .00 單圖之記敘文 -6.84 32 .00 -6.19 44 .00 -12.05 96 .00 四格連環圖記敘文 -6.45 32 .00 -6.34 44 .00 -10.33 96 .00 問題解決性說明文 -4.33 32 .00 -7.67 44 .00 -11.98 96 .00 表十五 四到六年級學習障礙與一般能力學生在「相異字數」t 考驗之摘要表
文章寫作作文能力測驗 四年級 五年級 六年級
t 自由度 p T 自由度 p t 自由度 p 比較性說明文 -5.10 32 .00 -4.12 44 .00 -12.19 96 .00 故事開頭之記敘文 -7.24 32 .00 -6.70 44 .00 -12.50 96 .00 單圖之記敘文 -8.16 32 .00 -5.47 44 .00 -12.44 96 .00 四格連環圖記敘文 -6.29 32 .00 -5.20 44 .00 -10.60 96 .00 問題解決性說明文 -5.94 32 .00 -7.53 44 .00 -12.82 96 .00
兩類學生在造句測驗不同評分方式上的平 均數與標準差陳列於表十六,綜合表十六與先 前的表九,可以觀察以下的趨勢(由於造句測 驗中成語使用的頻率很低,此部份不納入以下 的討論):首先,各類學生在兩種造句測驗分 數上的表現皆隨年級的增高而增加;其次,相 鄰年級在測驗分數上的比較結果顯示非常用字 數的計分方法較能靈敏反映出學生造句能力的 成長,因為其年級與年級間的差異分數較意義 正確的句數來得明顯;再者,學習障礙學生在 兩種造句測驗上的分數皆明顯低於一般能力學 生或該年級的平均表現;最後,檢驗六年級學
障學生表現的結果顯示,此類學生在造句能力 上落後的情形不若文章寫作能力明顯,就讀年 級與實際能力的差距約在一到二個年級數間。
一般能力學生之表現與年級平均數比較的結果 顯示“高能力"較“一般能力"更能代表這些 學生的表現。學習障礙與一般能力學生在兩種 造句測驗分數上的差異亦以t考驗來進行分析,
結果呈現於表十七。分析的結果顯示除了四、
五年級學生在成語數的使用上無差異外,其他 之比較全部達到 .01以上的顯著水準,這個現象 代表意義正確的句數與非常用字數的造句測驗 分數都能夠鑑別學習障礙與一般能力學生。
表十六 四到六年級學習障礙與一般能力學生在各種造句測驗評分方法上的平均數與標準差
造句測驗之評分方式 四年級 五年級 六年級
學障 一般 學障 一般 學障 一般 意義正確的句數 12.71
(11.90)
11.59 (11.50)
17.48 (16.30)
12.30 (11.29)
17.80 (13.22)
12.90 (1.80)
成語數 10.00
(11.00)
10.00 (11.00)
10.17 (11.49)
10.52 (11.99)
10.16 (11.43)
10.65 (11.10) 非常用字數 12.88
(18.64)
30.35 (13.86)
17.91 (11.69)
38.09 (16.20)
23.53 (19.56)
42.51 (17.49) N=17 N=17 N=23 N=23 N=49 N=49
*括弧中的數字為標準差
表十七 四到六年級學習障礙與一般能力學生在各種造句測驗評分方法之t 考驗之摘要表
造句測驗之評分方式 四年級 五年級 六年級
t 自由度 p T 自由度 p t 自由度 p 意義正確的句數 -15.14 32 .00 -3.60 44 .00 -10.76 96 .00 成語數* -1.51 44 .14 -2.86 96 .01
非常用字數 -7.62 32 .00 -7.31 44 .00 -10.93 96 .00
*因兩個組別的標準差皆為 0,無法計算 t
五、研究結果摘要
統計分析的結果簡要摘述於下:
(一) 在五種文章寫作作文能力測驗中,故事 開頭和單圖記敘文之總字數和相異字數兩種分 數皆出現隨年級的增高而穩定、持續成長的趨 勢。
(二) 不論在那一個年級內,五種文章寫作作 文能力測驗之總字數與相異字數全都與效標評 量有顯著的連結關係;除四年級部分和少數例 外,效度係數多在中度相關的範圍內。
(三) 各種文章寫作作文測驗總字數和相異字 數的效標關聯效度有隨年級提升而增高的趨 勢,皆以六年級的效度最高。
(四) 在四、五年級階段,文章寫作作文測驗 相異字數之效標關聯效度整體而言優於總字 數。
(五) 在每一個年級階段中,單一實施任何文 章寫作作文能力測驗之效標關聯效度皆不及所 有測驗總分之效度,例外僅出現在四年級的單 圖和故事開頭記敘文,此兩種測驗分數與總分 沒有顯著差異。
(六) 在五種文章寫作作文能力測驗中,四年 級以故事開頭和單圖記敘文的效標關聯效度較 佳,問題解決性說明文則是六年級效度最好的 測驗方式。
(七) 造句測驗中的各種分數皆出現隨年級升 高而增加的穩定、持續成長趨勢。
(八) 各年級學生在造句測驗中,使用成語的 頻率非常低。
(九) 造句測驗中,意義正確的句數與非常用 字數兩種分數與作文能力效標之間有中度到高 度的相關性。
(十) 依年級來比較造句測驗之意義正確句數 與非常用字數的效標關聯效度:四年級意義正 確句數的效度明顯優於非常用字數;兩種分數 在五年級階段的旗鼓相當,都與效標分數間有 顯著的連結關係;六年級則以非常用字數的效 度最好,不過兩種分數在效度上的差異不及四 年級部分大。
(十一) 說明文和記敘文體中最能夠刺激寫作 者流暢反應的作文形式分別為比較性說明文和 故事開頭記敘文。
(十二) 各種文章寫作作文測驗的計分方式大 體而言能夠區分不同年級學生,相異字數的鑑 別能力優於總字數。
(十三) 造句測驗的各種分數多能明確的區分 不同年級的學生。
(十四) 學習障礙學生作文和造句能力之發展 皆較一般學生明顯低落,尤以文章寫作作文測 驗各種分數的落後情形最為嚴重。
結論與討論
本研究之主旨在於有效之形成性作文能力 測量工具的發展,藉此老師得以監控作文障礙 學生進步狀況,並以監測的結果作為修正教學 的依據。所檢驗的文章寫作作文能力測量方式 皆以總字數和相異字數來計分,包括故事開 頭、單圖和四格連環圖片的記敘文以及比較 性、問題解決性說明文,另外也嘗試以造句測 驗來評估學生之作文能力。透過不同年級和能 力組別學生在測驗表現上的比較,具有良好鑑 別能力之測驗亦可作為寫作學習障礙學生之篩 選工具。
一、結論
以下將先針對資料分析的結果來回答本研 究的問題。針對問題一和問題二,研究結果顯 示:五種文章寫作作文能力測驗之總字數和相 異字數,與代表作文和國語文成就的效標之
間,有顯著的連結關係,相關性的強度大致在 中度的範圍內。問題三中,各種文章寫作作文 能力測驗的兩種計分方式--總字數與相異字數-- 之效標關聯效度間有顯著差距存在。大體而 言,相異字數的效標關聯效度優於總字數。在 問題四裡文章寫作作文能力測驗間之效標關聯 效度差異性考驗結果顯示:各年級皆有部分的 文章寫作作文能力測驗之效標關聯效度與其他 測驗不同,狀況又因年級而有異。在四年級,
記敘文體測驗中故事開頭或單圖記敘文之效度 較說明文為佳;到了六年級,以問題解決性說 明文的效度最優。
針對問題五,除成語數外,造句測驗中意 義正確的造句數、非常用字數與作文能力的關 係不但達到統計上的顯著水準,效度係數多在 中度到高度相關的範圍內。在四年級階段,意 義正確的句數其效度優於非常用字數,到了六 年級情況則剛好相反,此發現也提供了問題六 的答案,造句測驗評分方式之效度間還是存在 有顯著的差異。單因子變異數分析的結果乃用 以回答問題七和問題八,簡言之,學生在文章 寫作和造句測驗上的表現會因為年級的不同而 有差異,年級越高表現越好。學習障礙與一般 作文能力學生在文章寫作和造句測驗上的表現 有顯著的差異,前者明顯落後,這個發現也回 答了最後兩個研究問題。以下將總結本次研究 的發現,並與相關文獻進行比較。
二、討論
本研究首先複製前一年的研究(葉靖雲,
民88),謹慎檢驗各種文章寫作作文能力測驗 分數與一般認可之作文能力效標間的關係。兩 次研究取樣的地區皆為中部四縣市(臺中縣 市、彰化、南投),取樣的學校雖不相同,但 有考量相同縣市內所選的學校其地區特性盡量 與前一年的學校近似。第一、二年的普通班樣 本總數分別為829和524位四到六年級學生。兩 次施測時所使用的文章寫作作文測驗以及施測
時間完全相同,計分方法也一樣。不同點在於 第一年納入的作文能力效標比第二年多,除了 學期成績外,還包括標準化的作文和國語文成 就測驗(陳英豪、吳裕益、王萬清所編之「兒 童寫作能力測驗」與周台傑之「國民小學國語 文成就測驗」)。由於第一年的資料顯示每種 文章寫作作文測驗與各個效標間的關係相近,
基於時間和經費上的考量,本年度的研究僅以 作文和國語科學期成績為作文能力發展的效 標。以下將說明今年和先前研究的資料中所呈 現之顯著趨勢。
首先,本研究中各種客觀、量化文章寫作 作文能力測量方式和分數類型皆與作文能力的 效標間有連結關係。然而統計上的顯著性不一 定表示有實質上的顯著關係,因為部分係數還 未達到中度相關的水準,此種現象以四年級最 明顯。對此階段的學生而言,可能還有其他的 測量方式更能反映其作文能力的發展狀況。到 了五、六年級,文章寫作的效度係數有升高的 趨勢,這種趨勢在本年度的研究中尤其明顯。
雖然文獻中也有關於國小階段作文能力指標間 在效度上的差異性比較(如 Deno, Mirkin &
Marson, 1980; Marston, 1982,引自Marston, 1989; Videen, Deno & Matson, 1982),但多以 跨年級的方式進行資料的分析,看不出年級間 的趨勢。國外這些跨年級且涵蓋一般與學障樣 本的研究指出有效作文能力指標,除總字數 外,常見者還有正確的字母順序(correct letter sequence)以及正確之字的順序(correct word sequence)。字母順序著眼在字的範圍裡,字 的順序偏重在字與字的連接,這兩種指標的有 效可能表示書寫語文之低階、技巧的發展,在 國小時期,可以用來標示作文能力的發展概 況。另從語言結構的角度來看,寫作能力的發 展由字、詞,到詞的組合、造句、敘述性的短 文,再進入不同文體文章的寫作(曹綺雯、周 碧紅,民82),一般四年級學生可能處於句
子、短文到文章寫作的過渡期,此時以文章寫 作的實作表現來評估學生的作文能力可能並不 恰當。研究者推測,在國小中年級(甚至高年 級)適用之作文能力指標可能隱身在字、詞、
句的層次,這也是研究者在第二年施測時加入 造句測驗的主要理由之一。
在這兩年的研究中,另一個非常明顯的趨 勢是相異字數的效標關聯效度優於總字數。換 言之,寫作者在文章中所用的字彙變化性愈 大,其作文能力愈好;這個現象顯示文字表達 的能力與字彙的豐富、變化性有緊密關係。字 彙豐富的寫作者在書寫表達時較能夠以精確、
合乎時宜的字眼來作陳述或推理;字彙的豐富 與否又與常識的多寡有高度相關(Hammill &
Bartel, 1995)。知識豐富之人其寫作上的優勢 為有較多的素材供自己選擇、組織、表達。過 去,相異字指標的研究多集中在大學階段,如 Gajar 等 人 ( Gajar, 1989; Gajar & Harriman, 1987)的研究顯示文章中的相異字數是評估大 學生整體表現最好的指標。目前的研究也顯示 相異字數的效標關聯效度非常穩定的隨年級的 升高而增強。
文體也是一個作文能力評量時的重要影響 因素。去年和今年的資料皆顯示四年級學生在 故事開頭和單圖記敘文上所寫出的總字數與相 異字數具有最佳的效標關聯效度,到了六年級 則以問題解決性說明文測驗上的分數最能有效 反映學生的作文能力。在四年級,單獨實施故 事開頭或單圖記敘文的寫作評量,其預測作文 能力的效果與五種類型的文章寫作的總分差不 多,可見得記敘文寫作在此階段作文能力發展 上之顯著地位。到了六年級,一般學生記敘文 寫作技巧逐漸熟稔,課程中內容科目的比重增 加,需要以書寫來完成的作業比重也愈來愈 高,此時說明文寫作的重要性逐漸展現。然 而,作文能力評量僅考慮到文體的層次似嫌不 足,因為本研究中屬於記敘文體的測驗有三個
(故事開頭、單圖、四格連環圖片),其中四 格連環圖片這種測驗類型的效度顯然不及其他 兩種。在說明文方面也有類似的情形:兩年的 研究中,比較性說明文的效度皆不及問題解決 性說明文。所以評量作文能力時,除了文體的 考量外,測驗類型也應在考慮之列。
五種跨文體和試題類型的文章寫作作文測 驗總和之效標關聯效度優於任何一種測驗單獨 實施的效度,例外僅出現在前面提及之四年級 單圖和故事開頭記敘文的部分,這是另外一個 兩年研究中的共同趨勢。以單一文章寫作作文 測驗分數評估作文能力的效度最好也不過在接 近高度相關的位置,完全依賴學生在此種測驗 上的表現來作重要的教學決定的風險不小。面 對這個問題,研究者去年所提出的建議是先形 成性實施(如每週一次)一種相對而言效度最 好的測驗,每隔一段固定的時間(如每月一 次)施予次佳的測驗,第二個測驗實施的目的 在驗證或輔助解釋第一個測驗所反映之作文能 力變化情形。所謂最佳、次佳的建議是由迴歸 分析的資料中,比較各個測驗分數對於效標分 數變異量的解釋程度來決定的。最佳者乃解釋 變異量最大的測驗,次佳則是超越最佳的測驗 額外增加變異數解釋量最大者,最佳、次佳的 兩組測驗依年級順序分別為故事開頭和單圖記 敘文、單圖記敘文和比較性說明文、故事開頭 記敘文和問題解決性說明文。然而,按照這種 方法實施形成性評量只能讓老師知道學生能力 變化的大概情形,根本的問題在於這些文章寫 作作文測驗的效標關聯效度從實際應用的層次 上來看還不夠理想。如果為了提高測驗資料的 效度而每次都執行兩、三種測驗又違背了形成 性評量工具“快又有效"的特性。解決的辦法 之一是嘗試其他可能的有效測量方式。這是研 究者在今年的試題中加入造句測驗的最主要理 由。
造句是文章寫作的先備技巧之一,雖然它
與作文能力有關,但過去還未有研究者直接以 造句測驗上的表現來反映學生作文能力的情 況。造句測驗與作文能力效標間的效度資料著 實令研究者驚訝,造句測驗中,意義正確的句 數與非常用字數的效度係數,顯然較作文測驗 為高。研究者已計畫在下一年度複製這部分的 研究,以獲致更肯切的結論。單從今年的資料 來看,造句測驗的選擇仍需要考量年齡與技能 發展的因素:四年級階段,學生能夠將語詞或 句型建構成意義完整的句子,是最好的作文能 力評量方式;到了六年級,學生造句時,非常 用字出現的數量為最好的作文能力評量方式。
在信效度條件相似,測驗的實施也都符合經 濟、便利的情況下,測驗的分數是否具有”靈敏 性”成為形成性評量工具選擇的一個重要考量要 素。根據 Deno(1985)的解釋,愈靈敏的測驗 愈能清楚的反映出學生在短期內能力變化的情 形。測驗分數愈能儘快反映學生能力的微小變 化,教師愈容易獲得教學有效性的回饋資料,
以修訂出符合學生需要的教學內容。在本次研 究裡,五年級階段造句測驗中,意義正確句數 和非常用字數都是穩定、有效的作文能力指 標,這時便可從靈敏性的角度來選擇其中之一 為形成性評量工具。比較兩種分數跨越年級的 平均數變化情形:在普通班樣本部分,意義正 確句數每年成長幅度約為兩個單位,非常用字 數約在五個單位以上;在學生能力真的有變化 的前提下,非常用字數的作文能力監控資料較 容易讓老師察覺到能力變化的情形。除非有其 他特別的考量,否則在五年級階段,研究者建 議採用的系統是非常用字數的監控資料。
在建構效度的比較方面,本研究的發現與 先前回顧的文獻一致,顯示各種作文測驗大都 能夠正確區分不同能力的寫作者,由於本次研 究中直接比較總字數與相異字數在鑑別效果上 的差異,因此研究者進一步建議以相異字數的 計分為優先採用的方式。如果加入造句測驗方
面的資料,則意義正確句數或非常用字數計分 的造句測驗,也是很好的鑑別工具。這一部份 的結果顯示這些測驗可以作為篩選寫作學習障 礙或低寫作能力學生的簡便、有利工具。
參考文獻
一、中文部份
向惠芳(民82):寫出圖來-談看圖作文。國 教月刊,39期,40-49頁。
杜淑貞(民75):國小作文教學探究。臺北 巿:臺灣學生。
林寶貴、黃瑞珍、彭千紅(民86):兒童書寫 語言發展指標研究。國科會報告。
周台傑(民81):國民小學國語文成就測驗。
臺北:精華。
周台傑(民86):國民小學閱讀障礙學生閱讀 錯誤類型分析及有效學習策略之研究(I)。
國科會報告。
柯華葳、陳俊文(民81):小學生說話與作文 產品之比較。國立中正大學學報,3(1),
27-46頁。
施錚懿(民86):國小六年級寫作學習障礙與 普通學生在故事與說明文寫作成果之比 較。國立彰化師範大學特殊教育研究所碩 士論文。
曹綺雯、周碧紅(民82):寫作基本法。臺 北:書林。
黃國彥、鍾思嘉、傅粹馨(民66):羅桑二氏 非語文智力測驗指導手冊。臺北:正昇教 育科學社。
葉靖雲(民87):國小學習障礙學生作文錯誤 類型分析及有效學習策略之研究(一)。國 科會報告。
葉靖雲(民88):五種作文能力測驗的效度研 究。特殊教育學報,13期,331-366頁。
二、英文部份
Barenbaum, E., Newcomer, P., & Nodine, B.
(1987). Children's ability to write stories as a function of variation in task, age, and developmental level. Learn- ing Disability Quarterly, 10, 175-188.
Brand, A. G. (1991). Construction tasks for direct writing assessment: A frontier revisited. (ERIC Document Reproduc- tion Service No. ED 340 037).
Christenson, S. L., Thurlow, M. L., Ysseldyke, J. E., & McVicar, R. (1989).
Written language instruction for students with mild handicaps: Is there enough quantity to ensure quality? Learning Disability Quarterly, 12, 219-229.
Crowhurst, M. (1987). Cohension in argument and narration at three grade levels. Research in the Teaching of English, 21, 185-201.
Deno, S., Marston, D., & Mirkin, P. (1982).
Valid measurement procedures for continuous evaluation of written expres- sion. Exceptional Children, 48, 358- 371.
Deno, S. L., Mirkin, P. K., & Marston, D.
(1980). Relationships among simple measures of written expression and per- formance on standardized achieve ment tests ( Research Report No. 22 ).
Minneapolis: University of Minnesota, Institute for Research on Learning Dis- abilities.
Espin, C. A., Scierka, B. J., Skare, S., &
Halverson, N. (1999). Reading and Writing Quarterly, 15(1), 5-27.
Finn, P. J. (1977). Computer-aided de- scripion of mature words choices in writing. In C. R. Cooper & L. Odell
(Eds.), Evaluating writing: Describing, measuring, judging (pp69-90). Urbana, IL: National Council of Teachers of English.
Gajar, A. H. (1989). A computer analysis of written language variables and a com- parison of compositions written by university students with and without disabilities. Journal of Learning Dis- abilities, 22(2), 125-130.
Gajar, A. H. & Harriman, N. (1987).
Identifying data based procedures for written expression disabilities at the university level. Education, 107(3), 252-258.
Goodman, L. (1985). The effective schools movement and special education. Teach- ing Exceptional Children, 17, 102-105.
Graves, A., Semmel, M., & Gerber, M.
(1994). The effects of story prompts on the narrative production of students with and without learning disabilities. Learn- ing Disability Quarterly, 17, 154-164.
Hammill, D. D. & Bartel, N. R. (1995).
Teaching students with learning and behavior problems: Managing mild to moderate difficulties in resource and inclusive settings (6th ed.). Austin, TX:
PRO-ED.
Hammill, D. D. & Larsen, S. C. (1996).
Test of written language: examiner’s manual. Austin, TX: PRO-ED.
Hoffman, J. V. & Rutherford, W. L. (1984).
Effective reading programs: A critical review of outlier studies. Reading Re- search Quarterly, 20, 79-92.
Isaacson, S. L. (1988). Assessing the written product: Qualitative and quanti- tative measures. Exceptional Children,
54, 528-534.
Marston, D. B. (1989). A curriculum-based measurement approach to assessing aca- demic performance: What it is and why do it. In M. R. Shinn (Ed.), Curricu- lum-based measurement: Assessing special children (pp18-78). New York:
Guilford.
Mastropieri, M. A. & Scruggs, T. E. (1994).
Effective instruction for special educa- tion (2nd ed.). Austin, TX: PRO-ED.
Montague, M. & Graves, A. (1993).
Improving students’ story writing.
Teaching Exceptional Children, 25(4), 36-37.
Neilsen, L. & Piche, G. L. (1981). The influence of headed nominal complexity and lexical choice on teachers’ evalua- tion of writing. Research in the Teaching of English, 15(1), 65-73.
Newcomer, P. L. & Barenbaum, E. M. (1991).
The written composing ability of children with learning disabilities: A review of the loterature from 1980 to 1990. Journal of Learning Disabilities, 24(10), 578-593.
Nodine, B. F., Barenbaum, E. M., &
Newcomer, P. L. (1985). Story compo- sition by learning disabled, reading disabled, and normal children. Learn- ing Disability Quarterly, 8, 167-179.
Parater, D. & Padia, W. (1983). Effects of modes of discourse on writing perform- ance in grades four and six. Research in the Teaching of English, 17(2), 127-134.
Parker, R. I., Tindal, G., & Hasbrouck, J.
(1991). Progress monitoring with ob- jective measures of writing performance
for students with mild disabilities. Ex- ceptional Children, 58, 61-73.
Poteet, J. A. (1980). Informal assessment of written expression. Learning Disabil- ity Quarterly, 3(4), 88-98.
Quellmalz, E. S., Capell, F. J., & Chou, C. P.
(1982). Effects of discourse and re- sponse mode on the measurement of writing competence. Journal of Educatonal Measurement, 19(4), 241- 258.
Rieth, H. J., Polsgrove, L., & Semmel, M. I.
(1981). Instructional variables that make a difference: Attention to task and beyond. Exceptional Education Quar- terly, 2(3), 61-72.
Shinn, M. & Marston, D. (1985). Differ- entiating mildly handicapped, low achiev- ing, and regular education students: A curriculum based approach. Remedial and Special Education, 6(2), 31-38.
Thomas, D. & Donlan, D. (1980). Correla- tions between holistic and quantitative methods of evaluating student writing, grades 4 12. (ERIC Document Repro- duction Service No. ED 221 976).
Tindal, G. A. & Marston, D. B. (1990).
Classroom based assessment: Evaluat- ing instructional outcomes. New York:
Merill/Macmillan.
Vacca, R. T. & Vacca, J. L. (1989). Con- tent area reading (3rd ed.). Clenview, IL: Acott, Foresman and Comparny.
Vallecorsa, A. & Garriss, C. (1990). Story composition skills of middle grade students with learning disabilities. Ex- ceptional Children, 57, 48-53.
Videen, J., Deno, S. L., & Marston, D. (1982).
Correct word sequences: A valid indica- tor of proficiency in written expression (Research Report No. 84). Minneapolis:
University of Minnesota Institute for Research on Learning Disabilities.
Wiggins, G. (1989). A true test: Toward more authentic and equitable assessment.
Phi Delta Kappan, 70, 703-713.
Wiggins, G. (1993). Assessing student per- formance: Exporing the purpose and limits of testing. San Francisco: Jossey- Bass.
Wong, B., Wong, R., & Blenkinsop, J. (1989).
Cognitive and metacognitive aspects of learning disabled adolescents' composing problems. Learning Disability Quar- terly, 12, 300-322.
Bulletin of Special Education 1999, 18, 151-172
National Taiwan Normal University, Taipei, Taiwan, R.O.C.
THE VALIDITY OF INDICATORS OF WRITING COMPETENCE
Ching-Yun Yeh
National Changhwa University of Education]
The main purpose of the study was to establish the validity -- criterion-related as well as construct validity -- of five direct, objective and quantitative measures of written expression. The writing measures were composed of four kinds of test stimuli (title, story starter, single picture and four pictures),two modes of writing (story and expository), totally five types of writing samples.
Two types of scores--total number of words and the number of different words--were derived from these measures. Besides, validity of scores derived from sentence construction task were also examined. The criterion measures included class grades of written expression and language. The results showed that writing measures with the number of different words as dependent variable correlated moderately with the criterion measures. Moreover, number of different words derived from each measure could differentiate students from various grades and with high/low ability on written expression. Scores of sentence construction correlated stongly with the criterion measures and were able to discriminate students with different writing competence.
Key words: elementary, assessment, validity, mode of writing, writing stimulus, learning disabilties, sentence construction, validity, total number of words, number of different words, matures words