第一章 緒論
第四節 研究範圍與研究限制
此節在說明本研究之研究範圍及研究限制:
壹、研究範圍
自研究對象而言:
依據研究動機與研究目的,以國中基本學力測驗成績與在學成績為研究範 圍;研究對象主要是國中學生具交互作用之物理與化學、生物及地球科學三科自 然科畢業成績,進而預測國中基本學力測驗自然科成績之資料為例,以交叉驗證 法,比較基於訊息理論非可加性完全測度 Choquet 積分迴歸模式與複迴歸模式、
脊迴歸模式之預測效力。
貳、研究限制
一、自研究對象而言
基於時間與經費的考量,本研究只取樣苗栗某私立中學國中部 94 學年度畢 業學生成績;由於在學成績各班老師評分標準不一致,所以本研究以班級為單位 進行國中基本學力測驗自然科成績預測效力的研究。
二、自研究方法而言
基於時間及樣本數少的考量,本研究僅使用交叉驗證法來做比較預測效力,
交叉驗證法的優點就是能在樣本數小的情況下,可達一致性。
第貳章 文獻探討
本章共分為四節,第一節在探討國中基本學力測驗,包含學力測驗分數的意 義以及學力測驗分數的建立;第二節為單調性測度的探討,包含單調性測度的發 展與改進;第三節為亂度與訊息理論的探討;第四節在探討交叉驗證法,包含交 叉驗證法的定義以及不同類型之比較。
第一節 國中基本學力測驗
國中基本學力測驗是教育部於民國 90 年起開始實施的一套標準化測驗,將 考生的作答結果以量尺分數型式呈現,其目的是要評量學生在各個學科上的基本 能力,來做為學生「高級中學多元入學」的依據。國內的各項考試分數都是以對 各個題目加權計分而得到,然後加總得到一個總分作為測驗分數;然而,基本學 力測驗在計分時,原始分數將依照專家學者針對基本學力測驗所進行之研究結果 而建立的公式來進行,轉換成 1~60 分的量尺分數。本節將分別從基本學力測驗 分數的意義與基本學力測驗分數的建立兩方面來闡述。
壹、基本學力測驗分數的意義
從統計上的實質意義來看,由於每一個分數都有測量誤差,因此兩個人在測 驗分數上的些微差距可能是誤差造成的,通常我們會以統計上是否有達到顯著的 差異來說明兩個人的分數到底有沒有差異。舉例來說(參見表 3-2-1),如果一 個人的分數是 40 分,而測量誤差是 3 分,此時我們可以說明此人的能力範圍在 37~43 分之間,以常態分布的機率來看,此人能力介於 37~43 分之間的機率約為
68%(林清山,1992);現今有另一個人,其分數為 43 分,測量誤差也是 3 分,
則我們就有 68%的信心認為此人的分數比前一個人高。當然我們也可以用兩個標 準差來作為判斷兩個人的分數是否有差異的依據,例如,當一個人的分數是 46 分,誤差也是 3 分,比前述 40 分的人多了兩倍的測量誤差,我們就有更高的信 心(約為 95%)認為此人的分數比前一個人高。而這樣的比較都是建立在各個分 數的測量誤差是相同的基礎之下,這也就是傳統測驗理論的基本假設(王寶墉,
1995)。
表 2-1-1 三名學生分數比較
學生 A B C 分數 40 43 46 測量誤差(SEM) 3 3 3
68% 信賴區間 37~43 40~46 43~49 95% 信賴區間 34~46 37~49 40~52
貳、基本學力分數的建立
一般測驗機構所採用的量尺分數及其應用之測驗(參見表 2-1-2)大概可以 分為兩種:(1)將原始分數常態轉換(normalizing raw scores)之量尺分數。(2)
均等測量標準誤(equalizing measurement error variability)之量尺分數。在測驗上 通常見到的是,對兩個極端的考生(即能力較高或較低的考生)而言,測驗分數 的誤差會比在一般中等能力考生的測驗分數的誤差還要大,而且不同考生分數之 信賴區間的大小亦將有所不同(Kolen, Hanson, & Brennan, 1992)。如果採用均 等測量標準誤的量尺分數,不同能力考生所得分數的精確程度將會類似,不至於 有能力高或能力低的考生的測量誤差比能力中等的考生測量誤差來得大的情 形;而因為在各分數點上的測量誤差均等或非常近似,也使得分數帶解釋方式的 運用變得容易;因此,基本學力測驗將採用這種均等測量標準誤的量尺分數。
表 2-1-2 量尺分數使用之測驗的類型
類型 常態轉換 均等測量標準誤
使用之測驗
1. GRE or TOEFL 2. 比西量表分數
3. 魏氏兒童智力量表分數
ACT Assessment Test
以我們對未來基本學力測驗的信度估計而言,一份 40 題左右的測驗,其信 度應該有 0.85 左右。再採用 Kelley (引自 Brennan, 1989)對測量標準誤差分數 的建議,認為以 3 分為一個測量標準誤差單位較為理想,如此所計算出來的群體 分數的標準差為 7.75,再根據常態分布的機率來看,正負四個標準差就能涵蓋幾 乎全部(99.99%)的人;因此,若要涵蓋所有的群體,量尺分數就必須要有 62 分(7.75×4×2),為了使用上的方便,我們單純的將量尺分數定成 1~60 分。
[公式] 根據測量誤差(SEM)與測驗信度(ρ)以及群體分數標準差的(SD)
關係公式(如下所示,引自賴保禎,周文欽,林世華,1996):
SEM = SD× 1−ρ
第二節 單調性測度探討
壹、單調性測度與模糊積分之發展契機
現今最廣泛被應用之多重決策統計理論,主要建構於嚴謹優美之可加性機率 測度理論上,但是當我們欲進行預測及分類之資料具有潛在交互作用時,傳統可 加性測度分析方法雖計算方便,卻在實際應用上,會遇到情境不盡相符,無法有 效的表達主觀評估的模糊性,常有力有未逮及功效不彰之感。
在此舉一簡例說明如下:
[例]假設某國中之畢業成績中,自然學科之科目包含物理與化學、生 物、地球科學三科,三科之滿分均為 100 分,某生成績依次分別為 70,80,90 分,則表現其整合學習能力之自然科成績總分應如何加權計 分?
情況一:若三科目之重要度加權為已知,分別為 0.5 比 0.3 比 0.2,則 其加權平均為 70 0.5 80 0.3 90 0.2× + × + × =77
情況二:若三科目之重要度加權為未知,則一般可視為等加權,則其 加權分平均為 70 1 80 1 90 1 80
3 3 3
× + × + × =
然而,若以嚴謹之測度論之觀點檢視上例,則上述三科成績之重要度之直接 加權可視為一種可加性計分測度,必須滿足物理與化學、生物、地球科學三科相 互之間無交互作用之基本假設。事實上,這三科間多少會包含影響整合學習能力 之潛在重疊交互作用與互補交互作用;例如三科中均包含語文閱讀理解能力,數 式計算能力,實驗操作能力等,因未考慮學科間之重疊交互作用,可能任二科之 基本學習能力,會發生重複計算之情形,另外若未考慮學科間互補整合學習能力 則會發生偏低計算之情形,因此引發兩種待解決之測度問題。在情況一中,單科 重要度為已知,如何考慮交互作用而訂定多科聯合之非完全模糊測度及整合模糊
積分的問題,上述情形在λ測度、P 測度、m 測度、廣義 m 測度、ρ∗測度、及完 備 m 測度等已有論析;至於情況二,單科重要度或測度為未知,須與多科聯合之 測度一併訂定其單調性完全測度及整合模糊積分的問題,這是本節探討解決之主 要課題。
貳、單調性測度定義與分類
一般常見之 Lebesgue 測度及機率測度,皆為可加性測度之特例,其滿足可加 性之測度必滿足單調性,反之不必然;現在我們放寬限制,以單調性取代可加性 之測度即為單調性測度,此時可加性之測度即為單調性測度之特例,簡而言之,
單調性測度包含可加性測度與非可加性測度。單調性測度又稱模糊測度,其初始 概念首先由 Dempster (1967) 提出,完備之發展由 Shafer (1976) 提出,單 調性測度及其分類之嚴謹定義如下:
一、單調性測度
若
(
X, 2X)
為可測空間,且集合函數g: 2X →[ ]
0,1 滿足下列條件時,則稱g為(
X, 2X)
上之單調性測度(monotonous measure)或模糊測度(fuzzy measure):(1) g
( )
φ =0 ,g X( )
=1 [正規性(regularity)](2) ∀A B, ∈2 ,X A⊆B⇒g A
( )
≤g B( )
[單調性(monotonicity)]
二、單調性測度之分類
令g為
(
X, 2X)
上之單調性測度:(1) 若 ∀A B, ∈2 ,X A∩B= ∋φ g A
(
∪B)
=g A( )
+g B( )
時,則稱g為(
X, 2X)
上之可加性測度(additive measure) 調性測度(mixture monotonous measure)。
(5) 若g不為可加性測度,則稱為非可加性測度(non-additive measure)。
三、單調性非完全測度之分類
(1) gP
( )
φ =0 ,gP( )
X =1(3) ∀ ⊂A X, 2≤ A <n
第三節 亂度及訊息理論探討
[註] 上述顯示:機率分配亂度反應機率分配之散亂程度或不確定性。
(二)H f
(
X0 || fX1)
≥0 , H f(
X1|| fX0)
≥0(三)(a)fX0
( )
x = fX1( )
x ,∀ ∈x R ⇒ H f(
X0|| fX1)
=H f(
X1|| fX0)
=0(b)H f
(
X0|| fX1)
=H f(
X1|| fX0)
不恆成立。其顯示兩分配相同時相對亂度最小,但相對亂度不具對稱性,故不可視為分離度。
參、機率分配之分離度及其性質
一、定義:兩離散機率分配fX1
( )
x 與 fX2( )
x 之分離度(divergence)為(
X1|| X2) (
X1|| X2) (
X2 || X1)
J f f =H f f +H f f
二、性質:fX1
( )
x 與 fX2( )
x 之分離度具對稱性(
X1|| X2) (
X2|| X1)
J f f =J f f
顯示兩分配之分離度反應兩分配不相同之程度。
肆、機率分配之條件亂度及其性質
一、定義:條件亂度(Conditional Entropy)為
(a)
(
|) ( (
|) ) (
|)
logb(
|)
x
H X Y = y =H f x Y =y = −
∑
f x Y= y f x Y= y(b)
(
|)
Y( ) (
|)
y
H X Y =
∑
f y H X Y = y 二、性質:(一)(a)H X Y
(
| =y)
≥0(b)H X Y
(
|)
≥0(二)(a)H X Y
(
|)
=H X Y(
,)
−H Y( )
≥0(b)H Y X
(
|)
=H X Y(
,)
−H X( )
≥0伍、機率分配之相互訊息及其性質
一、定義:兩離散機率分配fX1
( )
x 與 fX2( )
x 之相互訊息(Mutual Information)為(
X || Y) (
||) ( (
,)
||( ) ( ) )
I f f =I X Y =H f x y f x f y 二、性質:
(一)
( ) ( ) ( )
( ) ( )
|| XY , logb XY , 0
x y X Y
f x y
I X Y f x y
f x f y
=
∑∑
≥(二)X⊥⊥Y ⇒ I f
(
X || fY)
=I X Y(
||)
=0當X⊥⊥Y或兩分配相關為 0 時,相互訊息最小,且其值為 0,其即相互訊息反應相 關程度。
(三)I X Y
(
||)
=H X( )
+H Y( )
−H X Y(
,)
≥0相互訊息與聯合分配亂度為反變,聯合分配亂度表兩分配不相關聯程度,而相互 訊息則表兩分配有共同訊息程度,相當於不考慮變數值之相關程度。
(四)I X Y
(
||)
=H X( )
−H X Y(
|)
≥0無條件分配與條件分配之差,其亦反應相關程度。
(五)(a)H X Y
(
|)
≤H X( )
≤H X Y(
,)
(b)H Y X
(
|)
≤H Y( )
≤H X Y(
,)
條件分配不大於無條件分配,邊際分配不大於聯合分配。
陸、機率分配之條件訊息及其性質
一、定義:兩離散機率分配fX1
( )
x 與 fX2( )
x 之條件訊息(Conditional Information)( ) ( )
( )
|| ||
X Y
I X Y C f f
= H X 二、性質:
(i)
( ) ( ) ( )
( ) ( )
|| |
|| 1 0
X Y
I X Y H X Y C f f
H X H X
= = − ≥
(ii)0≤C f
(
X || fY)
≤1第四節 交叉驗證
壹、交叉驗證法之定義
資料採礦(data mining)所要處理的問題,就是在龐大的資料庫中尋找出有 價值的隱藏事件,並且加以分析。而其主要的貢獻在於,它能從資料庫中獲取有 意義的資訊以及對資料歸納出有結構的模式,以作為企業在進行決策時之參考依 據(Carven and Shavlik, 1997)。資料採礦應用於選取模型時,抽樣與建立模型
(Training and testing)是一種常用且有效的方法,目的主要在驗證假設的模型是 否適合,其方法為:將樣本資料分為訓練樣集(Training set)與驗證集(Validation set)兩組,訓練集資料用以估計參數並建立模型,而驗證集資料則是用以測試訓 練集所建立的模型,驗證之結果可作為判斷模型假設是否顯著的指標。
交叉驗證法是抽樣與建立模型的方法之一,它是將一組具有獨立且分配相同 的樣本資料以隨機抽樣的方法分成訓練集與驗證集兩個集合,接著進行訓練與驗
交叉驗證法是抽樣與建立模型的方法之一,它是將一組具有獨立且分配相同 的樣本資料以隨機抽樣的方法分成訓練集與驗證集兩個集合,接著進行訓練與驗