第一章 緒論
第二節 研究目的
根據上述之研究動機,在具有潛在交互作用的資料下,本研究之目的在基本 事件測度為未知時,提出基於訊息理論之兩則非可加性完全測度包括ε完全測度 及η 完全測度,進而提出ε完全測度及η 完全測度之 Choquet 積分迴歸模式,以 交叉驗證法比較上述兩項基於訊息理論非可加性完全測度 Choquet 積分迴歸模式 與複迴歸模式、脊迴歸模式的預測效力,並撰寫電腦應用程式,作為日後研究者,
一些具體的建議或可行研究方法與參考依據。故整體而言,本研究欲達成的具體 目的為:
一、發展出基於訊息理論之兩則非可加性完全測度:(1)為推廣相互訊息係數定 義複相互訊息係數,所提出規格化複相互訊息非可加性完全測度,在此稱為 η完全測度;(2)另一為規格化亂度非可加性完全測度,在此稱為ε完全測 度。
二、運用程式軟體 MATLAB,撰寫出計算ε完全測度及η 完全測度之 Choquet 積分值以及其迴歸模式與複迴歸模式、脊迴歸模式進行交互驗證法的電腦應 用程式。
三、提出ε完全測度及η 完全測度之 Choquet 積分迴歸模式,以交叉驗證法進行 上述兩項基於訊息理論非可加性完全測度 Choquet 積分迴歸模式與複迴歸模 式、脊迴歸模式之預測效力比較。
第三節 專有名詞解釋
壹、訊息理論
訊息理論在1948年由 Claude E. Shannon 最早提出,在現今這個資訊時代,
我們每天都要處理與交換資訊,資訊這個觀念已經存在很久了,而研究訊息處理 和交換的理論,就是今日我們所熟知的訊息理論。訊息有著不確定性,在直覺上 我們可以發現,越不可能發生的事件發生,給我們的訊息就越大。
在訊息理論中,我們可以把訊息來源約化成一個隨機變數(random variable)。令 X ∼ px( ),x x∈X 是一個訊息來源,我們可以直覺假設在事件
{
X =x}
中,訊息為 i x( )= f (px( ))x ,其將會滿足以下的性質:(1) f (1) = 0
(2) f'( )α 存在,對於所有的 0<α<1
(3) f(αβ) = f(α)+f(β) ,對於所有的 0<α, β≤1
貳、非可加性測度
在模糊測度的分類中,令 為 上之模糊測度且 ,則:
(1)若∀A B, ∈2 ,X A B∩ = ∋φ g A B
(
∪)
=g A( )
+g B( )
時,則稱 為(
X, 2X)
上之可加性測度(additive measure)。
(2)若∀A B, ∈2 ,X A∩B= ∋φ g A
(
∪B)
>g A( )
+g B( )
時,則稱g為(
X, 2X)
上之超可加性測度(super-additive measure)。
(3)若∀A B, ∈2 ,X A∩B= ∋φ g A
(
∪B)
<g A( )
+g B( )
時,則稱g為(
X, 2X)
上之次可g
(
X, 2X)
, 2 ,X ,
A B A B A B X
φ ≠ ∀ ∈ ∩ =φ ∪ ≠
g
加性測度(sub-additive measure)。
若g不為可加性測度、超可加性測度及次可加性測度時,稱為混合單調性測 度(mixture monotonous measure),也可稱為非可加性測度(non-additive
measure)。
Choquet 積分是傳統可加性積分之推廣,也是最早由 Choquet(1953)所提 出之模糊積分。
伍、迴歸模式
迴歸分析可用來找出兩個或兩個以上計量變數間的關係,並進而從一群變數 中可以預測資料趨勢,如:若某人知道廣告費用和銷售之關係,則他可以藉由迴 歸分析從廣告費用中預測銷售。
在迴歸分析中,最簡單的模型是二變數的直線迴歸關係式,即所謂的簡單線 性迴歸模型 (Simple Linear Regression Model)。設X 為自變數,Y為應變數,在 一特定X值下重複實驗或觀察,則Y觀測值可構成一條件機率分配這兩變數的函 數關係,可以數學公式表示為:y= f x
( )
,因此若已知x之值,可由函數關係中計算出y之預測值。
陸、複迴歸模式
複迴歸是所有統計方法中最受廣泛使用的方法之一,而在模式中引用一個自 變數並不能提供正確或足夠的訊息,因為用一個自變數其敏感度較多個自變數 小,而且敘述問題的範圍較窄,例如在對平均數求預測值時,若單用一個自變數 估計則效果較差精確度不夠。在多重迴歸模式中,採用多個自變數對平均數求預 測值,常可以求得較精確及有效的估計值,用以瞭解一組預測變項和一個效標變 項的直線關係,而每個預測變項的預測能力,是研究者重要的參考指標。
柒、脊迴歸模式
脊迴歸分析法是由 Hoerl 及 Kennard 於 1970 年所提出,主要是修改最小平方 法,允許有偏估計量,而矯正自變數間呈現共線性的情形,其目的在於迴歸係數 β之估計過程中損失少許準確度(precision),而提高估計精確度(accuracy)的 一種偏量估計式,估計所得脊迴歸估計式β∧RR
( )
K 雖具偏差性,但在共線性存在的情況下,脊迴歸估計式之總變異卻比最小平方估計式β∧之總變異小,表示估計結 果較為穩定、精確。
令Y = Xβ +ε , ~ N 0 ,ε
(
σ 2In)
為一複迴歸模式,βˆ=(
X X′)
−1X Y′ 為複迴歸係數估計量,而βˆk =
(
X X′ +kIn)
−1 X Y′ 為其脊迴歸係數估計量。若 X X′ = In 且 n 2
k σ
= β β
′ ,可以求得 M SE
( )
βˆk ≤ M SE( )
βˆ 。則 Hoerl , Kenard and Baldwin 所提出之脊迴歸模式中,脊迴歸係數為
(
ˆ)
1ˆk X X kIn X Y
β∗ = ′ + − ′ ,其中
ˆ2
ˆ ? k nσ
= β β
′ 。
第四節 研究範圍與研究限制
此節在說明本研究之研究範圍及研究限制:
壹、研究範圍
自研究對象而言:
依據研究動機與研究目的,以國中基本學力測驗成績與在學成績為研究範 圍;研究對象主要是國中學生具交互作用之物理與化學、生物及地球科學三科自 然科畢業成績,進而預測國中基本學力測驗自然科成績之資料為例,以交叉驗證 法,比較基於訊息理論非可加性完全測度 Choquet 積分迴歸模式與複迴歸模式、
脊迴歸模式之預測效力。
貳、研究限制
一、自研究對象而言
基於時間與經費的考量,本研究只取樣苗栗某私立中學國中部 94 學年度畢 業學生成績;由於在學成績各班老師評分標準不一致,所以本研究以班級為單位 進行國中基本學力測驗自然科成績預測效力的研究。
二、自研究方法而言
基於時間及樣本數少的考量,本研究僅使用交叉驗證法來做比較預測效力,
交叉驗證法的優點就是能在樣本數小的情況下,可達一致性。
第貳章 文獻探討
本章共分為四節,第一節在探討國中基本學力測驗,包含學力測驗分數的意 義以及學力測驗分數的建立;第二節為單調性測度的探討,包含單調性測度的發 展與改進;第三節為亂度與訊息理論的探討;第四節在探討交叉驗證法,包含交 叉驗證法的定義以及不同類型之比較。
第一節 國中基本學力測驗
國中基本學力測驗是教育部於民國 90 年起開始實施的一套標準化測驗,將 考生的作答結果以量尺分數型式呈現,其目的是要評量學生在各個學科上的基本 能力,來做為學生「高級中學多元入學」的依據。國內的各項考試分數都是以對 各個題目加權計分而得到,然後加總得到一個總分作為測驗分數;然而,基本學 力測驗在計分時,原始分數將依照專家學者針對基本學力測驗所進行之研究結果 而建立的公式來進行,轉換成 1~60 分的量尺分數。本節將分別從基本學力測驗 分數的意義與基本學力測驗分數的建立兩方面來闡述。
壹、基本學力測驗分數的意義
從統計上的實質意義來看,由於每一個分數都有測量誤差,因此兩個人在測 驗分數上的些微差距可能是誤差造成的,通常我們會以統計上是否有達到顯著的 差異來說明兩個人的分數到底有沒有差異。舉例來說(參見表 3-2-1),如果一 個人的分數是 40 分,而測量誤差是 3 分,此時我們可以說明此人的能力範圍在 37~43 分之間,以常態分布的機率來看,此人能力介於 37~43 分之間的機率約為
68%(林清山,1992);現今有另一個人,其分數為 43 分,測量誤差也是 3 分,
則我們就有 68%的信心認為此人的分數比前一個人高。當然我們也可以用兩個標 準差來作為判斷兩個人的分數是否有差異的依據,例如,當一個人的分數是 46 分,誤差也是 3 分,比前述 40 分的人多了兩倍的測量誤差,我們就有更高的信 心(約為 95%)認為此人的分數比前一個人高。而這樣的比較都是建立在各個分 數的測量誤差是相同的基礎之下,這也就是傳統測驗理論的基本假設(王寶墉,
1995)。
表 2-1-1 三名學生分數比較
學生 A B C 分數 40 43 46 測量誤差(SEM) 3 3 3
68% 信賴區間 37~43 40~46 43~49 95% 信賴區間 34~46 37~49 40~52
貳、基本學力分數的建立
一般測驗機構所採用的量尺分數及其應用之測驗(參見表 2-1-2)大概可以 分為兩種:(1)將原始分數常態轉換(normalizing raw scores)之量尺分數。(2)
均等測量標準誤(equalizing measurement error variability)之量尺分數。在測驗上 通常見到的是,對兩個極端的考生(即能力較高或較低的考生)而言,測驗分數 的誤差會比在一般中等能力考生的測驗分數的誤差還要大,而且不同考生分數之 信賴區間的大小亦將有所不同(Kolen, Hanson, & Brennan, 1992)。如果採用均 等測量標準誤的量尺分數,不同能力考生所得分數的精確程度將會類似,不至於 有能力高或能力低的考生的測量誤差比能力中等的考生測量誤差來得大的情 形;而因為在各分數點上的測量誤差均等或非常近似,也使得分數帶解釋方式的 運用變得容易;因此,基本學力測驗將採用這種均等測量標準誤的量尺分數。
表 2-1-2 量尺分數使用之測驗的類型
類型 常態轉換 均等測量標準誤
使用之測驗
1. GRE or TOEFL 2. 比西量表分數
3. 魏氏兒童智力量表分數
ACT Assessment Test
以我們對未來基本學力測驗的信度估計而言,一份 40 題左右的測驗,其信 度應該有 0.85 左右。再採用 Kelley (引自 Brennan, 1989)對測量標準誤差分數 的建議,認為以 3 分為一個測量標準誤差單位較為理想,如此所計算出來的群體 分數的標準差為 7.75,再根據常態分布的機率來看,正負四個標準差就能涵蓋幾 乎全部(99.99%)的人;因此,若要涵蓋所有的群體,量尺分數就必須要有 62 分(7.75×4×2),為了使用上的方便,我們單純的將量尺分數定成 1~60 分。
[公式] 根據測量誤差(SEM)與測驗信度(ρ)以及群體分數標準差的(SD)
關係公式(如下所示,引自賴保禎,周文欽,林世華,1996):
SEM = SD× 1−ρ
第二節 單調性測度探討
壹、單調性測度與模糊積分之發展契機
現今最廣泛被應用之多重決策統計理論,主要建構於嚴謹優美之可加性機率 測度理論上,但是當我們欲進行預測及分類之資料具有潛在交互作用時,傳統可 加性測度分析方法雖計算方便,卻在實際應用上,會遇到情境不盡相符,無法有 效的表達主觀評估的模糊性,常有力有未逮及功效不彰之感。
在此舉一簡例說明如下:
[例]假設某國中之畢業成績中,自然學科之科目包含物理與化學、生
[例]假設某國中之畢業成績中,自然學科之科目包含物理與化學、生