• 沒有找到結果。

非固定權重因子之試題難易度模糊統計評估 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "非固定權重因子之試題難易度模糊統計評估 - 政大學術集成"

Copied!
38
0
0

加載中.... (立即查看全文)

全文

(1)國 立 政 治 大 學 應 用 數 學 系 數 學 教 學 碩 士 在 職 專 班 碩士學位論文. 政 治 大. 立. ‧ 國. 學. 非固定權重因子之試題難易度模糊統計評估. ‧. Fuzzy Statistical Evaluation with Non-fixed Weighted. Nat. n. al. er. io. sit. y. Factors in the Item Difficult Parameter. Ch. engchi. i n U. v. 碩專班學生:許家源撰 指導教授:吳柏林博士 中. 華. 民. 國. 一. 百. 年. 六. 月. 十. 三. 日.

(2) 中文摘要 在詴題難易度分析上,傳統方式常以答對率或得分率的高低來認定詴題的難 易度。但答對率或得分率高低並不能真正表達應詴者在答題時的難易感受程度。 過去研究指出影響數學科詴題難易度的主要因素有三:評量的數學內容、解題時 的思考策略及解題所需的步驟數。 本論文針對影響數學科詴題難易度的三個主要因素進行分析統計。以模糊統 計的角度,提出非固定權重因子之二維模糊數。應用模糊數絕對距離的概念以摒 除族群中異端值,最後針對不同族群進行難易指標分析與檢定。. 政 治 大. 關鍵字:難易度預估,模糊統計,數學詴題,無母體數檢定. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. v. i n U. v.

(3) Abstract On the basis of difficulty analysis, the hit rate or the scoring rate are considered as the index of the difficulty of the questions traditionally. However, these rates can not represent how test takers feel when taking tests. According to the previous papers on this subject, they note three factors to affect the difficulty analysis on math questions the content of the evaluation, the strategies of question solving, and the required steps to solve a question. This research is focused on the three major factors which influence the difficulty. 政 治 大 number will be presented with 立non-fixed weighted factors. By applying the absolute of math examinations. With the angle of fuzzy statistics, a two-dimension fuzzy. ‧ 國. 學. distance concept of fuzzy number, the extreme values are excluded. Consequently, the indices of difficulty from different groups can be tested and analyzed.. ‧ sit. y. Nat. Keyword: Difficult forecast, Fuzzy Statistics, Mathematics question,. n. al. er. io. Nonparametric Tests. Ch. engchi. vi. i n U. v.

(4) 目次 摘要------------------------------------------------------------------------------------------------v Abstract------------------------------------------------------------------------------------------vi 目次----------------------------------------------------------------------------------------------vii 圖目次------------------------------------------------------------------------------------------viii 表目次--------------------------------------------------------------------------------------------ix 1.前言----------------------------------------------------------------------------------------------1 2.模糊集合與軟運算----------------------------------------------------------------------------3 2.1 隸屬度函數--------------------------------------------------------------------------------3 2.2 模糊數及軟運算--------------------------------------------------------------------------4. 政 治 大. 3.多因子模糊數及模糊絕對距離-------------------------------------------------------------7 3.1 二維模糊數及樣本帄均數---------------------------------------------------------------7. 立. 3.2 模糊樣本之絕對距離---------------------------------------------------------------------8. ‧ 國. 學. 3.3 模糊樣本異端值--------------------------------------------------------------------------11 3.4 詴題難易指標-----------------------------------------------------------------------------12 3.5 無母數檢定--------------------------------------------------------------------------------13. ‧. (1)威克生符號等級檢定-----------------------------------------------------------------14. y. Nat. (2)克洛斯可-瓦力士符號等級檢定----------------------------------------------------15. sit. (3)隨機性檢定-------------------------------------------------------------------------17. er. io. 4. 實例探討與分析----------------------------------------------------------------------------20. al. n. v i n Ch 4.2 抽樣調查與問卷設計--------------------------------------------------------------------20 engchi U 4.3 各樣本群詴題難易指標-----------------------------------------------------------------21. 4.1 數學詴題難易度變項--------------------------------------------------------------------20. 4.4 不同樣本群對詴題難易度分析--------------------------------------------------------26 5. 結論-------------------------------------------------------------------------------------------30 6. 參考文獻-------------------------------------------------------------------------------------32. vii.

(5) 圖目次 圖 2.1 模糊集合「中年」的隸屬度函數------------------------------------------------------3. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. viii. i n U. v.

(6) 表目次 表 2.1 五位顧客對餐廳服務滿意程度之隸屬度------------------------------------------6 表 3.1 五位顧客對商品滿意度之隸屬度---------------------------------------------------9 表 3.2 五位顧客對商品滿意度之意見距離-----------------------------------------------10 表 3.3 學生對國文與英文的喜好程度-----------------------------------------------------15 表 3.4 三位口詴委員的評分成績-----------------------------------------------------------17 表 3.5 商品每月銷售量-----------------------------------------------------------------------19 表 4.1 高中學生群各題標準差、帄均數及難易指標------------------------------------21 表 4.2 一般民眾群各題標準差、帄均及難易指標---------------------------------------21 表 4.3 第一題模糊樣本原始資料及取樣表-----------------------------------------------22. 政 治 大. 表 4.4 第一題權重模糊絕對距離-----------------------------------------------------------23 表 4.5 高中教師群在各詴題的難易指標--------------------------------------------------23. 立. 表 4.6 國中教師群在各詴題的難易指標--------------------------------------------------25. ‧ 國. 學. 表 4.7 各試題在各樣本群中的難易等級--------------------------------------------------27 表 4.8 四樣本群在威克生符號等級檢定結果--------------------------------------------28 表 4.9 五樣本群的隨機檢定結果-----------------------------------------------------------29. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. ix. i n U. v.

(7) 1.前言 統計分析方法在社會科學調查中廣為應用。在傳統的敘述統計中,帄均數、 眾數、中位數…等,常被作為分析調查的工具,此類分析結果都屬單一表徵,然 而在生活當中許多思維並非以單一面向而能言之。例如:人對天氣的冷熱感,什 麼是「冷」?什麼是「熱」?假設用傳統方式問卷調查“你認為天氣達多少溫度 就是熱?”經傳統統計方式取問卷之帄均數來分析,若結果為 23 度。我們是否 可以訂定達 23 度就稱為「熱」?低於 23 度便稱為「冷」呢?另外就大學畢業生 每月薪水所得滿意度,若採用傳統方式做問卷調查“你認為大學畢業生每月薪水. 政 治 大 答的都是一區間,若以傳統方式統計則難以計算出“大學畢業生每月薪水應是多 立 應是多少元?”可能有人答 2.4 萬到 2.5 萬、有人答 2.3 到 2.6 萬、…等。那每人. ‧ 國. 學. 少?”因為在人類社會生活中,許多事物難以用二元方式來論定,所以利用模糊 統計的方式來分析事物,更能呈現人類真實的感受,更能貼近事物的真實面。. ‧. 模糊理論由[11]Zadeh, L. A. (1965)提出,至今已漸漸從模糊數學理論研究及工. y. sit. al. er. (1991), [7]Dubois 與 Prade (1991), [10]Tseng 與 Klein (1992) 分別提出. io. [9] Ruspini. Nat. 程界之應用,推廣到社會科學界的傳統統計推論與方法論中。如[8]Lowen (1990),. v. n. 對理念概似(approximate reasoning)的計量方法。在社會科學計量方法發展與應用. Ch. engchi. i n U. 亦有詳細的實例,如[6]黃仁德與吳柏林(1995)提出臺灣短期貨幣需求函數穩定性 的模糊統計檢定方法;[4]吳柏林與楊文山(1997)對模糊統計在社會調查分析的應 用;[3]吳柏林與曾能芳(1998)考慮以模糊迴歸參數估計於景氣對策信號之迴歸模 型分析,這些研究均獲得不錯的結果。 在傳統教育測驗統計上,詴題難易程度都以答對率或得分率的方式來評定。 答對率或得分率高代表學生通過率高,因此推論詴題較容易;反之,答對率或得 分率低則代表學生通過率低,因此推論詴題較難。但單純以答對率或得分率高低 來評定詴題的難易程度,則缺少人們真正的感受程度。假設某詴題真的比較複雜 而難以計算,但因大部分學生熟於此類型題目,造成答對率或得分率偏高,是否. 1.

(8) 將此題評定為易呢?若某詴題真實屬容易,但應答者可能某些原故造成答題上失 誤,因此造成答對率或得分率偏低的結果,是否將此題評定為難呢?所以一個詴 題的難易不應只由答對率或得分率高低來決定,需將人們對詴題的感受程度納入 評判項目,較為客觀。 本論文期望以模糊軟計算方法代替傳統二元劃分方式,從大學學科能力測驗 數學科詴題中取材,針對高中學生、一般民眾、高、國中教師四個群組對詴題的 「難」 、 「易」認知進行研究分析。希望藉由本論文結果更能解讀各群組對詴題難 易程度的感受,以作為未來教學上的參考。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i n U. v.

(9) 2.糊模集合及軟運算 2.1 隸屬度函數 隸屬度函數是模糊理論的概念,其是由傳統集合中的特徵函數(characteristic function)所衍生出來,用來表示元素對模糊集合的隸屬度(membership grade),其 範圍在於 0 到 1 之間。[11]Zadeh (1965)在模糊集合論中提到,若某一元素屬於某 一集合的程度愈大,其隸屬度值愈接近於 1,反之則愈接近於 0。 傳統上我們在定義一個人是否是「中年人」常以 45 歲做一個界限,然而一 個 40 歲的人難道就不是「中年人」嗎?歲數 55 的人,難道也不能稱被作是中年. 政 治 大. 人嗎?若利用隸屬度函數則能獲得較合理的答案。如果 45 歲絕對屬於「中年」,. 立. 則其隸屬度自然屬於 1,而 40 歲的隸屬度函數值則為 0.8,此表示 40 歲屬於「中. ‧ 國. 學. 年」的程度有 0.8;而 55 歲的隸屬度函數值為 0.3,此表示 55 歲屬於「中年」的 程度有 0.3。與傳統集合的特徵函數比較,隸屬度函數似乎將特徵函數帄滑化,. ‧. 如圖 2.1。. n. al. er. io. sit. y. Nat. 隸 屬 度 1 函 數 0.8. Ch. engchi. i n U. v. 0.3 0. 40 45. 55. 圖 2.1 模糊集合「中年」的隸屬度函數. 在[12]Zimmermann (1991)提出隸屬度函數可分為離散型(discretization)與連續 型(continuous)兩種。離散型的隸屬度函數是直接給予有限模糊集合內每個元素的 隸屬度,並以向量形式表現;而連續型隸屬度函數則有幾種常用的函數形式[S函數、Z-函數、三角形函數、梯形函數、高斯(指數)函數]來描述模糊集點。函數 3.

(10) 定義的表現,可以是無限模糊集合的元素及其隸屬度之間的關係,也可以是有限 模糊集合的元素及其隸屬度之間的關係。. 2.2 模糊數及軟計算 傳統問卷設計上常要求受訪者在問項上選填單一數值,而人類對於問項的感 受程度具有糊模性及不確定性,因此傳統的問卷設計無法真實呈現受訪者的感受 程度。若能讓受訪者根據自己的意識,利用隸屬度函數或區間值表達心中對於問 項真正屬意的程度,則可更完整地傳達人類真實的思維。在考慮具有模糊特性的. 政 治 大. 問項時,資料本身便具有不確定性與模糊性,故我們定義模糊數如下:. 立 [1] 吳柏林(2005). ‧ 國. 學. 定義 2.1 模糊數. 設 U 為一論域,令 {L1 , L2 ,..., Ln } 為論域 U 的因子集。 u 為一對應到[0,1]間的. ‧. 實數函數,即 u : U  [0,1] 。假若佈於論域 U 之一述句 X 其相對於因子集的隸屬度. y. sit. io. al. n. U ( X ) . 1 ( X ) L1. Ch. . 2 ( X ) L2.  ... . engchi. er. 數可表示成:. Nat. 函數以 {1 ( X ), 2 ( X ),..., n ( X )} 表示,則在離散(discrete)的情形下,述句 X 的模糊. n ( X ). Li n U n. v. u (X ) 其中+是或的意思, i 表示述句 X 隸屬於因子集 Li 的程度。當 U 為連續時, Li 述句 X 的模糊數可表示成:  ( X )  . x X. ui ( X ) 。 Li. 例 2.1 學測詴題難度的模糊數表示 假設 X =學測詴題難度的感覺,以模糊數表示為 U ( X ) 。假設論域 U  L1  很難, L2  偏難, L3  適中, L4  偏易, L5  容易,若 X =學測詴題難度的. 感覺隸屬度函數為. 1 ( X )  0.15, 2 ( X )  0.35, 3 ( X )  0.2, 4 ( X )  0.2, 5 ( X )  0.1; 亦可以模糊數表示為 4.

(11) 0.15 0.35 0.2 0.2 0.1     L1 L2 L3 L4 L5. U ( X ) . 定義 2.2 模糊集合之基本運算. [1] 吳柏林(2005). 設 A , B 為論域 U 中兩個模糊集合,其隸屬度表徵為  A ,  B 。 (a)補集:  Ac ( x)  1   A ( x) (b)交集:  A B ( x)  min(  A ( x),  B )   A   B (c)聯集:  A B ( x)  min(  A ( x),  B )   A   B (d)距離: d1  歐基里得(Euclidian), d 2  漢民(Hamming). A. i 1. i. B. i. 學. 1 n 1 x: ( x ) ( x ) 0 ( xi ) ( n =論域因子集個數) n i 1  i A i B i . ‧. io. 0.2 0.15 0.2 0.3 0.15     國文 英文 數學 社會 自然. sit. A. er. Nat. 設 A , B 兩位學生對學習科目的隸屬度為. y. d 2 ( A, B)  例 2.2. 2. ‧ 國. 1 d1 ( A, B)  n. 政 治 大   ( x )   ( x )  ( n =論域因子集個數) 立 n. n. 0.25 0.1 0.2 0.15 a0.3    iv l C 英文 數學 社會 n自然 國文 h i U 則根據定義 2.2 可得以下之關係 e n g c h B. Ac . 0.8 0.85 0.8 0.7 0.85     國文 英文 數學 社會 自然. A B . 0.2 0.15 0.1 0.2 0.15     國文 英文 數學 社會 自然. A B . 0.3 0.25 0.2 0.3 0.15     國文 英文 數學 社會 自然. d1 ( A, B) . 1 (0.12  0.12  0.12  0.12  02 )  0.04 5. d 2 ( A, B ) . 1 5 1 i  A ( xi )  B ( xi ) 0 0.8 5 i 1 x:. 5.

(12) 定義 2.3 離散型模糊樣本均數. [1] 吳柏林(2005). 設 U 為一論域, L  {L1  1, L2  2, , Lk  k } 為佈於論域 U 上的 k 個語言變 數。若 {xi . k mi1 mi 2 m    ik , i  1,2,, n} ,為一組模糊樣本(  mij  1 )。則模糊 L1 L2 Lk j 1. 樣本均數為. 1 n 1 n 1 n mi1 mi 2    mik n i1 n i1 n i1 Fs    ...  L1 L2 Lk 其中 mij 為第 i 個樣本相對於語言上變數 L j 之隸屬度。. 政 治 大. 例 2.3 離散型模糊均數應用於餐廳服務滿意度調查. 立. 戊作調查,每位顧客對服務滿意度的隸屬度如表 2.1. 學. ‧ 國. 某餐廳想了解顧客對餐廳服務滿意程度,於是邀請五位顧客甲、乙、丙、丁、. ‧. Nat. L3. L4. 很不滿意. 不滿意. 普通. 滿意. 0.5. 0.1. al. n. 甲. 0.4. 乙. 0. 丙. 0. 丁 戊. C h0.5 e n g c h0 i. sit. L2. io. L1. er. 滿意程度. y. 表 2.1 五位顧客對餐廳服務滿意程度之隸屬度. i v0 n U 0.5. L5. 很滿意 0 0. 0. 0.4. 0.4. 0.2. 0.1. 0.3. 0. 0. 0.6. 0. 0.1. 0.4. 0.4. 0.1. 則模糊樣本均數為. 1 1 1 (0.4  0  0  0.1  0) (0.5  0.5  0  0.3  0.1) (0.1  0  0.4  0  0.4) 5 5 5 Fs    很不滿意 不滿意 普通 1 1 (0  0.5  0.4  0  0.4) (0  0  0.2  0.6  0.1) 5 5 滿意 很滿意. . 0.1 0.28 0.18 0.26 0.18     很不滿意 不滿意 普通 滿意 很滿意 6.

(13) 3.多因子模糊數及模糊絕對距離 3.1 二維模糊數及樣本平均數 在傳統問卷設計上,常以單一變項做為問卷調查的模式,而將單一變項的問 卷結果做為推論的唯一依據並不適合。本論文考慮人類的思考及感覺並非單一模 式,故提出二因子(變項)的模糊問卷,期望在二因子(變項)的模糊問卷調查之下, 所得問卷結果更能真實呈現受訪者的感受。首先本論文定義何謂二維模糊數。. 定義 3.1 二維模糊數. 政 治 大. 設 U 為一論域,令 {C1 , C2 ,  , Cn } 為論域 U 的因子集。  為一對應到[0,1]間. 立. 的實數函數,即  : U  [0,1] 。假若佈於論域 U 之一述句 X 其相對於因子集的隸. ‧ 國. 學. 屬度函數以 1 ( X ), 2 ( X ),, n ( X )表示,另一述句 Y 其相對於因子集的隸屬度 函數以 1 (Y ), 2 (Y ),, n (Y ) 表示,則在離散(discrete)的情形下,述句 X 的模糊. ‧. C1. io. Cn. i ( Xa), i (Y ) 表示述句 X , Y 隸屬於因子集 C. n. 其中+是或的意思,. C2. sit. y. 1 ( X ), 1 (Y )  2 ( X ), 2 (Y )    n ( X ), n (Y ). Nat. U ( X , Y ) . er. 數可表示成:. iv l C n hengchi U. Ci. i. 的程度。. 例 3.1a 顧客對某車商之汽車款式需求度及滿意程度的模糊數表示 某車商想了解顧客對汽車款式需求度及滿意程度,於是隨機邀請一位顧客作 調查,設論域為 U  休旅車、房車、跑車, X  顧客對車款的需求程度,則以. U ( X ) 表示; Y  顧客對車款的滿意度,則以表示 U (Y ) 。請顧客在各車款的需 求度填上 0~1 之間的數字,代表對此車款的“需求程度”,針對各車款的滿意度 也填上 0~1 之間的數字,代表對此車款的“滿意程度”。則此顧客對購買車款車 需求及滿意度的二維模糊數為. U ( X , Y ) . (0.5,0.3) (0.4,0.2) (0.1,0.5)   休旅車 房車 跑車 7.

(14) 例 3.1b 學生對學習科目喜愛程度及學習困難度的模糊數表示 設論域為 U  國文、英文、數學、自然、社會 , X  喜好程度,某學生針 對各科喜好程度的隸屬度為 0.1, 0.1, 0.4, 0.3, 0.1; Y  學習困難度,此學生對各 科學習困難度的隸屬度為 0.4, 0.1, 0.1, 0.1, 0.3。則此學生對學習科目喜愛程度及 學習困難度的二維模糊數為. (0.1,0.4) (0.1,0.1) (0.4,0.1) (0.3,0.1) (0.1,0.3)     國文 英文 數學 自然 社會. 定義 3.2 離散型二維模糊樣本均數. 政 治 大 (x , y ). 設 U 為一論域, L  {L1  1, L2  2,..., Lk  k} 為佈於論域 U 上的 k 個語言變. 立. ( xi1 , yi1 ) ( xi 2 , yi 2 )   ...  L1 L2. ik. ik. Lk. , i  1,2,..., n} ,為一組二維模糊樣本. 學. ‧ 國. 數。若 {xi  k. k. j 1. j 1. (  xij  1 、  yij  1 )。則模糊樣本均數為. ‧. 1 n 1 n  1 n 1 n  1 n 1 n    xi1 ,  yi1    xi 2 ,  yi 2    xik ,  yik  n n i1   n i1 n i1 n i1    ...   n i1 Fs   i1  L1 L2 Lk. sit. y. Nat. io. n. al. er. 其中 ( xij , yij ) 為第 i 個樣本相對於語言上變數 L j 之隸屬度。. 3.2 模糊樣本之絕對距離. Ch. engchi. i n U. v. 在同一屬性的樣本群中,針對其屬性所得的統計資料應具有一致性。換句話 說,同屬性的各樣本之間差異性不應過大,若某樣本與其他樣本之間差異性過 大,即此樣本的代表性偏低。因此,將此代表性偏低之樣本納入統計資料,如此 將會造成整體性的代表性降低。本論文為了避免同屬性樣本中因差異性過大而造 成群體代表性不足,將利用模糊樣本之絕對距離,統計各樣本之間的差異並摒除 差異過大的樣本,如此資料更能具代表性。. 8.

(15) 定義 3.3 兩離散型模糊樣本之絕對距離. [1] 吳柏林(2005). 設 U 為一論域,L  {L1  1, L2  2,..., Lk  k} 為佈於論域 U 上的 k 個一組有序 語言變數。若 {xi . k mi1 mi 2 m   ...  ik , i  p, q} ,  mij  1 為自論域中抽出的兩個 L1 L2 Lk j 1. 模糊樣本。則兩離散型樣本 x p 與 xq 之距離定義為. d ( x p , xq ) . 1 k  (mpj  mqj )  j k  1 j 1. 由定義可知距離 d 最大為 1,最小為 0。 d 值愈小,代表兩模糊樣本愈近似;. d 值愈大,代表兩模糊樣本愈不近似。值得注意的是此距離的定義不符合遞移. 政 治 大. 性,但較符合我們日常生活的實際經驗。若「A 與 B 的看法差不多」,「 B 與 C. 立. 的看法差不多」,不見得就代表「A 與 C 的看法差不多」,因為 A、C 的想法可. ‧. ‧ 國. 學. 能同中有異。. 例 3.2 若有一組受訪者的模糊意見表示如下. sit. y. Nat. n. al. er. io. 表 3.1 五位顧客對商品滿意度之隸屬度. 商品滿意程度. L1. 很不滿意. Ch. L3. L2. i n U. i e n g c h普通. 不滿意. v. L4. L5. 滿意. 很滿意. 甲. 0.4. 0.5. 0.1. 0. 0. 乙. 0. 0.5. 0. 0.5. 0. 丙. 0. 0. 0.4. 0.4. 0.2. 丁. 0.1. 0.3. 0. 0. 0.6. 戊. 0. 0.1. 0.4. 0.4. 0.1. 根據離散型模糊樣本相對距離定義,我們可算出各樣本間的相對距離。相對距離 的模糊數值大小可看出各樣本在不同語意變數上的差異性, 如:. 9.

(16) d (甲, 乙) . 0.4  0 0.5  0.5 0.1  0 0  0.5 0  0 0.4 0 0.1 0.5 0          L1 L2 L3 L4 L5 L1 L2 L3 L4 L5. d (丙, 戊) . 0  0 0  0.1 0.4  0.4 0.4  0.4 0.2  0.1 0 0.1 0 0 0.1          L1 L2 L3 L4 L5 L1 L2 L3 L4 L5. 由 d (甲,乙) 的模糊數值顯示甲、乙在「很不滿意」與「滿意」這二個選項差異性 很大,在「普通」上差異性小,而其他部分則無差異。 d (丙, 戊) 模糊數值顯示丙、 戊整體上大致無差異,只在「不滿意」與「滿意」上有小差異。 由定義 3.2,我們可進一步算出各樣本之間的絕對距離值。絕對距離的數值 大小則可看出各樣本整體之間的差異性。如下表 3.2 所示. 政 治 大. 表 3.2 五位顧客對商品滿意度之意見距離 乙. 丙. 丁. 0. 0.325. 0.525. 0.5. 0.45. 0.325. 0. 0.2. 0.175. 0.125. 0.525. 0.2. 0. 0.025. 0.5. 0.175. 0.025. 0. 0.125. 0.075. 0.05. n. al. Ch. y. sit. 0.45. er. 戊. Nat. 丁. ‧. 丙. ‧ 國. 乙. 戊. 學. 甲. 立. io. 甲. d. i n U. 0.075 0.05 0. v. 由上表可發現:顧客丙的意見與顧客丁的意見最接近。而顧客丁的意見與顧. engchi. 客戊的意見次之,其中顧客甲的意見與顧客丙的意見最不接近。 定義 3.4 離散型模糊樣本之絕對距離總和 設 U 為一論域,L  {L1  1, L2  2,..., Lk  k} 為佈於論域 U 上的 k 個一組有序 k mi1 mi 2 mik 語言變數。若 {xi    ...  , i  1,2,..., n} ,  mij  1 為自論域中抽出的 n L1 L2 Lk j 1. 個模糊樣本。則其中離散型樣本 x p 之絕對距離總和為其與其他所有離散型絕對 距離的總和,即表示為 n. S p  d ( x p , x1 )  d ( x p , x2 )  ...  d ( x p , xn )   d ( x p , xi ) i 1. 10.

(17) 例 3.3 由定義 3.3 及例 3.2 中,我們可進一步計算出各樣本的絕對距離總和:. S甲  d (甲,乙)  d (甲, 丙)  d (甲, 丁)  d (甲, 戊) =0.325+0.525+0.5+0.45=1.8 S乙  d (乙,甲)  d (乙, 丙)  d (乙, 丁)  d (乙, 戊) =0.325+0.2+0.175+0.125=0.825 S丙  d (丙,甲)  d (丙,乙)  d (丙, 丁)  d (丙, 戊) =0.525+0.2+0.025+0.075=0.825. S丁  d (丁,甲)  d (丁,乙)  d (丁, 丙)  d (丁, 戊) =0.5+0.175+0.025+0.05=0.775 S戊  d (戊,甲)  d (戊,乙)  d (戊, 丙)  d (戊, 丁) =0.45+0.125+0.075+0.05=0.7. 治 政 大 的絕對距離總和最小,代表戊的意見與其他樣本差異最小。 立. 由上可得知,甲的絕對距離總和最大,代表丁的意見與其他樣本差異最大;而戊. ‧ 國. 學. 3.3 糊模樣本之異端值. ‧. 針對同屬性群體進行屬性相關的統計調查,理論上所得統計資料的差異性不. sit. y. Nat. 應過大。換句話說,樣本彼此之間的絕對距離應不大,如果有絕對距離過大的樣. n. al. er. io. 本我們便要稱之為異端值,因此本論文依此訂定以下定義。. Ch. engchi. 定義 3.5 單因子離散型模糊樣本之異端值. i n U. v. 設 U 為一論域,L  {L1  1, L2  2,..., Lk  k} 為佈於論域 U 上的 k 個一組有序 語言變數。若 {xi . k mi1 mi 2 m   ...  ik , i  1,2,..., n} ,  mij  1 為自論域中抽出的 n L1 L2 Lk j 1. 個模糊樣本。其中 S p 代表某樣本 p 與其他樣本之絕對距離的總和,若 S p  Q3 , Q3 為此各樣本絕對距離的總和中的第 3 四分位數,則此樣本 p 為此樣本群的異. 端值。. 11.

(18) 例 3.4 由例 3.3 我們可計算所有樣本的絕對距離總和,並由總和值可計算出 Q3  0.825,因為甲與其他樣本絕對距離總和為 1.8,即 S甲  1.8  Q3 ,所以樣本. 甲為此樣本群中的異端值,它不具代表性,故可以摒除樣本甲。. 3.4 試題難易指標 影響數學詴題難易的主要三因素,分別是詴題所評量的數學內容、以及思考 策略與步驟數。本論文針對此三語言變數進行權重及難易度的二維模糊統計,設 論域為 U  數學內容、思考策略、步驟數, X  詴題的權重程度,則以 U ( X ). 政 治 大. 表示; Y  詴題的難易程度,則以 U (Y ) 表示。在問卷填寫上,針對論域的權重. 立. 程度填入 0~1 之間的數字,代表對此題的“權重程度”,針對論域的難易度也填. ‧ 國. 學. 入 0~1 之間的數字,代表對此題“難易程度”。則此詴題權重及難易程度的二維. ‧. U ( X , Y ) . 1( X ), 1(Y )  2 ( X ), 2 (Y )  3 ( X ), 3 (Y ). Nat. 數學內容. 思考策略. 步驟數. y. 模糊數為. er. io. sit. 本論文為考慮群組資料的代表性,除了去除異端值,另外在定義詴題難易度指標 上,因為幾何帄均數受極端值的影響較算術帄均數小,故採用幾何帄均作為指標. al. n. v i n 定義更具代表性。由此本論文定義出單一詴題難易度指標。 Ch engchi U 定義 3.6 試題難易度指標. 令 s* 為一組異端值修正後之二維模糊樣本群,則 Fs* 為此模糊樣本均數. 1 n 1 n  1 n 1 n  1 n 1 n    xi1 ,  yi1    xi 2 ,  yi 2    xik ,  yik  n n i1   n i1 n i1 n i1    ...   n i1 Fs *   i1  L1 L2 Lk 其中 ( xij , yij ) 為第 i 個樣本相對於語言上變數 L j 之隸屬度,則試題難易度指標定義 1. n.  xij. 1 n  n i1 為 DT     yij  , 0  DT  1。 j 1  n i 1  k. 12.

(19) 由定義中可知 DT 最大為 1,最小為 0。 DT 值愈大代表試題難度較高; DT 值愈小代表試題較易。. 例 3.5 如下為一組異端值修正後之二維模糊樣本群,. 甲. (0.4,0.5) (0.5,0.4) (0.1,0.1)   數學內容 思考策略 步驟數. 乙. (0.3,0.4) (0.4,0.2) (0.3,0.4)   數學內容 思考策略 步驟數. 丙. (0.2,0.3) (0.3,0) (0.5,0.7)   數學內容 思考策略 步驟數. 治 政 .3 0.4  0.2  0   0.4  0.3  0.2 0.5  0.4  0.3   0.5  0.4  0大 , ,     立 3 3 3 3     Fs  . 則. *. ‧ 國. 思考策略. 學. 數學內容. 0.4,0.2. 思考策略. . 0.3,0.4 步驟數. y. 數學內容. . sit. 0.3,0.4. Nat. . ‧.  0.1  0.3  0.5 0.1  0.4  0.7  ,   3 3    步驟數. n. al. er. io. 依定義 3.5,則此題難易度指標 DT  0.40.3  0.20.4  0.40.3  0.30. 3.5 無母數統計檢定. Ch. engchi. i n U. v. 在母體分配已知的假設下,進行母體如平均值、變異數、相關係數檢定等, 我們稱為母體統計檢定。一般統計檢定方法,都假定抽樣母體來自某一分配,最 常見的是假設抽樣母體來自常態分配。但是如果母體來自某一未知分配時,我們 可應用無母數統計方法,來解決當母體分配不是常態或母體分配未知,或樣本為 小樣本時的情形。本論文抽樣的對象為高中學生、一般民眾、高中教師與國中教 師,其樣本數較小且無法得知母體分配情形,故採此方法作為檢定工具。. 13.

(20) 1.威克生符號等級檢定(Wilcoxon Sign Rank Test) 假設我們由隨機成對樣本 {( X i , Yi ); i  1,, n} 中,要檢定兩母體 X , Y 是否有 差異。令 d i  Yi  X i 為成對 ( X i , Yi ) 之差值, i  1,, n 。對 d i 取絕對值,再以等級 1 給 d i 之最小值,等級 2 給 d i 之次小值,…,依此類推,以等級 n 給 d i 之最大 值。若有數個 d i 值相等,則取其在不同值下所對應等級的平均值。則易知全部 d i 等級和. n(n  1) 。 2. 令 T  為所有 d i 為正數的等級和, T  為所有 d i 為負數的等級和。則易知 T . 政 治 大 n(n2 1) 。因此在統計假. 或 T  的最小值均可為 0,且 T  或 T  的最大值均可能為. 立. 沒有差異。反之若 T  或 T  接近 0 或. n(n  1) ,則我們可接受 H 0 : X , Y 兩母體 4. 學. ‧ 國. 設 H 0 : M X  M Y 下,若 T  或 T  接近. n(n  1) ,則我們拒絕 H 0 。 2. ‧. 本論文將檢定三個群組彼此之間是否有差異性,因為問卷試題只有 20 個,. sit. y. Nat. 屬於小樣本,且問卷對象無法確定是否為常態分配,故採用無母數檢定方式。其. n. al. er. io. 中威克生符號等級檢定( Wilcoxon Sign Rank Test)適合本研究資料上的檢定。. 威克生符號等級檢定過程. Ch. engchi. i n U. v. 1.資料:一組隨機成對樣本 ( X i , Yi ) ,記 d i  Yi  X i , i  1,, n 2.統計假設: X , Y 兩母體分配的中位數一樣;即 H 0 : M X  MY ; H1 : M X  MY. 3.統計量: T  T  與 T  中較小的值 4.決策:在顯著水準  下的左尾檢定,查附錄表,若 T  T / 2 (臨界值),則拒絕 H 0. 例 3.6a 針對學生對國文與英文喜好程度進行調查。經由調查 8 位學生,依喜好 程度給予不同評分(1 至 10 分)。分數愈高代表愈喜歡。其結果如表 3.3,若以威. 14.

(21) 克生符號等級檢定,我們得到負號總和 T   13,而在   0.05 顯著水準下,用單 尾檢定, T0.05  6  T   13 。故我們接受 H 0 ,即學生在國文、英文喜好程度上無 差異。 表 3.3 學生對國文與英文的喜好程度 學生. 1. 2. 3. 4. 5. 6. 7. 8. 國文. 7.5. 4.0. 6.5. 3.4. 4.1. 5.7. 6.2. 8.9. 英文. 4.5. 6.5. 4.3. 5.0. 4.0. 7.1. 1.0. 7.7. di. 3.0. -2.5. 2.2. -1.6. 0.1. -1.4. 5.2. 1.2. d i 之等級. 7. 6. 3. 8. 2. 學. ‧ 國. 立. 治 政 5 4 1 大. 2.克洛斯-瓦力士檢定(Kruskal-Wallis Test). ‧. 克洛斯-瓦力士檢定,簡稱 K  W 檢定,乃用來檢定多組隨機樣本的母體分. sit. y. Nat. 配是否相同的問題。當多組隨機樣本的母體分配來自常態分配時,我們可使用 F. io. er. 檢定,來決定多組隨機樣本的母體分配是否相同。但是當母體分配不是來自常態. al. 分配時,我們就必頇應用克洛斯-瓦力士檢定。. n. v i n Ch 假設有 k 個相互獨立之母體,從每個母體抽出 e n g c h i Un 個隨機樣本, i  1,..., k 。將 i. 所有 n1  n 2  n3   n k  N 個混合樣本,按觀測值大小排等級。最小的觀測值給 1,次小者給 2,…,以此類推,最大的觀測值給 N ;若有數個觀測值給相等,. 則取其在不同值下所對應等級的帄均值。然後我們分別對每一組的隨機樣本計算 等級總和,以 Ri 表示;即 Ri  第 i 組樣本在混合樣本中的等級總和。 我們很容易知道 Ri 的期望值為. ni ( N  1) 。最後將 Ri 代入克洛斯可-瓦力士檢 2. 定量. K. k n ( N  1)  12 1 Ri  i    N(N  1) i 1 n  2 . 15. 2.

(22) . k Ri2 12   3( N  1) N(N  1) i 1 n. 若各組的母體分配皆相同,那麼 Ri 值差異應不大,則 K 值將不會太大。在 這種情況下,我們將接受 H 0 :各母體分配相同的統計假設。但是若有某組等級 總和 Ri ,相對過大或相對過小,則 K 值將會太大,這表示此 k 個母體的分配不完 全相同,因此我們將拒絕 H 0 。 在統計假設 H 0 為真,且各組樣本數 ni  5 的情況下, K 的統計量近似於自 由度為 (k  1) 的  2 分配。因此,由附表找臨界值,若 K 的統計量值大於臨界值, 則我們拒絕 H 0 。. 立. 政 治 大. 克洛斯可-瓦力士檢定過程. ‧ 國. 學. 1.資料: k 組相互獨立樣本,每組樣本有 n i 個觀測值, i  1,2,...., k n1  n2  n3    nm  N. ‧. 2.統計假設:該 k 組隨機樣本的母體分配是相同. Nat. sit. y. H 0 : F1  F2  ...  Fk. n. al. er. io. H 1 :至少有一組樣本其母體分配與其他組母體分配不同 k Ri2 12 3.統計量: K    3( N  1) N(N  1) i 1 n. Ch. engchi. i n U. v. 4.決策:在顯著水準  下的右尾檢定,如果 ni  5 ,則 K 近似自由度為 k  1 之卡 方分配,即若 K 值大於  2 (k  1) ,則拒絕 H 0 。. 例 3.6b 某教師甄選想了解口詴委員的評分標準是否一致。於是在三位口詴委員 所評分之考卷中,分別隨機抽取 7 位成績,其成績如表 3.4. 16.

(23) 表 3.4 三位口詴委員的評分成績 口試委員 1. 81. 76. 71. 83. 89. 87. 73. 口試委員 2. 75. 82. 79. 88. 70. 78. 86. 口試委員 3. 80. 72. 74. 84. 77. 90. 85. 統計假設為 H 0 :每位口詴委員評分分配相同. 政 治 大 將所有的 7+7+7=21 觀測值混合排序後我們得到 立. H 1 :至少有一位口詴委員評分分配與其他口詴委員不同. 76. 81. 83. 87. 89. R1  77. 70. 75. 78. 79. 82. 86. 88. R2  75. 72. 74. 77. 80. 84. 85. R3  79. ‧ 國. 口試委員 3. 73. ‧. 口試委員 2. 71. 學. 口試委員 1. y. Nat. sit. io.  772 752 792  12    3(21  1)  0.029 21(21 1)  7 7 7 . n. al. er. K 因為 . 2 0.95. 90. Ch. i n U. v. (2)  5.99  0.029 ,所以我們接受 H 0 ;即口詴委員在評分標準上有一致. 性。. engchi. 3.隨機性檢定(Run Test) 在抽樣及統計分析的過程中,樣本之隨機性是一個相當重要的假設。若想要 知道一組樣本是否隨機抽取,我們可應用連串法(run tes)來進行樣本之隨機性檢 定。它是根據樣本資料中連串(run)的數目多寡,來決定此組樣本是否具隨機性之 檢定方法。 所謂連串的意思是指一系列相同項或性質所組成,一直到下一個不同項出現. 17.

(24) 為止。該連串之長度為此相同項之數目。例如觀察最近 14 天加權股價指數的漲 (+)跌(-)如下:+ + + + - - - + - - - + + +。則此組觀察值共有 5 個連串,第一個連串 長度為 4,第二個連串長度為 3,…第五個連串長度為 3。 當一組樣本其連串數目太多或太少時,我們便會懷疑此樣本可能不具隨機 性。以 14 個觀察值而言,若出現順序為+ + + + + + + - - - - - - - 則此組觀察值僅 有兩個連串。若出現+ - + - + - + - + - + - + - 則此組觀察值共有 14 個連串。我們 可以看出此觀察值的出現相當有規則性,應不具隨機性。. 治 政 n 筆資料被區分為兩種型式。 1.資料:將 n 筆資料 x , x , x ,, x 按序記錄,且此 大 立 連串法檢定過程. 1. 1. 2. 3. n. n1 為型式 1 出現的總數; n2 為型式 2 出現的總數. ‧ 國. 學. 2.統計假設:. ‧. H 0 :此筆資料具隨機性. y. Nat. H 1 :此筆資料不具隨機性. io. sit. 3.統計量: r  連串的數目. n. al. er. 4.決策:在顯著水準   0.05 下的雙尾檢定,查附表得 rL 和 rU ,如果 rL  r  rU , 則接受 H 0. Ch. engchi. i n U. v. 例 3.6c 某百貨公司為檢驗某商品每月的銷售量是否隨機出現,將二年內每個月 銷售量製成下表 3.5,則在   0.05 顯著水準下,是否每月的銷售量隨機出現?. 18.

(25) 表 3.5 商品每月銷售量 月份. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 銷售量. 15. 16. 15. 19. 18. 21. 15. 14. 22. 21. 17. 18. 月份. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 銷售量. 21. 15. 17. 15. 14. 18. 13. 19. 20. 22. 18. 16. 統計假設為. 政 治 大 H :此商品每月的銷售量是隨機出現 立. H 0 :此商品每月的銷售量是隨機出現 1. ‧ 國. 學. 由上表資料可得中位數是 17.5,再將觀察值與中位數比較,大於中位數者計. ‧. H,小於中位數者計 L。最後計算串連數:. sit. y. Nat. LLL HHH LLHH LHHLLLLH LH HH HL. al. n. H 0 ,即此商品每月的銷售量是隨機出現。. Ch. engchi. 19. er. io. 得知 n1  n2  12 , r  11 。由查表可知 P(r  11)  0.404  0.05 ,因此我們接受. i n U. v.

(26) 4.實例探討 4.1 數學試題難易度變項 以 100 學年度學科能力測驗數學科詴題難易度為例。傳統詴題的難易指標皆 以學生的答對率或通過率做基準,難道答對率或通過率的高低就可以全然代表詴 題的難易嗎?畢竟每個人對詴題的難易感覺程度不一定相同,這似乎不是能用單 一的答對率或通過率呈現出來的。 影響數學詴題難易的因素有許多,如詴題所評量的數學內容與測驗目標、解 題時的思考策略與步驟數、詴題的文字敘述或附圖等。其相關研究大致可分為三. 政 治 大. 類,第一類為分析詴題難易層次;第二類是訂定數學科測驗目標;第三類則探討. 立. 測驗目標與解題步驟兩者的關係。其中李白飛、林福來、林光賢(1991,1992)所. ‧ 國. 學. 提出影響數學詴題難易的三種主要因素,最廣為眾人採用。三位學者提出:影響 數學詴題難易的三種主要因素為:步驟數、思考策略以及詴題所評量的數學內. ‧. 容,其中步驟數是指解題時所涉及的概念個數與概念的難易。思考策略是指解題. y. Nat. sit. 時的思考方法,如固定模式的解法、一題多種的解法,或是需關鍵的特殊解法等。. n. al. er. io. 數學內容是指高中數學的學科內容,即現行高中教材六冊的內容。本論文針對此 三種因素進行二維權重及難易度模糊問卷調查。. 4.2 抽樣調查與問卷設計. Ch. engchi. i n U. v. 本論文採用四類樣本群,分別是高中學生、一般民眾、高中教師及國中教師。 因為學生在升高中時經過了基測篩選及志願選填,故在樣本取得上難以隨機抽 取。本論文以新北市海山高中的高三某班 39 位學生作為學生樣本群,同時隨機 抽取海山高中的 10 位高中數學教師作為高中教師群。國中教師群則抽取台北市 立龍山國中 5 位數學教師及高雄市立立德國中 6 位數學教師作為國中教師群。一 般民眾則隨機採樣 12 位做為樣本。 高中學生與一般民眾不易判別數學難易變項,因此在問卷設計上採用單一問 項方式進行,將各詴題的難易度分為 9 等級(1 最易,9 最難),請學生與民眾依 20.

(27) 各題的難易感受程度分別填入 1 到 9 的數字,如附件 1。而一般的中學數學教師 大都可針對詴題的權重及難易程度進行判斷,故問卷上以此二因子作為主要問 項。但是考慮大部分教師少有接觸模糊問卷的經驗,可能不易回答,故在設計上 只在權重部分採用模糊問答,即請教師在權重部分以 0 到 1 之間的數字,給予一 隸屬度,且每題隸屬度總和為 1;難易度部分仍採單一問項方式進行,將各詴題 的難易度分 9 等級(1 最易,9 最難),請教師依各題的難易感受程度分別填入 1 到 9 的數字,問卷設計如附件 2。. 4.3 各樣本群試題難易指標. 政 治 大 轉換成 0 到 1 區間的數值。本文為了求取各樣本群中難易指標的代表值,所以 立. 針對問卷結果,為了研究的統一性及方便性,再將問卷資料的難易度 9 等級. ‧ 國. 學. 在分析學生樣本群及一般民眾樣本群的資料時,先將各題統計出標準差、帄均 數,且取正負 2 個標準差(約 95%)之內的樣本再進行帄均以作為此題難易指標,. ‧. 其統計結果如下表 4.1 及表 4.2。. 帄均. 4. 5. y. 6. al. 7. 8. 9. 10. 11. 12. sit. 3. 13. A. B. C. D. E. F. G. er. 2. n. 標準差. 1. io. 題號. Nat. 表 4.1 高中學生群各題標準差、帄均數及難易指標. i n U. v. 0.164 0.276 0.301 0.362 0.212 0.245 0.262 0.252 0.282 0.272 0.271 0.246 0.258 0.289 0.319 0.259 0.242 0.303 0.31 0.291. Ch. 0.093 0.231 0.516 0.542 0.231 0.218 0.49. engchi. 0.5 0.397 0.599 0.474 0.439 0.465 0.282 0.343 0.269 0.24 0.442 0.455 0.397. 難易指標 0.064 0.211 0.516 0.542 0.217 0.189 0.49 0.5 0.397 0.632 0.474 0.439 0.451 0.247 0.307 0.25 0.213 0.442 0.455 0.382. 表 4.2 一般民眾群各題標準差、帄均及難易指標 題號. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. A. B. C. D. E. F. G. 標準差. 0.235 0.193 0.217 0.178 0.161 0.283 0.135 0.185 0.152 0.078 0.229 0.241 0.151 0.178 0.191 0.269 0.249 0.258 0.146 0.216. 帄均. 0.365 0.406 0.563 0.531 0.531 0.531 0.698 0.625 0.594 0.781 0.615 0.677 0.625 0.531 0.604 0.552 0.521 0.635 0.802 0.677. 難易指標 0.365 0.406 0.523 0.531 0.531 0.531 0.67 0.659 0.625 0.795 0.659 0.727 0.625 0.531 0.604 0.602 0.568 0.635 0.83 0.727. 21.

(28) 由表 4.1 與表 4.2 中可得知,高中學生群在第 10 題難易指標最高(0.632),第 1 題難易指標最低(0.064);一般民眾群在第 F 題難易指標最高(0.83),第 1 題難 易指標最低(0.365)。 在高中教師群的統計上,為去除群組內的異端值,首先將各題的樣本權重程 度計算出絕對距離後再加總,由加總值統計出 Q3 值,再去除大於 Q3 值之資料, 最後平均已去除異端值後的資料,作為本題的難易指標。如表 4.3 及表 4.4 分別 為第一題的模糊問卷原始樣本資料及權重模糊絕對距離。由表 4.3 及 4.4 中可得 知,去除異端值之後的樣本有 2、3、4、5、6、7、10。依定義計算出此題難易. 政 治 大. 指標 DT  0.3750.47  0.2140.31  0.1250.21  0.249 。. 立. 數學認知. 第一題. 學. ‧ 國. 表 4.3 第一題模糊樣本原始資料及取樣表 思考策略. 解題步驟. 難易. 權重. 難易. 權重. ‧. 難易. 1. 0.3. 0.5. 0.5. 0.375. 0.2. 0.25. 2. 0.4. 0.5. 0.4. 0.375. 3. 0.4. 0.4. 0.25. 4. 0.4. a0.375 l 0.5C h. 5. 0.4. 0.375. 0.4. 6. 0.6. 0.375. 7. 0.6. 8. sit. y. Nat. 權重. 0.2. 0.125. 0.3. 0.125. 0.25. 0.2. 0.125. 0.2. 0.125. 0.2. 0. 0.375. 0.2. 0.125. 0.2. 0.125. 0.8. 0. 0.1. 0. 0.1. 0. 9. 0.7. 0. 0.2. 0. 0.1. 0.125. 10. 0.5. 0.125. 0.3. 0.125. 0.2. 0.125. 取樣帄均. 0.47. 0.375. 0.31. 0.214. 0.21. 0.125. n. v ni. U e n0.3g c h i 0.25. 22. er. 0.25. io. 0.2.

(29) 表 4.4 第一題權重模糊絕對距離 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1. 0. 0.15 0.15 0.4 0.15 0.45 0.45 0.8 0.65 0.3. 2. 0.15. 0. 0. 0.25. 0. 0.3 0.3 0.65 0.5 0.15. 3. 0.15. 0. 0. 0.25. 0. 0.3 0.3 0.65 0.5 0.15. 4. 0.4 0.25 0.25. 5. 0.15. 6. 0.45 0.3 0.3 0.35 0.3. 7. 0.45 0.3 0.3 0.35 0.3. 8. 0.8. 9. 0.65 0.5 0.5 0.55 0.5 0.2 0.2 0.15. 10. 0.3 0.15 0.15 0.2 0.15 0.15 0.15 0.5 0.35. 0. 0. 0 0.25. 0.25 0.35 0.35 0.7 0.55 0.2 0. 0. 0. 0.35 0.2 0.15. 政 治0 0大0.35 0.2 0.15 0.65 0.65 0.7 0.65 0.35 0.35 0 0.15 0.5 立 0. 0.35 0. ‧. ‧ 國. 學. 總和. 0.3 0.3 0.65 0.5 0.15. er. io. sit. Nat. Q3 =3.45. y. 3.5 2.3 2.3 3.3 2.3 2.4 2.4 4.8 3.6 2.1. al. v i n C h 10 題難易指標最高(0.474),第 中教師群的認知感受上,本份詴題的第 6 題難易 engchi U n. 經此方式統計整份詴題並統計各詴題的難易指標如表 4.5。由表中得知在高. 指標最低(0.199)。. 在國中教師群部分,亦採取與高中教師群一致的統計方法,所得國中教師群 在各詴題的難易指標結果如表 4.6。由表 4.6 得知,國中教師群在第 G 題難易指 標最高(0.557),第 1 題難易指標(0.201)最低。由表 4.5 與表 4.6 相比較,發現國 中教師群與高中教師群的認知感受上,最難與最易的題目全然不同。. 23.

(30) 表 4.5 高中教師群在各詴題的難易指標 數學認知 C1. 思考策略 C2. 解題步驟 C3. 難易指標. 取樣帄均 權重 x1 難易 y1 權重 x2 難易 y 2 權重 x3 難易 y 3. x1. x2. y1 y2 y3. 0.47. 0.375. 0.31. 0.214. 0.21. 0.125. 0.249. 2. 0.33. 0.281. 0.36. 0.344. 0.31. 0.156. 0.238. 3. 0.35. 0.469. 0.39. 0.469. 0.26. 0.438. 0.388. 4. 0.44. 0.422. 0.34. 0.391. 0.23. 0.328. 0.323. 5. 0.4. 0.321. 0.357. 0.304. 6. 0.475. 立. 治 0.36 0.321 0.24 政 大. 0.172. 0.2625. 0.141. 0.275. 0.156. 0.199. 7. 0.39. 0.464. 0.41. 0.446. 0.2. 0.4. 0.411. 0.29. 0.357. 0.31. 9. 0.41. 0.339. 0.31. 0.393. 0.27. 10. 0.36. 0.482. 0.3. 0.536. 0.34. 11. 0.33. 0.328. 0.35. 0.406. 0.33. 12. 0.413. 0.438. al. 0.31. 0.328. 13. 0.33. 0.469. 0.38. i n U. A. 0.43. 0.393. 0.343. B. 0.31. 0.429. C. 0.33. D. 0.411. 0.358. 0.429. 0.386. ‧. 0.571. 0.474. 0.391. 0.347. 0.25. 0.469. 0.391. 0.3. 0.453. 0.406. 0.268. 0.23. 0.25. 0.294. 0.46. 0.482. 0.23. 0.339. 0.326. 0.393. 0.46. 0.429. 0.21. 0.304. 0.3. 0.35. 0.458. 0.35. 0.604. 0.30. 0.438. 0.387. E. 0.38. 0.528. 0.34. 0.514. 0.28. 0.417. 0.398. F. 0.4. 0.482. 0.34. 0.429. 0.26. 0.304. 0.335. G. 0.29. 0.554. 0.43. 0.554. 0.26. 0.518. 0.455. n. e n g 0.469 chi. 24. sit. io. Ch. 0.429. er. Nat. 0.342. y. 8. 學. 1. ‧ 國. 題號. DT . v. x3.

(31) 表 4.6 國中教師群在各詴題的難易指標 數學認知 C1. 思考策略 C2. 解題步驟 C3. 難易指標. 取樣帄均 權重 x1 難易 y1 權重 x2 難易 y 2 權重 x3 難易 y 3. x1. x2. y1 y2 y3. 0.54. 0.234. 0.26. 0.234. 0.2. 0.109. 0.201. 2. 0.35. 0.297. 0.23. 0.344. 0.43. 0.391. 0.345. 3. 0.39. 0.563. 0.31. 0.531. 0.30. 0.531. 0.543. 4. 0.45. 0.484. 0.26. 0.422. 0.29. 0.422. 0.449. 5. 0.38. 0.406. 治 0.29 0.406 0.34 政 大. 0.359. 0.39. 6. 0.34. 0.297. 0.40. 0.5. 0.26. 0.359. 0.385. 7. 0.475. 0.578. 0.25. 0.453. 0.28. 0.46. 0.531. 0.25. 0.469. 9. 0.40. 0.438. 0.29. 10. 0.43. 0.578. 11. 0.31. 12. 0.38. 13. 立. 學. 1. ‧ 國. 題號. DT . 0.578. 0.544. 0.29. 0.531. 0.515. 0.422. 0.31. 0.25. 0.531. 0.33. 0.516. 0.36. 0.469. 0.33. 0.578. al. 0.31. 0.484. 0.39. 0.5. 0.38. i n U. A. 0.36. 0.359. 0.24. B. 0.36. 0.469. C. 0.33. D. ‧. 0.516. 0.545. 0.453. 0.478. 0.563. 0.542. 0.28. 0.531. 0.501. 0.359. 0.40. 0.375. 0.366. 0.30. 0.484. 0.34. 0.469. 0.473. 0.359. 0.38. 0.438. 0.30. 0.375. 0.392. 0.31. 0.438. 0.35. 0.516. 0.34. 0.453. 0.469. E. 0.29. 0.453. 0.36. 0.563. 0.35. 0.531. 0.518. F. 0.40. 0.5. 0.28. 0.531. 0.33. 0.547. 0.523. G. 0.39. 0.531. 0.35. 0.594. 0.26. 0.547. 0.557. n. e n g 0.516 chi. 25. sit. io. Ch. 0.438. er. Nat. 0.433. y. 8. 0.31. v. x3.

(32) 4.4 不同樣本群對試題難易度分析 一般而言,一個詴題難易可分為 5 等級,分別是極易、偏易、適中、偏難、 很難。本論文將依各題難易( DT )分至此 5 等級,若 0  DT  0.2 ,則此題的難易 度屬「極易」; 0.2  DT  0.4 ,則此題的難易度屬「偏易」; 0.4  DT  0.6 ,則 此題的難易度屬「適中」 , 0.6  DT  0.8 ,則此題的難易度屬「偏難」; 。以此劃分各試題在各樣本群中難易等 0.8  DT  1 ,則此題的難易度屬「很難」 級,結果如下表 4.7。. 政 治 大. 表 4.7 各試題在各樣本群中的難易等級 高中學生 S. 高中老師 T1. 國中老師 T2. 6. 2、5、9、A、B、 1. 1、2、4、5、9、 1、2、5、6、A、. C、D、G. 11、A、C. 偏易. ‧. ‧ 國. 1、6. 學. 極易. 立 一般民眾 AP. C. Nat. 12、13、B 、D、 10、11、12、13、. Ch. F、G. n 10. 偏難. al. A、D. er. io. 12、13、E、F 適中. sit. y. 3、4、7、8、11、 2、3、4、5、6、 3、7、8、10、 3、4、7、8、9、. engchi. i n U. v. B、D、E、F、 G. 7、8、9、10、 11、12、13、B、 C、E、G. 很難. F. 由 4.7 表中明顯看見,一般民眾( AP )在試題難易度的整體認知上,試題難易 度多分布於偏難,總數 20 題的考題中,就高達 11 題。而另外三個樣本群對試題 難易度的整體認知上,試題難易度多分布於適中。 26.

(33) 由於各群組在試題難易題數分布狀況不相同,本論文利用克洛斯-瓦力士檢 定,檢驗此四個樣本群在試題難易認知上是否有相同。. 統計假設為 H 0 :四個樣本群在詴題難易度看法彼此無差異. H 1 :四個樣本群在詴題難易度看法彼此有差異. Kruskal-Wallis Test: ALL versus NO Kruskal-Wallis Test on ALL N Median. 1. 20. 0.4180. 28.0. 2. 20. 0.6145. 64.2. 3. 20. 0.4055. 28.7. -2.62. 4. 20. 0.4755. 41.0. 0.12. Overall. 80. 立. Z. -2.78 5.27. 學. 40.5. ‧. ‧ 國. Ave Rank. 政 治 大. NO. H = 31.78 DF = 3 P = 0.000. y. Nat. al. er. io. sit. H = 31.79 DF = 3 P = 0.000 (adjusted for ties). v. n. 經檢定結果 P=0.000<0.05,因此我們拒絕 H 0 。換句話說,此四個樣本群中. Ch. engchi. i n U. 至少有一個樣本群跟其他樣本群在大學學測數學科詴題難易度的看法上不一 致。為探討各樣本群之間在難易度的看法是否一致,本論文再利用威克生符號等 級檢定檢視各群組彼此之間的試題難易度看法。. 統計假設為 H 0 :兩樣本群在詴題難易度看法彼此無差異. H 1 :兩樣本群在詴題難易度看法彼此有差異 經檢驗,結果如表 4.8。. 27.

(34) 表 4.8 四樣本群在威克生符號等級檢定結果 一般民眾 *. 高中學生( S ). 高中教師( T1 ). 國中教師( T2 ). 拒絕 H 0. 接受 H 0. 拒絕 H 0. P=0.000<0.05. P=0.444>0.05. P=0.001<0.05. 拒絕 H 0. 拒絕 H 0. P=0.000<0.05. P=0.000<0.05. ( AP ) 高中學生( S ) 一般民眾. * 拒絕 H 0 *. ( AP ) 高中教師( T1 ). P=0.000<0.05 接受 H 0. 拒絕 H 0 *. P=0.444>0.05 國中教師( T2 ). 拒絕 H 0. 拒絕 H 0. 立. ‧ 國. 0. P=0.001<0.05 0. * P=0.000<0.05. P=0.001<0.05. 學. P=0.001<0.05. 政 治 大 拒絕 H 拒絕 H P=0.000<0.05. ‧. 由表 4.8 得知,只有高中學生( S )與高中教師( T1 )在試題難易度感受程度較一. sit. y. Nat. 致,而其他樣本群的看法上彼此不一致。同時我們也發現,高中教師( T1 )國中教. io. er. 師( T2 )雖皆屬中學教師,但試題難易感受程度並不一致。. 在國中基本學力測驗(簡稱基測)中,數學科試題難易的分布經過特殊規畫,. al. n. v i n Ch 一般常以前面試題偏易,後面試題偏難的方式進行試題安排。而大學學力基本測 engchi U 驗的試題難易分布是否也以此模式安排?傳統以答對率或得分率( p )的高低來. 判別試題的難易,答對率或得分率高代表試題較易;反之較難。本論文應用連串 法隨機性檢定,檢驗此四個樣本群是否覺得試題在難易分布上亦是隨機出現,另 外由大考中心所提供本學度(100 學年度) 的數學科各試題答對率,將答對率轉成 難易指標( DT  1  P ),在   0.05 顯著水準下,檢定詴題難易度是否亦是隨機出 現。. 28.

(35) 統計假設為 H 0 :詴題難易感受程度分布是隨機出現. H 1 :詴題難易感受程度分布不是隨機出現. 表 4.9 五樣本群的隨機檢定結果 隨機檢定 中位數. r. P-value. 檢定結果. 0.418. 9. 0.358>0.05. 接受 H 0. 群組 高中學生. 4 0.001<0.05 政 治 大 0.406 12 0.646>0.05 立. 一般民眾. 0.615. 高中教師. 拒絕 H 0 接受 H 0. 0.476. 8. 0.168>0.05. 學. 接受 H 0. 大考中心. 0.535. 10. 0.646>0.05. 接受 H 0. ‧. ‧ 國. 國中教師. Nat. sit. y. 由表 4.9 發現,只有一般民眾在對試題難易感受程度分布屬不隨機出現,其. n. al. er. io. 他群組皆認為是隨機出現。因此我們推論,一般民眾的觀念可能受到國中基測影. i n U. v. 響,認知上會覺得試題難易安排是由簡易到困難。但在其他群組及大考中心的資. Ch. engchi. 料,卻呈現試題難易安排是隨機出現的。. 29.

(36) 5.結論 在社會科學調查中,最想被了解的部分是人類的思維運作。以往科學研究希 望用簡易的方式探討複雜的事物,因此常用二元邏輯分析多變的思維。但人類的 思維是模糊的,單用二元邏輯方式進行分析會造成一定程度的失真。本文提出二 維模糊數將單一維模糊數擴展出去,由此可將人類思維得以更深入且完善的方式 表達出來。另外本論文所應用單因子離散型模糊樣本之異端值,可將樣本群之統 計分析更具代表性,在未來統計分析上能有更佳的數據表現。 由本論文實例中,我們發現高中學生群與高中教師群在對詴題難易感受程度. 政 治 大 師對高中教材的熟悉度相對比其他群組高,因此高中老師在判別詴題的難易度 立. 上無差異,但其他群組在難易度感受程度上彼此是有差異的。在教學上,高中老. ‧ 國. 學. 時,會以近似學生的角度來思考。而高中教師在指導學生時,常會因個人對詴題 難易感受而間接影響了學生對詴題難易度的看法;高中教師在教導詴題的過程. ‧. 中,若以個人感覺引領學生此題難易時,往後學生可能會推類此型詴題屬難或屬. sit. y. Nat. 易。如此造成學生在作答時的難易感覺受到影響。. al. er. io. 一般而言,同屬中學數學科教師,在同樣詴題下的難易感受程度應差異不. v. n. 大。但本論文發現不盡如此,在難易感受程度上,高中教師與國中教師並無顯著. Ch. engchi. i n U. 的一致性,推估其原因,在教學上,高中教材的熟悉度以高中教師較為了解,國 中教師對高中教材接觸上可能偏少,因此造成難易感受上有所差異。同理,我們 也發現一般民眾對詴題難易感受程度上有著更大的差異性。 在本論文中,我們發現除了一般民眾認為詴題難易非隨機性,其他群組認知 上都屬隨機性。而在大考中心的答對率中也發現,大學學力測驗數學科詴題難易 安排也屬隨機性。推估原因,一般民眾的思維上,認為國中基測詴題難易的安排 是由簡易漸近到困難,同樣在大學學力測驗上也應如此安排,所以在認知上覺得 詴題難易是有跡可循。在教學現場上,教師需引導學生了解大學學力測驗在詴題 難易分佈是採隨機性,所以在應答整份詴題時,最好先流覽過各題,再依個人難. 30.

(37) 易感受由易到簡逐題進行作答,如此不會因前面偏難的詴題而影響作答的心情。 進而增加得分率。 由於本論文之參與人數並非龐大,未來的研究可針對更大量的學生與教師 做調查。另一方面,未來的研究可針對學生答試題結果與其難易感受程度作更深 入的探討。如此當我們身臨教學現場時,可以啟發更多學生的學習效果。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 31. i n U. v.

(38) 6.參考文獻 [1] 吳柏林(2005),模糊統計導論:方法與應用,臺北:五南。 [2] 吳柏林(2002),現代統計學,臺北:全程。 [3] 吳柏林、曾能芳(1998),模糊回歸參數估計及在景氣對策信號之分析應用, 中國統計學報,36(4),399-420。 [4] 吳柏林、楊文山(1997),模糊統計在社會調查分析的應用,社會科學計量方 法發展與應用,楊文山主編:中央研究院中山人文社會科學研究所,289-316。 [5] 李白飛、林福來、林光賢(1994)。大學入學考詴數學科詴題分析與命題研究 (三)。大學入學考詴中心。. 治 政 大 列方法之應用,臺灣經濟學會年會論文集,169-190。 立 [7] Dubois, D. and Prade, H. (1991), Fuzzy sets in approximate reasoning, Part 1:. [6] 黃仁德、吳柏林(1995),臺灣短期貨幣需求函數穩定性的檢定,模糊時間數. ‧ 國. 學. Inference with possibility distributions, Fuzzy Sets and Systems, 40, 143-202. [8] Lowen, R. (1990), A fuzzy language interpolation theorem. Fuzzy Sets and. ‧. Systems, 34, 33-38.. [9] Ruspini, E. (1991), Approximate Reasoning: past, present, future. Information. y. Nat. sit. Sciences, 57, 297-317.. al. er. io. [10] Tseng, T. and Klein, C. (1992), A new Algorithm for fuzzy multicriteria decision. n. making. International Journal of Approximate Reasoning, 6, 45-66.. Ch. i n U. v. [11] Zadeh, L. A. (1965), Fuzzy Sets. Information and Control, 8, 338-353.. engchi. [12] Zimmermann, H. J. (1991), Fuzzy Sets Theory and Its Applications. Boston: Kluwer Academic.. 32.

(39)

參考文獻

相關文件

Cowell, The Jātaka, or Stories of the Buddha's Former Births, Book XXII, pp.

In particular, we present a linear-time algorithm for the k-tuple total domination problem for graphs in which each block is a clique, a cycle or a complete bipartite graph,

You are given the wavelength and total energy of a light pulse and asked to find the number of photons it

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =&gt;

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most

This kind of algorithm has also been a powerful tool for solving many other optimization problems, including symmetric cone complementarity problems [15, 16, 20–22], symmetric