• 沒有找到結果。

2B4C data analysis

N/A
N/A
Protected

Academic year: 2021

Share "2B4C data analysis"

Copied!
25
0
0

加載中.... (立即查看全文)

全文

(1)

7

數據分析

7.1

單變量數據分析

單變量數據分析 : 對某一種變數(變量) 感興趣,所做的數據資料分析。(一維數據分析) 資料型式常以數列 X : x1, x2, x3, · · · , xn 表示之。 雙變量數據分析 : 對某兩個變數(變量)間的交互作用關係感興趣, 所做的數據資料關係分析。(二維數 據分析) 資料常以成雙成對 (X, Y ) : (x1, y1), (x2, y2), (x3, y3), · · · , (xn, yn)坐標型式表示之。 多變量數據分析 : 對多個變數(變量) 間的相關影響感興趣, 所做的數據資料關係分析。(多維數據分 析) 統計圖表: 對變量所蒐集到的資料用圖表簡化成有用的資訊, 使之比數據或文字提供有效資訊, 稱為 統計圖表。 離散型數據: 統計數據資料分成連續型與離散型數據 。 變量數據無介於兩類別數據資料之間的類型資 料稱為離散型數據。 如性別、 血型、 顏色、 職業等分類的計數數據。 又分次序數據 (以1、2、3、4代表強、 中、 弱、 微) 及名目數據(無大小次序之分的數據, 如色彩中的紅色、 藍色、 綠色、 白色等) 連續型數據: 變量數據可以有連接性、 有次序數值關係的資料, 稱為連續型數據。 如身高、 體重、 測驗成績等計量的數據。 常用的統計圖表: 1. 圓面積圖(圓餅圖): type A 24% type B 12% type C 15% type D 33% other 16%

(2)

2. 長條圖: 1930 1940 1950 1960 1970 3 4 5 6 7 ·107 P op u la tio n Far Near 3. 折線圖: 次數分配折線圖或相對累積次數分配折線圖 0 20 40 60 80 0 200 400 600 800 1,000

Discarding unbounded coords

4. 直方圖: 成績 0-59 60-69 70-79 80-89 90-100 百 分 比 % 10 20 30 40 50 60 5. 盒鬚圖: Me Q1 Q3 ¯ x IQR

Box and Whisker Plot

集中趨勢量數: 用一數值來表示這一群數的中心位置或共同趨勢。 一般常見的集中趨勢量數有算術平均數、 中位數、 眾數、 幾何平均數等。 算術平均數(Mean) µ : 資料集中趨勢量的一個表示方法。 優點: 簡單, 易算, 靈敏。 缺點: 易受極端 值影響。 數學式:µ = 1n(x1+ x2+ · · · + xn) = 1n n P i=1 xi 中位數(Median) Me: 將資料依大小順序排列,取其正中央之數值或正中央兩數的平均數。 優點: 易

(3)

至少有一半的數值大於或等於中位數,而且至少有一半的數值小於或等於中位數。 將資料由小至大排列如: x(1) ≤ x(2) ≤ x(3) ≤ · · · ≤ x(n) 若n = 2k + 1 為奇數筆數據, 則中位數 Me= x(k+1) ,即中間項的數據。 若n = 2k 為偶數筆數據, 則中位數 Me = 12(x(k)+ x(k+1))。 加權平均數: 將各數據分別乘以權數,再將乘積的總和除以權數總和, 所得之商。 眾數(Mode) Mo : 一群數值中出現次數最多的數值(次數分配無顯著集中時沒有代表性)。 優點: 簡 單容易、 不受極端值影響。 缺點: 不靈敏、 不具唯一性、 代數運算性質不佳。 幾何平均數: √nx 1x2· · · xn 分組資料的集中趨勢量的計算方式: 量數 未分組 分組 普通法 簡捷法 平均數µ 1 n n P i=1 Xi 1 n k P j=1 xjfj X = A + h · 1n k P j=1 djfj 其中dj = xi−Ah 中位數 Me n = 2k + 1為奇數Me= x(k+1) *** Lme+ n 2 − F−1 fme· hme n = 2k為偶數Me= 12(x(k)+ x(k+1)) 眾數Mo 出現次數最多的數值 ***插值, 比率法

資料與平均數, 中位數, 眾數三者關係:

(

平均數 : 機率分配圖的重心位置(槓桿的支撐點)。

中位數 : 將機率分配圖左右等分面積。

眾數 : 機率分配圖的最高點位置。

稱的單峰分配 (資料直方圖以中間為高峰且左右對稱) : µ

X

= M

e

= M

o

左偏分配 (資料直方圖左端值次數分配拖的較長): µ

X

< M

e

< M

o

右偏分

配 (資料直方圖右端值次數分配拖的較長): M

o

< M

e

< µ

X

(4)

右偏:

Mo < Me< X

左偏:

X < Me< Mo

離散趨勢的統計量: 全距 R、 四分位差 Q.D.、 標準差 σ 等。

離差: 一群數值, 除了考慮集中趨勢外, 另一重點是分散的程度, 就是離差。

一般常用測量離散程度的量數有全距、 四分位差、 變異數與標準差等。

全距

R =Max-min: 資料中的最大值減資料的最小值。 表資料的最大差異量。

將資料 x

i

依大小排序, x

(1)

≤ x

(2)

≤ x

(3)

≤ · · · ≤ x

(n)

, 全距R = X

(n)

− X

(1)

四分位差 Q.D. = Q

3

− Q

1

: 意義: 表有一半的資料 (中間那一群) 彼此的差異量小於

等於此值。 有些書定義 Q.D. = Q

3

− Q

1

2

資料 x

i

依大小排序後, 分成四等分, 依序為 Q

1

, Q

2

, Q

3

; 有 25% 的資料≤ Q

1

, 有 25% 的資料≤ Q

1

, 有 75% 的資料≥ Q

1

, 稱第一四分位 Q

1

; 有 50% 的

資料≤ Q

2

, 有 50% 的資料≥ Q

2

, 稱第二四分位 Q

2

亦為中位數; 有 75% 的資

料≤ Q

3

, 有 25% 的資料≥ Q

3

, 稱第三四分位 Q

3

四分位差 Q.D. = Q

3

− Q

1

為第三四分位數 Q

3

減第一分位差 Q

1

未分組 (Q

1

為前半部資料的中位數,Q

3

為後半部資料的中位數) 例: n=11 , 則

Me = Q

2

= X

n+1 2

= X

6

, Q

1

=

5+1 2

= X

3

, Q

3

= X

6+3

= X

9

已分組: 原則上可按照比例求 Q

3

= X

75%

= X

3n 4

, Q

1

= X

25%

= X

n 4

離均差 : x

i

− µ

x

資料與其平均值的差 , 所以

P

(x

i

− µ

x

) = 0

變異數 V ar(X) =

P

(x

i

− µ

x

)

2

N

: 資料離均差平方和的平均

1. 母群體: 母群體的算術平均數為 µ , 則變異數為 V ar(X) = σ

2

=

1

N

N

P

i=1

(x

i

µ)

2

V ar(X) =

1

N

(

N

P

i=1

x

2i

) − µ

2

2. 樣本: 若樣本資料的算術平均數為 x , 則變異數為 V ar(X) = S

2

=

1

n − 1

n

P

i=1

(x

i

x)

2

未分組: S

2

=

1

n − 1

[

n

P

x

2 i

− nX

2

]

(5)

已分組: S

2

=

n

n − 1

[ 1

n

k

P

i=1

f

i

d

2i

− (

P fidi n

)

2

]h

2

,

其中 d

i

= m

i

h

− A

標準差 σ: 衡量資料分散程度情形中最常用的統計量, 亦為變異數 V ar(X) 的平方根

1. 母群體: 母群體的標準差為 σ =

s

1

N

N

P

i=1

(x

i

− µ)

2

=

s

1

N

N

P

i=1

(x

i

)

2

− µ

2

=

s

1

N

N

P

i=1

(x

i

− A)

2

− (A − µ)

2

, A 為 µ 的近似估計值。

2. 樣本: 樣本資料的標準差為 S =

s

1

n − 1

n

P

i=1

(x

i

− X)

2

=

v

u

u

u

t

N

X

i=1

(x

i

)

2

− nX

2

n − 1

=

v

u

u

u

t

N

X

i=1

(x

i

− A)

2

− n(A − X)

2

n − 1

, A 為 X 的近似估計值。

(母群體的資料取得有其限制或困難, 故採取抽樣樣本的平均值, 標準差資訊

來推估原母群

體的平均值及標準差; 為了使樣本資料值推估原母體保持不偏,

必須有所修正調整, 因此分母為 n − 1 而非取 n )

標準差的意義:

計算資料與算術平均數的平均距離, 用以表明整個資料的離散情形。 值愈小, 表示

資料數值較接近, 變動範圍小, 集中趨勢量數也較具代表性。

0.00

0.10

0.20

0.30

標準差小: 資料差異性小,集中 標準差大:資料差異性大,分散

變數 X

機率 P (X = k)

變異係數C.V.: 比較母群體變動性的大小, 係數值愈小其變動性愈小。

C.V. = S

X

× 100%

若我們了解機率模型則只要掌握

平均值

標準差

就可知道資料結構關係。

對同

一群資料而言: 標準差 ≥ 平均絕對離差 ≥ 四分位差一半 。

(6)

即 S

x

≥ 1n

P

|X

i

− X| ≥

1

2

(Q

3

− Q

1

)

資料呈單峰對稱 (或微偏): Q

3

− Q

1

≈ 43S , 平均絕對離差

n

1

P

|X

i

− x| ≈ 45S

1: 各種差異量數的比較 量數 (統計量) 優點 缺點 特殊使用場合 標準差 σ 定義明確, 感應靈敏, 適 合運算, 受抽樣方法變 動影響小 不易計算, 易受極端值 影響 大都會用到(資料 差異的衡量大小) 四分位差 Q.D. 定義明確, 簡單易懂, 計 算容易, 不受極端值影 響 不適合運算, 感應不靈 敏, 較易受抽樣方法變 動影響 順序資料 全距 R 簡單易懂, 計算容易 不適合運算, 感應不靈 敏, 較易受抽樣方法變 動影響小 常 用 於 品 質 管 制 時 *變異係數 C.V. = s x 比較不同群組時或 在 同 態 下 但 其, 平 均 數 相 差 太 大 時 標準化 Z 分數 zi = xi − µ σ |Z|料愈遠離中心。分數愈大表該筆資 必需知道變數的算術平均 數 及 標 準 差 才能 計 算Z分數 可 用 在 不 同變 數 間 的 資 料 排 序 比 較情形

資料的線性平移: 兩群資料 X

i

, Y

i

; 若有 Y

i

= aX

i

+ b 關係, 稱資料 Y

i

為 X

i

的線性

平移。 則

1. 算術平均數: Y = aX + b = aX + b

2. 中位數 :M

e(Y )

= M

e

(aX + b) = aM

e(X)

+ b

3. 全距: R

Y

= |a|R

X

4. 四分位差: Q.D.

Y

= |a| × Q.D.

X

5. 標準差: σ

Y

= σ

aX+b

= |a| · σ

X

數據標準化 z

i

=

x

i

− µ

σ

: 若資料直方圖大致呈現單峰鐘形曲線可將數據線性變換成

平均數為0, 標準差為1的新數據。 可用來比較不同變數間資料的排序高低。

z

i

=

x

i

− µ

σ

稱為標準分數或 z 分數。 亦即

P

z

i

= 0, σ

z

= 1

(7)

符號說明: • 母群體資料的統計量一般會以希臘字母表示之。 母群體資料的算術平均數 µ = P xi N , 標準 差 σ = s 1 N N P i=1 (xi− µ)2 。離差平方和 Sxx =P(xi− µ)2 = Nσ2 • 樣本資料的統計量一般會以英文大寫字母表示之。 樣本資料的算術平均數X = P xi n ,標準 差 Sd = r 1 n − 1 n P i=1 (xi− X)2 。離差平方和 Sxx =P(xi− X)2 = (n − 1)Sx2 • 描述資料重要的統計量為集中趨勢量: 平均數 µ及資料離差量: 標準差 σ • 資料的標準化:Z 分數 zi = xi− µ σ

例題

資料集中趨勢量與離差量 範例 1: 5位學生的數學成績如右:79, 67, 61, 70, 73求平均數 µ , 離差平方和 Sxx, 變異數 σ2, 標準 差σ ? µ = 70, Sxx = 180, σ2 = 36, σ = 6 xi xi− µx (xi− µx)2 µx = P= 0 Sxx = 演練 1a : 求滿足(79 − x)2+ (67 − x)2+ (61 − x)2+ (70 − x)2+ (73 − x)2 為最小值時, 求定值 x 為何? 平均值,x = µx = 70 演練 1b : 求滿足 |79 − x| + |67 − x| + |61 − x| + |70 − x| + |73 − x| 為最小值的定值 x 為何? 中位數,x = 70 演練 1c : 數據資料如下, 求平均數 µ , 離差平方和 Sxx, 標準差 σ ? 智商: 120, 116, 108, 104, 102 µ = 110, Sxx = 240, σ = 4 √ 3 演練 1d : 數據資料如下, 求平均數 µ , 離差平方和 Sxx, 標準差σ ? 成績: 90, 85, 85, 80, 70 µ = 82, Sxx = 230, σ = √ 46

(8)

演練 1e : 數據資料,2, 6, 4, 8, 10 求平均數 µ , 離差平方和 Sxx, 標準差σ ? µ = 6, Sxx = 40, σ = 2 √ 2 演練 1f : 數據資料,1, 3, 5, 7, 9求平均數 µ , 離差平方和Sxx, 標準差 σ ? µ = 5, Sxx = 40, σ = 2 √ 2 演練 1g : 數據資料,1, 2, 4, 5, 8求平均數 µ , 離差平方和Sxx, 標準差 σ ? µ = 4, Sxx = 30, σ = √ 6 演練 1h : 數據資料,14, 10, 8, 6, 2 求平均數 µ , 離差平方和 Sxx, 標準差σ ? µ = 8, Sxx = 80, σ = 4 範例 2: 男生隊伍8隊員年齡為 14, 14, 16, 16, 16, 17, 17, 18。 女生隊伍10隊員的年齡為 3, 3, 4, 5, 5, 6, 6, 6, 60, 62分別求男生隊員與女生隊員年齡的四分位距? IQR1 = 17 − 15 = 2, IQR2 = 6 − 4 = 2 演練 2a : 求下列8筆資料: 2, 4, 12, 16, 14, 8, 6, 10的四分位Q1, Q2, Q3 分別為多少? 5; Me = 9; 13 演練 2b : 調查15個大學畢業家庭收入情形 4, 25, 30, 30, 30, 31, 32, 35, 50, 50, 50, 55, 60, 74, 110,(單位: 千元) 求其四分位 Q1, Q2, Q3 分別為多少? Q1 = 30, Q2 = 35, Q3 = 55 範例 3: 某籃球隊有10名隊員, 其身高分別為 182,185,186,186,183,175,196,188,186,183 公分, 求 此球隊隊員身高的平均數與標準差? 平均數 µ = 185 公分, 標準差為σ = 5 公分 演練 3a : 將上述例題10名隊員的身高標準化? (解:)−0.6, 0, 0.2, 0.2, −0.4, −2, 2.2, 0.6, 0.2, −0.4 演練 3b : 五筆數據資料:2,4,5,6,8 求其平均數與標準差? 並求每筆數據資料標準化後的值? (解:)µ = 5, σ = 2;−1.5, −0.5, 0, 0.5, 1.5 演練 3c : 五筆數據資料:2,0,4,3,6 求其平均數與標準差? 並求每筆數據資料標準化後的值? (解:)µ = 3, σ = 2;−0.5, −1.5, 0.5, 0, 1.5 範例 4: 某班50名學生的期中考數學成績, 中位數74分, 算術平均數75.2分。 後來發現某生成績應 為86分誤登記為76分, 試問班級的中位數, 算術平均數, 標準差應否更正? 若該更正, 則變大還 是變小?

(9)

(解:)Ans: 中位數不變, µ = 75.4 變大, σ 增大。 演練 4a : 甲、 乙兩班的數學期考成績分別為: 甲班30人: 平均70分, 標準差10分; 乙班20人: 平均80 分,標準差8分。 求兩班的數學平均分數及標準差? µ = 74, σ =q5485 ≈ 10.5 範例 5: 某測驗, 甲、 乙兩班數學成績如下表所示, 求甲、 乙兩班的算術平均數及標準差? 班級(成績) 40 ∼ 50 50 ∼ 60 60 ∼ 70 70 ∼ 80 80 ∼ 90 90 ∼ 100 合計 甲班 2 5 4 6 2 1 20 乙班 1 6 5 3 3 2 20 (解:)(1)µ= 67, S= 13; µ = 68.5, S= 14.2 演練 5a : 某段考50位學生數學成績如下表所示,求班上50位學生數學段考的算術平均數及標準差 (四 捨五入取至整數)? 成績 (分數) 40 ∼ 50 50 ∼ 60 60 ∼ 70 70 ∼ 80 80 ∼ 90 90 ∼ 100 以下累積次數 4 12 24 34 42 50 (解:)µx = 71.8,σ =229.76= 15. 範例 6: 某公司調查其名下各分公司員工的薪水, 得算術平均數為30000元, 標準差為4000元。 為激 勵員工, 公司提出兩個調薪方案: 甲方案: 每人加薪5000元。 乙方案: 每人加薪 5%。 求兩方案員 工薪水的算術平均數與標準差? 甲: 35000; 4000 乙: 31500; 4200 演練 6a : 班上44位學生, 數學段考成績班平均40分, 標準差10分; 老師決定每位學生線性加分, x 為 原始成績, y 為新成績 y = ax + b , 結果班平均為60分, 標準差為12分, 且沒有人超過100 分,則班上學生志伶 原始成績50分, 新成績應為多少分? 72分 範例 7: 假設有一群十筆資料,11,15,13,15,9,8,4,5,5,15; 如果將最後一筆數據由15改為14, 則下列7 個統計量, 那幾個對應的統計量會因此有所變動 (說明變大或變小或其值不變)? (a) 平均數 (b) 眾數 (c) 中位數 (d) 全距 (e) 變異數 (f) 標準差 (解:)(a) 變小 (b) 增加一個 (c) 不變(d) 不變(e) 變小 (f) 變小 資料的標準化

(10)

範例 8: 小溥的期中考數學成績為91分, 而全班的平均分數為75分, 標準差為8分。 而小溥期末考數 學成績為88分, 班上的平均分數為73分, 標準差為5分。 求小溥兩次考試數學成績標準化的 z 分 數? 就全班成績來觀察, 小溥數學成績到底是進步還是退步呢? z1 = 2, z2 = 3 ; 成績進步 演練 8a : 志伶與伊伶分別就讀某高中甲班、 乙班, 某次段考甲班數學平均60分,標準差6分,乙班平均 66分,標準差10分,若志伶與伊伶數學分別考75分、81分,問兩位在各自班上數學排名較佳? 志伶排名較佳 演練 8b : 已知第一次數學段考班平均60分, 標準差10分, 班上學生承伶考70分。 第二次數學段考班 平均50分, 標準差6分, 結果承伶考62分。 問承伶在這兩次段考哪一次數學成績表現較好? 第二次 (標準化分數較大) 演練 8c : 志伶在某次段考數學62分,英文70分,而班上數學平均50分,標準差6分,英文班平均65分, 標準差5分,問志伶此次段考在班上數學或英文排名較佳? 數學排名較佳 習題7-1 單變量數據分析 1. 十位同學的身高 (cm) 如下:155,156,158,158,160,160,161,163,163,166選出正確選項? (1) 全 距為11 (2) 中位數為160 (3) 四分位距為 5 (4)平均數是160 (5) 標準差小於4 2. 下列有關 z 分數的敘述, 何者正確?(1) z 分數表示某數與平均數的距離是標準差的幾倍 (2)z 分數一定是正數 (3) z 分數常被用來比較不同單位之量數間的大小 (4) 將整組數據 z分數化 後的新數據, 其平均數為0 (5)將整組數據 z 分數化後的新數據, 其標準差為1 3. 某次段考全班的平均為50分, 標準差為8分, 老師將每各同學的成績除以2再加50分,求調整後 的算術平均數和標準差? 4. 某工廠連續10天的零件不良數如下:8,7,7,6,8,8,9,8,6,6,試算出這些零件不良數的平均數、 中位 數及眾數? 5. 求資料X:1,2,3,4,5等五筆數值的標準差? 求資料Y:101,102,103,104,105等五筆數值的標準差? 6. 若對班上數學成績作如下改變:(1) 每個同學成績均加10分 (2) 每個同學成績均增加其原有的 10% ,則此二措施分別對原成績的平均數和標準差各有何影響? 7. 假設有一群十筆資料,11,15,13,15,9,8,4,5,5,15; 如果將最後一筆數據由15改為14, 則下列7個 統計量, 那幾個對應的統計量會因此有所變動 (說明變大或變小或其值不變)? (a) 平均數 (b) 眾數 (c) 中位數 (d) 全距 (e) 變異數 (f) 標準差

(11)

科目 社會 國文 自然 英文 數學 甲 100 70 80 60 50 乙 90 60 70 50 40 丙 80 56 64 48 40 8. 甲、 乙、 丙三位同學參加大學學科能力測驗, 五科的原始成績如下表所示, 設 S甲, S乙, S丙 , 分 別代表甲、 乙、 丙三位同學五科成績的標準差,請仔細觀察表中數據,再判斷其S甲, S乙, S丙 的 大小關係? 9. 下表為10名學生的身高體重: 學生 A B C D E F G H I J 身高 (公分) 171 164 164 165 171 167 169 162 166 171 體重 (公斤) 66 65 62 66 66 63 55 68 63 76 (a) 求身高體重的算術平均數與標準差? (b) 計算 A 生身高及體重的 z 分數? (c) 就整體而言 A 生的身高和體重何者較突出? 10. 下表為20名成年男子每分鐘脈搏跳動的次數分配表: 求脈搏跳動的算術平均數及標準差? 脈搏次數 40 ∼ 50 50 ∼ 60 60 ∼ 70 70 ∼ 80 80 ∼ 90 人數 1 8 8 2 1

習題

7-1

1. 1, 2, 3, 4, 5 2. 1, 3, 4, 5 3. µ = 75, σ = 4分 4. M = 7.3, Me = 7.5, Mo = 8 5. √2,√2 6. (1) 平均分數多10分, 標準 差沒變 (2) 平均分數為其原有 的 110% ; 標準差亦為其原有的 110% 7. (a) 變小 (b) 增加一個 (c) 不變(d) 不變(e) 變小 (f)變小 8. S = S > S = 0.8 · S 9a. 身高 x = 167, s ≈ 3.16; 體重 x = 65, s = 5 9b. ≈ 1.27; 0.2 9c. 身高 10. x = 62, S = 9

7.2

雙變量數據分析

二維數據分析: 討論兩個變數之間是否有關聯, 稱為二為數據分析。 資料通常成對以 (xi, yi) 出現並 先觀察其散佈圖。

(12)

電流 電壓 電流 電壓 電流 電壓 0 0.4 0.2 0.3 0.4 0.6 0.6 0.6 0.8 0.4 1 1 1.2 0.9 1.4 0.7 1.6 1 1.8 1.1 2 1.3 2.2 1.1 2.4 1.4 2.6 1.6 2.8 1.9 3 1.9 3.2 2 3.4 1.9 3.6 2.1 3.8 2.1 4 2.4 4.2 2.4 4.4 2.5 4.6 2.5 1 2 3 4 5 0 1 2 3 電流 電 壓 1 2 3 4 5 0 1 2 3 ˆ Y 電流 電 壓

1: 電流、 電壓關係的散佈圖與迴歸直線 散佈圖: X, Y 兩變量, 將兩數據看成序對(xi, yi) ,在坐標系上繪出點(x1, y1), · · · , (xn, yn)所得的 圖, 以利觀察其相關情形。 1,985 1,990 1,995 2,000 2,005 2,010 2,015 250 300 350 年度 人 口 數 ( 萬 ) 數據資料 (xi, yi) 散佈圖 數據資料趨勢線 y = −1.62 · x + 3,508.8 例: 歐姆定律描述了電壓和電流在導體的關係, 某一段電線電流與電壓的關係如下: 相關係數: r = n P i=1 (xi− µx)(yi− µy) n · σx· σy , 未標準化兩變量 X,Y 之間的線性相關程度 (高中只討論線 性相關) 相關係數就是用標準化新資料計算出的, 可減少不同測量單位的數據對散佈圖的影響, 使資料分 布情形更易觀察其相關程度。 資料標準化(x′, y)的相關係數: r = n X i=1 x′ iyi′ n 與未標準化資料相關係數相等。 r = n X i=1 x′ iyi′ n = n X i=1 (xi− µx)(yi− µy) n · σx· σy = n X i=1 xiyi− nµX · µy r X x2 i − nµ2x  X y2 i − nµ2y 

(13)

= n X i=1 (xi− µx)(yi− µy) qX (xi− µx)2 qX (yi− µy)2 = p Sxy Sxx· p Syy = n P i=1 (xi − A)(yi− B) − n(µx− A)(µy− B) pP (xi− A)2− n(µx− A)2pP(yi− B)2− n(µy− B)2 , 其中 A, B 分別為xi, yi 的平 均估計值。 = p Sx′y′ − n(µx− A)(µy− B) Sx′x′ − n(µx− A)2 · p Syy− n(µy − B)2 公式說明: • 變量 X 的離差平方和: Sxx =P(xi− µx)(xi− µx) =P(xi− µx)2 = n · σx2 • 變量 Y 的離差平方和: Syy =P(yi− µy)(yi− µy) =P(yi− µy)2 = n · σ2 y • 變量 X、Y 的離差乘積和: Sxy =P(xi− µx)(yi− µy) =Pxiyi− nµxµy • 變量 X 的標準差: Sx = rX (xi− µx)2 n = q Sxx n , Sxx = n · σx2 • 變量 Y 的標準差: Sy = rX (yi− µy)2 n = q Syy n , Syy = n · σy2 rx,y = Sxy nσxσy = pSxy SxxSyy 標準化 = n P i=1 x′ iyi′ n 。(若為樣本數據資料, 將資料數n 修正為 n − 1) 相關係數的意義與性質: 顯現兩變數之間線性關聯性的程度。 一般兩變數之間具有高度相關才會進 一步尋求此“線性”的方程式。 1. r = 1 完全正相關 2. 0.7 ≤ |r| ≤ 1 表高度相關。(r > 0 表正相關,r < 0 表負相關) 3. 0.3 ≤ |r| ≤ 0.7表中度相關 4. 0 < |r| < 0.3 表低度相關 5. r = 0 表零相關。(表兩變數之間無線性關係, 但可能其他函數關係) 6. r = −1 表完全負相關 小心闡釋相關係數: 1. 當兩變數的線性相關程度很高時, 兩變數之間未必可解釋存在 「因果關係 」。 相關係數只 顯現兩變數之間關連性的強弱程度。 2. 若兩變量 X,Y 的相關係數為r, X′ = aX + b, Y= cY + d , X, Y的相關係數r (a) ac > 0, r′ = r

(14)

(b) ac < 0, r′ = −r 3. 相關係數與單位無關。 變量 X, Y 線性平移後的相關係數與原相關係數一樣 (頂多改變正 負相關)。 4. X 和Y 相關係數與 Y 和X 的相關係數不變。 5. 相關係數與平均數及標準差一樣, 易受少數極端數據 (離群數據)影響。 迴歸直線(最適合直線): byi = a + bxi 兩變數散佈圖之趨勢呈現類似直線關係,可用一適當直線方程 式來描述兩變量關係。(殘差最小平方法)。 最小平方法: 使上述直線 ybi = a + bxi 與實際資料 yi 的誤差值平方和為最小時 (即 min P (yi− byi)2 所得出的 a, b值),稱此直線為最小平方迴歸直線。 此直線ybi = a + bxi 稱為 y 對x 的迴歸線。 迴歸線必過資料中心點 X, µY)。 擬合值ybi: 迴歸直線 ybi = a + bxi 中的 ybi 為xi 的擬合值。 殘差 ei: 稱 ei = yi− byi = yi− a − bxi 為第 i筆資料的殘差。 迴歸直線斜率 b 的意義: 若變量X 每增減1單位, 則變量Y 平均增減 b 單位。 迴歸線的截距 a : 一般無特殊涵義 (只是配合一次函數關係式) 例: 編號 身高 (in) 體重 (lb) 1 68 155 2 61 99 3 63 115 4 70 205 5 69 170 6 65 125 7 72 220 60 62 64 66 68 70 72 100 150 200 250 e1 e2 e3 e4 e5 e6 e7 身高 (in) 體 重 (lb ) 原始數據 (xi, yi) y = 11.19 · x − 592.67 殘差 ei 迴歸線 ( by = a + bxi 為變量Y 對 X 最適合的直線): b y = a + bxi 採取平方誤差最小 ⇒ Pe2i = P (yi− by)2 = P(yi− a − bxi)2 為最小值時, 分 別對 a及 b取微分等於0, 可得      n P i=1 yi = n P i=1 a + b n P i=1 xi n P i=1 xiyi = a n P i=1 xi+ b n P i=1 x2 i ⇒      a = µy − bµx b = SSxy xx = r ·ppSyy Sxx = r · σσ y x , r為相關係數 b yi = µy+ Sxy S (xi− µx)

(15)

= y + r ·σσyx(xi− µx) 數據標準化(平均值為0, 標準差為1)後迴歸線: by′ = rx′ i,斜率 m = 相關係數 r 資料標準化 (x′, y) 的迴歸線方程式為 yb′ = rx其中 r 為其相關係數。 (此時圖中的迴歸線過 資料中心點(µx, µy)即原點) R2 = r2 : 迴歸線中的 R2 = Sxy Sxx · Sxy Syy = r · σy σx r · σx σy = byxbxy = r2 表兩變數 (xi, yi)可用迴歸 線方程式來闡釋兩資料關係的比率。 迴歸分析的三大功能: 1. 描述資料用: 利用迴歸線模式解釋資料關係。(R2 決定兩變量用此模式可闡釋的比率) 2. 預測資料: 利用迴歸線預測變數 y 3. 控制用: y 若受限制時,控制 x 變量

例題

範例 1: 計算未標準化的兩樣本數據 (xi, yi) 的相關係數? X 3 4 7 11 15 Y 5 40 15 35 55 xi yi xi− µx yi− µy (xi− µx)2 (yi− µy)2 (xi− µx)(yi− µy) µx = 405 µy = 1505 P= 0 P= 0 Sxx = 100 Syy = 1600 Sxy = 290 r = 29 40 = 0.725 演練 1a : 二維數據資料,求兩者線性相關係數?(參考: 第7頁1c ,1d ) 智商 xi 120 116 108 104 102 成績 yi 90 85 85 80 70 (解:) xi yi xi− µx yi− µy (xi− µx)2 (yi− µy)2 (xi− µx)(yi− µy) µ = 110 µ = 82 P= 0 P= 0 S = 240 S = 230 S = 200

(16)

r ≈ 0.85;by = −293 + 5 6x 演練 1b : 蒐集到五筆體重與身高的資料, 如表, 求兩者線性相關係數? 體重 8 14 16 20 22 身高 40 42 46 50 60 xi yi xi− µx yi− B (xi− µx)2 (yi− B)2 (xi− µx)(yi− B) µx = µy = A = µx B = 48 Sxx = 120 Sy′y′ = 252 Sxy′ = 156 (解:)µx = 16, µy = 47.6,取估計值 A = 16, B = 48,r = √ 156−5(0)(48−47.6) 120−5(0)2√252−5(48−47.6)2 ≈ 0.9 演練 1c : 蒐集到五筆二維數據資料,如表: 求兩者線性相關係數?(參考: 第8頁3b ,3c ) x 2 4 5 6 8 y 2 0 4 3 6 r = 0.75 演練 1d : 蒐集到五筆二維數據資料, 如表: 求兩者線性相關係數? x 3 4 7 11 15 y 2 16 6 14 22 r = 0.725;µx = 8, µy = 12, Sxy = 116, Sxx = 100, Syy = 256 範例 2: 某公司近五年的投資金額如表: 年度x 1 2 3 4 5 投資金額 y 1 1 3 4 6 (單位: 億元) 請繪 x, y 的散佈圖, 並求出迴歸直線方程式? 利用此迴歸線來預測此公司第7年度的投資金額大 約為多少元? 1 2 3 4 5 6 7 0 2 4 6 8 年度 投 資 金 額 ( 億 元 ) original data (x, y) y = 1.3 · x − 0.9 lin. Regression

(17)

演練 2a : 五筆二維數據資料,(2, 1), (6, 3), (4, 5), (8, 7), (10, 9)先繪出(x, y)的散佈圖,並求線性相關 係數 r , 若為高度相關求其迴歸直線方程式?(參考: 第8頁1e ,1f ) 0 2 4 6 8 10 12 0 2 4 6 8 10 年度 投 資 金 額 ( 億 元 ) original data (x, y) y = 0.9 · x − 0.4 ˆ y = 0.9x − 0.4 演練 2b : 蒐集到五筆二維數據資料, 如表: 求y 對 x 的最佳直線方程式?(參考: 第16頁1d ) x 3 4 7 11 15 y 2 16 6 14 22 y = 2925x + 6825 演練 2c : 使用瓦斯的汽車, 啟動剛行駛會增加了燃料使用量, 然後隨著車速的增加, 燃料使用量會減 低。 假設這種關係是非常規則的, 如由下面的速度數據 (英里/每小時) 和燃料耗損里程 (英 里/每加侖) 速度 (英里/每小時) 20 30 40 50 60 燃料 (英里/每加侖) 24 28 30 28 24 試作速度與燃料耗損的散佈圖, 並說明其線性相關係數為0, 是否存在其它函數關係? (解:) 20 30 40 50 60 24 26 28 30 年度 投 資 金 額 ( 億 元 ) 線性相關係數為0表非線性相關,有可能隱含 其它函數對應關係。 範例 3: 已知班上10位學生的會考數學成績與高一數學成績如表:

(18)

2: 會考數學成績與高一數學成績 成績 \ 編號 1 2 3 4 5 6 7 8 9 10 平均數 標準差 會考 x 52 40 40 48 40 42 42 46 46 44 44 q144 10 高一數學 y 82 58 60 80 76 64 68 72 68 72 70 q57610 40 45 50 55 60 70 80 會考成績 高 一 數 學 成 績 original data (x, y) y = 1.5 · x + 4 50 60 70 80 90 35 40 45 50 高一數學成績 會 考 成 績 original data (x, y) y = 0.37 · x + 17.75 −2 −1 0 1 2 −1 0 1 2 會考成績(標準化) 高 一 數 學 成 績 ( 標 準 化 ) 標準化data (x′, y) y = 0.75 · x + 0 1. 計算前述10位同學會考數學成績與高一數學成績的相關係數? r = 216 144×576 = 0.75;Sxy = 216, Sxx = 144, Syy = 576 2. 計算前述10位同學高一數學成績y對會考數學成績x的最佳直線? y = 4 + 1.5x 3. 若此班上某生會考數學成績為50分,試預測此同學高一數學成績為多少? 79分 4. 求此10位同學會考數學成績x對高一數學成績y的最佳直線? x = 3 8y + 71 4 5. 若班上有位同學的高一數學成績為56分,試估計此位同學的會考數學成績(四捨五入取至整 數)? 39 6. 問y 對x 的最佳直線斜率 byx 與x 對y 的最佳直線斜率bxy 乘積是否為相關係數 r 的平 方關係?

(19)

(解:)byxbxy = 3 2 × 3 8 = ( 3 4) 2 = r2 演練 3a : 五筆二維數據資料,(1, 14), (2, 10), (4, 8), (5, 6), (8, 2) 先繪出 (x, y) 的散佈圖, 並求線性相 關係數 r , 若為高度相關求其迴歸直線方程式?(參考: 第8頁1g ,1h ) 0 2 4 6 8 10 0 5 10 15 original data (x, y) y = −1.6 · x + 14.4 r = −2 5 √ 6 ≈ −0.98; ˆy = −1.6x + 14.4 演練 3b : 五筆二維數據資料,(14, 1), (10, 2), (8, 4), (6, 5), (2, 8) 先繪出 (x, y) 的散佈圖, 並求線性相 關係數 r , 若為高度相關求其迴歸直線方程式?(參考: 第8頁1g ,1h ) 0 5 10 15 0 2 4 6 8 original data (x, y)y = −0.6 · x + 8.8 r = −2 5 √ 6 ≈ −0.98; ˆy = −0.6x + 8.8 演練 3c : 試比較說明上述兩題數據資料關係對迴歸線的關係?(相關係數, 迴歸線斜率?) (解:)y 對 x 迴歸線, 斜率 byx= SSxy xx = r·√Syy √ Sxx = r·σy σx , r 為相關係數 x 對 y 迴歸線, 斜率 bxy = SSxy yy = r·√√Sxx Syy = r·σx σy , r 為相關係數。 相關係數不變, 迴歸線兩 斜率非倒數關係。 範例 4: 班上學生 A、B、C、D、E 與 F 共6位的兩次段考數學成績分別如下表 1. 完成表格空白的資料 (第一次成績標準化、 第二次原始成績及第二次成績的標準差)

(20)

3: 第一次段考與第二次段考數學成績 成績 \編號 A B C D E F 平均數 標準差 第一次原始成績 x 41 44 50 53 53 59 50 6 第一次成績標準化 x′ 0 1 第二次原始成績 y 52 60 64 60 第二次成績標準化 y′ −1 −1.5 0.5 0 1.5 0.5 0 1 (解:) 成績 \ 編號 A B C D E F 平均數 標準差 第一次原始成績 x 41 44 50 53 53 59 50 6 第一次成績標準化 x′ −1.5 −1 0 0.5 0.5 1.5 0 1 第二次原始成績 y 52 48 64 60 72 64 60 8 第二次成績標準化 y−1 −1.5 0.5 0 1.5 0.5 0 1 2. 哪一位學生成績進步最多? E 3. 求這兩次考試成績的相關係數? r = 3 4;Sxy = 216, Sxx = 216, Syy = 384 4. 求第二次成績 y 對第一次成績 x 的迴歸線方程式? (解:) 40 45 50 55 60 65 50 60 70 第一次成績 第 二 次 數 學 成 績 original data (x, y) y = 1 · x + 10 5. 原6位學生成績散佈圖, 現在新增班上兩位學生 G、H 的兩次數學成績共八筆資料如圖: 你 認為八位學生的第一、 二次段考數學成績平均值分別會增大(+)或減小(−) 還是不變(0)呢? 請用數對表示之? 例: (+, +)表兩次平均值均增大。(−, +)表第一次平均值減小,第二次增 大。(0, −) 表第一次不變,第二次減小。

(21)

40 45 50 55 60 50 60 70 G H 第一次段考數學成績 第 二 次 段 考 數 學 成 績 original data (x, y) 6位學生成績迴歸線 新增data (−, +) 演練 4a : 將6筆成對資料標準化後如表: x −3 −2 0 1 1 3 µx= 0 σx = 1 y −2 −3 1 0 3 1 µy = 0 σy = 1 求相關係數及 y 對 x 的迴歸線方程式? Sxy = 18, Sxx = 24, Syy = 24;r = 34, y = 34x 範例 5: 某飲料公司想瞭解廣告費用x (百萬元)與飲料銷售金額y (億元)之間的關係: 於是進行調 查, 連續10個月的每月廣告金額與銷售金額資料整理如下: P10 i=1 xi = 28, 10 P i=1 x2 i = 303.4, 10 P i=1 yi = 75, 10 P i=1 y2 i = 598.5, 10 P i=1 xiyi = 237 求銷售金額 y 對廣告費用 x 迴歸方程式? 若廣告費用每增加 1百萬元預算則銷售金額可期待增加多少元? ˆ y = 7.164 + 0.12x;0.12 億元 演練 5a : 某公司想瞭解行銷員數x (人) 與營業額y (百萬元)之間的關係: 於是進行調查, 資料如下: 人員數x 18 15 24 21 27 營業額 y 35 30 55 45 65 問 i. 營業金額y對行銷人數x的迴歸方程式? y = −17 + 3xˆ ii. 行銷人員每增加1人則營業金額可期待增加多少元? 3百萬元 iii. 當營業額60百萬元時估計應有多少行銷人員? 29人 演練 5b : 已知二維數據資料 (xi, yi), 其線性相關係數 r = 0.8 ,算術平均數 µx = 20, µy = 10 , 標準 差σx = 2, σy = 4 。 i. 求y 對 x 之迴歸線方程式? by = −22 + 1.6x ii. 求x 對y 之迴歸線方程式? x = 16 + 0.4yb 演練 5c : 已知兩變量關係 100P i=1 xi = 5000, 100 P i=1 yi = 6000, 100 P i=1 xiyi = 300028, 100 P i=1 x2 i = 250036, , 10 P i=1 y2 i = 360049, 則兩變量的線性相關係數為何? r = 2 3 求y 對 x 的迴歸線方程式? y = 14 3x − 520 3 當變量 x每增加1單位,變量 y 平均會增加多少? 14 3

(22)

習題7-2 雙變量數據分析 1. 某群學生練習準備課業時間與考試成績關係如表: 請做出這群學生練習時間與名次的散佈圖? 時間 154 390 130 70 240 280 175 103 成績排名 5 1 6 8 3 2 4 7 依你的觀察請簡單描述練習時間與名次的趨勢關係? 2. 二維數據24筆資料(xi, yi)其中 24 P i=1 xi = 1080, 24 P i=1 yi = 960, 24 P i=1 x2 i = 57600, 24 P i=1 y2 i = 48000, 24 P i=1 xiyi = 50400求相關係數 r ? 3. 某大學校系以往申請入學分口試與筆試兩項測驗, 因口試相當耗時, 若根據過去錄取者資料其 筆試與口試平均成績相關係數 r > 0.8 則今年研議取消口試, 過去5年錄取者的平均成績如表: 試繪錄取者筆試平均成績與口試平均成績的散佈圖?今年口試有取消嗎? 求近5年錄取者Y 對 年度 甲 乙 丙 丁 戊 筆試平均x 5 5 4 7 9 口試平均y 3 1 4 3 9 X 的相關係數及其迴歸直線方程式? 已知今年某考生筆試成績為8分, 若依照過去迴歸線經驗 此生口試成績應至少要達多少分時此生可望錄取此校系? 4. 某城市近年的人口數統計如下表: 標準化後求迴歸直線方程式並預測這城市2012年的人口數? 年度 x 2002 2004 2006 2008 2010 人口 (百萬) y 2 6 8 10 14 將x平移 0 2 4 6 8 y 2 6 8 10 14 x 標準化x’ √2 −√2 2 0 √ 2 2 √ 2 y 標準化y’ −1.5 −0.5 0 0.5 1.5 5. 已知成對資料(xi, yi),其相關係數為r = 0.8 ,其中X之算術平均數µx = 20 ,標準差σx = 1 及另一算術平均數µy = 10, 標準差σy = 2 ; 試求(1) y 對x 的迴歸直線方程式Ly? (2) x對 y 的迴歸直線方程式 Lx? (3) 兩迴歸直線Ly, Lx 的斜率乘積? 6. 已知甲、 乙、 丙、 丁四名考生的數學成績 X 與 英文 Y 級分及戊的數學成績如下: 求甲乙丙丁 四名考生 Y 對X 的迴歸直線方程式? 並依此迴歸線預測考生戊的英文成績應為多少級分?

(23)

考生 甲 乙 丙 丁 戊 數學級分 13 11 9 7 15 英文級分 14 12 8 10 * 3 6 9 12 15 3 6 9 12 15 數學級分 自 然 級 分 7. 已知母群體100筆 (xi, yi) 資料的標準差 σx = 0.1, σy = 0.2 , 相關係數為 0.9 及迴歸線 L 如 下: 則下列有關迴歸線方程式何者為真? (A) L : y = 1.8x + 1 (B) L : y = 5 9x + 1 (C) L : y = 2x + 1 (D) L : y = 12x + 1 (E) L : y = 0.45x + 1 8. 有4筆資料 A(1, 2), B(2, 1), C(2, 4), D(3, 3)求 Y 對X 的最適合直線方程式? 9. 設一組資料的平均 µX = 10, 標準差 σx = 4 ,且資料 xi和yi 資料的相關係數rxy = 0.69 , 若 zi = 3xi+ 5 求(1)µZ =?(2)σZ(3)r3x+5,5y+3=? 10. 研究6位學生的性向測驗與成就測驗的關係, 已知6位學生兩種測驗的得分如下表: (1) 求 x,y 學生代號 A B C D E F 總計 性向 X 5 6 8 9 9 11 48 成就 Y 5 8 8 12 13 14 60 的相關係數 (小數點第二位, 以下四捨五入) ?(2) 求 y 對x 的最適合直線 ? (3) 推測 X = 12 時,y 之值為何? 11. 調查10名學生的某次英文與數學考試成績如下表: 試求 Y 對X 的最小偏差直線方程式? 英文 (Y) 84 82 81 78 85 87 87 88 88 89 數學 (X) 68 67 66 69 68 70 71 72 74 75 12. 一研究人員想了解風力發電, 風速 x (MPH) 與電力 y (AMP) 之間的關係, 其模型設為 yi = a + bxi , 由25個資料 (xi, yi) i = 1 、2、3 · · · 、25 利用最小平方法計算得迴歸方程式為 y =b 0.13 + 0.25x 試回答下列問題: (a) 當風速增加1MPH 時, 電力估計平均變動多少?

(24)

(b) 在25個資料中, 改為 (xi+ 10, yi+ 20) i = 1 、2、3 · · · 、25 則直線迴歸方程中 x 的係數 0.25變為多少? (c) 若已知 P25 i=1 xi = 150 則 25 P i=1 yi =? (d) 若 Sxx = 146.88, Syy = 10.2則 X 與Y 之相關係數為何? 13. 調查某國家一年五個地區的香煙與肺癌之相關性, 得到數據為 (xi, yi), i = 1, 2, 3, 4, 5 其中 X 表每人每年香菸消費量 (單位:10包), Y 表示每十萬人死於肺癌的人數。 若已計算出 P5 i=1 xi = 135,P5 i=1 yi = 105, 5 P i=1 x2 i = 3661, 5 P i=1 y2 i = 2209, 5 P i=1 xiyi = 2842 (a) 求 X 與Y 之相關係數? (b) 試以最小平方法求 y 對x 的迴歸線 y = a + bx 方程式? 14. 研究人員收集20筆資料 (xi, yi) 其中 20 P i=1 xi = 1330, 20 P i=1 yi = 1862.8, 20 P i=1 x2 i = 90662, 20 P i=1 y2 i = 173554.26, 20 P i=1 xiyi = 124206.9 (計算機計算) (a) 求 X 與Y 之相關係數? (b) 試以最小平方法求迴歸線 y = a + bx ?

習題

7-2

1. 100 200 300 400 −2 0 2 4 6 8 練習時間 名 次 original data (x, y) y = −2.23 · 10−2· x + 8.78 2. r = 6 60 ≈ 0.77 3. 2 4 6 8 10 2 4 6 8 10 筆試 口 試 r = 0.75 < 0.8 未取消口試; 迴歸線 :ˆy = 9 8x − 11 4 ;x = 8, ˆy = 25 4 4. y′ = 7√2 10 x′; y′ = 21 10, by = 2.1 × 4 + 8 = 16.4;S = 7√2 2 , Sx′x′ = 5 L : y−84 = 7√2 10 x−42√2,16.4百萬人 5. (1) ˆy = −22 + 1.6X (2) ˆ x = 16 + 0.4Y (3) r = √m ymx, r2 = 0.64 6. y = 45x + 3,ˆ 戊英文= 15 7. A 8. y = 3/2 + 1/2x 9. (1)35(2)12(3)0.69 10. (1)r = 0.93(2)y = 32x − 2(3)16 11. µx = 70, µy = 84.9, Sxy = 74, Sxx = 80, Syy = 117 − 0.1;y = 37 403 12a. 0.25 12b. 0.25 12c. 40.75 12d. √3 10 = 0.96 13a. r = 0.875 13b. Sxy = 7, Sxx = 16, Syy = 4; y = −10316 + 167x; 14a. r = 0.96 14b. a = 83.23, b = 0.149

(25)

數據

表 2: 會考數學成績與高一數學成績 成績 \ 編號 1 2 3 4 5 6 7 8 9 10 平均數 標準差 會考 x 52 40 40 48 40 42 42 46 46 44 44 q 144 10 高一數學 y 82 58 60 80 76 64 68 72 68 72 70 q 576 10 40 45 50 55607080 會考成績高一數學成績 original data (x, y)y = 1.5 · x + 4 50 60 70 80 9035404550高一數學成績會考成績origina
表 3: 第一次段考與第二次段考數學成績 成績 \ 編號 A B C D E F 平均數 標準差 第一次原始成績 x 41 44 50 53 53 59 50 6 第一次成績標準化 x ′ 0 1 第二次原始成績 y 52 60 64 60 第二次成績標準化 y ′ −1 −1.5 0.5 0 1.5 0.5 0 1 ( 解 :) 成績 \ 編號 A B C D E F 平均數 標準差 第一次原始成績 x 41 44 50 53 53 59 50 6 第一次成績標準化 x ′ −1.5 −1 0 0.5 0

參考文獻

相關文件

第一次 第二次 第三次

第 1 次招考 108.7.3(三) 下午 17:00 時前公告於本校網站. (二)錄取時僅以電話通知,不另寄發成績通知;若需成績通知者,請於放榜後一週內至本校人事

甄選成績未達 70

110年度第3梯次自辦職前訓練考生達口試資格公告

(二) 依【管道一】複選鑑定,數學及自然性向測驗成績兩科均達平均數正 2 個標準 差或 PR97,且數理實作評量成績達參加複選學生平均數負

複選通過標準:國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外 語文性向測驗成績達平均數正 1.5 個標準差或 PR93

(二) 依【管道一】複選鑑定,數學及自然性向測驗成績兩科均達平均數正 2 個標準 差或 PR97

(二) 依【管道一】複選鑑定,國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外語文性向測驗成績達平均數正 1.5 個標準差或 PR93