2 ︱
1
3 ︱
1
1-4 分析二維數據
例題 1
如右圖表兩組數據 x,y 的散佈圖,試問其相關係數 r 最接近下列何 值? ( )A 1 ( ) B 0.5 ( )C 0 ( )D-0.5 ( )E-1‧
■解:∵所給八點呈上下對稱、左右對稱
∴相關係數 r=0,故選 ( )C
例題 2
下列有關兩變量 X 與 Y 的 20 對點資料的五個散佈圖中,哪些相關係數為正相關?
( )A ( ) B ( )C
( )D ( )E
■解: ( )A 為低度正相關; ( ) B 為中度正相關; ( )C 為高度正相關; ( )D 和 ( )E 皆為中度負相關 故選 ( )A ( ) B ( )C
例題 3
十位考生之國文與數學成績列表如下:
考生編號 1 2 3 4 5 6 7 8 9 10 國 文 89 65 76 69 82 57 66 72 78 66 數 學 75 57 65 65 83 63 58 62 63 69
今算出國文成績之標準差為 9.4 分(取至小數點第一位),數學成績之標準差為 7.9 分
(取至小數點第一位),則此十位考生兩科成績之相關係數最接近 ( )A-0.85 ( ) B 0.25 ( )C 0.66 ( )D 0.78 ( )E 0.85‧
■解:
國文平均 ¯x= 1
10 (89+65+76+69+82+57+66+72+78+66)=72 數學平均 ¯y= 1
10 (75+57+65+65+83+63+58+62+63+69)=66 又 (xi-¯x)(yi-¯y)=442
2 ︱
1
3 ︱
1
故相關係數 r=
(xi-¯x)(yi-¯y)
(n-1)×Sx×Sy = 442
9×9.4×7.9 =0.66……,故選 ( )C
例題 4
四人參加性向及成就測驗,其成績如右表所示‧
( )1 若性向、成就測驗成績的算術平均數分別為 ¯x,¯y,則
數對(¯x,¯y)= ‧
( )2 性向、成就兩者成績的相關係數為 ‧
■解:
( )1 ¯x= 1+8+4+7
4 =5,¯y= 2+4+2+8 4 =4 故數對(¯x,¯y)=(5,4)
( )2 (xi-¯x)2=(1-5)2+(8-5)2+(4-5)2+(7-5)2=16+9+1+4=30
(yi-¯y)2=(2-4)2+(4-4)2+(2-4)2+(8-4)2=4+0+4+16=24
(xi-¯x)(yi-¯y)=(-4)(-2)+3×0+(-1)×(-2)+2×4=18
相關係數 r= 18
30 . 24 ~~0.67
例題 5
下圖中,有五組數據,每組各有 A,B,C,D,E,F 等六個資料點‧
( )1 ( )2 ( )3 ( )4 ( )5
設各組的相關係數由左至右分別為 r1,r2,r3,r4,r5,則下列關係式何者為真?
( )A r1=r2 ( ) B r2<r3 ( )C r3>r4 ( )D r3<r5 ( )E r4=r5‧
■解:圖 ( )1 、 ( )2 之各組資料對稱於點(¯X,¯Y) ∴r1=r2=0 圖 ( )3 、 ( )4 之結構相同,且是正相關 ∴r3=r4>0
又比較圖 ( )3 、 ( )5 知 r(X,Y)=r(X,2Y-1) ∴r3=r5,故選 ( )A ( ) B ( )E
代 號 A
B C D
性向 x 1 8 4 7 成就 y 2 4 2 82 ︱
1
3 ︱
1
例題 6
調查全校三年級學生的第一次段考數學成績(x)與物理成績(y),抽查其中 40 位同 學,得到平均數、標準差及相關係數如下:¯x=70,¯y=65,Sx=10,Sy=5,r=0.8‧
( )1 求物理成績(y)對數學成績(x)的最佳直線為 ‧
( )2 已知三年級學生中數學成績最高分為 95 分,試推估其物理成績約為 分‧
■解:
( )1 設 L:y=a+bx,則 b=
(xi-¯x)(yi-¯y)
(xi-¯x)2 =r. Sy
Sx=0.8. 5 10 =0.4 a=¯y-b¯x=65-0.4×70=37,故最佳直線 L 為 y=37+0.4x
( )2 ∵x=95 ∴y=37+0.4×95=75,故物理成績約為 75 分 例題 7
設有一群資料:
x 1 3 4 6
8 9 11 14y
1 2 4 4 5 7 8 9 ,則:( )1 x 對 y 的相關係數為 ‧
( )2 y 對 x 的最佳直線(迴歸線)方程式為 ‧
■解: xi yi xi-¯x yi-¯y (xi-¯x)(yi-¯y) (xi-¯x)2 (yi-¯y)2
1 1 -6 -4 24 36 16
3 2 -4 -3 12 16 9
4 4 -3 -1 3 9 1
6 4 -1 -1 1 1 1
8 5 1 0 0 1 0
9 7 2 2 4 4 4
11 8 4 3 12 16 9
14 9 7 4 28 49 16
合計 56 40 84 132 56
¯x=Σxi
8 = 56
8 =7,¯y=Σyi
8 = 40 8 =5 ( )1 x 對 y 的相關係數 r= 84
132 56 ~~0.98 ( )2 b= 84
132 =7 11 a=¯y-bׯx=5-7
11 ×7= 6 11
∴y 對 x 的迴歸線方程式為 y= 6 11 +7
11 x
2 ︱
1
3 ︱
1
例題 8
設有兩組變量 x 與 y,x:x1,x2,……,x10;y:y1,y2,……,y10,已知
x
i=11,x
i2=32.1, yi=14, yi2
=39.6,
x
iy
i=28,則:( )1 這兩組變量 x 與 y 的相關係數為 ‧
( )2 滿足這十個點(x1,y1),(x2,y2),……,(x10,y10)的最適合直線方程式為 ‧
■解:
由題意知 ¯x= 11
10=1.1,¯y= 14 10=1.4
(xi-¯x)2= xi2
-10(¯x)2=32.1-10×1.12=20
(yi-¯y)2= yi2
-10(¯y)2=39.6-10×1.42=20
(xi-¯x)(yi-¯y)= xiyi-10(¯x)(¯y)=28-10×1.1×1.4=12.6
( )1 r=
(xi-¯x)(yi-¯y)
(xi-¯x)2 (yi-¯y)2
= 12.6
20 20 =0.63
( )2 b=
(xi-¯x)(yi-¯y)
(xi-¯x)2
= 12.6
20 =0.63 a=¯y-b¯x=1.4-0.63×1.1=0.707
故最適合直線方程式為 y=0.63x+0.707
例題 9
五個學生參加一項包含數學與英文之能力測驗(每科皆為滿分十 分)得其成績之散佈圖如右(x 表數學成績,y 表英文成績),試 求:
( )1 數學之算術平均數 ¯x 為 ,標準差 Sx 為 ‧ ( )2 x,y 之相關係數為 ‧
( )3 y 對 x 之最佳直線為 ‧(以 y=a+bx 之形式表示)
■解: ( )1 由圖知 x,y 之對應關係如下:
x 3 5 7 7 8 y 6 5 6 8 10
2 ︱
1
3 ︱
1
可得 ¯x= 1
5(3+5+7+7+8)=6
¯y= 1
5(6+5+6+8+10)=7
xi yi xi-¯x yi-¯y (xi-¯x)2 (yi-¯y)2 (xi-¯x).(yi-¯y)
3 6 -3 -1 9 1 3
5 5 -1 -2 1 4 2
7 6 1 -1 1 1 -1
7 8 1 1 1 1 1
8 10 2 3 4 9 6
16 16 11
Sx= 1
4(xi-¯x)2 = 1
4(9+1+1+1+4)= 16 4 =2 ( )2 相關係數 r= 11
16 16 = 11
16 ~~0.69 ( )3 設最適直線 L:y=a+bx,則
b= (xi-¯x)(yi-¯y)
(xi-¯x)2 = 11 16 a=¯y-b¯x=7- 11
16×6= 23 8
∴最佳直線方程式為 y= 11
16 x+ 23 8
例題 10
空氣品質會受到汙染物排放量及大氣擴散等因素的影 響‧某一機構為了解一特定地區的空氣品質,連續二 十八天蒐集了該地區早上的平均風速及空氣中某特定 氧化物的最大濃度‧再繪製這二十八筆資料的散佈圖
(見右圖),現根據該圖,可知
( )A此筆資料中,該氧化物最大濃度的標準差大於 15
( ) B此筆資料中,該氧化物最大濃度的中位數為 15
( )C此筆資料中,平均風速的中位數介於 45 與 50 間
( )D若以最小平方法決定數據集中直線趨勢的直線,則該直線的斜率小於 0‧
2 ︱
1
3 ︱
1
■解: ( )A ╳:最大濃度之平均約為 15(毫克/立方公尺),而所有的點幾乎集中在
15±10(毫克/立方公尺)內,即 5~25(毫克/立方公尺)
∴標準差不可能大於 15
( ) B ╳:最大濃度之樣本由小到大 a1,a2,……,a28 共有 28 個 由圖形知最大濃度 a14~~13,a15=15,即中位數 a14+a15
2 =14<15
∴中位數小於 15
( )C ○:平均風速之樣本由小到大 b1,b2,……,b28 共有 28 個 由圖形知平均風速之 b13=b14=b15=48
即中位數 b14+b15
2 =48 ∴中位數介於 45 與 50 之間 ( )D ○:根據 28 個點之散佈圖知平均風速與最大濃度兩者為負相關
∴直線之斜率小於 0 故選 ( )C ( )D