4-2 二維數據分析
重點一 散佈圖 例題 1為了解成人的身高與鞋子尺寸的關聯性而做抽樣調查,得到 9 位男性身高與鞋子的號數如 下,試作身高與鞋號的散佈圖。(10 分)
身高(公分) 186 180 180 182 178 178 175 177 178 鞋 號 13 11 9 10 11 10 8 9 9 解
例題 2
下列有關兩變量x 與 y 的 20 對點資料的五個散佈圖中,哪些相關係數為正相關?(10 分)
(A) (B) (C)
(D) (E)
解 (A)為正相關 (B)為正相關 (C)為正相關 (D)為負相關 (E)為負相關 故選(A)(B)(C) 例題 3
某班上有七名學生(以甲、乙、丙、丁、戊、己、庚編號),其期末考成績與該學期 上課時缺課數的資料如下:
編 號 甲 乙 丙 丁 戊 己 庚
缺課數x(天) 0 1 2 3 4 5 6
期末考成績y(分) 87 83 79 75 71 67 63 (1) 試繪出散佈圖。(5 分)
(2) 試繪出標準化數據的散佈圖。(5 分)
解 (1)
(2) μx=1
7(0+1+2+3+4+5+6)=3 μy=1
7(87+83+79+75+71+67+63)=75 σx=
7
2
1
1
7 i i x
x μ=
( - )= 1 3 2 2 2 1 2 02 12 22 32 7〔(- )+(- )+(-)+ + + + 〕=2
σy=
7
2
1
1
7 i i y
y μ=
( - )= 1 122 82 42 02 4 2 8 2 12 2 7〔 + + + +(- )+(- )+(- )〕=8 標準化後的數據如下:
ui= i x
x
x μ σ
- -1.5 -1 -0.5 0 0.5 1 1.5
vi= i y
y
y μ σ
-
1.5 1 0.5 0 -0.5 -1 -1.5 故得標準化數據的散佈圖如下
重點二 相關係數 例題 4
四人參加性向及成就測驗,其成績如右表所示。
(1) 若性向、成就測驗成績的算術平均數分別為 μx,μy, 則數對(μx , μy)= 。(4 分)
(2) 試作出其散佈圖。(4 分)
(3) 性向、成就兩者成績的相關係數為 。(四捨五入 取到小數點後第二位)(4 分)
解 (1) μx=1 8 4 7 4
+ + +
=5
代 號 A B C D 性向x 1 8 4 7 成就y 2 4 2 8
μy=2 4 2 8 4
+ + +
=4
故數對(μx , μy)=(5 , 4)
(2)
(3)
4
2
1
i x
i
x μ=
( - ) =(1-5)2+(8-5)2+(4-5)2+(7-5)2=16+9+1+4=30
4
2
1
i y
i
y μ=
( - ) =(2-4)2+(4-4)2+(2-4)2+(8-4)2=4+0+4+16=24
4
1
i x i y
i
x μ y μ
=( - )( - )=(-4)(-2)+3×0+(-1)×(-2)+2×4=18
相關係數r=
4
1
4 4
2 2
1 1
i x i y
i
i x i y
i i
x μ y μ
x μ y μ
=
= =
( - )( - )
( - )‧ ( - )
= 18
30 24‧ 0.67
例題 5
設五位同學的身高與體重如下表所示:
身高x(公分) 163 165 167 171 174 體重y(公斤) 48 54 62 66 70 (1) 試繪出標準化數據的散佈圖。(4 分)
(2) 承(1),利用標準化數據求其相關係數。(4 分)
解 (1) μx=1
5(163+165+167+171+174)=168 μy=1
5(48+54+62+66+70)=60 σx=
5
2
1
1
5
i x μi x=
( - )= 1 5 2 3 2 1 2 32 62 5〔(- )+(- )+(-)+ + 〕=4
σy=
5
2
1
1
5
i y μi y=
( - )= 1 12 2 6 2 22 62 102 5〔(- )+(- )+ + + 〕=8 標準化後的數據如下:
ui= i x
x
x μ σ
- -1.25 -0.75 -0.25 0.75 1.5
vi= i y
y
y μ σ
- -1.5 -0.75 0.25 0.75 1.25
故得散佈圖如下
(2) 直接計算得 r=1
5(
5
1 i i i
u v=
)
=1
5×〔(-1.25)×(-1.5)+(-0.75)×(-0.75)+(-0.25)×0.25+0.75×0.75
+1.5×1.25〕
=1
5×(1.875+0.5625-0.0625+0.5625+1.875)
=1
5×4.8125
=0.9625
即相關係數為 0.9625 例題 6
下列哪一組(x , y)資料的相關係數為 1?(10 分)
(A) (B) (C)
(D) (E)
解 (A):水平線 相關係數為 0
(B)(C):直線的斜率為負 相關係數為-1 (D)(E):直線的斜率為正 相關係數為 1 故選(D)(E)
例題 7
右圖表兩組數據x,y 的散佈圖,試問其相關係數 r 最接近下列何值?(10 分)
(A) 1 (B) 0.5 (C) 0 (D)-0.5 (E)-1。
解 ∵所給八點呈上下對稱、左右對稱
∴相關係數r=0 故選(C)
重點三 最小平方法與迴歸直線 例題 8
散佈圖上有資料(1 , 1),(2 , 4),(3 , 5),試用最小平方法求迴歸直線方程式。(10 分)
解 設所求迴歸直線方程式為 L:y=a+bx
要求a,b 使右圖中的 d12+d22+d32有最小值,計算可得 d12+d22+d32
=〔(a+b)-1〕2+〔(a+2b)-4〕2+〔(a+3b)-5〕2
=(a+b)2-2(a+b)+1+(a+2b)2-8(a+2b)+16
+(a+3b)2-10(a+3b)+25
=a2+2ab+b2-2a-2b+1+a2+4ab+4b2-8a-16b
+16+a2+6ab+9b2-10a-30b+25
=3a2+12ab+14b2-20a-48b+42
=3(a+2b)2+2b2-20a-48b+42
=3
10 2
2 3 a b
( + )- +2b2-8b+26 3
=3
10 2
2 3 a b
+ - +2(b-2)2+2 3
故當
2 10 0 3 2 0 a b b
+ - =
- =
,即
2 3 2 a b
=-
=
時有最小值2 3 故所求的迴歸直線方程式為L:y=-2
3+2x 例題 9
設有一群資料如右表,則:
(1) 試作其散佈圖。(4 分)
(2) x 與 y 的相關係數為 。(4 分)
(四捨五入取到小數點後第二位)
(3) y 對 x 的迴歸直線方程式為 。(4 分)
解 (1)
(2) xi yi xi-μx yi-μy (xi-μx)(yi-μy) (xi-μx)2 (yi-μy)2
1 1 -6 -4 24 36 16
3 2 -4 -3 12 16 9
x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9
4 4 -3 -1 3 9 1
6 4 -1 -1 1 1 1
8 5 1 0 0 1 0
9 7 2 2 4 4 4
11 8 4 3 12 16 9
14 9 7 4 28 49 16
合計 56 40 84 132 56
μx= 8
xi
=568 =7,μy= 8
yi
=408 =5
∴x 與 y 的相關係數 r= 84
132 56 0.98 (3) 令 y 對 x 的迴歸直線方程式為 y=a+bx
由(2)知 b= 84
132= 7 11
a=μy-b×μx=5- 7
11×7= 6 11
∴y 對 x 的迴歸直線方程式為 y= 6 11+ 7
11x 例題 10
汽車的耗油量與行駛速度有關聯性,今測試一部 1500 c.c.的汽車,得到下列的數據,
速度x(公里 / 小時) 60 70 80 90 100 耗油量y(公里 / 公升) 14 16 19 20 21 試求:
(1) 耗油量對速度的迴歸直線方程式為 。(4 分)
(2) 預測速度為 85(公里 / 小時)時的耗油量為 公里 / 公升。(4 分)
解 (1) μx=1
5(60+70+80+90+100)=80 μy=1
5(14+16+19+20+21)=18
xi yi xi-μx yi-μy (xi-μx)(yi-μy) (xi-μx)2
60 14 -20 -4 80 400
70 16 -10 -2 20 100
80 19 0 1 0 0
90 20 10 2 20 100
100 21 20 3 60 400
合計 400 90 180 1000
設迴歸直線方程式為y=a+bx
則b=
5
1 5
2
1
i x i y
i
i x
i
x μ y μ x μ
=
=
( - )( - )
( - )
= 180 1000= 9
50
a=μy-bμx=18- 9
50×80=18 5 故迴歸直線方程式為y=18
5 + 9 50x (2) 當 x=85 時,y=18
5 + 9
50×85=18.9(公里 / 公升)