3-2 二維數據分析 二維數據分析 二維數據分析 二維數據分析
基礎題基礎題 基礎題基礎題
1. 試比較下列選項(A)~(F)的散布圖中,x,y 相關係數的大小
(A) (B) (C)
(D) (E) (F)
解 解解
解 (A) r=1 (B) r=-1 (C) r=0 (D)-1<r<0 (E) 0<r<1 (F) r=0
故得(B)<(D)<(C)=(F)<(E)<(A)
2. 下列選項中,哪些圖形的相關係數與右圖的相關係數相等?
(A) (B) (C)
(D) (E)
解 解解
解 假設題圖的 9 個點為(xi,yi),其中 i=1,2,……,9,相關係數為 α (A)點(xi,2yi-1),相關係數為 α
(B)點(6-xi,yi),相關係數為-α (C)點(xi,4-yi),相關係數為-α (D)點(6-xi,4-yi),相關係數為 α (E)點(yi,xi),相關係數為 α
故選(A)(D)(E)
3. 一組二維數據(xi,yi)經標準化後(Xi,Yi)的數據如下表所示,試求:
i x
i
x
X x
µ
σ
= − 1.5 -1.5 -1 -0.5 1 0.5 0
i y
i
y
Y y
µ
σ
= − 1 -1.5 0 -1 1.5 0.5 -0.5
(1)(Xi,Yi)的相關係數
(2) 在標準化數據時,Y 對 X 的最適直線方程式
解解解
解 (1) 標準化數據(Xi,Yi)之相關係數 r= 1 1 2 2 7 7
7
X Y +X Y +L L +X Y
=1.5 1 ( 1.5 ) ( 1.5 ) ( 1) 0 ( 0.5 ) ( 1) 1 1.5 0.5 0.5 0 ( 0.5 ) 7
× + − × − + − × + − × − + × + × + × −
=6 7 (2) Y 對 X 的最適直線方程式為 Y=rX,即 6
Y =7X
4. 某超市依據過去的銷售紀錄,平均氣溫在 20°C 到 36°C 時,每日平均售出的冰淇淋數量與當天 的平均氣溫之相關係數為 0.99,部分紀錄如下表。
平均氣溫(°C) 22 24 26 28 30 32 平均售出量(盒) 135 203 279 361 437 512
若某日平均氣溫為 33°C,依據上述資訊推測,試問該日賣出的冰淇淋數量應接近下列哪一個選 項?
(A) 530 盒 (B) 550 盒 (C) 570 盒 (D) 590 盒 (E) 620 盒
解 解解
解 因為相關係數接近 1,所以數據幾乎散布於一條直線附近 假設平均氣溫 33°C 時,賣出 y 盒,則
512 512 135 33 32 32 22
y− = −
− − y=549.7≈550(盒)
故選(B)
5. 有 20 筆數據(xi,yi),i=1,2,……,20,其中 xi 與 yi 的算術平均數分別為
µ
x 與µ
y, 若已知(x1-µ
x)(y1-µ
y)+(x2-µ
x)(y2-µ
y)+……+(x20-µ
x)(y20-µ
y)=36,2 2 2
1 2 20
(x −
µ
x) +(x −µ
x) + +L (x −µ
x) =36,2 2 2
1 2 20
(y −
µ
y) +(y −µ
y) + +L (y −µ
y) =49, 試求(xi,yi)的相關係數解 解解
解 依定義,相關係數
r= 1 1 2 2 20 20
2 2 2 2 2 2
1 2 20 1 2 20
( ) ( ) ( ) ( ) ( ) ( )
( ( ) ( ) ( ) ) ( ( ) ( ) ( ) )
x y x y x y
x x x y y y
x y x y x y
x x x y y y
µ µ µ µ µ µ
µ µ µ µ µ µ
− − + − − + + − −
− + − + + − × − + − + + −
L
L L
= 36
36 49× =6 7
6. 若 10 筆數據如右表,已知 x 與 y 的算術平均數分別為
µ
x=10,µ
y=20,標準差分別為σ
x=2,σ
y=4,x 與 y 的相關係數為 1r= 2,試求:
(1) y 對 x 的最適直線方程式 (2) x 對 y 的最適直線方程式
解 解解
解 (1) y y( x)
x
y
µ
rσ
xµ
− =
σ
−1 4
20 ( 10 )
2 2 y− = × x−
y=x+10
(2) x x( y)
y
x
µ
rσ
yµ
− =
σ
−1 2
10 ( 20 )
2 4 x− = × y−
y=4x-20
7. 有一組二維數據(xi,yi),i=1,2,……,n,若已知平均數
µ
x=5,µ
y=2,標準差σ
x=3,σ
y=8,且 y 對 x 的最適直線過點(3,6),試求 x 與 y 的相關係數解 解解
解 y 對 x 的最適直線方程式為 y y( x)
x
y
µ
rσ
xµ
− =
σ
−即 8
2 ( 5 )
y− = ×r 3 x− ,又此直線通過點(3,6)
得 8
6 2 ( 3 5 ) r 3
− = × − 3
r= −4 故 x 與 y 的相關係數為 3
−4
x x 1 x 2 …… x 10 y y 1 y 2 …… y 10
進階題進階題 進階題進階題
8. 圖(一)是項目 A(x 軸)與項目 C(y 軸)的散布圖,
圖(二)是項目 B(x 軸)與項目 C(y 軸)的散布圖,
試繪製項目 A(x 軸)與項目 B(y 軸)的散布圖,
並觀察是正相關還是負相關?
解 解 解
解 利用圖(一)、圖(二)製表並繪製項
目 A(x 軸)與項目
B(y 軸)的散布圖如左,觀察可 知為負相關
9. 已知有 20 筆數據(xi,yi),i=1,2,……,20,若已知平均數
µ
x=3、µ
y=4,x 與 y 的相關 係數 r=0.8,且 y 對 x 的最適直線經過點(2,0),則下列選項哪些正確?(A) y 對 x 的最適直線過點(3,4)
(B) y 對 x 的最適直線方程式為 y=4x+8 (C) x 的標準差大於 y 的標準差
(D)當 x=4 時,可預測 y=8
(E)新數據(2xi-3,4-5yi)的相關係數仍為 0.8
解解解
解 (A) ○:最適直線必過點(µx,µy)=(3,4)
(B) ×: y y ( x)
x
y r
σ
xµ µ
− =
σ
− y-4=m(x-3),其中 yx
m r
σ
=
σ
代入(2,0)可得斜率 m=4,故最適直線方程式為 y=4x-8 (C) ×:由(B)知 y
x
r
σ
mσ
=4 5 0.8
y x
σ
σ
= = σy>σx(D) ○:將 x=4 代入最適直線方程式 y=4x-8,可得 y=8 (E) ×:新數據(2xi-3,4-5yi)的相關係數為-0.8
故選(A)(D)
項目 A 項目 B 項目 C
10 65 26
17 60 28
20 55 37
22 50 41
30 45 44
34 40 50
42 35 56
47 30 61
53 25 63
54 20 72
圖(一) 圖(二)
10. 測量五位同學的身高(x)與體重(y),結果如右 表,試求:
(1) 身高與體重的相關係數
(2) 體重對身高的最適直線方程式
(3) 利用最適直線,預測當身高是 173 公分時,體重約為多少公斤?
解 解 解
解 x y x-µx y-µy
(x−
µ
x)2 (y−µ
y)2 (x-µx)(y-µy)160 48 -8 -2 64 4 16
164 46 -4 -4 16 16 16
168 50 0 0 0 0 0
172 54 4 4 16 16 16
176 52 8 2 64 4 16
µx=168 µy=50 160 40 64 (1) 相關係數 r= 64
160 40 =0.8
×
(2) 體重對身高的最適直線斜率為 64
m=160
即 64
50 ( 168 )
y− =160 x− y=0.4x-17.2
故體重對身高的最適直線方程式為 y=0.4x-17.2
(3) 當 x=173 時,代入 y=0.4x-17.2,可得 y=52(公斤)
11. 假設二維數據變數(ai,bi)的相關係數 r=0.9,已知 ai 的算術平均數
µ
a=3,標準差σ
a=1,bi 的算術平均數µ
b=2,標準差σ
b=2。令 xi=3ai-1,yi=3-2bi,試求:(1) xi 的算術平均數
µ
x 與標準差σ
x(2) yi 的算術平均數
µ
y 與標準差σ
y(3)(xi,yi)的相關係數 R (4) y 對 x 的最適直線方程式
解解解
解 (1)(2) 由數據的平移與伸縮可得
µx=3µa-1=8,σx=|3|σa=3 µy=3-2µb=-1,σy=|-2|σb=4
(3) 因 xi=3ai-1,yi=3-2bi 之 ai 與 bi 的係數異號 故 R=-r=-0.9
(4) y 對 x 的最適直線方程式 y y ( x)
x
y R
σ
xµ µ
− =
σ
−即 4
( 1) ( 0.9 ) ( 8 )
y− − = − × × −3 x y=-1.2x+8.6
身高(公分) 160 164 168 172 176 體重(公斤) 48 46 50 54 52