• 沒有找到結果。

兩變量x與 y 的數據如下表: x 1 3 5 2 4 y 9 1 9 3 3 求x與 y 的相關係數

N/A
N/A
Protected

Academic year: 2021

Share "兩變量x與 y 的數據如下表: x 1 3 5 2 4 y 9 1 9 3 3 求x與 y 的相關係數"

Copied!
5
0
0

加載中.... (立即查看全文)

全文

(1)

39 單元 9 二維數據分析

每題 10 分。

1. 右圖的散布圖中應去掉哪一點後,其相關係數會變大?

(1) A (2) B (3)C (4) D (5) E 。

因為去掉 D 點後,其餘 4 點比較接近一直線,所以相關係數變大。

故選(4)。

2. 下列散布圖中,選出表示兩變量間為負相關的選項。

(1) (2) (3)

(4) (5)

散布點的分布集中在斜率為負的直線附近即為負相關。

故選(2)(4)。

(2)

40

3. 兩變量x與 y 的數據如下表:

x 1 3 5 2 4

y 9 1 9 3 3

x與 y 的相關係數。

兩變量x與 y 的平均數分別為 1 3 5 2 4

5 3

x      , 9 1 9 3 3 5 5

y      。 依公式需要整理如下表:

xx yy xx2 yy2 xxyy

2 4 4 16 8

0 4 0 16 0

2 4 4 16 8

1 2 1 4 2

1 2 1 4 2

總和 Sxx 10 Syy 56 Sxy 0

代入相關係數的計算公式,得 0 0

10 56

xy

xx yy

r S

S S

4. 有20筆數據x yi, i都滿足yi  3xi ,其中1 i12 ,20,求x與 y 的相關係數。

因為數據x yi, i都滿足 yi  3xi ,表示所有點都在一斜直線上,相關係數為1或 11  。 又該直線斜率小於0x與 y 為負相關,所以相關係數為 。 1

(3)

41 5. 關於散布圖的敘述,選出正確的選項。

(1)若各數據點全落在一直線上,表示兩變量呈現完全正相關或完全負相關

(2)若以  當作原點,各數據點多半集中在第一、三象限,表示兩變量呈現正相關 x, y

(3)若各數據點散布上、下、左、右均成對稱,表示兩變量為零相關 (4)若各數據點散布在一平行x軸的直線上,表示兩變量呈現完全正相關 (5)散布圖上各數據點的迴歸直線,其斜率恰等於相關係數。

(1) 錯誤:若為鉛直線或水平線,則為零相關。

(2) 錯誤:反例:

x 1 2 1 2 10 10

y 2 1 2 1 10 10

x y 0,第一、三象限的數據點比第二、四象限的數據點多,

但是兩變量呈現負相關。

(3) 正確。

(4) 錯誤:若平行x軸,表示兩變量為零相關。

(5) 錯誤:當兩變量的標準差相等時方有此性質。

故選(3)。

6. 關於下列的敘述,選出正確的選項。

(1)相關係數 r 的變動範圍在 1 與1之間

(2)當兩變量x與 y 的相關係數愈大時,代表x與 y 的相關程度愈強 (3)迴歸直線 y mx k  中的斜率m的變動範圍在 與1之間 1

(4)由兩變量x與 y 的數據所求得的迴歸直線之斜率m與相關係數 r 正負號相同 (5)若兩變量x與 y 的數據皆滿足 yax b ,則x與 y 的相關係數r 。 1

(1) 正確。

(2) 錯誤:例如相關係數 1 ,表完全負相關。

(3) 錯誤:因為迴歸直線 y mx k  中的斜率m與相關係數r的關係為 y

x

m r

  所以m的變動範圍未必在 與1之間。 1

(4) 正確。

(5) 錯誤:r可能為1、 1 或0 故選(1)(4)。

(4)

42

7. 兩變量x與 y 的數據如下表:

x 1 2 3 4 5

y 3 3 6 3 5

(1)已知x與 y 的相關係數為 5

k ,求k的值。

(2)求 y 對x的迴歸直線方程式。

(1) 兩變量x與 y 的平均數分別為 1 2 3 4 5

5 3

x      , 3 3 6 3 5 5 4

y      。 依公式需要整理如下表:

xx yy xx2 yy2 xxyy

2 1 4 1 2

1 1 1 1 1

0 2 0 4 0

1 1 1 1 1

2 1 4 1 2

總和 Sxx 10 Syy 8 Sxy 4 代入相關係數的計算公式,得

4 1 5

10 8 5 5

xy

xx yy

r S

S S

。故k 5

(2) 代入迴歸直線方程式 y xy x

xx

y S x

S

,得 4 4 3

y 10 x , 2 14

5 5 y x

8. 設有n 組數據x yi, ii12 ,n ,兩變量x與 y 的算術平均數分別為x  ,5

y 3

,標準差分別為x  ,2 y 6。已知 y 對x的迴歸直線過點 2, 6 ,求兩變量x y 的相關係數。

迴歸直線方程式yym x x,其中 y

x

m r

 

因為 y 對x的迴歸直線方程式為y 3 m x  ,且通過點5  2,6 ,

所以6 3 m2 5 ,解得 m 1

6

1 r 2

   ,得 1

r  。故兩變量3 x與 y 的相關係數為 1

 。 3

(5)

43 9. 某班學生的身高x的平均數x 160公分、標準差x 10公分;體重 y 平均數y 50

斤、標準差y 8公斤。已知身高和體重的相關係數r0.7 (1)求體重 y 對身高x的迴歸直線方程式。

(2)利用迴歸直線預測:某人的身高為170公分,其體重約為多少公斤?

(3)當將身高單位改為x公吋時,求身高x公吋與體重 y 公斤的相關係數。

(1) 迴歸直線方程式yy m x x,其中 8

0.7 0.56 10

y x

m r

  故迴歸直線為 y50 0.56 x160,即y0.56x39.6

(2) 將x170代入y50 0.56 x160,得y50 5.6 55.6 (公斤)。

(3) 相關係數與單位無關。改變x的度量單位時,相關係數不會改變。

x與 y 的相關係數為0.7

10. 某飲料店根據過去的銷售紀錄,當每日最高氣溫在22 C 39 C 時,該日飲料的銷售量 與當天的最高氣溫之相關係數為0.99,部分紀錄如下表:

最高氣溫C 25 27 29 31 33 35 銷售量(杯) 205 257 303 356 408 464

已知某日最高氣溫為38 C ,依據上述的資訊推測,試問該日飲料的銷售量應接近下列 哪個選項?

(1)490 (2)520 (3)542 (4)616杯。

若以最高氣溫當橫軸,銷售量當縱軸,作散布圖時,因為相關係數為0.99,所以散布 圖的所有點會相當靠近一條斜率為正的直線 L 。觀察紀錄表中銷售量的變化:

最高氣溫C 25 27 29 31 33 35 銷售量(杯) 205 257 303 356 408 464

52 46 53 52 56 得知:最高氣溫每增加2 C ,銷售量約增加52杯。

因此,直線 L 的斜率約為52

2 26

38 C 時的銷售量為x杯。由直線斜率的定義,得 464 38 35 26 x

解得x542,故選(3)。

參考文獻

相關文件

The best way to picture a vector field is to draw the arrow representing the vector F(x, y) starting at the point (x, y).. Of course, it’s impossible to do this for all points (x, y),

依獎懲及 法定程序 予以書面 懲處 暫時讓學 生與其他 同學保持 距離..

第二級失能 生活補助金 滿第一年 15萬元 11.25萬元 滿第二年 20萬元 15.00萬元 滿第三年 25萬元 18.75萬元 滿第四年 30萬元

[對數律 law of logarithm] 給定 x, y

Estimate the sufficient statistics of the complete data X given the observed data Y and current parameter values,. Maximize the X-likelihood associated

對於給定的一個 x 值,經過某一對應方式後得到「唯一」的 y 值,這種對應方式我們稱 為函數,其中 x 是自變數,y 是應變數。. 而在表

二年愛班有 7 位同學假日相約去爬山,秀秀帶了 113 個聖女小番茄分給大家品嚐,已知男生每 人分得 14 個,女生每人分得 17 個,剛好分完所有的小番茄,假設男生有

[r]