第八章
二元隨機變數及其機率分配
學習目的
1. 定義或了解二元間斷隨機變數與連續隨機變數的意義 及其機率分配。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 定義或了解二元間斷隨機變數與連續隨機變數的意義 及其機率分配。
2. 了解邊際機率分配與條件機率分配。
學習目的
1. 定義或了解二元間斷隨機變數與連續隨機變數的意義 及其機率分配。
2. 了解邊際機率分配與條件機率分配。
3. 了解兩變數間的關係。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 定義或了解二元間斷隨機變數與連續隨機變數的意義 及其機率分配。
2. 了解邊際機率分配與條件機率分配。
3. 了解兩變數間的關係。
4. 了解二元隨機變數函數的期望值。
學習目的
1. 定義或了解二元間斷隨機變數與連續隨機變數的意義 及其機率分配。
2. 了解邊際機率分配與條件機率分配。
3. 了解兩變數間的關係。
4. 了解二元隨機變數函數的期望值。
5. 了解多元隨機變數。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
本章結構
二元隨機變數及其機率分配
二元間斷隨機變數
聯合機率函數
邊際機率函數
條件機率函數
兩變數間的關係
兩變數獨立
兩變數不獨立-
共變與相關
共變數
Excel 的使用
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
• 聯合機率函數
設 X、Y 為間斷隨機變數,X 之值為 x
1, x2, ... , xn,
Y 之值為
y1, y2, ... , yn,則
f(x , y) 為二元聯合機率函數。二元間斷隨機變數
• 聯合機率函數
設 X、Y 為間斷隨機變數,X 之值為 x
1, x2, ... , xn,
Y 之值為
y1, y2, ... , yn,則
f(x , y) 為二元聯合機率函數。• 邊際機率函數
X 的邊際機率函數
二元間斷隨機變數
fx ] gx = f x, y^ h
/
y = f x, y^ 1h + f x, y^ 2h + g + f x, y^ mh應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
• 聯合機率函數
設 X、Y 為間斷隨機變數,X 之值為 x
1, x2, ... , xn,
Y 之值為
y1, y2, ... , yn,則
f(x , y) 為二元聯合機率函數。• 邊際機率函數
X 的邊際機率函數
Y 的邊際機率函數
二元間斷隨機變數
fx ] gx = f x, y^ h
/
y = f x, y^ 1h + f x, y^ 2h + g + f x, y^ mh fy ^ hy = f x, y^ h/
x = f x^ 1, y h + f x^ 2, yh + g + f x^ n, yhX \ Y y1 y2 … yj … ym fx(xi) x1 f(x1 , y1) f(x1 , y2) … f(x1 , yj) … f(x1 , ym) fx(x1) x2 f(x2 , y1) f(x2 , y2) … f(x2 , yj) … f(x2 , ym) fx(x2)
⠇ ⠇ ⠇ … ⠇ … ⠇ ⠇
xi f(xi , y1) f(xi , y2) … f(xi , yj) … f(xi , ym) fx(xi)
⠇ ⠇ ⠇ … ⠇ … ⠇ ⠇
xn f(xn , y1) f(xn , y2) … f(xn , yj) … f(xn , ym) fx(xn)
X 與 Y 的聯合機率分配與邊際機率分配表
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
• 條件機率函數
在
Y = yj 的條件下,發生 xi的條件機率表為:
二元間斷隨機變數
f x |Y = y^ jh = fy ^y jh f x^ i, y jh
• 條件機率函數
在
Y = yj 的條件下,發生 xi的條件機率表為:
在
Y = yj 的條件下,發生 xi的條件機率表為:
二元間斷隨機變數
f x |Y = y^ jh = fy ^y jh f x^ i, y jh
f y |X = x^ i h =
fx ] gxi
f x^ i, y jh
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
Y(是否看過型錄)
合計
0(未看過) 1(看過)
X(有否購買
手機)
0(不買) 600 240 840
1(購買) 120 240 360
合計 720 480 1,200
華訊通訊最新型手機的銷售資料
Y(是否看過型錄)
合計
fx(x)
0(未看過) 1(看過)
X(是否購買
手機)
0(不買) 0.50 0.20 0.7
1(購買) 0.10 0.20 0.3
合計
fy(y) 0.60 0.40 1.0
X 與 Y 的聯合機率分配表
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
f(x | y)的條件機率
f(x | y) f(x | Y = 0)(未看過) f(x | Y = 1)(看過)
X = 0(不買)
0.833 0.5
X = 1(購買)
0.167 0.5
f(y | x)的條件機率
f(y | x) f(y | X = 0)(不買) f(y | X = 1)(購買)
Y = 0(未看過)
0.71 0.33
Y = 1(看過)
0.29 0.67
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
• X 的期望值
二元間斷隨機變數的期望值
E X] g = xf x, y^ h
/
y/
x= x f x, y^ h
/
y/
x = xfx ] gx/
x• X 的期望值
• Y 的期望值
二元間斷隨機變數的期望值
E X] g = xf x, y^ h
/
y/
x= x f x, y^ h
/
y/
x = xfx ] gx/
xE Y] g = yf x, y^ h
/
y/
x= y f x, y^ h
/
x/
y = yfy ^ hy/
y應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
• X 的變異數
二元間斷隨機變數的變異數
V X] g = ^ x - nX h2 f x, y^ h
/
y/
x= ^ x - nX h2 fx ] gx
/
x = x2 fx ] gx - n2X/
x• X 的變異數
• Y 的變異數
二元間斷隨機變數的變異數
V X] g = ^ x - nX h2 f x, y^ h
/
y/
x= ^ x - nX h2 fx ] gx
/
x = x2 fx ] gx - n2X/
xV Y] g = ^y - nY h2 f x, y^ h
/
y/
x=
/
^y - nY h2 fy ^ hy =/
y2 fy ^ hy - nY2應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
星期 型錄發放量 x 銷售收入 y
1 100 125,000
2 250 283,000
3 50 72,500
4 150 191,000
5 200 251,000
6 50 65,500
7 250 276,000
8 150 151,000
9 200 263,000
10 100 106,000
11 150 162,000
12 200 263,000
型錄發放量與銷售收入
50,000 100,000 150,000 200,000 250,000 300,000
型錄發放量與銷售收入的散佈圖
Y
銷
售
收
入
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 兩變數獨立的條件
設
X, Y 為二元隨機變數,若 X 與 Y 之值均滿足下列任一條件,則
X, Y 獨立。兩變數間的關係
• 兩變數獨立的條件
設
X, Y 為二元隨機變數,若 X 與 Y 之值均滿足下列任一條件,則
X, Y 獨立。1. f(x , y) = fx
(x).f
y(y)
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 兩變數獨立的條件
設
X, Y 為二元隨機變數,若 X 與 Y 之值均滿足下列任一條件,則
X, Y 獨立。1. f(x , y) = fx
(x).f
y(y)
2. f(x | y) = fx(x)
兩變數間的關係
• 兩變數獨立的條件
設
X, Y 為二元隨機變數,若 X 與 Y 之值均滿足下列任一條件,則
X, Y 獨立。1. f(x , y) = fx
(x).f
y(y)
2. f(x | y) = fx(x)
3. f(y | x) = fy
(y)
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
X
(受傷程度)
Y(繫安全帶)
0(無) 1(有) 合計
1(輕傷) 380 170 550
2(重傷) 240 50 290
3(死亡) 140 20 160
合計 760 240 1,000
繫安全帶與車禍受傷程度統計表
X
(受傷程度)
Y(繫安全帶)
合計
fx(x)
0(無) 1(有)
1(輕傷) 0.38 0.17 0.55
2(重傷) 0.24 0.05 0.29
3(死亡) 0.14 0.02 0.16
合計
fy(y) 0.76 0.24 1.00
X 與 Y 的聯合機率分配表
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
Ⅰ
(x − µ
x) > 0 (y − µ
y) > 0
Yµy
Cov(X , Y) 的符號
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
Ⅰ
(x − µ
x) > 0 (y − µ
y) > 0
Ⅱ
(x − µ
x) < 0 (y − µ
y) > 0
X Y
µx
µy
Cov(X , Y) 的符號
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
Ⅰ
(x − µ
x) > 0 (y − µ
y) > 0
Ⅱ
(x − µ
x) < 0 (y − µ
y) > 0
Ⅲ
Yµy
Cov(X , Y) 的符號
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
Ⅰ
(x − µ
x) > 0 (y − µ
y) > 0
Ⅱ
(x − µ
x) < 0 (y − µ
y) > 0
Ⅲ
(x − µ
x) < 0 (y − µ
y) < 0
Ⅳ
(x − µ
x) > 0 (y − µ
y) < 0
X Y
µx
µy
Cov(X , Y) 的符號
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
正向共變
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
反向共變
兩變數間的關係
• 共變數
Cov X, Y^ h = E X - n7^ xh^Y - nyhA
無關係
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數的優缺點
1. 它可看出共變的方向與程度。
兩變數間的關係
• 共變數的優缺點
1. 它可看出共變的方向與程度。
2. −∞ < Cov(X , Y) < ∞,其值域無限,不易根據 Cov(X , Y) 的大小來判斷其相關程度。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 共變數的優缺點
1. 它可看出共變的方向與程度。
2. −∞ < Cov(X , Y) < ∞,其值域無限,不易根據 Cov(X , Y) 的大小來判斷其相關程度。
3. 它易受衡量單位的影響。
兩變數間的關係
• 共變數的優缺點
1. 它可看出共變的方向與程度。
2. −∞ < Cov(X , Y) < ∞,其值域無限,不易根據 Cov(X , Y) 的大小來判斷其相關程度。
3. 它易受衡量單位的影響。
4. 具有雙重的衡量單位。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
利用 Excel 求共變數
手機客戶的資料
利用 Excel 求共變數
手機客戶的資料
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
利用 Excel 求共變數
看過型錄與購買手機之共變數
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l
相關係數
ρXY = 1兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l
相關係數
ρXY = −1應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l X、Y 無關
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l X、Y 為拋物線觀念
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l X、Y 為圓形觀念
兩變數間的關係
• 相關係數
tXY = Cov X, Yv^X vY h
= E b X - nvX X lbY - nvY Y l X、Y 為非線性關係
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 相關係數的數值
1. 相關係數的數值可證明世界於 −1 與 +1 之間。
兩變數間的關係
• 相關係數的數值
1. 相關係數的數值可證明世界於 −1 與 +1 之間。
2. 當 ρXY = +1 時,我們稱 X、Y 具正的完全直線關
係,此時 (X , Y) 的點會落在一條斜率正的直線
上。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
兩變數間的關係
• 相關係數的數值
1. 相關係數的數值可證明世界於 −1 與 +1 之間。
2. 當 ρXY = +1 時,我們稱 X、Y 具正的完全直線關
係,此時 (X , Y) 的點會落在一條斜率正的直線 上。
3. 當 ρXY = 0 時,X、Y無線性旅遊
兩變數間的關係
• 相關係數的數值
1. 相關係數的數值可證明世界於 −1 與 +1 之間。
2. 當 ρXY = +1 時,我們稱 X、Y 具正的完全直線關
係,此時 (X , Y) 的點會落在一條斜率正的直線 上。
3. 當 ρXY = 0 時,X、Y無線性旅遊
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
利用 Excel 求相關係數
手機客戶的資料
利用 Excel 求相關係數
手機客戶的資料
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006