• 沒有找到結果。

一、Pearson 積差相關分析

皮爾森相關係數(Pearson Correlation Coefficient, 𝑟𝑟)又稱為積差相關係數 (Coefficient of Product-moment Correlation),其範圍−1 ≤ 𝑟𝑟 ≤ 1(詳細內容請 參閱:陳寬裕與王正華,2011,第 12 章;梁德馨與王智立,2014,第 12 章)。

𝑟𝑟 = 𝑆𝑆𝑥𝑥𝑥𝑥

�𝑆𝑆𝑥𝑥𝑥𝑥𝑆𝑆𝑥𝑥𝑥𝑥 =

∑ (𝑥𝑥𝑛𝑛𝑖𝑖=1 𝑖𝑖− 𝑥𝑥̅)(𝑦𝑦𝑖𝑖− 𝑦𝑦�) 𝑛𝑛 − 1

�∑ (𝑥𝑥𝑛𝑛𝑖𝑖=1 𝑖𝑖 − 𝑥𝑥̅)2

𝑛𝑛 − 1 ×∑ (𝑦𝑦𝑛𝑛𝑖𝑖=1 𝑖𝑖− 𝑦𝑦�)2 𝑛𝑛 − 1 𝑆𝑆𝑥𝑥𝑥𝑥X 的樣本變異數

𝑆𝑆𝑥𝑥𝑥𝑥Y 的樣本變異數 𝑆𝑆𝑥𝑥𝑥𝑥X, Y 的樣本共變異數

二、獨立樣本t 檢定

獨立樣本 t 檢定可比較兩母體的平均值(詳細內容請參閱:梁德馨與王 智立,2014,第 10 章)。

(一)假設

假設有兩個獨立母體,其分佈分別為𝑁𝑁(𝜇𝜇1, 𝜎𝜎12),𝑁𝑁(𝜇𝜇2, 𝜎𝜎22)。從第一 個母體取n 個樣本𝑋𝑋1, 𝑋𝑋2, ⋯ , 𝑋𝑋𝑛𝑛,從第二個母體取m 個樣本𝑌𝑌1, 𝑌𝑌2, ⋯ , 𝑌𝑌𝑚𝑚。 令𝑋𝑋� =∑ 𝑋𝑋𝑛𝑛1𝑛𝑛 𝑖𝑖,𝑌𝑌� =∑ 𝑌𝑌𝑚𝑚1𝑚𝑚 𝑗𝑗,𝑆𝑆12 = ∑(𝑋𝑋𝑛𝑛−1𝑖𝑖−𝑋𝑋�)2,𝑆𝑆22 =∑(𝑌𝑌𝑚𝑚−1𝑗𝑗−𝑌𝑌�)2。𝜇𝜇1, 𝜇𝜇2, 𝜎𝜎12, 𝜎𝜎22的估 計量分別為𝑋𝑋�, 𝑌𝑌�, 𝑆𝑆12, 𝑆𝑆22 。若要估計𝜇𝜇1− 𝜇𝜇2,可利用𝑋𝑋� − 𝑌𝑌�,它為𝜇𝜇1 − 𝜇𝜇2

的不偏估計量。因此兩組樣本為獨立樣本,故𝑋𝑋� − 𝑌𝑌�之變異數為𝜎𝜎𝑛𝑛12+𝜎𝜎𝑚𝑚22

24

25

其中自由度v 計算方式如下:

𝑣𝑣 = (𝑠𝑠𝑛𝑛 +12 𝑠𝑠22

𝑚𝑚)2 (𝑠𝑠𝑛𝑛 )12 2

𝑛𝑛 − 1 + (𝑠𝑠𝑚𝑚)22 2 𝑚𝑚 − 1 1. 檢定統計量為

𝑡𝑡 = (𝑥𝑥̅ − 𝑦𝑦�)

�𝑠𝑠12 𝑛𝑛 +𝑠𝑠22

𝑚𝑚 2. 雙尾檢定

若要檢定母體 1 與母體 2 的平均數是否有顯著差異,其假設檢 定表示如下:

𝐻𝐻0:𝜇𝜇1 = 𝜇𝜇2 𝐻𝐻1:𝜇𝜇1≠ 𝜇𝜇2

在此情況下,我們使用雙尾檢定,拒絕域表示如下:

|𝑡𝑡| > 𝑡𝑡𝑣𝑣,𝛼𝛼 2

若檢定統計量落入拒絕域內,則代表p 值小於α值,即拒絕虛 無假設𝐻𝐻0,表示有足夠的證據證明𝜇𝜇1與𝜇𝜇2是有顯著差異。

三、迴歸分析

迴歸分析是以一個以上的變數來預測一個連續型隨機變數,並建立預測 模型,可分為簡單線性迴歸與多元線性迴歸。簡單線性迴歸是指兩個變數之 間的關係,可以透過某些參數的應用,直接以直線關係表達的模型,而多元 線性迴歸是指兩個以上的變數的迴歸問題。投手表現中含有兩個以上的變數,

因此可利用多元迴歸分析探討投手表現與薪資的關係,並建立薪資模型(詳 細內容請參閱:陳寬裕與王正華,2011,第 12 章;梁德馨與王智立,2014,

第12 章)。

26

(一)迴歸方程式

E(𝑌𝑌𝑖𝑖|𝑥𝑥𝑖𝑖) = α + 𝛽𝛽𝑥𝑥𝑖𝑖 𝑥𝑥𝑖𝑖:為已知常數,代表自變數在第i 次試驗的值 E(𝑌𝑌𝑖𝑖|𝑥𝑥𝑖𝑖):給定𝑥𝑥𝑖𝑖下𝑌𝑌𝑖𝑖之機率分配的期望值 α:截距

β:迴歸係數,為此方程式之斜率

但線性模式求得的期望值與實際值是有誤差存在的,因此迴歸模型如下:

𝑌𝑌𝑖𝑖 = α + 𝛽𝛽𝑥𝑥𝑖𝑖 + 𝜀𝜀𝑖𝑖

𝜀𝜀𝑖𝑖:隨機誤差項,表示依變數與其期望值的差,理論假設其平均數為0,

變異數為𝜎𝜎2的常態分配。

(二)前提假設

1. 對每一個特定的 x 來說,其相對應的 Y 應是平均數為E(𝑌𝑌𝑖𝑖|𝑥𝑥𝑖𝑖)、標

準差為𝜎𝜎𝑌𝑌|𝑥𝑥的常態分配。

2. Y 的期望值E(𝑌𝑌𝑖𝑖|𝑥𝑥𝑖𝑖)與 x 之間呈線性關係:E(𝑌𝑌𝑖𝑖|𝑥𝑥𝑖𝑖) = α + β𝑥𝑥𝑖𝑖。 3. 對每一個特定的 x 來說,標準差為𝜎𝜎𝑌𝑌|𝑥𝑥是不會改變的,即Y 的分

配的變異數在整條迴歸線上面是固定的,不會隨著x 的變化而有所 改變,是為變異數同質性(Homogeneity of variance),又稱等分散性 (Homoscedasticity)。

4. 對任意的兩�𝑌𝑌𝑖𝑖, 𝑌𝑌𝑗𝑗�,𝑖𝑖 ≠ 𝑗𝑗,其誤差項𝜀𝜀𝑖𝑖與𝜀𝜀𝑗𝑗應彼此獨立。

(三)參數估計─最小平方和法

使用最小平方法來估計迴歸線,是希望依變數與其估計期望值的 差之平方和愈小愈好。樣本點(𝑥𝑥𝑖𝑖, 𝑌𝑌𝑖𝑖)與估計的迴歸線(𝑥𝑥𝑖𝑖, 𝑌𝑌�𝑖𝑖)之差稱為𝑒𝑒𝑖𝑖, 稱為殘差(Residual)。利用最小平方和法,使殘差最小化後:

27

� 𝑒𝑒𝑛𝑛 𝑖𝑖2

𝑖𝑖=1 = � �𝑌𝑌𝑛𝑛 𝑖𝑖 − 𝑌𝑌��𝚤𝚤 2

𝑖𝑖=1

推估多元迴歸模式:

𝑌𝑌� = α� + 𝛽𝛽̂1𝑥𝑥1+ 𝛽𝛽̂2𝑥𝑥2+ 𝛽𝛽̂3𝑥𝑥3+ ⋯ + 𝛽𝛽̂𝑝𝑝𝑥𝑥𝑝𝑝

迴歸係數的解釋:迴歸模型裡的其他自變數使其固定後,有興趣之自 變數每增加一個單位,則為依變數平均改變的量。

(四)多元判定係數

判定係數𝑅𝑅2為評估迴歸關係的變異量解釋力。在多元迴歸分析裡,

大部分會採以自變數個數調整𝑅𝑅2,以避免同時放入多個自變數而高估 其為變異量的解釋力,稱為調整後多元判定係數。判定係數愈接近1,

其迴歸模型的解釋力愈佳。

(五)殘差分析

殘差分析所探討的是迴歸模型中的誤差項,是否能符合下列三個性 質──常態性、恆等性、獨立性。以簡單迴歸模型為例,其方程式為:

Y = α + 𝛽𝛽𝑥𝑥 + 𝜀𝜀 誤差項的前提假設:

1.E(𝜀𝜀) = 0

2.對所有𝑥𝑥來說,𝜀𝜀的變異數為𝜎𝜎2 3.誤差項𝜀𝜀之間彼此獨立

4.誤差項𝜀𝜀為一常態分配

28

相關文件