第二章 文獻回顧
2.7 相關分析
際上,在淨化氣體流速上一個材料看起來可能有兩種簡單的區別,這 些區別發生原因是因為退化機制對溫度是敏感的並且再接近樣本下方 的等溫情況可能增強,所有這些防備措施用於強調一個重要事實:當 執行這些實驗的實驗者必須有分解化學的能力,否則,他就有可能曲 解分解過程所獲得的結果。
(四) 數據收集
根據實驗的目的每攝氏度增量設法在二到八個資料點之間平均。
在決定為了得到上較低的加熱速率比較高的升溫速率要求更高的搜集 資料率,在一些商業儀器操作上,實驗的程序在搜集資料率各種步驟 可以由低到高不同的實驗性做法。注意高數據採集率在緩慢的升溫速 率可能產生大量的數據資料,產生在資料的決定上一點或沒有改善。
在統計學當中,變異數是描述一個連續變數分佈狀況(亦即離散 情形)的重要統計量數。當變異數越大,代表一個變數的數值越分散,
反之,當變異數越小,代表一個變數的數值越集中。其數學原理係將 每一個觀察值減去平均數加以平方後,加總得到離均差平方和(SS),再 除以觀察值個數而得。
( )
N SS N
x
Variance x− = x
=
∑
2 (2.1)變異數利用離均差的概念來描述單一變數的離散情形,現在若要 以一個統計量數來描述兩個連續變數X 與 Y 的分佈情形,則因為兩個 變項各有不同的離散情形,故有兩個離均差 X-X 與 Y-Y需予以處理。
若將每一個配對的離均差相乘之後加總,得到積差和(Sum of the Cross-Product),再除以觀察值個數,則得到一個新的離散量數,稱之 為共變數(covariance)。
( )( )
N
Y Y X iance X
Covar =
∑
− − (2.2)共變數的正負號代表兩變數是正向或負向關係。例如,若要得到 一個正值的共變數,兩個離均差必須同時為正值或同時為負值,也就 是兩個變數需同時在平均數的左側或右側,表示兩個變數有同方向的 變動關係,或正向關聯。相反的,要得到一個負的共變數時,兩個離 均差必須同時一為正值、一為負值,也就是兩個變數有反方向的變動 關係,或負向關連。
共變數的數值,會因為兩個變數的不同單位,而沒有一定的範圍 與特定的意義,無法直接用於比較。例如身高與體重的共變數,其單
位若由公斤改為公厘與公克,共變數數值大小則增加十萬倍。
二、標準化共變
共變數的數值無法直接用於比較的原因,是變項具有不同的單 位,因此若能將單位去除,標準化後的共變數將具有可比較性,期可 理解性亦增加。而去除單位的影響,即是取兩個變數的標準差作為分 母,將共變數除以兩個變數的標準差,得到一個標準化的關聯係數,
即是皮氏相關係數。
( ) ( )( )
( ) ( )
xxy yy
x SS SS
SP Y
Y X X
Y Y X X s
s y
r x =
−
−
−
= −
=
∑
∑
2 2
,
cov (2.3)
除了將共變數除以標準差來計算 Pearson’s r,皮氏相關係數亦可 將兩個變項的分數轉換為標準化 Z 分數來求得。也就是先將每一個個 別觀察值標準化,再計算其共同變化的情形。這兩種方式推導過程雖 不同,但其數學原理相同。
( )
N Z r=
∑
Zx y (∵x
x s
X Z = X −
y
y s
Y
Z =Y − ) (2.4)