醫學研究之生物統計介紹
醫學研究部 生統小組 徐倩儀
兩大原則 互斥、完整性
變項類型
• 分類資料(discrete variable)
– 名義尺度(nominal scale)
• 類別尺度(categorical scale)
– 序位尺度(ordinal scale)
• 大小程度順序之關係
• 連續性資料(continuous scale)
– 等距尺度(interval scale)
• 代表相對距離,沒有絕對的0
– 等比尺度(ratio scale)
• 使用標準化的單位,有絕對的0
社經地位 教育程度
疾病 性別
溫度
身高 體重 年齡
描述性統計量-1
• 分類資料(discrete variable)
– 個數、百分比
• 連續性資料(continuous scale)
– 集中量數
• 平均值(mean)、中位數(median)、眾數(mode)
– 變異量數
• 標準差(SD)、標準誤(SE)
• 四分位距/差(IQR)、組距(Range)
• 變異數(Variance)
• 變異係數(coefficient of variance)
描述性統計量-2
• 箱型圖(Box plots)
最大值
最小值
75%(Q3)
50%(Q2, Median)
1.5*IQR
1.5*IQR
*
IQR
1.5*IQR
1.5*IQR
25%(Q1)
嚴重離群值 (極端值)
溫和離群值 (outliers) 溫和離群值
(outliers) 嚴重離群值
(極端值)
常態分佈-1
• 高斯分佈(Gaussian shape)
– 以平均值為中心的對稱曲線
• 平均值=中位數=眾數
• 加減1個標準差的區間
– 機率(面積)為68.27%
• 加減2個標準差的區間
– 機率(面積)為95.45%
mean
-1SD +1SD
-1SD +1SD
Mean ± SD 68.27%
Mean, Median, Mode
常態分佈-2
• 平均值(mean)
– 中心點位置
• 標準差(SD)
– 鐘型曲線形狀
Mean=0 SD=1
SD=2
SD=3 為什麼文章都呈
現mean ± SD呢?
• 常態分佈
– 高斯分佈(Gaussian shape)
• 平均值為中心的對稱曲 線
• Mean=Median=Mode
• 非常態分佈
常態分佈-3
右偏分布
左偏分布
假設Hypothesis-1
• Null hypothesis(H 0 ):虛無假設
– 樣本之間沒有差異
• Alternative hypothesis (H 1 ):對立假設
– 樣本之間有差異
• α level(推翻虛無假設)
– 可容忍的最大誤差
– 通常設為0.1、0.05及0.01
臨界面積 顯著水準
寬鬆 嚴格
假設Hypothesis-2
• 雙尾檢定
– H 0 :相等(=) – H 1 :不相等(≠)
• 單尾檢定
– 假設一
• H
0
:大於等於(≧)• H
1
:小於(<)– 假設二
• H
0
:小於等於(≦)• H
1
:大於(>)男女血壓是否相等?
H 0 :μ 1 = μ 2 H 1 :μ 1 ≠ μ 2
新藥試驗,實驗組(μ 1 ) 使用 新藥、對照組(μ 2 )使用傳統 藥物,實驗組血壓是否比對 照組低?
H 0 :μ 1 ≥μ 2
H 1 :μ 1 <μ 2
假設Hypothesis-3
H 0
-4 -2 0 2 4
0.050.100.150.20
x
dnorm(x, sd = 2)
-4 -2 0 2 4
0.050.100.150.20
x
dnorm(x, sd = 2)
H 1
α level
β level
該接受H
0沒接受H
0該拒絕H
0沒拒絕H
01-α
該接受H
0有接受H
01-β (power)
該拒絕H
0有拒絕H
0α error
β error
假設Hypothesis-4
• α error (Type I error)
– 該用ANOVA test,誤用T test
• T test正確機率:1-α
• 當檢定重複檢定k次
– 正確機率:(1-α)k
– 錯誤機率(α error) :1-(1-α)k
• β error (Type II error)
– False Negative
• α level嚴格
– 新藥試驗
» 藥物有成效,但被判定為無效
例如:重複檢定3次
正確機率:(1-α)*(1-α)*(1-α)=(1-α)3 錯誤機率(α error):1-(1-α)3
檢定次數越多、
α error機率越高
自變項/依變項
預測
自變項 推論
Independent variable
研究者操弄的變數
研究差異來源
依變項
Dependent variable
被觀察記錄的變數
被預測的變項
隨自變項改變而改變
結果變項(Outcome)
統計方法-1(使用時機)
資料 屬性
兩群 獨立樣本
三群以上
獨立樣本 相關 前後測 比較
連續
資料 Independent t test ANOVA Pearson
Correlation Paired t test 序位
資料
(連續無 母數)
Wilcoxon Rank Sum test (Mann- Whitney U test)
Kruskal- Wallis test
Spearman's rho
Wilcoxon signed-rank
test
類別 資料
Chi-square (χ
2
) testFisher’s exact
Yate’s 校正數
Chi-square (χ
2
) testMcNemar’s test
統計方法-2 (使用時機)
資料屬性 統計方法
自變項(X) 依變項(Y)
連續資料 類別資料
連續資料 線性回歸
(Linear regression)
類別資料 邏輯回歸
(Logistic regression)
連續資料 類別資料
存活率分析
(Cox Proportional Hazard Regression Model, Cox.
Model)
統計方法-3 (連續變項)
• Independent t test (Two sample t-test)
– 兩組連續樣本有沒有差異(差異值是否為0)
• 兩種不同手術(A、B)的患者,住院天數是否不同?
– H0:μA=μB – H1:μA≠ μB
• One-way Analysis of Variance (ANOVA)
– 透過變異數分析檢定各組樣本代表之母群體平 均值間是否不同
– 檢定三組或以上變項間連續變項是否不同
• 三種不同手術(ABC)的患者,住院天數是否不同?
– H0:μA=μB=μC (=μ) – H1:μι不全等
事後多重
統計方法-4 (連續變項)
• Paired t test
– 比較兩組相依樣本的差異值是否為0
• 患者吃藥前後的血壓是否有差?
• 動物實驗中,老鼠注射藥物前後,尿中代謝物的濃度 是否不同?
• 衛教介入後,血糖值是否有差異?
– H0:μd=0 – H1:μd≠0
飲食衛教前後,血糖值是否有差異?
GLU_1 (n=50) GLU_2 (n=50)
p value
Mean ± SD Mean ± SDGLU 106.76±4.71 86.32±10.67 <0.001**
Paired t test.*p<0.05, **p<0.01
統計方法-5 (序位變項)
• Wilcoxon Rank Sum test
– Mann-Whitney U test – 兩組連續樣本
• 性別不同,飯前血糖是否不同?
– H0:Rank(M)=Rank(F) – H1: Rank(M) ≠ Rank(F)
• Kruskal-Wallis test
– 三組以上連續樣本
• 不同血型(A, B, AB, O),身高是否不同?
– H0:Rank(A)=Rank(B)=Rank(AB)=Rank(O) – H1:Rank不全等
血糖非常態分 佈,有極端值
T test, ANOVA
不適用
統計方法-6 (序位變項)
• Wilcoxon signed-rank test
– 兩組相依連續樣本
• 患者吃藥前後的血壓是否有差?
– H0:W+=W- – H1:W+≠W-
Paired t test 不適用
統計方法-7 (類別變項)
• Chi-square (χ 2 ) test
– 檢定類別變項間,是否有關聯?
觀察值(O) 預期值(E)
有病 沒病 有病 沒病
抽菸 A B A+B 抽菸 (A+B)*(A+C) (A+B)*(B+D)
N N
不菸 C D C+D 不菸 (A+C)*(C+D) (B+D)*(C+D)
N N
A+C B+D N
每格觀察值偏離預期值的程度=(O-E)/E 避免負號, χ
2
=Σ(O-E)2
/E2×2列聯表注意事項
• >20%的預期值<5,看Fisher’s Exact test結果
統計方法-8 (類別變項)
• Chi-square (χ 2 ) test
• 抽菸與罹患疾病有無關連?
– H0:抽菸與疾病無關(無差異) – H1:抽菸與疾病有關(有差異)
• 男女之間的糖尿病罹患率是否不同?
– H0:男女糖尿病罹患率相同 – H1:男女糖尿病罹患率不同
• 血型不同,糖尿病罹患率是否不同?
– H0:血型不同糖尿病罹患率相同 – H1:血型不同糖尿病罹患率不同
統計方法-9 (類別變項)
• McNemar’s test
– 兩相依樣本
• 僅適用於
2×2 表格
• 課程前後,認知問答對與錯是否有差異?
– 注意事項
• 非一致觀察值加總<25
– Binomial test
課程前後,認知問答對與錯是否有差異?
課程前 課程後
p value
n % n %
認知問答 0.110
對 30 60% 20 40%
錯 20 40% 30 60%
ID Q1_1 Q1_2
01 0 0
02 0 0
03 0 1
… … …
… … …
48 0 0
49 0 1
Paper review-1
CHL (n=16) CNH (n=24) p
vocabulary level 93.94±13.95 111.00±13.38 <0.001
T test.
Paper review-1
Y= word learning performance Model 1 Model 2
β p β
age 0.03 0.86 age
vocabulary -0.54 <0.01
R
20.29 0.05
F 7.49 2.11
Paper review-1
ANCOVA test
•Fixed factors
hearing status
wordlikeness catergory
•Dependent variable
number of correct responses Ƞ
2=0.01 Effect size small
Ƞ
2=0.06 Effect size medium
Ƞ
2=0.15 Effect size large
Paper review-1
高度相關:>0.7 中度相關:0.3 - 0.7 低度相關:< 0.3
Paper review-1
Semantic subsitution error
vs Target
Wordlikeness substitution error vs Target
Unrelated error vs Target OR
p valueOR
p valueOR
p valueCHL ref. ref. ref.
CNH 0.43 <0.05
Multinomial logistic regression.
Paper review-2
Paper review-2
Paper review-2
d=0.2 Effect size small
d=0.5 Effect size medium
d=0.8 Effect size large
Paper review-2
Paper review-2
高度相關:>0.7 中度相關:0.3 - 0.7 低度相關:< 0.3
Paper review-3
Paper review-3
*
*
Paper review-3
&: difference in relation to rest.
+: difference in relation to 10% of 1-RM.
‡: difference in relation to 20% of 1-RM.
#: difference in relation to 30% of 1-RM.
•: difference in relation to 40% of 1-RM.
*: difference in relation to 50% of 1-RM
Paper review-3
Paper review-3
使用布蘭德-奧特曼差異圖判別rMSSDT與SDIT兩種測量方法無明顯差異
Paper review-4
Paper review-4
Paper review-4
Paper review-4
Paper review-4
Paper review-5
Paper review-5
Paper review-5
Paper review-6
Paper review-6
Paper review-6
Paper review-6
Paper review-7
Paper review-7
Paper review-7
References
• Stiles DJ, McGregor KK, Bentler RA. Wordlikeness and word learning in children with hearing loss. Int J Lang Commun Disord. 2013 Mar-Apr;48(2):200-6.
• Schlenstedt C, Paschen S, Kruse A, et al. Resistance versus Balance Training to Improve Postural Control in Parkinson's Disease: A Randomized Rater Blinded Controlled Study. PLoS One. 2015 Oct 26;10(10)
• Sperling MP, Simões RP, Caruso FC, et al. Is heart rate variability a feasible method to determine anaerobic threshold in progressive resistance exercise in coronary artery disease? Braz J Phys Ther. 2016 Jul-
Aug;20(4):289-97.
• Patel BK, Pohlman AS, Hall JB, Kress JP. Impact of Early Mobilization on Glycemic Control and ICU- Acquired Weakness in Critically Ill Patients Who Are Mechanically Ventilated. Chest. 2014 Sep;146(3):583- 589.
• Zhang TY, Hu Y, Nie ZY, Jin RX, Chen F, Guan Q, Hu B, Gu CY, Zhu L, Jin
LJ.Effects of Tai Chi and Multimodal Exercise Training on Movement and Balance Function in Mild to Mode rate Idiopathic Parkinson Disease. Am J Phys Med Rehabil. 2015 Oct;94(10 Suppl 1):921-9.
• Smedes F, van der Salm A, Koel G, Oosterveld F. Manual mobilization of the wrist: a pilot study in
rehabilitation of patients with a chronic hemiplegic hand post-stroke. J Hand Ther. 2014 Jul-Sep;27(3):209- 15.
• Ganesan M, Sathyaprabha TN, Pal PK, Gupta A. Partial Body Weight-Supported Treadmill Training in Patients With Parkinson Disease: Impact on Gait and Clinical Manifestation. Arch Phys Med Rehabil. 2015 Sep;96(9).