• 沒有找到結果。

04-02 R-web資料分析應用:分析方法 – 平均數檢定

N/A
N/A
Protected

Academic year: 2021

Share "04-02 R-web資料分析應用:分析方法 – 平均數檢定"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

第 1 頁

R-web 資料分析應用:分析方法 – 平均數檢定

溫怡然 副統計分析師 前兩期的生統 eNews 向大家介紹了許多實用的圖表繪製功能,相信大 家對於資料特性已有初步的瞭解。本期開始,我們要利用【雲端資料分析 暨導引系統】(R-web, http://www.r-web.com.tw)來做進一步的分析,首先, 就由『平均數檢定』揭開序幕。 平均數檢定會依據研究的問題與感興趣的群體而有所不同,其檢定包 含:單一樣本平均數t檢定、獨立雙樣本平均數差異t檢定、成對雙樣本平均 數差異t檢定、獨立多樣本平均數差異檢定(或稱變異數分析),我們會利 用例子逐一介紹,並搭配雙尾、單尾檢定,介紹如下表;而在使用t檢定的 時候,要注意資料需具有或近似”常態分配”的這個條件。本系列分析將統 一使用源自基隆社區為基礎的整合篩檢計畫(Keelung Community-based Integrated Screen Program, KCIS)的心血管疾病資料作為範例資料檔,有關 此資料的詳細資訊及變數定義請參閱首期生統eNews。 表一 雙尾、單尾檢定介紹 雙尾檢定 左尾檢定 右尾檢定 H0 :μ=μ0 關心兩個方向的結果 α平均分配在兩邊 H0 :μ≧μ0 關心特定方向的結果 α全部放在左邊 H0 :μ≦μ0 關心特定方向的結果 α全部放在右邊

(2)

第 2 頁

 單一樣本平均數 t 檢定

單一樣本平均數 t 檢定的使用時機為:當資料中僅討論單一樣本且樣 本數較大時(通常以樣本筆數≧30 為區分標準),檢定母體平均數是否大 於、小於或等於某一特定數值。這一部分我們搭配左尾檢定來舉例:腰圍 是判斷罹患心血管疾病的一項重要指標,衛生署國民健康局 2002 年及 2007 年的調查發現,臺灣各年齡層男性腰圍明顯增加,如男性腰圍超過 90 公 分、女性超過 80 公分就要有所警惕1。現在,我們用範例資料來做檢定, 檢定資料檔中男性的平均腰圍是否在安全值範圍內(< 90 公分)。 在 R-web 主選單中依序點選【分析方法】→【平均數檢定】→【單一 樣本】即可進入分析頁面。 操作畫面如上圖所示。首先選擇要進行分析的資料檔,點選”使用者個 人資料檔”後選擇”cvd_m”(男性)的檔案,系統將自動帶出參數設定畫面。 在步驟二中選擇要進行分析的變數”Waist”(腰圍),設定檢定平均數的地 方填入”90”。最後點選【進階選項】如下圖,選擇檢定方向設定”單尾(左)”, 如需要顯示樣本敘述統計量,可勾選後儲存設定即可【開始分析】。

(3)

第 3 頁

下圖為分析結果,左側可以看到檢定的變數及相關設定,檢查沒問題 後即可看分析結果,第一個表格為敘述統計量;在第二個表格中顯示虛無 假設為母體平均數≧90,而 p-值 < 2.22e-16*** 表顯著,拒絕虛無假設, 代表資料中男性平均腰圍沒有超過標準值。

(4)

第 4 頁

 獨立雙樣本平均數差異 t 檢定

獨立雙樣本平均數差異 t 檢定的使用時機為:當資料中兩組獨立樣本 之樣本數皆較大時(通常以樣本筆數≧30 為區分標準),檢定兩組樣本間 母體平均數的差異是否大於、小於或等於某一特定數值。這一部分我們搭 配雙尾檢定來舉例:世界衛生組織指出,吸菸與二手菸暴露是心血管疾病 的主要病因 2,而在上一段落中,我們知道腰圍是判斷心血管疾病的一項 指標 1,進而我們懷疑,有吸菸者與沒有吸菸者的腰圍是否會有統計上的 顯著差異呢?讓我們來做個檢定吧! 在 R-web 主選單中依序點選【分析方法】→【平均數檢定】→【獨立 雙樣本】即可進入分析頁面。 操作畫面如上圖所示。首先選擇要進行分析的資料檔,點選”使用者個 人資料檔”後選擇”CVD”的檔案(此為原始檔),系統將自動帶出資料型態

(5)

第 5 頁 設定,選擇欲進行檢定的資料型態中”資料型態為一檢定變數及一分組變 數”。接著,系統會再帶出參數設定畫面,選擇要進行分析的變數之檢定變 數”Waist”(腰圍)、分組變數”Tobacco”(抽菸與否),設定檢定平均數差異 的地方填入”0”。 最後點選【進階選項】如下圖,選擇要進行分析的類別,系統會自動 幫您分類好:1.選擇檢定方向設定”雙尾”;2.依雙樣本變異數檢定結果進行 t 檢定,此功能會先幫您檢定兩群體變異數是否相等,再依結果執行 t 檢 定,如您想假設兩母體具有(或不具有)相同變異數,亦可自行點選;3.顯 示樣本敘述統計量可依需求勾選,儲存設定後即可【開始分析】。 下圖為分析結果,左側可以看到檢定的變數及相關設定,檢查沒問題 後即可看分析結果,第一個表格中顯示虛無假設為兩組資料的變異數相等, 此為進階選項中,我們請系統幫忙執行的變異數檢定,而 p-值為 0.027363* 表顯著,拒絕虛無假設,表示兩組資料變異數不相等;第二個表格中的虛 無假設則是母體平均數差異=0,而 p-值 < 2.22e-16*** 為顯著,拒絕虛無

(6)

第 6 頁 假設,代表有吸菸者與沒有吸菸者的腰圍是有所差異的。

 成對雙樣本平均數差異 t 檢定

成對雙樣本平均數差異 t 檢定的使用時機為:比較資料中兩兩成對樣 本的差異(如:減肥前體重與減肥後體重),且資料之樣本數較大時(通常 以樣本筆數≧30 為區分標準);分析時,即計算兩兩成對樣本的差異值, 並檢定此差異值資料的母體平均數是否大於、小於或等於某一特定數值。

(7)

第 7 頁 這部分我們搭配右尾檢定來舉例:國民健康署提醒,高血壓如果沒有即時 發現,往往會導致後續心臟病、中風等嚴重的心血管疾病3;但別以為血壓 正常就算安全,如果收縮壓及舒張壓相差超過 60 mmHg,表示血管彈性變 差、血管硬化變嚴重,進而增加罹病風險 4。我們用範例資料來檢定研究對 象的平均脈壓差是否超過標準值(> 60 mmHg)? 在 R-web 主選單中依序點選【分析方法】→【平均數檢定】→【成對 雙樣本】即可進入分析頁面。 操作畫面如上圖所示。首先選擇要進行分析的資料檔,點選”使用者個 人資料檔”後選擇”CVD”的檔案(此為原始檔),系統將自動帶出參數設定 畫面,選擇要進行分析的變數之檢定樣本一”SysBP”(收縮壓)、檢定樣本 二”DiaBP”(舒張壓),設定檢定平均數差異的地方填入”60”。最後點選【進 階選項】如下圖,選擇檢定方向設定”單尾(右)”,如需要顯示樣本敘述 統計量,可勾選後儲存設定即可【開始分析】。

(8)

第 8 頁

下圖為分析結果,左側可以看到檢定的變數及相關設定,檢查沒問題 後即可看分析結果,第一個表格為敘述統計量;第二個表格中顯示虛無假 設為母體平均數差異≦60,而 p-值為 1 表不顯著,無法拒絕虛無假設,代 表資料中研究對象之平均脈壓差在標準值範圍內。

(9)

第 9 頁

 獨立多樣本平均數差異檢定

獨立多樣本平均數差異檢定(或稱變異數分析)的使用時機為:當資 料中包含多組樣本(三組以上之樣本)且樣本數皆較大時(通常以樣本筆 數≧30 為區分標準),檢定多組樣本間母體平均數是否有差異。此部分接 續獨立雙樣本平均數差異 t 檢定的例子來延伸:我們已知有吸菸者與沒有 吸菸者的腰圍是有所差異的,接著就進一步將吸菸者分為三個等級,每日 一包、每日兩包及每日三包以上,檢定這三組吸菸者的平均腰圍是否有差 異? 在 R-web 主選單中依序點選【分析方法】→【平均數檢定】→【獨立 多樣本(或稱變異數分析)】即可進入分析頁面。 操作畫面如上圖所示。首先選擇要進行分析的資料檔,點選”使用者個 人資料檔”後選擇”cvd_tobacco”的檔案(有吸菸者),系統將自動帶出資料

(10)

第 10 頁 型態設定,選擇欲進行檢定的資料型態中”資料型態為一檢定變數及一分組 變數”。接著,系統會再帶出參數設定畫面,選擇要進行分析的變數之檢定 變數”Waist”(腰圍)、分組變數”Tobacco_Consumption”(菸草消費量)。 最後點選【進階選項】如下圖,模式設定中,選擇要進行分析的類別 (此例為菸草消費量的三組類別),系統會自動幫您分類好;顯示樣本敘述 統計量及顯示多樣本變異數(標準差)差異檢定可依需求勾選。多重比較、 殘差及影響點也可自行選擇,儲存設定後即可【開始分析】。

(11)

第 11 頁

下圖為分析結果,左側可以看到檢定的變數及相關設定,檢查沒問題 後即可看分析結果,第一個表格為敘述統計量;第二個表格為模式摘要; 第三個表格顯示虛無假設為各母體的變異數相等,p-值為 0.023663* 表顯 著,拒絕虛無假設,表示各組資料變異數不完全相等。

(12)

第 12 頁 第四個表格中的虛無假設則是各母體的平均數相等,而 p-值 < 2.22e-16*** 為顯著,拒絕虛無假設,表示各組資料平均數不完全相等。在最後 的表格五中,我們可以看到兩兩比較的結果:第一組與第二組、第一組與 第三組的 P-值為 < 2e-16***為顯著,表示組與組之間的平均腰圍是有差異 的;而第二組與第三組的 P-值為 0.093787#為不顯著,代表兩組間的平均 腰圍沒有統計上的差異。

(13)

第 13 頁 本期生統 eNews 介紹到此,這次分別介紹了平均數檢定的四大項目: 單一樣本平均數 t 檢定、獨立雙樣本平均數差異 t 檢定、成對雙樣本平均 數差異 t 檢定、獨立多樣本平均數差異檢定,相信大家對於檢定方法與操 作方式有更深入的瞭解。下一期的生統 eNews 將為大家介紹『中位數檢定』, 敬請期待! 參考資料 1. 台灣男人腰圍 5 年增加 3 公分 https://tw.news.yahoo.com/台灣男人腰圍-5 年增加 3 公分-213000643.html 2. 天冷、須嚴防心血管疾病發作猝死 http://health99.hpa.gov.tw/txt/HealthyHeadlineZone/HealthyHeadlineDetai.aspx?TopIcNo=6728 3. 保護心血管 從定期量血壓開始 http://www.mohw.gov.tw/cht/ministry/DM2_P.aspx?f_list_no=7&fod_list_no=4557&doc_no=44955 4. 脈壓差逾 60 心血管硬化高危險群 http://www.cvmetrics.com.tw/super%20monopoly/news/news2.htm

參考文獻

相關文件

Step 4: : :模擬結果分析 : 模擬結果分析 模擬結果分析(脈寬為 模擬結果分析 脈寬為 脈寬為90%) 脈寬為.

推理論證 批判思辨 探究能力-問題解決 分析與發現 4-3 分析文本、數據等資料以解決問題 探究能力-問題解決 分析與發現 4-4

方法一: 採用 【Compare Means】分析選項 One- One -way ANOVA way ANOVA分析報表說明 分析報表說明

相關分析 (correlation analysis) 是分析變異數間關係的

母體分配 樣本平均數 的抽樣分配 抽樣誤差與 非抽樣誤差 樣本平均數 的平均數與. 變異數

本研究採用的方法是將階層式與非階層式集群法結合。第一步先運用

在做容忍度的分析時,又有四種的分析方法可以選擇:極值分析 (Extreme Value Analysis,簡稱 EVA),和方根(Root-Sum-Square,簡稱 RSS)分析,快速蒙地卡羅分析(Fast Monte

三、依可質化或量化分析為前提選定成效檢核 四、依可具體可行無爭議為前提選用策略方法