資料分析方法介紹
陳碩珮 陳碩珮
本章重點
敘述統計學
信度與效度的檢定 因素分析
因素分析
平均數檢定與變異數分析
迴歸分析與複迴歸分析 卡方檢定
卡方檢定
集群分析
一、敘述統計學
次數分配—樣本基本資料分析
集中趨勢—平均數、中位數、眾數 離散程度 變異數 標準差
離散程度—變異數、標準差
當政府發布所得資料時,應採(1)平均 數(2)中位數?
一、敘述統計學(續)
一、敘述統計學(續)
一、敘述統計學(續)
二、信度與效度的檢定
信度的意義
信度是衡量沒有誤差的程度,也是測驗 結果的一致性程度
1.再測性(repeatability)-使用同樣的衡量 工具重複衡量某項特質時,是否可以得 工具重複衡量某項特質時 是否可以得 到相同的結果
2 內部一致性(consistency) 衡量工具內部 2.內部一致性(consistency)-衡量工具內部
是否具有一致性
二、信度與效度的檢定(續)
衡量信度的方法
1.再測信度(test-retest method)-讓同一組受測 者再其後兩個時間內測驗兩次,以其兩次測驗 的結果求其相關係數
的結果求其相關係數
--需注意前後施測時間的掌控
2.折半信度(split-half method)-將受測題目分成 兩半,然後再以前半段之題目與後半段之題目 做相關
做相關
--適用於沒有複本且衡量只能進行一次時
二、信度與效度的檢定(續)
3.複本信度(equivalent-forms method)-為 了讓不同程度的受測者能夠明確了解問 卷題目的意思,有時候同一個測驗中有 甲、乙卷兩種以上的複本
此法可以解決使用再測法的困擾 但兩 --此法可以解決使用再測法的困擾,但兩 份試題中不管在內容、格式必須一致,
才能算真正的複本 才能算真正的複本
二、信度與效度的檢定(續)
4.庫李信度(Kuder-Richardson reliability)-目的在於分析 問項間的一致性,只是不須把問卷中的問項折半作測 問項間的一致性,只是不須把問卷中的問項折半作測 試,在估計時常用的公式為
k
∑) 1
1)(
( 2
20
s
pq k
r
KRk
− ∑= −
K:整份問卷測驗的題數 s2:表示測驗總分的變異量
∑pq:表整個測驗中每題答對與答錯百分比乘積之總合 --適合用於答案類型為對或錯兩類的測驗
二、信度與效度的檢定(續)
5.Cronbach α係數—其公式如下
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ −
⎥⎦⎤
⎢⎣⎡
= ∑
2 12 2
1
T
s s
k α k
K:測驗的總題數 測驗的總標準差
⎥⎦
⎦⎢⎣
⎣ −
k
1s
T2sT:測驗的總標準差 sl:每個題目的標準差
--當再測信度、折半信度及複本信度在實質測試 之可行性不高時
二、信度與效度的檢定(續)
二、信度與效度的檢定(續)
二、信度與效度的檢定(續)
二、信度與效度的檢定(續)
效度的意義
指衡量的工具是否能真正衡量到研究者想 要衡量的問題,即根據研究的目的、內 要衡量的問題 即根據研究的目的 內 容及範圍來檢定研究所做的衡量是否有 效 就衡量工具的效度來說 只針對內 效,就衡量工具的效度來說,只針對內 部效度而言,一般分為內容效度、效標 關聯效度及建構效度
關聯效度及建構效度
二、信度與效度的檢定(續)
內容效度—以研究者專業知識來主觀判 斷所選擇的尺度是否能正確衡量研究所 斷所選擇的尺度是否能正確衡量研究所 愈衡量的東西,提高內容效度的方法 1 仔細從文獻中找尋適合且相關的衡量 1.仔細從文獻中找尋適合且相關的衡量
項目及尺度
對於最初決定的衡量項目可請教專家判 2.對於最初決定的衡量項目可請教專家判
斷是否適當
3.對和母體類似的樣本實施前測,依前測 結果加以修正
二、信度與效度的檢定(續)
效標關聯效度—是指使用中的衡量工具和其他 的衡量工具來比較兩者是否具有關聯性,包括 預測效度和同時效度
1.預測效度—是指以新的衡量工具預測未來事件 ex.如果以面試的成績來預測未來在公司的潛力
一個有關電視機購買行為的抽樣調查可以正 確的預測出明年的消費者購買行為
二、信度與效度的檢定(續)
2.同時效度-是指根據衡量工具與目前某衡 量效標的相關程度,用以衡量該研究衡 量工具的有效性
量工具的有效性
ex.以電視機的調查為例,能夠正確地估 計出目前市場上高 中 低所得的家庭 計出目前市場上高、中、低所得的家庭 分別擁有彩色電視機的家數和比例,即 具有同時效度
二、信度與效度的檢定(續)
建構效度—是利用一種衡量工具能衡量某種特 時或構念的程度 可分為
時或構念的程度,可分為
--收斂效度(convergent validity)-用兩種不同的 衡量方式去衡量同一構面的內容時,其相關程 度都很高
--區別效度(discriminant validity)-是將不同的兩 個概念進行量測,量測的過程不管是使用相同 個概念進行量測 量測的過程不管是使用相同 的方法或不同的方法,若經量測結果進行相關 分析而其相關程度很低
分析而其相關程度很低
二、信度與效度的檢定(續)
結語
1.信度是效度的必要條件而非充分條件 2 有信度的衡量不一定具有效度
2.有信度的衡量不一定具有效度
三、因素分析
因素分析主要目的減少變數和歸納變數 ex.有30個不同的特性會影響消費者對商
店印象的評價,但是在做決策時,沒有 店印象的評價,但是在做決策時,沒有 辦法依這麼多的變數發展其活動計畫 --利用因素分析達到探索與確認的目的
三、因素分析 (續)
因素分析—所有變數都會被考慮,每個 變數都是與其他變數相關的一個線性組 合
合
--與其他相關分析方法不同點在於其他相 關分析的變數通常有一些用來作為自變 關分析的變數通常有一些用來作為自變 數,一些作為因變數
三、因素分析 (續)
導出因素並評估整體的適合度 1.萃取因素的方法:
a 一般因素分析法 主要用來確認變數共 a.一般因素分析法-主要用來確認變數共
同存在的潛在因素或構面
b.主成分分析法-將原始的變數簡化成最 少數量的因素
少數量的因素
三、因素分析 (續)
選擇因素的標準
1.因素的特徵值(eigenvalue)須大於一
2 最大變異數轉軸法旋轉後 取因素負荷 2.最大變異數轉軸法旋轉後,取因素負荷
量(factor loading)絕對值大於0.6者 3.兩因素負荷量差大於0.3者
4 分項對總項(item to total)相關係數大於 4.分項對總項(item to total)相關係數大於
0.5,且顯著者
三、因素分析 (續)
因素命名—以負荷量最大的作為優先命 名
因素之內部一致性分析—由Cronbach’s
因素之內部一致性分析—由Cronbach s coefficient alpha來判定
三、因素分析 (續)
三、因素分析 (續)
三、因素分析 (續)
三、因素分析 (續)
刪除來聲辨人
四、平均數檢定與變異數分析
檢定一個母體平均數或比較二個樣本平 均數時,通常是使用Z檢定或t檢定
虛無與對立假設如下:
虛無與對立假設如下:
H
0
:µ1
= µ2
H1:µ1
≠ µ2
P< α 則Reject H
P< α 則Reject H
0
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
統計資料常受多種因素之影響,而使得 各個體的某種特徵發生差異,而對這種 影響因素所造成之變異的觀察與驗證的 影響因素所造成之變異的觀察與驗證的 統計方法即為變異數分析(ANOVA)
ANOVA分析係將一組Data所產生的總變
ANOVA分析係將一組Data所產生的總變 異,依可能發生變異之來源分割成幾部 份,再利用統計分析的概念來測度各種 變異是否有差異。
四、平均數檢定與變異數分析(續)
ANOVA若加入實驗設計,可增加試驗分 析的精確度,實驗設計是利用重複性和 隨機性使特定因素以外的其他已知及未 隨機性使特定因素以外的其他已知及未 知因素的影響互相抵消於無形,以淨化 觀察特定因素的影響效果(降低犯Type II 觀察特定因素的影響效果(降低犯Type II 的機率)
四、平均數檢定與變異數分析(續)
步驟:將samples的各觀測值離中差的總 平方和,按變量發生原因分解為各原因 所引起的平方和,然後將各平方何除以 所引起的平方和 然後將各平方何除以 自由度,化成變異數,再取成F統計量,
根據F統計量以檢定各原因或處理間是否 根據F統計量以檢定各原因或處理間是否 有顯著性差異,即檢定三個及三個以上 母體平均數是否相等的方法
母體平均數是否相等的方法。
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
四、平均數檢定與變異數分析(續)
上表顯示不同的所得在手機造型與功能的選擇 上有顯著差異
五、迴歸分析與複迴歸分析
尋求兩個或兩個以上變數間的關係,例如:智 力與學業成績之間的關係
力與學業成績之間的關係
若僅探討變數監相關的大小與方向,為相關分 析
析
若要能根據某變數來預測另一變數的值,則是 迴歸分析
迴歸分析
基本上迴歸分析須以相關分析作為基礎,任何 預測的可靠性是依變數間關係的強度而有所不 預測的可靠性是依變數間關係的強度而有所不 同
五、迴歸分析與複迴歸分析 (續)
五、迴歸分析與複迴歸分析 (續)
五、迴歸分析與複迴歸分析 (續)
五、迴歸分析與複迴歸分析 (續)
迴歸模式的型態
ε β
β β
α
+ + + + +=
X X
mX
mY
1 1 2 2 L上述的模式只是理論上的模式(母體模式),
上述的模式只是理論上的模式(母體模式),
通常母體不可知,在實際運算時,因為係數 的真正數值無法得知,故將上式依簡單迴歸 的真正數值無法得知 故將上式依簡單迴歸 或複迴歸修改為
1 簡單迴歸
1
X b a
Y
=a
+b
1X
1 簡單迴歸Y
= +m m
X b X
b X
b a
Y
= + 1 1 + 2 2 +L+ 複迴歸五、迴歸分析與複迴歸分析 (續)
迴歸模式之適合度及判定係數
1.根據現有的資料建立一個迴歸模式時,
必須檢定此模式與資料的符合程度,稱 必須檢定此模式與資料的符合程度,稱 為適合度(goodness of fit) ,檢定適合度 最常用的量數是R
2
(R square)或稱為判定 最常用的量數是R2
(R-square)或稱為判定 係數(coefficient of determination)2. R
2
等於0表示變數間沒有線性關係五、迴歸分析與複迴歸分析 (續)
3.當兩條迴歸式所含的預測變數多寡不一時,若 只用R2來判別各自的解釋能力有時會有不公平 只用R2來判別各自的解釋能力有時會有不公平 的現象,此時應改用修正後R2會比較正確
共線性
共線性
是指當某一個自變數與其他的自變數具有高度 相關 這些變數所提供的訊息相似 使我們無 相關,這些變數所提供的訊息相似,使我們無 法分辨個別變數的效果
檢查方法 可從相關矩陣中看出 檢查方法—可從相關矩陣中看出
五、迴歸分析與複迴歸分析 (續)
複迴歸必須決定預測變數進入迴歸模行之順序,
通常有以下幾種方法:
通常有以下幾種方法:
1.強迫進入法(enter) 2 強迫去除法( ) 2.強迫去除法(remove)
3.順向選擇法(forward)-依與因變數的相關性一 個一個納入模型
個一個納入模型
4.反向淘汰法(backward)-全部納入再一一淘汰 5.逐步選擇法(stepwise)-採用順向選入,依反向
淘汰法檢查是否排除
五、迴歸分析與複迴歸分析 (續)
五、迴歸分析與複迴歸分析 (續)
五、迴歸分析與複迴歸分析 (續)
D-W值通常介於1.5-2.5之間,表示誤差項之間 無自我相關存在
五、迴歸分析與複迴歸分析 (續)
六、卡方檢定
主要應用於無母數統計的檢定
類別資料的檢定
六、卡方檢定(續)
六、卡方檢定(續)
六、卡方檢定(續)
六、卡方檢定(續)
六、卡方檢定(續)
通常每一個cell 的個數須大於5,否則須 合併處理
合併處理
七、集群分析
集群分析(Cluster)是一種將樣本觀察值進行分 析,若具有某些共同特性者予以整合在一起,
析 若具有某些共同特性者予以整合在一起 然後分配到特定的群體,最後行程許多不同集 合集群的一種分析方法。
集群與因素分析概念大致相同
1 集群係將不同的觀察值依相對距離的遠近加以 1.集群係將不同的觀察值依相對距離的遠近加以 分類成不同集群,然後對不同集群所具有的特 性程度加以命名。
2.因素分析是將不同的變數依照相關程度加以萃 取成少數的因素,然後依各因素中所含變數來 加以命名。