資料分析方法介紹

(1)

資料分析方法介紹

陳碩珮陳碩珮

(2)

本章重點

敘述統計學

信度與效度的檢定因素分析

因素分析

平均數檢定與變異數分析

迴歸分析與複迴歸分析卡方檢定

卡方檢定

集群分析

(3)

一、敘述統計學

次數分配—樣本基本資料分析

集中趨勢—平均數、中位數、眾數離散程度變異數標準差

離散程度—變異數、標準差

當政府發布所得資料時，應採（1）平均數（2）中位數?

(4)

一、敘述統計學(續)

(5)

一、敘述統計學(續)

(6)

一、敘述統計學(續)

(7)

二、信度與效度的檢定

信度的意義

信度是衡量沒有誤差的程度，也是測驗結果的一致性程度

1.再測性(repeatability)-使用同樣的衡量工具重複衡量某項特質時，是否可以得工具重複衡量某項特質時是否可以得到相同的結果

2 內部一致性(consistency) 衡量工具內部 2.內部一致性(consistency)-衡量工具內部

是否具有一致性

(8)

二、信度與效度的檢定(續)

衡量信度的方法

1.再測信度(test-retest method)-讓同一組受測者再其後兩個時間內測驗兩次，以其兩次測驗的結果求其相關係數

的結果求其相關係數

--需注意前後施測時間的掌控

2.折半信度(split-half method)-將受測題目分成兩半，然後再以前半段之題目與後半段之題目做相關

做相關

--適用於沒有複本且衡量只能進行一次時

(9)

二、信度與效度的檢定(續)

3.複本信度(equivalent-forms method)-為了讓不同程度的受測者能夠明確了解問卷題目的意思，有時候同一個測驗中有甲、乙卷兩種以上的複本

此法可以解決使用再測法的困擾但兩 --此法可以解決使用再測法的困擾，但兩份試題中不管在內容、格式必須一致，

才能算真正的複本才能算真正的複本

(10)

二、信度與效度的檢定(續)

4.庫李信度(Kuder-Richardson reliability)-目的在於分析問項間的一致性，只是不須把問卷中的問項折半作測問項間的一致性，只是不須把問卷中的問項折半作測試，在估計時常用的公式為

k

∑

) 1

1)(

( 2

20

s

pq k

r

_KR

k

− ^∑

= −

K:整份問卷測驗的題數 s²:表示測驗總分的變異量

∑pq:表整個測驗中每題答對與答錯百分比乘積之總合 --適合用於答案類型為對或錯兩類的測驗

(11)

二、信度與效度的檢定(續)

5.Cronbach α係數—其公式如下

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ −

⎥⎦⎤

⎢⎣⎡

= ^∑

2 12 2

1

T

s s

k α k

K:測驗的總題數測驗的總標準差

⎥⎦

⎦⎢⎣

⎣ −

k

1

s

_T²

s_T:測驗的總標準差 s_l:每個題目的標準差

--當再測信度、折半信度及複本信度在實質測試之可行性不高時

(12)

二、信度與效度的檢定(續)

(13)

二、信度與效度的檢定(續)

(14)

二、信度與效度的檢定(續)

(15)

二、信度與效度的檢定(續)

效度的意義

指衡量的工具是否能真正衡量到研究者想要衡量的問題，即根據研究的目的、內要衡量的問題即根據研究的目的內容及範圍來檢定研究所做的衡量是否有效就衡量工具的效度來說只針對內效，就衡量工具的效度來說，只針對內部效度而言，一般分為內容效度、效標關聯效度及建構效度

關聯效度及建構效度

(16)

二、信度與效度的檢定(續)

內容效度—以研究者專業知識來主觀判斷所選擇的尺度是否能正確衡量研究所斷所選擇的尺度是否能正確衡量研究所愈衡量的東西，提高內容效度的方法 1 仔細從文獻中找尋適合且相關的衡量 1.仔細從文獻中找尋適合且相關的衡量

項目及尺度

對於最初決定的衡量項目可請教專家判 2.對於最初決定的衡量項目可請教專家判

斷是否適當

3.對和母體類似的樣本實施前測，依前測結果加以修正

(17)

二、信度與效度的檢定(續)

效標關聯效度—是指使用中的衡量工具和其他的衡量工具來比較兩者是否具有關聯性，包括預測效度和同時效度

1.預測效度—是指以新的衡量工具預測未來事件 ex.如果以面試的成績來預測未來在公司的潛力

一個有關電視機購買行為的抽樣調查可以正確的預測出明年的消費者購買行為

(18)

二、信度與效度的檢定(續)

2.同時效度-是指根據衡量工具與目前某衡量效標的相關程度，用以衡量該研究衡量工具的有效性

量工具的有效性

ex.以電視機的調查為例，能夠正確地估計出目前市場上高中低所得的家庭計出目前市場上高、中、低所得的家庭分別擁有彩色電視機的家數和比例，即具有同時效度

(19)

二、信度與效度的檢定(續)

建構效度—是利用一種衡量工具能衡量某種特時或構念的程度可分為

時或構念的程度，可分為

--收斂效度(convergent validity)-用兩種不同的衡量方式去衡量同一構面的內容時，其相關程度都很高

--區別效度(discriminant validity)-是將不同的兩個概念進行量測，量測的過程不管是使用相同個概念進行量測量測的過程不管是使用相同的方法或不同的方法，若經量測結果進行相關分析而其相關程度很低

分析而其相關程度很低

(20)

二、信度與效度的檢定(續)

結語

1.信度是效度的必要條件而非充分條件 2 有信度的衡量不一定具有效度

2.有信度的衡量不一定具有效度

(21)

三、因素分析

因素分析主要目的減少變數和歸納變數 ex.有30個不同的特性會影響消費者對商

店印象的評價，但是在做決策時，沒有店印象的評價，但是在做決策時，沒有辦法依這麼多的變數發展其活動計畫 --利用因素分析達到探索與確認的目的

(22)

三、因素分析 (續)

因素分析—所有變數都會被考慮，每個變數都是與其他變數相關的一個線性組合

合

--與其他相關分析方法不同點在於其他相關分析的變數通常有一些用來作為自變關分析的變數通常有一些用來作為自變數，一些作為因變數

(23)

三、因素分析 (續)

導出因素並評估整體的適合度 1.萃取因素的方法：

a 一般因素分析法主要用來確認變數共 a.一般因素分析法-主要用來確認變數共

同存在的潛在因素或構面

b.主成分分析法-將原始的變數簡化成最少數量的因素

少數量的因素

(24)

三、因素分析 (續)

選擇因素的標準

1.因素的特徵值(eigenvalue)須大於一

2 最大變異數轉軸法旋轉後取因素負荷 2.最大變異數轉軸法旋轉後，取因素負荷

量(factor loading)絕對值大於0.6者 3.兩因素負荷量差大於0.3者

4 分項對總項(item to total)相關係數大於 4.分項對總項(item to total)相關係數大於

0.5，且顯著者

(25)

三、因素分析 (續)

因素命名—以負荷量最大的作為優先命名

因素之內部一致性分析—由Cronbach’s

因素之內部一致性分析—由Cronbach s coefficient alpha來判定

(26)

三、因素分析 (續)

(27)

三、因素分析 (續)

(28)

三、因素分析 (續)

(29)

三、因素分析 (續)

刪除來聲辨人

(30)

四、平均數檢定與變異數分析

檢定一個母體平均數或比較二個樣本平均數時，通常是使用Z檢定或t檢定

虛無與對立假設如下：

H

₀

：µ

₁

= µ

₂

H1：µ

₁

≠ µ

₂

P< α 則Reject H

₀

(31)

四、平均數檢定與變異數分析(續)

(32)

四、平均數檢定與變異數分析(續)

(33)

四、平均數檢定與變異數分析(續)

(34)

四、平均數檢定與變異數分析(續)

(35)

四、平均數檢定與變異數分析(續)

統計資料常受多種因素之影響，而使得各個體的某種特徵發生差異，而對這種影響因素所造成之變異的觀察與驗證的影響因素所造成之變異的觀察與驗證的統計方法即為變異數分析(ANOVA)

ANOVA分析係將一組Data所產生的總變

ANOVA分析係將一組Data所產生的總變異，依可能發生變異之來源分割成幾部份，再利用統計分析的概念來測度各種變異是否有差異。

(36)

四、平均數檢定與變異數分析(續)

ANOVA若加入實驗設計，可增加試驗分析的精確度，實驗設計是利用重複性和隨機性使特定因素以外的其他已知及未隨機性使特定因素以外的其他已知及未知因素的影響互相抵消於無形，以淨化觀察特定因素的影響效果(降低犯Type II 觀察特定因素的影響效果(降低犯Type II 的機率)

(37)

四、平均數檢定與變異數分析(續)

步驟：將samples的各觀測值離中差的總平方和，按變量發生原因分解為各原因所引起的平方和，然後將各平方何除以所引起的平方和然後將各平方何除以自由度，化成變異數，再取成F統計量，

根據F統計量以檢定各原因或處理間是否根據F統計量以檢定各原因或處理間是否有顯著性差異，即檢定三個及三個以上母體平均數是否相等的方法

母體平均數是否相等的方法。

(38)

四、平均數檢定與變異數分析(續)

(39)

四、平均數檢定與變異數分析(續)

(40)

四、平均數檢定與變異數分析(續)

上表顯示不同的所得在手機造型與功能的選擇上有顯著差異

(41)

五、迴歸分析與複迴歸分析

尋求兩個或兩個以上變數間的關係，例如：智力與學業成績之間的關係

力與學業成績之間的關係

若僅探討變數監相關的大小與方向，為相關分析

析

若要能根據某變數來預測另一變數的值，則是迴歸分析

迴歸分析

基本上迴歸分析須以相關分析作為基礎，任何預測的可靠性是依變數間關係的強度而有所不預測的可靠性是依變數間關係的強度而有所不同

(42)

五、迴歸分析與複迴歸分析 (續)

(43)

五、迴歸分析與複迴歸分析 (續)

(44)

五、迴歸分析與複迴歸分析 (續)

(45)

五、迴歸分析與複迴歸分析 (續)

迴歸模式的型態

ε β

β β

α

+ + + + +

=

X X

_m

X

_m

Y

1 1 2 2 L

上述的模式只是理論上的模式(母體模式)，

通常母體不可知，在實際運算時，因為係數的真正數值無法得知，故將上式依簡單迴歸的真正數值無法得知故將上式依簡單迴歸或複迴歸修改為

1 簡單迴歸

1

X b a

Y

=

a

+

b

₁

X

₁ 簡單迴歸

Y

= +

m m

X b X

b X

b a

Y

= + 1 1 + 2 2 +L+ 複迴歸

(46)

五、迴歸分析與複迴歸分析 (續)

迴歸模式之適合度及判定係數

1.根據現有的資料建立一個迴歸模式時，

必須檢定此模式與資料的符合程度，稱必須檢定此模式與資料的符合程度，稱為適合度(goodness of fit) ，檢定適合度最常用的量數是R

²

(R square)或稱為判定最常用的量數是R

²

(R-square)或稱為判定係數(coefficient of determination)

2. R

²

等於0表示變數間沒有線性關係

(47)

五、迴歸分析與複迴歸分析 (續)

3.當兩條迴歸式所含的預測變數多寡不一時，若只用R²來判別各自的解釋能力有時會有不公平只用R²來判別各自的解釋能力有時會有不公平的現象，此時應改用修正後R²會比較正確

共線性

是指當某一個自變數與其他的自變數具有高度相關這些變數所提供的訊息相似使我們無相關，這些變數所提供的訊息相似，使我們無法分辨個別變數的效果

檢查方法可從相關矩陣中看出檢查方法—可從相關矩陣中看出

(48)

五、迴歸分析與複迴歸分析 (續)

複迴歸必須決定預測變數進入迴歸模行之順序，

通常有以下幾種方法：

1.強迫進入法(enter) 2 強迫去除法( ) 2.強迫去除法(remove)

3.順向選擇法(forward)-依與因變數的相關性一個一個納入模型

個一個納入模型

4.反向淘汰法(backward)-全部納入再一一淘汰 5.逐步選擇法(stepwise)-採用順向選入，依反向

淘汰法檢查是否排除

(49)

五、迴歸分析與複迴歸分析 (續)

(50)

五、迴歸分析與複迴歸分析 (續)

(51)

五、迴歸分析與複迴歸分析 (續)

D-W值通常介於1.5-2.5之間，表示誤差項之間無自我相關存在

(52)

五、迴歸分析與複迴歸分析 (續)

(53)

六、卡方檢定

主要應用於無母數統計的檢定

類別資料的檢定

(54)

六、卡方檢定(續)

(55)

六、卡方檢定(續)

(56)

六、卡方檢定(續)

(57)

六、卡方檢定(續)

(58)

六、卡方檢定(續)

通常每一個cell 的個數須大於5，否則須合併處理

合併處理

(59)

七、集群分析

集群分析(Cluster)是一種將樣本觀察值進行分析，若具有某些共同特性者予以整合在一起，

析若具有某些共同特性者予以整合在一起然後分配到特定的群體，最後行程許多不同集合集群的一種分析方法。

集群與因素分析概念大致相同

1 集群係將不同的觀察值依相對距離的遠近加以 1.集群係將不同的觀察值依相對距離的遠近加以分類成不同集群，然後對不同集群所具有的特性程度加以命名。

2.因素分析是將不同的變數依照相關程度加以萃取成少數的因素，然後依各因素中所含變數來加以命名。

(60)