• 沒有找到結果。

資料分析方法介紹

N/A
N/A
Protected

Academic year: 2022

Share "資料分析方法介紹"

Copied!
60
0
0

加載中.... (立即查看全文)

全文

(1)

資料分析方法介紹

陳碩珮 陳碩珮

(2)

本章重點

„ 敘述統計學

„ 信度與效度的檢定 因素分析

„ 因素分析

„ 平均數檢定與變異數分析

„ 迴歸分析與複迴歸分析 卡方檢定

„ 卡方檢定

„ 集群分析

(3)

一、敘述統計學

„ 次數分配—樣本基本資料分析

„ 集中趨勢—平均數、中位數、眾數 離散程度 變異數 標準差

„ 離散程度—變異數、標準差

„ 當政府發布所得資料時,應採(1)平均 數(2)中位數?

(4)

一、敘述統計學(續)

(5)

一、敘述統計學(續)

(6)

一、敘述統計學(續)

(7)

二、信度與效度的檢定

„ 信度的意義

信度是衡量沒有誤差的程度,也是測驗 結果的一致性程度

1.再測性(repeatability)-使用同樣的衡量 工具重複衡量某項特質時,是否可以得 工具重複衡量某項特質時 是否可以得 到相同的結果

2 內部一致性(consistency) 衡量工具內部 2.內部一致性(consistency)-衡量工具內部

是否具有一致性

(8)

二、信度與效度的檢定(續)

„ 衡量信度的方法

1.再測信度(test-retest method)-讓同一組受測 者再其後兩個時間內測驗兩次,以其兩次測驗 的結果求其相關係數

的結果求其相關係數

--需注意前後施測時間的掌控

2.折半信度(split-half method)-將受測題目分成 兩半,然後再以前半段之題目與後半段之題目 做相關

做相關

--適用於沒有複本且衡量只能進行一次時

(9)

二、信度與效度的檢定(續)

3.複本信度(equivalent-forms method)-為 了讓不同程度的受測者能夠明確了解問 卷題目的意思,有時候同一個測驗中有 甲、乙卷兩種以上的複本

此法可以解決使用再測法的困擾 但兩 --此法可以解決使用再測法的困擾,但兩 份試題中不管在內容、格式必須一致,

才能算真正的複本 才能算真正的複本

(10)

二、信度與效度的檢定(續)

4.庫李信度(Kuder-Richardson reliability)-目的在於分析 問項間的一致性,只是不須把問卷中的問項折半作測 問項間的一致性,只是不須把問卷中的問項折半作測 試,在估計時常用的公式為

k

) 1

1)(

( 2

20

s

pq k

r

KR

k

=

K:整份問卷測驗的題數 s2:表示測驗總分的變異量

∑pq:表整個測驗中每題答對與答錯百分比乘積之總合 --適合用於答案類型為對或錯兩類的測驗

(11)

二、信度與效度的檢定(續)

5.Cronbach α係數—其公式如下

⎥⎦

⎢⎣

=

2 12 2

1

T

s s

k α k

K:測驗的總題數 測驗的總標準差

⎥⎦

⎢⎣

⎣ −

k

1

s

T2

sT:測驗的總標準差 sl:每個題目的標準差

--當再測信度、折半信度及複本信度在實質測試 之可行性不高時

(12)

二、信度與效度的檢定(續)

(13)

二、信度與效度的檢定(續)

(14)

二、信度與效度的檢定(續)

(15)

二、信度與效度的檢定(續)

„ 效度的意義

指衡量的工具是否能真正衡量到研究者想 要衡量的問題,即根據研究的目的、內 要衡量的問題 即根據研究的目的 內 容及範圍來檢定研究所做的衡量是否有 效 就衡量工具的效度來說 只針對內 效,就衡量工具的效度來說,只針對內 部效度而言,一般分為內容效度、效標 關聯效度及建構效度

關聯效度及建構效度

(16)

二、信度與效度的檢定(續)

„ 內容效度—以研究者專業知識來主觀判 斷所選擇的尺度是否能正確衡量研究所 斷所選擇的尺度是否能正確衡量研究所 愈衡量的東西,提高內容效度的方法 1 仔細從文獻中找尋適合且相關的衡量 1.仔細從文獻中找尋適合且相關的衡量

項目及尺度

對於最初決定的衡量項目可請教專家判 2.對於最初決定的衡量項目可請教專家判

斷是否適當

3.對和母體類似的樣本實施前測,依前測 結果加以修正

(17)

二、信度與效度的檢定(續)

„ 效標關聯效度—是指使用中的衡量工具和其他 的衡量工具來比較兩者是否具有關聯性,包括 預測效度和同時效度

1.預測效度—是指以新的衡量工具預測未來事件 ex.如果以面試的成績來預測未來在公司的潛力

一個有關電視機購買行為的抽樣調查可以正 確的預測出明年的消費者購買行為

(18)

二、信度與效度的檢定(續)

2.同時效度-是指根據衡量工具與目前某衡 量效標的相關程度,用以衡量該研究衡 量工具的有效性

量工具的有效性

ex.以電視機的調查為例,能夠正確地估 計出目前市場上高 中 低所得的家庭 計出目前市場上高、中、低所得的家庭 分別擁有彩色電視機的家數和比例,即 具有同時效度

(19)

二、信度與效度的檢定(續)

„ 建構效度—是利用一種衡量工具能衡量某種特 時或構念的程度 可分為

時或構念的程度,可分為

--收斂效度(convergent validity)-用兩種不同的 衡量方式去衡量同一構面的內容時,其相關程 度都很高

--區別效度(discriminant validity)-是將不同的兩 個概念進行量測,量測的過程不管是使用相同 個概念進行量測 量測的過程不管是使用相同 的方法或不同的方法,若經量測結果進行相關 分析而其相關程度很低

分析而其相關程度很低

(20)

二、信度與效度的檢定(續)

„ 結語

1.信度是效度的必要條件而非充分條件 2 有信度的衡量不一定具有效度

2.有信度的衡量不一定具有效度

(21)

三、因素分析

„ 因素分析主要目的減少變數和歸納變數 ex.有30個不同的特性會影響消費者對商

店印象的評價,但是在做決策時,沒有 店印象的評價,但是在做決策時,沒有 辦法依這麼多的變數發展其活動計畫 --利用因素分析達到探索與確認的目的

(22)

三、因素分析 (續)

„ 因素分析—所有變數都會被考慮,每個 變數都是與其他變數相關的一個線性組 合

--與其他相關分析方法不同點在於其他相 關分析的變數通常有一些用來作為自變 關分析的變數通常有一些用來作為自變 數,一些作為因變數

(23)

三、因素分析 (續)

„ 導出因素並評估整體的適合度 1.萃取因素的方法:

a 一般因素分析法 主要用來確認變數共 a.一般因素分析法-主要用來確認變數共

同存在的潛在因素或構面

b.主成分分析法-將原始的變數簡化成最 少數量的因素

少數量的因素

(24)

三、因素分析 (續)

„ 選擇因素的標準

1.因素的特徵值(eigenvalue)須大於一

2 最大變異數轉軸法旋轉後 取因素負荷 2.最大變異數轉軸法旋轉後,取因素負荷

量(factor loading)絕對值大於0.6者 3.兩因素負荷量差大於0.3者

4 分項對總項(item to total)相關係數大於 4.分項對總項(item to total)相關係數大於

0.5,且顯著者

(25)

三、因素分析 (續)

„ 因素命名—以負荷量最大的作為優先命 名

„ 因素之內部一致性分析—由Cronbach’s

„ 因素之內部一致性分析—由Cronbach s coefficient alpha來判定

(26)

三、因素分析 (續)

(27)

三、因素分析 (續)

(28)

三、因素分析 (續)

(29)

三、因素分析 (續)

„ 刪除來聲辨人

(30)

四、平均數檢定與變異數分析

„ 檢定一個母體平均數或比較二個樣本平 均數時,通常是使用Z檢定或t檢定

„ 虛無與對立假設如下:

„ 虛無與對立假設如下:

H

0

:µ

1

= µ

2

H1:µ

1

≠ µ

2

P< α 則Reject H

„ P< α 則Reject H

0

(31)

四、平均數檢定與變異數分析(續)

(32)

四、平均數檢定與變異數分析(續)

(33)

四、平均數檢定與變異數分析(續)

(34)

四、平均數檢定與變異數分析(續)

(35)

四、平均數檢定與變異數分析(續)

„ 統計資料常受多種因素之影響,而使得 各個體的某種特徵發生差異,而對這種 影響因素所造成之變異的觀察與驗證的 影響因素所造成之變異的觀察與驗證的 統計方法即為變異數分析(ANOVA)

ANOVA分析係將一組Data所產生的總變

„ ANOVA分析係將一組Data所產生的總變 異,依可能發生變異之來源分割成幾部 份,再利用統計分析的概念來測度各種 變異是否有差異。

(36)

四、平均數檢定與變異數分析(續)

„ ANOVA若加入實驗設計,可增加試驗分 析的精確度,實驗設計是利用重複性和 隨機性使特定因素以外的其他已知及未 隨機性使特定因素以外的其他已知及未 知因素的影響互相抵消於無形,以淨化 觀察特定因素的影響效果(降低犯Type II 觀察特定因素的影響效果(降低犯Type II 的機率)

(37)

四、平均數檢定與變異數分析(續)

„ 步驟:將samples的各觀測值離中差的總 平方和,按變量發生原因分解為各原因 所引起的平方和,然後將各平方何除以 所引起的平方和 然後將各平方何除以 自由度,化成變異數,再取成F統計量,

根據F統計量以檢定各原因或處理間是否 根據F統計量以檢定各原因或處理間是否 有顯著性差異,即檢定三個及三個以上 母體平均數是否相等的方法

母體平均數是否相等的方法。

(38)

四、平均數檢定與變異數分析(續)

(39)

四、平均數檢定與變異數分析(續)

(40)

四、平均數檢定與變異數分析(續)

上表顯示不同的所得在手機造型與功能的選擇 上有顯著差異

(41)

五、迴歸分析與複迴歸分析

„ 尋求兩個或兩個以上變數間的關係,例如:智 力與學業成績之間的關係

力與學業成績之間的關係

„ 若僅探討變數監相關的大小與方向,為相關分

„ 若要能根據某變數來預測另一變數的值,則是 迴歸分析

迴歸分析

„ 基本上迴歸分析須以相關分析作為基礎,任何 預測的可靠性是依變數間關係的強度而有所不 預測的可靠性是依變數間關係的強度而有所不

(42)

五、迴歸分析與複迴歸分析 (續)

(43)

五、迴歸分析與複迴歸分析 (續)

(44)

五、迴歸分析與複迴歸分析 (續)

(45)

五、迴歸分析與複迴歸分析 (續)

„ 迴歸模式的型態

ε β

β β

α

+ + + + +

=

X X

m

X

m

Y

1 1 2 2 L

„上述的模式只是理論上的模式(母體模式),

„上述的模式只是理論上的模式(母體模式),

通常母體不可知,在實際運算時,因為係數 的真正數值無法得知,故將上式依簡單迴歸 的真正數值無法得知 故將上式依簡單迴歸 或複迴歸修改為

1 簡單迴歸

1

X b a

Y

=

a

+

b

1

X

1 簡單迴歸

Y

= +

m m

X b X

b X

b a

Y

= + 1 1 + 2 2 +L+ 複迴歸

(46)

五、迴歸分析與複迴歸分析 (續)

„ 迴歸模式之適合度及判定係數

1.根據現有的資料建立一個迴歸模式時,

必須檢定此模式與資料的符合程度,稱 必須檢定此模式與資料的符合程度,稱 為適合度(goodness of fit) ,檢定適合度 最常用的量數是R

2

(R square)或稱為判定 最常用的量數是R

2

(R-square)或稱為判定 係數(coefficient of determination)

2. R

2

等於0表示變數間沒有線性關係

(47)

五、迴歸分析與複迴歸分析 (續)

3.當兩條迴歸式所含的預測變數多寡不一時,若 只用R2來判別各自的解釋能力有時會有不公平 只用R2來判別各自的解釋能力有時會有不公平 的現象,此時應改用修正後R2會比較正確

共線性

„ 共線性

是指當某一個自變數與其他的自變數具有高度 相關 這些變數所提供的訊息相似 使我們無 相關,這些變數所提供的訊息相似,使我們無 法分辨個別變數的效果

檢查方法 可從相關矩陣中看出 檢查方法—可從相關矩陣中看出

(48)

五、迴歸分析與複迴歸分析 (續)

„ 複迴歸必須決定預測變數進入迴歸模行之順序,

通常有以下幾種方法:

通常有以下幾種方法:

1.強迫進入法(enter) 2 強迫去除法( ) 2.強迫去除法(remove)

3.順向選擇法(forward)-依與因變數的相關性一 個一個納入模型

個一個納入模型

4.反向淘汰法(backward)-全部納入再一一淘汰 5.逐步選擇法(stepwise)-採用順向選入,依反向

淘汰法檢查是否排除

(49)

五、迴歸分析與複迴歸分析 (續)

(50)

五、迴歸分析與複迴歸分析 (續)

(51)

五、迴歸分析與複迴歸分析 (續)

D-W值通常介於1.5-2.5之間,表示誤差項之間 無自我相關存在

(52)

五、迴歸分析與複迴歸分析 (續)

(53)

六、卡方檢定

„ 主要應用於無母數統計的檢定

„ 類別資料的檢定

(54)

六、卡方檢定(續)

(55)

六、卡方檢定(續)

(56)

六、卡方檢定(續)

(57)

六、卡方檢定(續)

(58)

六、卡方檢定(續)

通常每一個cell 的個數須大於5,否則須 合併處理

合併處理

(59)

七、集群分析

„ 集群分析(Cluster)是一種將樣本觀察值進行分 析,若具有某些共同特性者予以整合在一起,

若具有某些共同特性者予以整合在一起 然後分配到特定的群體,最後行程許多不同集 合集群的一種分析方法。

„ 集群與因素分析概念大致相同

1 集群係將不同的觀察值依相對距離的遠近加以 1.集群係將不同的觀察值依相對距離的遠近加以 分類成不同集群,然後對不同集群所具有的特 性程度加以命名。

2.因素分析是將不同的變數依照相關程度加以萃 取成少數的因素,然後依各因素中所含變數來 加以命名。

(60)

七、集群分析(續)

參考文獻

相關文件

• 田口方法 (Taguchi method) 的意義為利用損 失函數的概念評估品質,採用實驗設計的 方法使產品不易受到不想要或無法控制因 子

2-1 化學實驗操作程序的認識 探究能力-問題解決 計劃與執行 2-2 化學實驗數據的解釋 探究能力-問題解決 分析與發現 2-3 化學實驗結果的推論與分析

推理論證 批判思辨 探究能力-問題解決 分析與發現 4-3 分析文本、數據等資料以解決問題 探究能力-問題解決 分析與發現 4-4

結合地方政府及民間團體,提具促進特定對象及就業弱勢者就業

進而能自行分析、設計與裝配各 種控制電路,並能應用本班已符 合機電整合術科技能檢定的實習 設備進行實務上的實習。本課程 可習得習得氣壓-機構連結控制

 善用從計劃得到的經驗 善用從計劃得到的經驗 善用從計劃得到的經驗 善用從計劃得到的經驗, , , ,自行設計及開發新 自行設計及開發新

微陣列玻片資料庫 (The Microarray Database,以下簡稱 TMD) 為本研究嘗 試建置的一套提供存取、分析微陣列玻片 (Microarray)

本章將對 WDPA 演算法進行實驗與結果分析,藉由改變實驗的支持度或資料 量來驗證我們所提出演算法的效率。實驗資料是以 IBM synthetic data generator