測量:確認範圍、方向、數量(研究測量比一般測量複雜)
研究者演繹出一個假設(某種條件真實存在的假說)後,
會對該假說所述的“條件”加以“測量”,如果發現,則 證實假說,否則即否定之。
研究者要測量的主要對象為“概念”(事物及其性質),
而真正測量者為性質的“指徵”(indicants)
年紀、年資、拜訪次數等性質可直接測量,但成功動機、忍 受壓力的能力..等構念則不易。
Def: 根據一組法則,分派數字(numeral)於事物上(實 徵觀察)。
測量尺度(scales):
測量必須有尺度,如男=0,女=1,如好=3,普通=2,
差=1。不同尺度適用於不同環境
四種測量尺度(等級由低高)
類別尺度:決定相同(equality)、無次序(order)、距離 (distance)、無原點 (origin)(如:北=台北,....,中
=...,南=...等之分類,或標記:1=台北,2=桃園) [此時的數字不為數值(僅為 Label),算術運算僅為計算 各類組之次數,僅可用眾數作為中間趨勢,但無離散可 用,可用卡方檢定(無母數),相關可用C表示(權變係 數)
等級尺度:決定大小(次序)、無距離、原點(絕對 0) (ordinal)
在遞移率(a〉b、b〉c a〉c)成立時可用。
可表大於、小於(優於、劣於)...。
不具距離,數個特性之綜合較難,此時可用多元尺度。
幾個人的 ranking 的合併不可用相加、平均,除非先 轉為含距離的等距尺度(用A、B 間的偏好程度表距 離)。
中間趨勢中位數,離散百分位差,相關排列相 關,檢定無母數檢定(卡方...)
(因有母數方法(如 ANOVA)的好用,當尺度接近
等距時可用之!)。
等距尺度(Interval):決定及距離,但無絕對 0
(如時間3-6 與 5-8 相同,但無絕對 0 時)
態度量表常用之,但有爭議(如偏好程度當作距 離之準確性)(如 Thurstone‘s scale:等距量 表)。
中 間 趨 勢 X , 離 散 S , 相 關 積 差 相 關 , ANOVA、t、F 檢定(有母數方法)。
不可乘、除(因為無 0)。
等比尺度(Ratio):決定及有絕對 0
可乘除(為一變項的實際量,如長、寬、高,$,人
(誤差大部份是 systematic(由偏差引起),少部份為隨 機(機遇性))
好的測量之三要件: 目)樣本(適量、適當的比例分配給不同issues)。
(如成就測驗之包含issues(聯考的 coverge))
為“主觀判斷”的結果、作法:
由設計者仔細定義此測量工具的關心主題,要量度的項 目,及使用的尺度後決定效度(可經由問題層級之細分 後,決定之)。
由一組人估計(判斷)此工具符合標準的程度。(例如
對績效測驗的項目可由一組人個別評估,給予主要的、
有用/非主要、不必要的評價(即由與行為有關之程度 評價給分),將之合計可得該項目的內容效度比,此效 度高者即保留作為績效評價項目。)。
效標關連效度
又稱實徵效度或統計效度,係以測驗分數與效標
(criterion)之相關係數表示之。以時間分為二種
(A)同時效度(concurrent):測量結果(分數)與目前效 標資料間的相關(如:品牌忠誠測驗與購買量,智力 測驗與成績)。
(B)預測效度(predictive):測量結果(分數)與未來效標資 料間的相關(如:遴選員工之測驗成績,與未來的績 效。)
有些效標概念上雖很清楚,但卻不能用(如收入無法真 正得知金額大小)。
效標可能有很多,但都不能完全滿意,其評量標準有:
相關(relevance) (我們認為它與測量特質有關,
如業績與成功業務員)
無偏差(不受外在因素影響,如業績應考慮地域、
競爭因素之修正,才無偏差)
可靠性(reliability)(穩定或可再生,如業績應具 穩定性才可作為效標,不可大起大落)
可用性(availability)(成本、時間的考量)
建構(construct) 效度:三種方法
測量工具能測量出理論的構念或特質之程度而言。(可 用(A)判斷,如已知「智力與年齡有關」理論而我們的 IQ 工具也發現成績與年齡有關,則可認為有效度)
(必須考慮包含此構念的理論,及使用的測量工具)
例如:為測量組織文化中儀式的效果而發展出一套工具 (B)若已有另一套工具可用,我們的工具得分可與該工 具得分相關作為構念效度稱為「收斂(幅合)效度」
另外,(C):「辨別效度」,如儀式可與符號、故事(傳 統)區分的程度(不相關)。
除以上三種外,因素分析、集群(群落)分析可幫助找 出構念的主要成分,可用以判斷建構效度之高低。
另外,多重特質(Multi-trait)多重方法為一有名的方法 (Campbell & Fiske):
假定有數種(一套)測量工具,每種均可測量相同的 數種特質(構念),則理論上應該滿足:
(a)以相同方法測量相同特質所得分數間應具有最大 相關。
(b)以不同方法測量相同特質所得分數間應具有次大 相關。
(c)以相同方法測量不同特質所得分數間應具有較小 相關。
(d)以不同方法測量不同特質所得分數間應具有最小 相關。
如果一套工具滿足上述條件同時具備“輻合”與
“辨別”效度。如(Kerlinger p424)社會態度量表
測量L(自由派),C(保守派)
方法1(用參考字) 方法 2(用敘述)
相關係數 L1 C1 L2 C2 方法1 L1 0.85
C1 -0.07 0.85
方法2 L2 0.53 -0.15 0.81
C2 -0.37 0.54 -0.09 0.82 (d) (b) (c) (a) (a):內部一致性,信度
(a)>(b)>(c)>(d) 有輻合、辨別效度
(內容、效標關聯、建構效度三者雖有不同、但有關,例如 為發展預測員工成功的測驗,(預測效度)須形成構念作 為預測基礎,故須考慮建構效度,接著再考慮從此構念 的所有相關項目找出一組樣本作為測驗時,必須考慮內 容效度。)
信度
表示測量結果的一致性(為效度的必要條件),但較易 估計,以相關係數表示。
表示一項測量不 受隨機 誤差影響 的程度 (故 rtt
=1-e2/o2)。
可 分 為 三 類 : 穩 定 性 (stability) 、 等 價 性 (equivalence)、內部一致性:
穩定性:不同時間測量結果的一致(相同)。
等價性:不同觀察者(觀察研究)、研究項目(問卷或量 表)間的結果的一致性(相關)。
內部一致性:測量工具本身項目間的一致性。
穩定性用再測信度(test-retest):兩次測量的相 關係數。
(問題點:*時間太短,測驗答案仍殘存,**受 測者有學習效果,***時間太久,受測者受到 其他外在因素而改變。)
一般心理測驗(2-4 週)
故此種信度已較不受重視
等價性 forms”再測加複本(A,B)(一半人先作 A,
再作B;另一半人先作 B,再作 A,如此也可去 除“先後次序”之因素干擾。
內部一致性(不適用於速度測驗)
(a) 拆半 (split-half) 信度( 分成 奇、 偶 項 , 求相 關 rnn) 一般測 驗愈 長, 信 度 (rhh) 愈 高 , 故 須 用 Spearman-Brown 公式。
作如下校正:(1)rtt=2rhh/1+rhh(此公式假設兩
(b)庫李 20 號公式(Kuder-Richardson, KR20)
rKR20= (1-pq/S2) K/(K-1)(K:題數;p:各題答 對%;q:各題答錯%;S2:總分的變異)(*每題一分 時)
(c)Cronbach 的係數
= (1-Si2/S2) I/(I-1)
者一致性,而增加項目的樣本,也可增加等價性(如問卷 中相似問題項目的增加,或觀察研究時的更 多 個 觀 察 者 與觀察點)。
對於態度、成就、遴選員工等的測量工具,在提高內部一致 性時常也可提高等價性(其假設為高分數表示高績效,低 則相反。因此可分析評分者最高與最低分者的項目得分變 異,而將較無辨別力的項目去掉,因此而提高內部一致性 也可提高等價性(評分者一致性))。
信度之要求與研究者對資料之要求目標(是否須精確)相 關,要精確資料則有高信度要求(但同時也須考慮資料的 基本變異本質)。
實用性(practicality)
分成3 項:
經濟:時間、成本
方便:常易執行(管理),如有一組詳細、清楚的說明、例 子之問卷較易填寫,layout 也應考慮填表者
可解釋:使不是設計者也可解釋測量結果,最好藉由以下 方式達成:(準備下述事項)
a.說明測量工具的功能、發展程序。
b.操弄測量時的詳細說明(執行說明)。
c.計分方式。
d.適當參考群體的 Norm(常模)。
e.測量的信度之證據。
f.子項目積分間的相關之證據。
g.此測量工具與其他事證(如其他工具)間關係的證據。
h.使用此測量及解釋結果的 guide。
測量工具之發展(製作)(4 步驟)
概念發展:想出目標構念。
概念規格:將初步概念細分為不同成份(如公司形象可分 為企業公民、生態責任、雇主角色、消費者眼中的供應商等,
可用因素分析、集群分析)。
指標(indicator)選擇:選擇代表上述不同成份的主要指 標(可用問題、統計量表、分數表示)。
* 可 用 單 一 尺 度 : 如 企 業 公 民 =leaderstrong
supporteraverage supporterbelow average
supporter
*可用多元尺度:如企業公民=資金支持、支援教育、支持公 共行政
形成指數(index)結合不同尺度為一單一指數(每一個別 指標僅表一我們所欲測量構念的機率性關係)(如給每一回答 對應到一個值,再合併起來)。