• 沒有找到結果。

證據概念-實作背後的思考

N/A
N/A
Protected

Academic year: 2021

Share "證據概念-實作背後的思考"

Copied!
21
0
0

加載中.... (立即查看全文)

全文

(1)

證據概念—實作背後的思考

陳美智

*

博士

吳裕益 教授

國立高雄師範大學科學教育暨環境教育研究所 國立高雄師範大學特殊教育學系

摘要

本文旨在試圖闡明證據概念的基礎,並基於證據的知識架構。當評價證據的

信效度時,必須洞悉數據的蒐集、研究計畫的設計、儀器測量、數據正確度之分

析手法、數據的趨勢、關聯以及預測等,並於結果中呈現。證據概念架構除了影

響英國所發展的課程內容之外,也被美國 k-12 科學教育架構及 PISA 2015 科學

架構所引用。證據概念是探究與實作的核心,在 Gott 與 Roberts(2008)的架構

圖中,不管是質性資料或量化數據,都能培養學生的能力,以投入在真實論據的

探究中發展知識及建立主張。108 課綱的概念包含實質的科學內容及科學表現,

而證據概念是學生可以學習、理解並且能夠在探究與實作中建構意義及知識,教

師也可在實驗課程中加強學生的過程理解及評量學生的學習表現,這就是 Gott

與 Roberts(2008)所強調,證據概念為「實作背後的思考」。

關鍵詞:證據概念、探究與實作、108課綱、科學素養

(2)

Concept of Evidence: The Thinking

Behind the Doing

Mei-Chih Chen

Doctor

Yuh-Yih Wu Professor

Graduate Institute of Science Education and Environmental Education, National Kaohsiung

Normal University

Department of Special Education, National Kaohsiung Normal University

Abstract

This study aims to elaborate the concept of evidence. Based on the knowledge

framework of evidence, when evaluating the validity and reliability of evidence, it is

necessary to understand data collection, research design, instrument measurements,

analytical methods of data accuracy, data patterns, correlations and predictions, and

presenting the results. In addition to influencing the curriculum content developed in

the United Kingdom, the concept of evidence has also been cited by the K-12 Science

Education in the United States and PISA 2015 Science framework. The concept of

evidence is the core of scientific investigation and practice. The framework of Gott

and Roberts (2008) emphasized on the interactive relations between the core of datum

and the peripheral sphere concerning student’s inquiry-enables students to get

equipped with the competence of forming authentic claims and scientific

argumentations by their own, regardless of applying qualitative or quantitative data.

The New Curriculum 2019 includes substantive concepts regarding the scientific

content and performance. Hence the students can learn and acquire to construct their

own meanings of investigation through the concept of evidence, while the teacher can

reinforce students’ process of thinking and evaluate their learning performance. This

explains “the thinking behind the doing,” as Gott and Roberts (2008) argued.

keywords:

concept of evidence, scientific inquiry, 2019 Curriculum, scientific literacy

(3)

壹、前言

教育部

12

年國教課程綱要的總綱是以素養為導向,除了將科學探究能力列為核心 素養的第一位,在

2018

11

2

日通過的自然領綱中,更規劃普通高中科學領域的學 習為「固定必修學分數應含

1

3

跨科目之主題式探究與實作課程內容」,可見臺灣科學 教育對學生探究能力的重視。同時,探究能力也需要強調證據概念教學的重要性,因為 證據概念在確認探究品質的可信度及有效性是至關重要的,理解證據能幫助學生在科學 探究課程中運用更純熟的思考技能以建構意義,並在結論時建立具說服力的主張。 探究與實作的學習,能讓學生在實驗與實作中,使用證據概念以貼近科學本質 (

Jeong, Songer, & Lee, 2007; Glaesser et al., 2009; Roberts, Gott, & Glaesser, 2010;

Roberts, 2017

)。探究能力又包含思考智能的發展,思考智能則蘊含著推理論證,是對探 究的內容及數據進行分析,再綜合統整數據以發現規則,最後呈現證據和推理,並提出 解釋和結論,以形成主張或問題解決的方法。

108

自然科學課程是始於學習表現的探究 能力,且於實驗數據分析結果的呈現。 陳美智與洪振方(

2018

)發現科學探究能力會透過學生的科學證據能力,間接影響 其科學論證能力,即科學證據概念具有部分中介變項的作用。當學生進行科學探究時, 如果有證據概念,則比較能使用證據概念的知識以合理證據解釋結果,並表達主張,顯 現證據概念的重要性。因此,筆者將依據英國

Durham

大學教育學院對科學證據的理解 所做的研究,編譯成適合國內中學於探究課進行科學探究所需的證據概念(

Gott

等人,

2015

)。

貳、證據概念

在科學教育中強調

K-12

教育的科學素養,是把探究能力列為核心素養的第一項, 但也不應該只聚焦在科學探究技能,也該對科學證據的評價有批判思考的能力(

Kuhn &

Reiser, 2005

)。

Schwichow

等人(

2016

)認為現代公民在做決策時,要具備基礎的證據 概念能力以協調證據與理論之間的一致性,如此才可以解決

K-12

教育中,學校所學與 社會所需沒有關聯的問題。

Gott

Roberts

2008

)定義「證據概念」是過程理解,是了

(4)

能」觀點。二、「理解證據概念」觀點。技能觀點一般以「過程技能(process skill)」這 個名詞出現,過程技能視「做科學」等同於概念理解,只注重學生的表現,包含:觀察、 分類、提出問題、預測、測量、解釋、分析、綜合評鑑等,但是只注重課程的行為目標 是有危險性的,這種教學法的觀念如同把做科學直接視為概念理解或過程理解,學生被 認為從實作的過程就可以發現科學過程中所隱含的程序要素。但事實並非如此,理解證 據概念的觀點是需要學生建構意義,並引導其「如何思考」及「思考什麼」,因此Gott 與 Roberts(2008)把理解證據概念簡稱為實作背後的思考(the thinking behind the doing)。 Gott 等人(2015)建立 93 個證據概念架構,該清單至今仍在增加及修改中,證據 概念是教師可以教導,而學生能夠學習、理解並在探究與實作中建構知識,教師也能在 實驗課程中加強學生的過程理解及評量學生的表現,這五層的架構如下:

一、單一測量

根據所要測量的數據,選擇出適當的儀器。對於單一測量,需要了解:(一)潛在 關係、(二)校準與誤差、(三)單一測量的信、效度。

二、基本的資料或數據的測量

測量可能需要的數據,在工業上使用精細的方法來收集參數是很重要的工作。對於 數據的測量,需要了解:(一)選擇儀器、(二)資料或抽樣方法、(三)使用統計方法 處理測量參數、(四)基本資料或數據的信、效度。

三、數據資料與趨勢研究

探討在自變項與應變項之間或眾多的數據之中的關聯,調查研究有很多不同的樣式 但是皆具基本的結構,評價調查研究的信度及效度的方法,都需要了解:(一)研究設 計、(二)研究資料的呈現及數據趨勢或關聯、(三)如何評價整個調查研究數據的信、 效度。

四、數據如何變成證據

數據要轉換為證據,需要與其他的測量方法比較,如:一系列的實驗、二手數據及 三角驗證。

(5)

五、社會因素

評估證據必須考量個人及社會經驗和調查研究者的地位,為當面對證據需要做判斷 時,仍需要考量社會、文化、經濟等因素。 證據概念架構(圖 1),該圖內部三層代表研究時的證據概念,外部兩層代表另外 一個相似的研究,但是對外面這兩層的認知,將會影響內部三層實驗時證據品質的收 集,譬如經濟及社會壓力會影響證據的蒐集,所以評價整個研究的有效性及可靠性得考 慮整體架構的影響,而整個測量的概念就在這個證據架構內。相信證據概念必然可以提 供做為 12 年國教有關探究與實作課程的基礎,因此下一節將完整描述 93 個證據概念的 內容。

圖1 證據概念清單的架構(Gott 等人,2015)

參、證據概念的內容

一、單一測量

根據所要測量的數據,選擇出適當的儀器。對於單一測量,需要了解:潛在關係、 校準與誤差、單一測量的信、效度。

單一測量

基本的資料或數據的測量

調查研究:

數據與資料的趨勢研究

數據變成證據:

與其他的測量比較

社會因素

(6)

(一)潛在關係

例如:量筒將液體體積變化轉換為高度變化; 溫度計將溫度變化轉換為體積的改變,再轉為高度的改變; 車速里程表或伏特計等把速度數值轉換為角度改變; 酸鹼指示劑的顏色改變呈現

PH

值的變化。 證

1

:直線關係:兩變數呈現正比或反比關係,例如:溫度計的液體體積與溫度的關係。 證

2

:非直線關係:例如:安培計電流的大小與轉動角度的關係。 證

3

:複雜關係:例如:某品種的地衣含量及分布是污染程度的指標,但還有其他影響 的因素,如:光線、土壤或空氣流動都會影響地衣的分布。 證

4

:多元關係:醫生診斷通常都是利用間接關係,像腸癌的發生,大部分都是經由糞 便潛血檢查,再做血液及大腸鏡檢查,醫生診斷並開刀之後,有切片組織做細胞 檢驗,就可以確認是癌細胞。其他科學研究在間接測量上面,也有很多例子,如 地質學及地球科學的研究中,科學家想知道古代氣候變遷,利用觀察樹木年輪及 冰核,都可以間接測量古代氣候可能的狀況。另外,煞車距離也是間接測量摩擦 力的方法。

(二)校準與誤差

任何儀器都需要校準,如此,測量的關係才能正確地對應到尺度,若非線性關係, 則尺度更需要常常校準。任何儀器不管多精準都會有誤差,且儀器的解析度及靈敏度都 會有其極限。 證

5

:端點校正:例如:溫度計的冰點及沸點都需要校正。 證

6

:端點之間要校正:中間刻度要校正以確保線性關係,溫度計的玻璃口徑厚度可能 不均勻所以需要校正以確保線性。 證

7

:零點偏誤:儀器可能有系統偏誤需要常校正,儀器使用一段時間之後,儀器的

0

點可能移動而需校正或儀器元件可能疲乏。 證

8

:極限負載/超越靈敏度及偵測極限:電子儀器有最高及最低的尺度測量範圍。 證

9

:靈敏度:儀器本身固有的測量誤差,電子儀器測量時,數字會有上下浮動的變化。 證

10

:解析度與誤差:測量能測到的最小單位,如果最小刻度是

cm

,測量值是

10cm

, 則可用

10

±

1cm

表示或誤差百分比

10%

。 證

11

:特異性:指所選擇的儀器需要能精確測到所要測量的標的成分或現象,而不受其 他可能存在之成分(例如:雜質、分解物等)之干擾。例如:鹼石灰(或熟石灰

Ca(OH)

2)可用來測量某些蟲類的呼吸活動(圖

2

)。

(7)

圖2 香港1999會考試題

證 12:儀器的使用:使用手冊有 SOP 的程序,例如溫度計拿離開液體觀測時,則測量 值便產生誤差,所以溫度計跟液體接觸的深度需要規定。 證 13:人為誤差:可能讀取錯誤。

(三)單一測量的信、效度

為了達到測量的目的,任何測量都必須有信、效度才足以信賴,不管使用相同儀器 或不同儀器或三角驗證都可增加信度。 證 14:信度(1):測量的可信度依賴在正確的重複測量,以求得平均值,例如:使用呼 吸法測酒精濃度值,至少要測量三次以上求其平均,才可以當作合理的數據。 證 15:信度(2):使用不同儀器測量可以增加信度,例如酒測可以使用呼吸式及血液測 量兩個方式,或溫度計種類有水銀、酒精及數位,不同儀器的使用可以提升信度。 證 16:信度(3):人為誤差可使用隨機抽取數人共同測量方式克服,由兩人以上來測量, 可檢核數據的準確度。 證 17:效度:要達到測量的目的,可使用不同的測量技術,如可使用一種以上的測量方 法來測量相同的維他命。例如:維他命 C 的定量方法,可使用碘溶液滴定法及 分光光度計測定法以比對數據差異。

(8)

二、基本的資料或數據的測量

測量可能需要許多的數據,在工業上使用科學精細的方法收集參數是相當重要的工 作。關於數據的測量,需要了解:選擇儀器、資料或抽樣、使用統計方法處理測量參數、 基本資料或數據的信、效度。

(一)選擇儀器

造成測量誤差的原因很多,但選擇正確的儀器,可達到事半功倍的效果。 證

18

:真值或正確性(

Accuracy

):重複測量很多次所得到的平均值極接近真值,例如 某人重複測量身高

1,000

次,平均值為

173cm

,如果他在某醫院的身高計所量出 的身高為

173cm

,那代表在該醫院所量到的身高極接近真值。 證

19

:非重複性:相同儀器重複測量不會得到相同值,例如:在浴室不同角落測量體 重,測量值不會相同,或測量時不同姿勢,體重也不會相同。 證

20

:準確度(

Precision

):有時也稱為信度,工業上則稱為「不準確度」,當使用儀器 測量時,如果儀器越不精確,則誤差越大,是一種測量的變異。正式的描述可用 觀察範圍或標準差來描述,是多次測量分散的程度,或儀器測量的標準誤來形 容,例如:測量值是

175

176

175

176

174

,可觀察到測量數據集中的程度, 但準確度不一定是真值。 證

21

:再現性:需要區別重覆性(

Repeatability

)與再現性(

Reproducibility

)所謂重覆 性:相同樣本、相同設備、相同實驗室,觀察實驗結果是否重複。所謂再現性: 相同樣本、相同設備(或不同)、不同實驗室(不同的人或團隊),觀察實驗結果 是否再現。例如:「

Round Robins

」就是使用標準樣本,在不同實驗室測量觀察 結果是否不同,以比較不同實驗室測量的不準度。 證

22

:離群值:異常值或反常值,當檢查數據發現離群值時,必須檢查造成離群值的原 因,如果是因為測量方法有誤,則必須捨棄離群值,在醫學領域發現離群值就要 特別的注意。

(二)抽樣數據

系統性的測量可確認數據的信度,譬如調查某種類動物或植物的分布範圍或黃金可 能被發現的地點之分布,這項研究的抽樣可實施無限多次,而每次測量對數據的效果是 相同的。 證

23

:抽樣:從所有可能的測量、或所有可能取得的樣本中取樣,例如抽取網球反彈高 度的數據,或抽取植物分布的様本。

(9)

24

:樣本的大小:測量次數愈多愈能代表真實的分布,例如:大學生的平均身高,測 量對象(次數)愈多愈有代表性;網球反彈高度測量次數愈多愈能代表可能的反 彈高度。 證

25

:減少抽樣誤差:使用適當的抽樣方法,例如:簡單隨機抽樣、系統抽樣、分層隨 機抽樣、叢集抽樣,以使樣本具有代表性。例如:欲測量大學生的平均身高,可 使用電腦隨機亂數來抽取大學生樣本。 證

26

:異常值:可能是數值固有的變異或不能控制的變數。例如:班上學生的平均身高, 可能有像姚明這種特別高的轉學生轉入,導致全班平均改變;或網球反彈高度中 的一個異常數據,可能是其中某顆球的材料有所不同。

(三)使用統計方法處理測量數據:

數據可用許多不同的數學方法描述,統計方法是在真值的一定範圍內,使用機率概 念來處理數據,以下是使用基本統計方法處理測量數據的方法。 證

27

:範圍:極大值和極小值之差距,亦稱「全距」。例如:連續測量發酵時所產生的

CO

2高度(圖

3

),測量值的大小順序如下:

2.7

2.9

3.1

3.1

3.1

3.3

3.4

3.4

3.5

3.6

3.7cm

,所以範圍是

1.0cm

3.7-2.7

之間)。

圖3 發酵時所產生的 CO

2

高度

28

:衆數:衆數是指一組數據中出現次數最多的數值。例如:上述連續測量的例子, 則衆數是

3.1

,因為

3.1

出現最多次。 證

29

:中位數:中位數是指一組數據分布的中點,例如:上述連續測量的例子,中位數 是

3.3

。 證

30

:平均數(μ):測量值總和除以測量次數,所得到之平均數值稱之為算術平均數, 例如:上述連續測量的例子中,平均數是

3.2cm

。 證

31

:次數分布:對重複出現的數據進行分組,則畫出的測量數據次數分布圖表所能提 量筒 水浴 水(40℃) 麵團與 酵母菌

(10)

32

:標準差(σ):標準差是變異數開根號,標準差是常態分布數據離散的程度,數據 是否集中在平均數附近,即測量數據與平均數差異的程度,測量的儀器及技術愈 好愈準確,在常態分布的曲線中標準差就會愈小。例如:上述連續測量的例子中, 如果要根據那

11

個樣本資料來推估母群標準差(σ),那所得到的標準差估計值 是

0.30cm

。 證

33

:平均數標準誤:樣本平均數的標準誤(

SE

),是指所得到的樣本平均數之抽樣誤 差的大小。只要從母群隨機抽取

N

個資料就可以計算該

N

個資料的樣本平均數, 如果重複進行非常多次各抽取

N

個資料來計算樣本平均數,接著計算由很多個 樣本平均值組成的分布之標準差,就可得到樣本數為

N

的平均數標準誤。測量 的儀器及技術愈好愈準確,且重複測量次數也愈多時,在常態分布的曲線中標準 誤就會愈小,標準誤是提供測量參數不確定性的簡單方法,SE=σ / N。例如: 上述連續測量的例子中,平均數標準誤

SE

0.09cm

。 證

34

:變異係數(

Coefficient of variation

):標準差會受測量單位不同之影響。像以公分 為單位所算出的身高標準差為

5

,那以公尺算出的標準差只有

5

÷

100

0.05

。因 此,要比較標準差之相對大小時,最好使用相對差異係數,亦稱變異係數,以 CV=(σ / μ)×

100

代表。變異係數不會受測量單位之影響。例如:上述連續測 量的例子中,CV=

9.3563%

。 證

35

:信心水準:對數據的信心,像區間估計之信心水準如果要求

95%

,那就還允許

5%

之推論誤差。母群標準差已知或是樣本數極大時,可以採用標準常態分配(

z

) 進行區間估計,

z

(1- α / 2 )=

z

(1-0.5 / 2)=

z

.975=

1.96

,也就是說介於正負

1.96

之間剛 好占

95%

,因此

95%

信賴區間之上限數值=μ+

1.96

×平均數標準誤,

95%

信賴 區間之下限數值=μ-

1.96

×平均數標準誤。例如:上述連續測量的例子中,

95%

信賴區間上限是

3.43

(即,

3.25

1.96

×

0.09

),下限是

3.07

(即,

3.25

1.96

×

0.09

),也就是有

95%

的信心真值會落在

3.07

3.43

之間。本例題之資料數只有

11

,屬於小樣本,因此不能直接使用標準常態分配(

z

)進行信賴區間估計,而 是需要使用

t

分配進行信賴區間估計,所得到之

95%

信賴區間之範圍是在

3.05

3.46

之間,其區間範圍稍大於根據標準常態分配所建立之信賴區間。 表

1

是以

SPSS

統計軟體計算上述

CO

2測量

11

次所得到的數據之描述統計量數, 包括本節所介紹的範圍、衆數、中位數、平均數、標準差、平均數標準誤、變異係數及 平均數

95%

信賴區間。

(11)

表1 CO

2

測量 11 次所得到的數據之描述統計量數

統計量數 數值 範圍(Range) 1.00 衆數(Mode) 3.10 中位數(Median) 3.30 平均數(Mean) 3.25 標準差(Std. Deviation) 0.30 平均數標準誤(Std. Error of Mean) 0.09 變異係數(Coefficient of variation) 9.4%

平均數 95%信賴區間(95% Confidence Interval for Mean) 下限(Lower Bound) 3.05 上限(Upper Bound) 3.46

(四)數據的信、效度

數據要有信、效度才能當作證據,因此需要仔細審查有效的程度,比如「是否測量 到適當的變項」、「數據是否有代表性」、「數據是否可信」或精確度及信心水準的範圍。 證 36:信度:當測量方法以及儀器相關的測量與誤差都是確定的,這樣的數據才能夠當 作證據。例如血液中酒精濃度的可信度,必須包含測量方法及誤差,測試的方法 包含深呼吸或淺呼吸及誤差(±0.01)的大小。 證 37:效度:使用適當的測量方法以收集資料數據,例如:測量樹木的圓周長來計算樹 齡是無效的方法。

三、調查研究:數據與資料的趨勢研究

探究是在尋找自變項與應變項之間或眾多數據之中的關聯,調查研究有很多不同的 樣式,但是基本的結構都相似。理解調查研究,需要了解:研究設計、研究資料的呈現 及數據趨勢或關聯、如何評價整個調查研究數據的信、效度。

(一)研究設計

有關如何評價研究設計的信、效度,需要了解以下幾個子項目:變項結構、效度、 公平測試和控制變因、數值選擇標準、正確性及準確度、表格、研究設計的信、效度。 1. 變項結構

(12)

證 38:自變項:是改變的變項,例如:「改變球的種類」來測量反彈高度,或「改變水 深」來測量光的強度。 證 39:應(依)變項:是結果的變項,是自變項改變後所測量到的結果變項之數值。例 如:測量不同種類網球的「反彈高度」,或測量不同深度水中「光的強度」。 證 40:相關:相關就是尋找關聯,相關不一定是因果。例如:腳的大小可以從手的大小 預測,但兩者都是由不同的遺傳基因造成的,而非誰影響誰,或哪個變項影響其 他的變項。 證 41:類別變項(名義變項):變項會有分類標籤,像金屬種類就分成鐵、銅、鋁、金 等。 證 42:次序變項:類別及分類或描述性的變項,可以給次序或大小的數目,例如國小、 國中、高中,可以給 1、2、3 次序。 證 43:連續變項:可以有任意的數值,例如:體重、身高、壓力等大小,都可以有連續 的數值。 證 44:不連續變項:是受限的整數,又稱為間斷變項,是只能有單一數值,而不是任何 值的變項,例如:家庭小孩數目、選舉結果的得票數、或骰子的點數數量。 證 45:多個變項:有多個自變項,例如橋的強度受到其長度及寬度的影響,或者溫度及 濕度都會影響羚羊在居住地的分布。 2. 效度、公平測試,和控制變因 下圖左右兩邊是兩個極端的策略,但中間還包含許多有效策略可以控制無關變因來 探討改變自變項對應變項之影響。例如:生態學家可能使用統計方法,研究日照長度和 蝴蝶出現的關係,但是其他可能的自然變因就要控制相同或相似,以確認有效的策略。 實驗室研究 場域研究 公平測試 有很多無法控制的自然變項 證 46:公平測試(Fair test):只有自變項會影響依變項,例如:糖溶解的時間與溫度的 關係,只有改變溫度但其他條件都不變。 證 47:實驗室的控制變因:例如:上述例子,控制變因是糖的質量、水的體積、攪拌技 術、室溫不變、沒有風的流動。 證 48:場域研究(Field studies)的控制變因:實驗者操縱一個或多個自變項,而且觀 察自變項對某依變項的影響。但一些不能控制的變項,可以確認變項的改變量相 同,例如:研究土壤肥沃度如何影響發芽的時間,但每個研究區域的氣候條件都 控制相同。

(13)

證 49:調查研究(Surveys)的控制變因:在場域研究中,例如:想探討光線強度是否 影響葉子的顏色,需另外記錄很多數據,像土壤養分、PH 值、水含量等,是為 了減低不能控制變因的影響,即植物的相關研究,要從蒐集的許多變項條件中, 去選擇且控制相似的條件。 證 50:對照組實驗:或控制組,例如:在藥物實驗中,相同病症的患者,分成實驗組(給 藥)及對照組(給安慰劑或不給藥),以比較藥物效果。 3. 數值選擇標準 研究時需選擇合適的變項數值,而在場域研究中,則事先必須記錄一些自然變因(例 如:溫度、濕度),場域研究只能使用追溯方法,最後再決定要應用那些數值。 證 51:預試:開始嘗試的實驗先建立廣大的參數,像尺度、間隔、範圍、數目等,這可 幫助如何選擇儀器和設備。例如:臨床人體藥物使用前,先細心測量藥劑量及藥 物副作用或其他可能的不良後果,預試需要在正式實驗以前完成。 證 52:取樣:與抽樣方法相同,樣本大小或代表性及取樣策略都會影響結果的有效性。 證 53:相對比例尺:選擇合理的測量比例數量,例如測量溶解度與溫度的關係時,水不 能少到產生飽和溶液,否則是無效的測量。 證 54:範圍:自變項數值範圍的選擇,要能測到依變項的變化趨勢。例如:測量溫度對 酵母麵糰體積變化的影響,如果溫度選擇在 20℃至 25℃之間,這樣效果不佳, 因為 20℃至 25℃看不到麵糰體積具體的變化。 證 55:間隔:數值間隔的選擇會影響趨勢的發現,例如:研究酵素的活性,如果測量溫 度間隔太大,選擇每 20℃測量一次,則不容易看到酵素的活性趨勢,因為活性 範圍可能在測量值 20℃間隔之內的某一個數目就產生變化。 證 56:數目:在趨勢改變的地方要有足夠的測量次數,例如:利用虎克定律,在測量值 的極限範圍時,要有足夠的測量次數,以確認趨勢改變是否超過彈性限度。 4. 正確性(Accuracy)及準確度(Precision) 不同的研究設計有不同的目的,但實驗的數據要能正確及準確的回答研究問題。 證 57:區別度:數據的準確度要能區別兩個平均值的不同,例如:區別網球及乒乓球反 彈的高度和區別兩顆乒乓球的反彈高度,所需要的準確度是不同的。 證 58:趨勢的決定:要決定趨勢需要有一定的準確度,僅由誤差數據或散佈圖,無法判 斷趨勢是向上的曲線或是直線。 5. 表格

(14)

←依變項

自變項→

數字代表

範圍及間隔

證 59:表格:實驗前可先規劃表格,例如:溫度對食鹽溶化時間的影響。 6. 研究設計的信、效度 評價研究設計的信、效度,需要評價實驗設計的概念及產生的數據是否能回答研究 問題。 證 60:實驗設計的信度:考慮所有跟數據測量有關的概念,例如:儀器測量所帶來的誤 差,數據的取樣,樣本的大小及抽樣的技術,相對比例尺,測量的範圍與間隔, 測量次數跟測量的正確性及準確度。 證 61:實驗設計的有效性:包含:信度及基本資料數據的效度,例如:儀器是否測量到 我們想測的目的,是否考慮變項結構跟公平測試,例如:若不考慮摩擦力,在斜 坡運動中的速度、角度及運動距離三個變數的關係,並不是在測量運動的距離之 後,就可以得到速度跟角度的函數關係,事實上當角度改變時運動距離也會改 變,所以在斜坡運動中,測量斜坡運動的距離無法回答斜坡運動的速度與斜坡角 度的關係

(二)研究資料的呈現及數據趨勢的關係

當研究設計已經達到信、效度,如何讓測量的資料或數據呈現變項的關係或趨勢, 而這個趨勢是有效及可信的,需要了解以下幾個子項目:數據呈現、使用統計方法處理 數據、數據的趨勢及關係。 1. 數據呈現 當研究結果以圖形來展現,則數據的呈現需使用不同的圖示,則趨勢及關係較容易 被發現。 證 62:表格:只能呈現部分實驗設計的概念,沒有顯示控制變項及測量技術,但表格可 呈現簡單的趨勢如正比或反比關係。 證 63:長條圖:也稱為「條狀圖」,自變項是類別變項,依變項是連續變項,例如:高 雄市 2004 年各區國民中學一年級學生數之長條圖(圖 4)。 溫度(℃) 時間(秒) 10 25 50 75 100

(15)

圖4 高雄市 2004 年各區國民中學一年級學生數之長條圖

證 64:線形圖:線形圖可用來呈現兩個量的變項之間之關係,自變項和依變項都是連續 變項,自變項畫在橫軸(X 軸),依變項畫在縱軸(Y 軸)。兩個軸均須有測量單 位及刻度。線形圖允許內插及外插法。例如在彈性限度內,物重與彈簧長度的關 係。 證 65:散布圖:自變項和依變項都是連續變項,散佈圖是用來描述雙變項分布情形之直 角座標圖。圖內只畫出座標點,點與點之間不加連接線。從散佈圖之形狀可看出 兩個變項是否有關聯,以及是否為線性關聯,另外也可以找出是否有某些「離群 值」(outliers)會嚴重影響兩變項之相關係數(如下圖)。

證 66:直方圖:直方圖是用於分組數量的自變項,依變項是連續變項,各長方形之間沒 有空隙。直方圖的各長方形之高度及寬度分別代表各組之次數及組距,所有長方 形面積之總和就是總樣本數(如下圖)。

(16)

證 67:盒形圖:也稱為「長鬚圖」,適合大型數據時使用,可以用來說明次數分配之某 些特點。盒形圖畫在第一個四分位數(Q1)及第三個四分位數(Q3)之間,盒 內還有一條代表中位數的線。兩條鬚狀線分別從第一及第三兩個四分位數延伸至 代表極端值的點(如下圖)。

證 68:多變項:立體圖較容易看出多變項各點在立體座標的確實位置(如下圖)。

證 69:其他形式的呈現:可以轉成對數數值以符合參數統計所要求的常態分配假定,例 如:臨床醫學或天氣圖的數據就常作對數轉換。

(17)

2. 使用統計方法處理數據 許多統計方法主要用以處理三個問題:(

1

)兩群數據平均不同嗎?或只是機率問 題?(

2

)在另外重複實驗的情況,數據會改變嗎?(

3

)兩群數據有關聯嗎? 統計方法需考慮在可能的機率中,數據變異的可能性,然後再呈現結果。並且統計 分析是依賴在數據形式、數據分布及樣本大小的不同,而一般使用的統計數據分析方法 有以下幾種。 證

70

:平均值的差異:平均數差異之

t

檢定(

t-test

),主要用在數據為常態(或接近常 態)分布,兩個樣本平均數差異之假設檢定,又區分為獨立樣本或相依(配對) 樣本兩種情形,當採用配對設計時,兩組樣本的依變項會產生相關,因此也稱之 為相依或相關樣本設計,重複測量也可以使用配對考驗。 證

71

:變異數分析:變異數分析是檢定兩組數據或多組數據平均數差異之顯著性的統 計方法,可用來檢定屬於類別變項的實驗,處理自變項對依變數是否有影響。 證

72

:直線或非直線的回歸:自變項是連續變項,為一種統計學上分析數據的方法,目 的在了解一個或數個自變項與依變項是否有相關、相關方向與強度,並建立數學 方程式,回歸分析可導出最適線。 證

73

:非參數統計:當群體分布未知且不是常態分布,或樣本太小所使用的統計推論方 法,稱為非參數統計或無母數統計。無母數統計主要是使用「排序」作計算,

Mann-Whitney U

是常用的非參數統計法,用於檢定兩數據的「平均排序」是否 有顯著差異,也就是將原始分數轉成排序,然後檢驗當母群排序相同時,會出現 樣本平均排序之差異的機率。 證

74

:類別數據:自變項與依變項都是類別變項時,可用卡方檢定。 3. 數據的趨勢及關係 檢查數據的潛在模式,變項的模式代表它在物理世界的趨勢,趨勢可用表格、圖形 或適當的統計分析呈現。數據的理解及關係趨勢有它的極限,不能過度推論或暗指因果 關係。 證

75

:趨勢的種類:變項的關係有因果、順序、間接相關和「機率關聯」。「機率關聯」 是數據會隨時間改變,且是碰巧的改變,所以對於趨勢的改變要保持質疑態度。 而統計檢定可以帶出合理的評估。例如:在大型的數據中,會有關聯,某些可能 是機率關聯,即便

X

Y

是高度相關,

X

也不一定是造成

Y

的原因,

Y

也可能 是形成

X

的原因,或

Z

也可能才是造成

X

Y

的原因。 證

76

:線性關係:

Y

mX

C

,斜率可能正或負而垂直或水平是特例,數據可用表格或

(18)

77

:比例關係:

Y

mX

,是線性關係的特例,例如:虎克定律,在彈性限度內

F

kX

外力與伸長量成正比。 證

78

:可預測的曲線:這個趨勢可代表系統中重要的規律,像曲線的預測關係式

Y

X

2,例如:自由落體高度與時間的關係,或車子輪胎的摩擦係數固定,則煞車 距離和車子速率的平方成正比。 證

79

:複雜曲線:曲線的不同部分可用數學建模方式建立近似關係,例如:虎克定律在 超過彈性限度時所呈現的彎曲圖形。 證

80

:實證關係:趨勢可能很難用數學模型建立關係,但可以完全是實證基礎,例如: 交通流量是一天中的時間函數。 證

81

:異常值:圖表會顯示異常值,在判斷趨勢時需做考量,例如:測量時,人為誤差 是很難避免的,就要決定數據的排除與否。 證

82

:最適線:回歸線可找出基本關係,讓折線變成平滑線,以去掉固有不能控制的變 異及人為誤差。

(三)評價整個調查研究數據的信、效度

首先,需要注意兩個問題:

1.

數據可信嗎?

2.

數據有效嗎?要理解上面兩個問題, 則從證據概念的圓心開始,每個概念都得考慮,如何選擇測量儀器、基本的資料或數據 的測量、評價研究設計有關的測量及如何呈現數據和趨勢的理解等。

四、數據變成證據

數據要變成證據,需要與其他的測量方法比較。 證

83

:一系列的實驗:也許實驗的準確度沒有很高,但系列的實驗可增加數據的信、效 度。 證

84

:二手數據:與他人的數據比較,可提供有價值的證據,也可當作後設分析使用。 證

85

:三角驗證:不同的研究方法比較,可增加證據的效度。

五、社會因素

評估證據必須考量個人及社會經驗和調查研究者的地位,而面對證據需要做判斷 時,仍然還有社會、文化、經濟等因素的影響需要考量。 證

86

:證據的可信性:可信性包含表面效度,如:傳統觀念、一般常識、個人經驗等。 如果關於證據的科學共識或理論所支持的證據成分增加時,這個證據的信度就增 加。不同證據型態,也會呈現不同的信度,例如:統計數字的信度相對於傳說軼 聞信度,兩者之間就有不同。

(19)

87

:後果的實用性:證據的含義具有實用性用途和成本效益,實用性越大,則會要求 更高標準及有信、效度的證據。例如:藥品的副作用可能勝過藥品的實際用途, 而危害到病人(絕症患者除外),那這個藥品的使用性就會降低。又如:加拿大 與美國邊界處,探討造成酸雨來源的證據,因為加拿大位於美國邊界是屬於下風 處,美國工業界會要求更大程度證據的確定性,如果:美國工廠排放的硫化物含 量飄入加拿大、則美國工業界將需要花費大量的金錢在污染減量的設備上,這牽 涉到經濟的發展。 證

88

:實驗者偏見:實驗者本身具有的偏見,而偏見的原因像研究資金的來源、個人知 識的僵化、效忠「科學」意識形態、宗教主義信仰、資本主義傾向等。例如:煙 草公司贊助的研究否定有關癌症與抽煙的相關,或由綠色和平組織贊助的研究, 認為基改食物對健康有影響,或加拿大邊界酸雨的問題,牽涉了可能受惠國家, 因此偏見也跟利益有關,誰有受惠?誰加重負擔? 證

89

:權力結構:證據可能因為政治或有影響力團體的操作,而被不適當的加權或過於 輕率的放棄。有時候人會被過去的經驗影響,而喪失對政府、機關團體、企業界 或利益團體的信任。例如:頂新集團所產生的劣質油含有銅葉綠素,以致

2014

年全國發起抵制味全的活動。 證

90

:實踐範式(

Paradigms of practice

):不同的研究領域有不同的範式,工程學家的 操作觀點可能不同於科學家,因此證據收集的觀點在不同領域之中可能有所不 同,例如:理論科學家可能會有比較充分的時間,使用證據當作論據去推展理論 模型,而一個為非政府組織工作的科學家,卻必須在短時間內使用證據解決身邊 的問題。因此理論科學家有多餘的心力,訂定更高的證據標準以產生高信度及高 效度的證據規範。 證

91

:結果的可接受性:證據可能因為一些不合邏輯的理由,而被否定或放棄,因為 公眾會有害怕的心理或政治恐懼,擔心產生不好的結果。這些都是因為偏見及先 入為主的觀念,造成干擾對證據的接受度。例如:

1980

年代的加拿大紅十字會 對於愛滋病由輸血傳染的證據就很難接受,而歐洲則有狂牛症及交通污染的案 例,

2012

年我國政府開放美國牛肉進口的政策,狂牛症是否會傳染人類?就曾 引發社會大眾的重視與恐慌。 證

92

:實驗者的身分地位:學術及專業的經驗或實驗者的權威,可能影響證據的重要 性。例如:諾貝爾奬得主所提供的證據就容易被他人接受;同時法庭上請來當作 證人者,大部分都是具有權威的專家或學者。

(20)

證 93:結論的有效性:結論必須受限於有效的數據,不能無限的推論。使用插補及外 推都要小心,臨床藥物實驗可能只限於實驗的樣本,例如:某種心臟藥物對男性 的試驗,可能就無法適用於女性心臟病患者。

肆、結論

全國中小學的老師,對於如何進行 108 課綱之探究與實作課程內容,可以證據概念 作為背景知識,以建立更高品質的探究課程。此架構具兩個重要觀念(圖 5),一、由中 心的實驗數據往外層建立結論的主張,也就是「往外看(looking forward)」,在一個反 覆對研究問題尋找證據的過程中,最後能建立以證據為基礎的主張,事實上這個往外看 的過程,是一個開放式的探究過程。二、「由外往內看(looking back)」,一個具有科學 素養的公民,當面臨具爭議的社會科學議題時,就必須向內看,從最外層的這個主張(或 宣稱)開始探究,產生對證據的懷疑跟評價證據的使用,以相同的證據概念進行實驗, 這才是所謂的科學素養。

圖5 以證據為基礎的主張,往外看及往內看證據概念清單的架構

(Gott 與 Roberts, 2008)

以證據概念為基礎 所提出的主張 探究過程(往外) 從數據經由實驗設計到主張

科學素養(往內) 從有主張的探究回推數據

(21)

參考文獻

教育部(

2014

)。十二年國民基本教育課程綱要。臺北:教育部。 教育部(

2018

)。

12

年國民基本教育課程綱要國民中小學暨普通型高級中等學校—自 然科學領域。臺北:教育部。 陳美智、洪振方(

2018

)。高一學生科探究能力對論證預測效果之研究:以科學證據概 念為中介變項。高雄師大學報,45,

43-84

Glaesser, J., Gott, R., Roberts, R., & Cooper, B. (2009). Underlying success in open-ended

investigations in science: using qualitative comparative analysis to identify necessary

and sufficient conditions.

Research in Science and Technological Education, 27

(1), 5-30.

Gott, R. & Roberts, R. (2008).

Concepts of evidence and their role in open ended practical

investigations and scientific literacy.

Background to published papers. Durham

University. Durham.

Gott, R., Duggan, S., Roberts, R., & Hussain, A. (2015).

Research into Understanding

Scientific Evidence

. Available on https://www.dur.ac.uk/resources/education/research/

Evidencetestcoding.pdf Accessed Dec. 8th 2018

Jeong, H. Songer, N.B., Lee, S-Y. (2007). Evidentiary competence: sixth graders’

understanding for gathering and interpreting evidence in scientific investigations.

Research in Science Education

,

37

(1), 75-97.

Kuhn, L. & Reiser, B. (2005).

Students constructing and defending evidence-based scientific

explanations.

Paper presented at the annual meeting of the National Association for

Research in Science Teaching, Dallas, TX.

Roberts, R. (2017). Understanding evidence in scientific disciplines: identifying and mapping

‘the thinking behind the doing’ and its importance in curriculum development.

Practice

and Evidence of Scholarship of Teaching and Learning in Higher Education Special

Issue: Threshold Concepts and Conceptual Difficulty

,

12

(2), 411-429.

Roberts, R., Gott, R., & Glaesser, J. (2010). Students' approaches to open-ended science

investigation: The importance of substantive and procedural understanding.

Research

Papers in Education, 25

(4), 377-407.

Schwichow, M., Croker, S., Zimmerman, C., H€offler, T., & H€artig, H. (2016). Teaching the

control-of-variables strategy: a meta-analysis.

Developmental Review

,

39

, 37-63.

參考文獻

相關文件

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

Hope theory: A member of the positive psychology family. Lopez (Eds.), Handbook of positive

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =>

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most

Monopolies in synchronous distributed systems (Peleg 1998; Peleg

Corollary 13.3. For, if C is simple and lies in D, the function f is analytic at each point interior to and on C; so we apply the Cauchy-Goursat theorem directly. On the other hand,