• 沒有找到結果。

音樂評量研究的啟示

第三章 口譯與音樂表演教學評量概述

第三節 音樂評量研究的啟示

而目前口譯評量的研究十分有限,而且許多評分的原則、規準或方 式,乃依據實務或教學經驗自行設計,甚少參考相關的教學理論,也 缺乏實證研究的檢驗 (葉舒白與劉敏華,2006;Sawyer, 2004),種種 現象,令人憂心。有鑑於此,研究人員實有必要加強這方面的研究,

或可參考其他相關領域的研究方法,透過對照,以了解本身研究目前 的進展以及未來可以努力的方向。

第三節、音樂評量

在許多音樂表演的場域裡,包括甄選會、期末公開發表會或是各 式音樂比賽,皆採取實作評量的方式以評定參與者的表現 (Zdzinski

& Barnes, 2002),評審必須就表演者當場所展現的各種特質,提供個 人的判斷,並賦予分數、名次或是講評 (McPherson & Thompson, 1998)。然而音樂評量在運作的過程中,並不如想像中的容易,許多 學者認為音樂表演會因為不同的表演者產生相異的表現方式,加上不 同的評審也有各自對表演的詮釋,因此,音樂評量很難真正做到客觀 (Daniel, 2001;Zdzinski & Barnes, 2002;Fink, 2006)。此外音樂評量 中另一個廣為討論的議題為評量的效度和信度。簡單來說,效度是指 可以測量到所欲測量的項目的程度,也就是評量的正確度或是有效的 程度,信度則是指評量的穩定性和一致性 (Stanley et al., 2002);過去

65

的音樂評量研究中,學者紛紛針對評審間的信度問題以及評量規準的 信效度提出疑問並進行實證研究。以下簡單描述過去幾十年的音樂評 量研究發展,並就其中主要的困難加以闡述及討論。

一、 音樂評量發展

音樂評量制度的發展歷程至今至少有五十年的歷史,早期的音樂 評量常使用整體表現評量制度 (holistic assessment) 作為評量工具,

通常評分者會根據個人的標準或是參考學校制訂的規準,評鑑音樂家 的整體表現並給予一個分數 (Mills, 1991)。但是隨著評量制度的發 展,研究人員逐漸意識到評分者給予的單一分數無法讓人了解其評分 的依據,畢竟音樂家的演出涵蓋了各式技巧,其高分究竟是得自其音 色圓潤、或是指法正確、抑或是詮釋感人,光靠一個整體分數並不能 顯示出得高分的原因;Fiske (1983)甚至認為許多評分者本身也不清楚 自己給分的標準。有鑑於此,學者開始研究如何制訂一套合理的評量 規準以及評量工具以加強評量的信度及效度,這種以一套包含許多項 目的評量規準量尺以檢定音樂表演的系統稱為個別規準評量制度 (criteria-based assessment)。

66

(一)個別規準評量制度的內容

個別規準評量制度的目的是企圖找出整體表現評量制度無法提 供的評量規準,以作為評鑑音樂家表現的依據 (Zdzinski & Barnes, 2002)。此類的研究經常採用因素分析的技術,找出某一樂器表演背 後的因素結構,一旦確立此結構後,再分別設定各個因素所包含的個 別項目(item),以建立因素分量表 (factor subscale),各個項目的評分 則採用李克特量表 (Likert-type scale) 以供評審在進行評量時使用 (Bergee, 2003)。這類評量制度的好處是比較客觀,而且可以利用統計 工具了解是否達到信效度 (Stanley et al., 2002)。

個別規準評量制度早先有 Abeles (1973) 開始研究單簧管的評量 規準之效度,之後其他研究人員陸陸續續展開一連串針對特定樂器的 評量研究;舉例來說,Fiske (1977)討論可能影響小號評量信度的因 素,Bergee (1987) 則仿照 Abeles 的做法,建立了一套低音號的評量 規準,之後並應用到其他銅管樂器 (Bergee, 1988),此類學者的共同 點為使用因素分析以找出評量規準。延續這類作法,Nichols (1985) 發展小鼓的評量制度,Jones (1986) 則研究獨唱表演的評量規準,

Horowitz (1994) (見 Zdzinsky et al., 2002) 將其應用在爵士吉他,

Zdzinsky & Barnes (2002) 則把焦點放在弦樂器上。在採用因素分析

67

法找出音樂表演的評量規準時,研究人員也十分重視評量方式的信效 度,多利用統計工具檢驗各評量規準的效度及評審間的信度 (Bergee, 2003),並根據分析的結果,做為之後改進規準設計的依據。

個別規準評量制度除了可檢視信效度之外,另一個好處是可解釋 評審在評分時的判斷標準,一方面提供了客觀的指標,另一方面更可 回應表演者,供其做參考。Saunders (1993) 所設計的個別規準量尺用 意即是讓表演者透過評審的評論,更清楚地了解自己演奏的優缺點,

如此一來,表演者可參考評審的回應改進自己的表演方式,精益求 精。舉例來說,Saunder 的管樂獨奏量尺中的技術大類之下列出了五 個敘述,每個描述為兩分;評審聆聽表演者的演奏並決定是否符合句 子描述,若是則在符合的描述上打勾,全部符合者即可在技術大類得 到十分:

□ 適當正確的點舌 □ 照譜吹重音 □ 照譜吹圓滑音 □ 照譜吹裝飾音

□ 照譜吹正確的音長 (如:斷音、長音)

68

(二)針對個別規準評量制度的批評

雖然個別規準評量制度因為在某些程度上可解決主觀性以及信 效度的問題而廣為研究人員採用,但許多支持整體表現評量制度的學 者仍質疑其功能,認為個別規準評量制度無法看到表演的全面,不一 定比較客觀,信效度也不見得比較高 (Stanley et al., 2002),紛紛提出 各自的論點以反駁個別規準評量制度。

1. 片段與全面

Mills (1991) 認為個別規準評量制度將音樂表演切成一個個項目 加以評分,並以一個數學公式來解釋這種看法:

技巧 + 詮釋 = 表現 (Skill + Interpretation = Performance)

Mills (1991)主張規準細項並不是一場音樂表現的全貌,在選擇某些作 為規準的項目時,可能忽略其他音樂表演的元素。更重要的是,在欣 賞音樂表演時,人類的感受是來自整體演出的印象,而不是一一分析 音樂家做到了哪些技巧;Mills (1991) 表示當人們敘述對某一個音樂 演出的感覺時,往往是先陳述一個概括性的感受,之後才一一探究音 樂家各種技巧的展現,而不是先研究音符、旋律等是否演奏無誤,再 加總起來判定自己是否喜歡這場演出,因此認為「表現」當然不只是

「技巧」與「詮釋」的加總而已。

69

Swanwick (1996) 延續 Mills 的看法,進一步強調音樂表演的複 雜性無法只用幾個評量規準來界定;將一場音樂表演分成「技巧」、「詮 釋」與「風格」,再把各自的得分加總起來,以此總分評定音樂家的 演出,這樣的做法沒有意義。舉例來說,兩個音樂家,一個可能技巧 十分、詮釋五分,另一個可能技巧五分、詮釋十分,兩人的總得分相 同,可是表現手法卻是天差地遠。因此,Swanwick (1996) 認為個別 規準評量制度把不同項目的得分加總起來的同時,也喪失了音樂表演 中很多重要的訊息。

Dixon (2000) (見 Stanley et al., 2002) 認為評量音樂表演的規準無 法完整逐一列出,因為每個項目都能夠再進一步拆解成更細的子項 目;當學者把一場複雜的音樂演出簡化成用幾個規準來檢視時,所得 到的結果也只能代表這場表演的片面,因此認為這些不完整的規準是 人們自我意識形態與偏見的產物,雖然便於使用但所反映的卻不是真 實的情形。

Stanley 等人 (2002) 針對雪梨音樂學院 (Sydney Conservatorium of Music) 的研究則發現,過多瑣碎的規準細項會妨評分過程。當評 分者忙著比對表演者的表現是否符合各項評分規準的敘述時,可能無 法專心聆聽音樂或是顧此失彼,忽略表演中其他技巧及情感的展現。

70

2. 主觀與客觀

Mills (1991) 表示整體評量制度常被詬病的一點,乃為太過依賴 評分人主觀判斷、不夠客觀。對此 Mills 提出反駁,表示所有評量制 度多少都有主觀因素存在,因為評分者都是人,只要是人就會有主觀 的意識運作。即使是有標準答案的紙筆測驗,題型也是由人設計出來 的,不同的出題者會設計出不同的題目,也有可能影響到受試者最後 的成績。事實上,Mills (1991) 認為人類運用自我的判斷以進行評分 並不是壞事,而且即使採用個別評分規準制度還是會有個人意識的運 作,因此整體評量制度不見得就比較主觀。

Johnson (1997) 指出研究人員不斷地改良個別規準評量制度,目 的之一是為了追求評量的客觀性,但是在評分的過程中,評分者還是 會主觀地詮釋各個評分規準的意義,並主觀決定音樂家的表現是否符 合規準的敘述。因此,看似客觀的個別規準評量制度事實上只是創造 了客觀的假象,因為最終還是得仰賴評分者主觀的判斷。

3. 信度

Fiske (1975) 研究小號表演中不同評審團的評量差異,發現個別 規準的得分與加總的總得分之間有顯著正相關,Fiske (1977) 的後續

71

相關研究發現,不同評審所給的總得分之間呈現一致性,然而對於個 別項目,諸如節奏、技巧等的共識卻較低,也就是說不同評審間的總 得分信度比個別項目的信度來得高,因此提倡以整體表現評量制度作 為音樂評量的工具 (Fiske, 1977)。

Mills (1991) 研究整體表現評量制度的單一得分與個別規準評量 制度的加總得分之間的關係。29 位評分者分成兩組評鑑 10 場不同樂 器的獨奏演出,採用兩種評量制度,其一是給予一個整體表現的總 分,其二為替 12 個評量規準項目打分數。Mills 利用多元迴歸分析以 整體總分當作因變數,12 個評量規準的得分作為自變數,發現自變 數對因變數的解釋能力達 71%,顯示這兩種評量制度之間有許多共通 性。此外,比較兩組評分人員的評分結果皆無顯著差異,可說明整體 評分法具有信度 (Mills, 1991)。

(三)未來研究方向

根據上面的討論,無論是整體表現評量制度或是個別規準評量制 度都有其優點及侷限,Swanwick (1996) 建議評分規準可以仿照一般 人聆聽完音樂表演後給的評語,以敘述的方式呈現,提供對於表演的 整體性觀感,由劣到優一共可分為八級 (表 3.3),可提供評分者參考

根據上面的討論,無論是整體表現評量制度或是個別規準評量制 度都有其優點及侷限,Swanwick (1996) 建議評分規準可以仿照一般 人聆聽完音樂表演後給的評語,以敘述的方式呈現,提供對於表演的 整體性觀感,由劣到優一共可分為八級 (表 3.3),可提供評分者參考

相關文件