音樂評量研究的啟示

第三章口譯與音樂表演教學評量概述

第三節音樂評量研究的啟示

而目前口譯評量的研究十分有限，而且許多評分的原則、規準或方式，乃依據實務或教學經驗自行設計，甚少參考相關的教學理論，也缺乏實證研究的檢驗 (葉舒白與劉敏華，2006；Sawyer, 2004)，種種現象，令人憂心。有鑑於此，研究人員實有必要加強這方面的研究，

或可參考其他相關領域的研究方法，透過對照，以了解本身研究目前的進展以及未來可以努力的方向。

第三節、音樂評量

在許多音樂表演的場域裡，包括甄選會、期末公開發表會或是各式音樂比賽，皆採取實作評量的方式以評定參與者的表現 (Zdzinski

& Barnes, 2002)，評審必須就表演者當場所展現的各種特質，提供個人的判斷，並賦予分數、名次或是講評 (McPherson & Thompson, 1998)。然而音樂評量在運作的過程中，並不如想像中的容易，許多學者認為音樂表演會因為不同的表演者產生相異的表現方式，加上不同的評審也有各自對表演的詮釋，因此，音樂評量很難真正做到客觀 (Daniel, 2001；Zdzinski & Barnes, 2002；Fink, 2006)。此外音樂評量中另一個廣為討論的議題為評量的效度和信度。簡單來說，效度是指可以測量到所欲測量的項目的程度，也就是評量的正確度或是有效的程度，信度則是指評量的穩定性和一致性 (Stanley et al., 2002)；過去

的音樂評量研究中，學者紛紛針對評審間的信度問題以及評量規準的信效度提出疑問並進行實證研究。以下簡單描述過去幾十年的音樂評量研究發展，並就其中主要的困難加以闡述及討論。

一、音樂評量發展

音樂評量制度的發展歷程至今至少有五十年的歷史，早期的音樂評量常使用整體表現評量制度 (holistic assessment) 作為評量工具，

通常評分者會根據個人的標準或是參考學校制訂的規準，評鑑音樂家的整體表現並給予一個分數 (Mills, 1991)。但是隨著評量制度的發展，研究人員逐漸意識到評分者給予的單一分數無法讓人了解其評分的依據，畢竟音樂家的演出涵蓋了各式技巧，其高分究竟是得自其音色圓潤、或是指法正確、抑或是詮釋感人，光靠一個整體分數並不能顯示出得高分的原因；Fiske (1983)甚至認為許多評分者本身也不清楚自己給分的標準。有鑑於此，學者開始研究如何制訂一套合理的評量規準以及評量工具以加強評量的信度及效度，這種以一套包含許多項目的評量規準量尺以檢定音樂表演的系統稱為個別規準評量制度 (criteria-based assessment)。

(一)個別規準評量制度的內容

個別規準評量制度的目的是企圖找出整體表現評量制度無法提供的評量規準，以作為評鑑音樂家表現的依據 (Zdzinski & Barnes, 2002)。此類的研究經常採用因素分析的技術，找出某一樂器表演背後的因素結構，一旦確立此結構後，再分別設定各個因素所包含的個別項目(item)，以建立因素分量表 (factor subscale)，各個項目的評分則採用李克特量表 (Likert-type scale) 以供評審在進行評量時使用 (Bergee, 2003)。這類評量制度的好處是比較客觀，而且可以利用統計工具了解是否達到信效度 (Stanley et al., 2002)。

個別規準評量制度早先有 Abeles (1973) 開始研究單簧管的評量規準之效度，之後其他研究人員陸陸續續展開一連串針對特定樂器的評量研究；舉例來說，Fiske (1977)討論可能影響小號評量信度的因素，Bergee (1987) 則仿照 Abeles 的做法，建立了一套低音號的評量規準，之後並應用到其他銅管樂器 (Bergee, 1988)，此類學者的共同點為使用因素分析以找出評量規準。延續這類作法，Nichols (1985) 發展小鼓的評量制度，Jones (1986) 則研究獨唱表演的評量規準，

Horowitz (1994) (見 Zdzinsky et al., 2002) 將其應用在爵士吉他，

Zdzinsky & Barnes (2002) 則把焦點放在弦樂器上。在採用因素分析

法找出音樂表演的評量規準時，研究人員也十分重視評量方式的信效度，多利用統計工具檢驗各評量規準的效度及評審間的信度 (Bergee, 2003)，並根據分析的結果，做為之後改進規準設計的依據。

個別規準評量制度除了可檢視信效度之外，另一個好處是可解釋評審在評分時的判斷標準，一方面提供了客觀的指標，另一方面更可回應表演者，供其做參考。Saunders (1993) 所設計的個別規準量尺用意即是讓表演者透過評審的評論，更清楚地了解自己演奏的優缺點，

如此一來，表演者可參考評審的回應改進自己的表演方式，精益求精。舉例來說，Saunder 的管樂獨奏量尺中的技術大類之下列出了五個敘述，每個描述為兩分；評審聆聽表演者的演奏並決定是否符合句子描述，若是則在符合的描述上打勾，全部符合者即可在技術大類得到十分：

□ 適當正確的點舌 □ 照譜吹重音 □ 照譜吹圓滑音 □ 照譜吹裝飾音

□ 照譜吹正確的音長 (如：斷音、長音)

(二)針對個別規準評量制度的批評

雖然個別規準評量制度因為在某些程度上可解決主觀性以及信效度的問題而廣為研究人員採用，但許多支持整體表現評量制度的學者仍質疑其功能，認為個別規準評量制度無法看到表演的全面，不一定比較客觀，信效度也不見得比較高 (Stanley et al., 2002)，紛紛提出各自的論點以反駁個別規準評量制度。

1. 片段與全面

Mills (1991) 認為個別規準評量制度將音樂表演切成一個個項目加以評分，並以一個數學公式來解釋這種看法：

技巧 + 詮釋 = 表現 (Skill + Interpretation = Performance)

Mills (1991)主張規準細項並不是一場音樂表現的全貌，在選擇某些作為規準的項目時，可能忽略其他音樂表演的元素。更重要的是，在欣賞音樂表演時，人類的感受是來自整體演出的印象，而不是一一分析音樂家做到了哪些技巧；Mills (1991) 表示當人們敘述對某一個音樂演出的感覺時，往往是先陳述一個概括性的感受，之後才一一探究音樂家各種技巧的展現，而不是先研究音符、旋律等是否演奏無誤，再加總起來判定自己是否喜歡這場演出，因此認為「表現」當然不只是

「技巧」與「詮釋」的加總而已。

Swanwick (1996) 延續 Mills 的看法，進一步強調音樂表演的複雜性無法只用幾個評量規準來界定；將一場音樂表演分成「技巧」、「詮釋」與「風格」，再把各自的得分加總起來，以此總分評定音樂家的演出，這樣的做法沒有意義。舉例來說，兩個音樂家，一個可能技巧十分、詮釋五分，另一個可能技巧五分、詮釋十分，兩人的總得分相同，可是表現手法卻是天差地遠。因此，Swanwick (1996) 認為個別規準評量制度把不同項目的得分加總起來的同時，也喪失了音樂表演中很多重要的訊息。

Dixon (2000) (見 Stanley et al., 2002) 認為評量音樂表演的規準無法完整逐一列出，因為每個項目都能夠再進一步拆解成更細的子項目；當學者把一場複雜的音樂演出簡化成用幾個規準來檢視時，所得到的結果也只能代表這場表演的片面，因此認為這些不完整的規準是人們自我意識形態與偏見的產物，雖然便於使用但所反映的卻不是真實的情形。

Stanley 等人 (2002) 針對雪梨音樂學院 (Sydney Conservatorium of Music) 的研究則發現，過多瑣碎的規準細項會妨評分過程。當評分者忙著比對表演者的表現是否符合各項評分規準的敘述時，可能無法專心聆聽音樂或是顧此失彼，忽略表演中其他技巧及情感的展現。

2. 主觀與客觀

Mills (1991) 表示整體評量制度常被詬病的一點，乃為太過依賴評分人主觀判斷、不夠客觀。對此 Mills 提出反駁，表示所有評量制度多少都有主觀因素存在，因為評分者都是人，只要是人就會有主觀的意識運作。即使是有標準答案的紙筆測驗，題型也是由人設計出來的，不同的出題者會設計出不同的題目，也有可能影響到受試者最後的成績。事實上，Mills (1991) 認為人類運用自我的判斷以進行評分並不是壞事，而且即使採用個別評分規準制度還是會有個人意識的運作，因此整體評量制度不見得就比較主觀。

Johnson (1997) 指出研究人員不斷地改良個別規準評量制度，目的之一是為了追求評量的客觀性，但是在評分的過程中，評分者還是會主觀地詮釋各個評分規準的意義，並主觀決定音樂家的表現是否符合規準的敘述。因此，看似客觀的個別規準評量制度事實上只是創造了客觀的假象，因為最終還是得仰賴評分者主觀的判斷。

3. 信度

Fiske (1975) 研究小號表演中不同評審團的評量差異，發現個別規準的得分與加總的總得分之間有顯著正相關，Fiske (1977) 的後續

相關研究發現，不同評審所給的總得分之間呈現一致性，然而對於個別項目，諸如節奏、技巧等的共識卻較低，也就是說不同評審間的總得分信度比個別項目的信度來得高，因此提倡以整體表現評量制度作為音樂評量的工具 (Fiske, 1977)。

Mills (1991) 研究整體表現評量制度的單一得分與個別規準評量制度的加總得分之間的關係。29 位評分者分成兩組評鑑 10 場不同樂器的獨奏演出，採用兩種評量制度，其一是給予一個整體表現的總分，其二為替 12 個評量規準項目打分數。Mills 利用多元迴歸分析以整體總分當作因變數，12 個評量規準的得分作為自變數，發現自變數對因變數的解釋能力達 71%，顯示這兩種評量制度之間有許多共通性。此外，比較兩組評分人員的評分結果皆無顯著差異，可說明整體評分法具有信度 (Mills, 1991)。

(三)未來研究方向

根據上面的討論，無論是整體表現評量制度或是個別規準評量制度都有其優點及侷限，Swanwick (1996) 建議評分規準可以仿照一般人聆聽完音樂表演後給的評語，以敘述的方式呈現，提供對於表演的整體性觀感，由劣到優一共可分為八級 (表 3.3)，可提供評分者參考

在文檔中口譯教學評量：與音樂表演評量之比較研究 (頁 73-114)

第三章 口譯與音樂表演教學評量概述

第三節 音樂評量研究的啟示

第三章口譯與音樂表演教學評量概述

第三節音樂評量研究的啟示