國立臺中教育大學教育測驗統計研究所理學碩士論文
指導教授: 施慶麟 博士
楊志堅 博士
美感品味能力量表之編製
—以大學生為例
研究生:張淑芬 撰
中華民國 一百年 六月
誌謝
說到感謝,心中自然有千萬分的感謝說不盡。首先非常感謝指導教授施慶 麟老師及楊志堅老師這兩年的指導與提攜,帶領著我進行學術專業領域的研究, 更感謝口試委員提供寶貴的學術意見;此外也感謝這一路以來所有授課教師的指 導,才能夠成就今天。特別感謝在這研究過程中所有協助施測的專家、人員與學 校,此外更特別感謝學長姐給了許多實務方式的指導,在我最需要幫忙的時候, 能夠適時的主動予以協助。另外也感謝這一路以來陪伴在身邊的家人、同學及好 友,因為有你們體貼的協助,讓我可以專心投入心思在研究中;也因為有你們的 默默的等待,更讓我有動力的繼續往前,不至於耽誤了論文進度。 這麼多人的支持與鼓勵,點滴都在我心頭。我由衷的感謝,感謝每一位在學 術之路幫助過我的人。 張淑芬 謹誌於 臺中教育大學測驗與統計研究所 民國一百年六月摘要
鑑於大學生在美感品味能力上的表現逐漸展現出個人的獨特性、創造力及多 元化,因此結合多位學者與教育部編定藝術與人文學習成效評量,編製大學生美 感品味能力量表,並經由專家效度修正後,一共分為三大分量表:認知與察覺、 探究與審美及實踐與應用。大學生美感品味能力預試量表,一共編製 25 題試題, 施測對象為某大學學生,一共收回 279 份有效樣本;預試結果信度值為 0.91,以 Mplus 進行驗證性因素分析 TLI 為 0.862。因大學多包含多個核心能力,因此透過 量化與質性試題分析,最終形成 10 題正式量表,正式施測有效回收樣本為 1277 份;正式量表信度值為 0.85,TLI 值為 0.972,整體量表信效度的表現良好。經由 ConQuest 軟體再次進行 Rasch 分析,在 RSM 模式下,以模式適配指標情形顯示, MNSQ 值皆介於 0.6~1.4 之間,顯示試題的適配度極佳,試題皆能與該向度吻合; 試題難度的估計值介於1.70 ~0.25 之間,即難度偏易,顯示本研究編擬之大學生 美感品味能力量表,具有良好的信、效度。 關鍵字:美感品味、Rasch 模式、量表Establishment of Aesthetic Scale for
University Students
Abstract
In view of the fact that the performance in aesthetic of university students gradually showed the uniqueness, creativity and diversity, this study aimed to develop an aesthetic scale for university students. The scale is divided into three subscales: cognitive and perceived、inquiry and aesthetic、practice and application. The Pretest questionnaire consists of 25items , a sample of 279 university students were included in the pretest and found the conditional reliability is 0.91 and TLI is 0.862. After the quantitative and qualitative analysis, the official scale consists of 10 questions, formally applied for 1277 valid samples. The conditional reliability is 0.85 and TLI is 0.972, which indicates the scale have high degree of reliability and validity. Furthermore ,the MNSQ for each item falls between 0.6 to 1.4, which indicates that all items fit Rasch model.目 錄
誌謝... I 摘要...II Abstract ... III 目 錄... IV 表目錄... VI 圖目錄... VII 第一章 緒論 ...1 第一節 研究背景與動機 ...1 第二節 研究目的 ...3 第二章 文獻探討 ...4 第一節 美感品味能力相關研究 ...4 第二節 量表編製原則與做法...9 第三節 Rasch 模式 ... 11 第三章 研究設計與實施...14 第一節 研究架構與設計 ...14 第二節 研究對象 ...15 第三節 研究工具 ...16 第四章 研究結果 ...18 第一節 預試量表信效度與 Rasch 分析 ...18 第二節 正式量表信效度與 Rasch 分析 ...24 第五章 結論與建議 ...27 第一節 結論...27 第二節 建議...28表目錄
表 1 RSM 的參數估計值與試題適配度:大學生美感品味能力預試量表...20
表 2 性別 DIF 參數估計值:大學生美感品味能力預試量表 ...22
表 3 RSM 的參數估計值與試題適配度:大學生美感品味能力正式量表 ...25
圖目錄
圖 1 「藝術與人文」課程主軸與目標結構(教育部藝術教育評量網) ...9 圖 2 研究架構圖 ...14
第一章 緒論
內田廣由記是日本視覺設計研究所創辦人,他曾經說過一句話:「設計的時 代,其實就是美的時代。在商業世界裡,不美,就無法說服人、也不能得到共鳴; 不美,就不能獲得信賴關係。」從這句話當中,不難感受到美感所產生的力量。 美感品味能力可以說是人類的生活方式,舉凡生活中大小瑣碎的事物,都能與美 感產生關係,例如:穿著、生活用品擺設、收藏品、溝通表達……等,都足以顯 示出美感能力與生活有著密切關係。換句話說,美的教育應該融入在生活中。在 大學生過去的求學生涯中,文學藝術的薰陶以及藝能的操作與練習上較少有時間 與機會接觸,另一方面則是大學生的視野與成熟度促使他們對於美感與情意的開 發充滿著好奇心,因此美感與情意教育逐漸深受大學生的歡迎。本研究旨在探討 大學生美感品味能力量表的現況分析。以下本章共分為兩節說明研究之源起:第 一節為研究背景與動機,第二節為研究目的。第一節 研究背景與動機
德國著名的美育哲學家席勒(Fr. Schiller, 17591805)曾說過:「人只有透 過美感教育(Aesthetic Education)才能使人類的感性、理性與精神性動力獲得 整體和諧的開展,以造就完美人格,進而達到和諧社會之建立」。歷經百年之後, 放眼國際來看,一九九九年十一月聯合國教科文組織(UNESCO) ,在第三十屆 年會中,理事長梅爾(Federico Mayor)曾提出藝術教育宣言,極力倡導藝術教 育對於每個人的重要性。此外,美國藝術學會在二○○一年也公佈了一項調查, 該研究調查指出:「藝術教育可以培養創造力、獨立性以及自我表達能力」。因 此,美國並適時調整教育方針,宣示全美中小學生皆需要接受舞蹈、戲劇等藝術課程,並與數學、歷史等課程並列(許芳菊,2006) 。從美國教育政策的推展 中,不難發現到逐漸地突顯出藝術課程的重要性。 而處在今日的臺灣,經濟、政治、教育、科技等領域都在不斷的革新中, 受到科學文明的影響之下,生活變遷日新月異,社會逐漸進步。但是,在社會 發展中的文化也隨之變動轉型。近年來,文化觀發展逐漸著重在群體之間的互 動、尊重他人與保存本身文化為主要的發展重點。在此時,也使得藝術教育面 臨多元化的衝擊。受到科學文明的影響,為了解決藝術教育受到的衝擊,臺灣 的教育體制也順勢將藝術與人文兩個領域做結合,透過人文的關懷,創造個人 充滿人文關懷的藝術,提升知覺與情感陶冶的部份(呂燕卿,2005)。由上述 可見,藝術所具備的美感品味能力已經成為全球化注意的焦點之ㄧ。 美感品味能力在生活中佔有極為重要的角色,生活中任何活動都無法與美 感兩個字作為切割。現今大學生教育方式-追求多元化教學,藉以提升大學生 基本素養,進而發展出許多大學生核心能力(吳京玲,2009)。在大學生過去 的求學生涯中,文學藝術的薰陶以及藝能的操作與練習上較少有時間與機會深 入接觸,另一方面則是大學生的視野與成熟度促使他們對於美感與情意的開發 充滿著好奇心,因此美感與情意教育逐漸深受大學生的歡迎。 國內學者陳木金(2009)更進一步指出:「教育的歷程中,倘若能夠協助 學生將自身所學的相關經驗達到統整性,必須透過感性、悟性、理性的配合, 建構出「感性→悟性→理性→美感」的模式,以達成教育目標的實現,特別是 在大學教育的實施中更須彰顯美感教育的精神。陳木金所提到的模式正巧呼應 了席勒所言:「人只有透過美感教育(Aesthetic Education) 才能使人類的感性、 理性與精神性動力獲得整體和諧的開展,以造就完美人格,進而促進和諧社會 之建立」。 由上述所言,在大學教育的推展中,必須配合著美感教育的實施,才能達到 學習經驗的統整性;大學生在美感品味能力上的表現逐漸展現出個人的獨特性、
創造力及多元化。因此,本研究擬編製大學生美感品味能力量表,並進行施測, 透過試題反應理論(item response models, IRT)中的單參數(Rasch)模式進行量 表模式適合度考驗、信效度及差異試題功能檢核,用以評估此量表的品質。
第二節 研究目的
本研究目的擬編製一份大學生美感品味能力量表,並經由信、效度考驗後, 運用 Rasch 模式進行量表模式適合度檢驗及性別的差異試題功能(Differential Item Functioning, DIF)分析,用以評估量表的品質。 研究的目的如下: 一、依據理論模式建構大學生美感品味能力量表。 二、運用 Rasch 模式檢驗量表模式適合度。 三、性別 DIF 檢核,檢核試題是否具有差異試題功能。第二章 文獻探討
第一節 美感品味能力相關研究
關於美感品味能力的研究,本研究將分為「美感及美感審美判斷原則」、「美 感教育」、「美感評量的內涵」等三部份進行介紹。壹、 美感及美感審美判斷原則
西元1750年,德國哲學家鮑姆嘉通(A. G. Baumgarten, 1714—1762)出版了 《美學》 (Aesthetica)一書,而這一年也被稱為美學誕生年。不過,鮑姆嘉通的 新著書名希臘文Aesthetica,其原意並不是指名詞的 「美」,而是指動詞的 「感覺」, 也就是「感受之美」的意思。Aesthetica《美學》的最初意義應該是「感受之學」。 因此,我們便稱 「美學」 為 「人類審美意識所呈現的理論形態」 (Baumgarten, 1750) 。 藝術(art)可以定義為在音樂的形式下,所得到的感覺及視覺藝術,藝術表現方 式有電影、舞蹈、文學藝術以及社會中花費大量時間及努力應用在藝術的類別 上,因此藝術生活無所不在(McManus & Furnham, 2006)。Welsch(2003)也指 出美感(aesthetics)在學術範疇之外,範圍不只限於藝術(art) ,甚至在說話的 時候、或是在日常生活中呈現出具備美感的行為(aesthetic behaviors)及美感生 活型態(aesthetic lifestyle) ,都可歸類為美感的範疇。 McManus與Furnham(2006)以背景、教育階層及五大經驗(The Big Five) 探討與美感活動及美感態度的相關性,所謂的五大經驗分別是外向程度 (extraversion)、合群(agreeableness)、責任感(conscientiousness)、情緒穩定 (emotional stability)、嘗試精神(open to experience),研究顯示性別與美感活動 之間並無相關、開放性格在許多美感活動上呈現特別高的相關性;美感態度上則 顯示出在開放經驗上有較高的相關性,階層、性別、年齡這些因素和美感態度則 沒有直接相關。 如何對於美感做出審美判斷呢?審美判斷的標準該如何取捨呢?美感的審美判斷來自於正確批評時所具備的適當情緒。James(2009)指出審美判斷可以 區分為主觀論、相對論及透視主義。主觀論的審美判斷必須引入主觀的評論,美 感判斷的真值不受到客觀存在事物的影響;相對論則是對於美感的真值判斷會隨 著環境不同而產生不同的判斷:美感透視主義不是主觀論的一種形式,也非真值 相對論的美感判斷方式,透視主義認為對於美學判斷的解釋是多元的,會依賴著 特定時間並以多數人能了解的標準作審美判斷的依據。 Helmut、Benno、Andries、Dorothee(2004)四人試圖提出資訊處理模型來 說明美感判斷的過程。該學者認為美感經驗出現在現代生活中,起源於對物體的 美感過程、心理上特殊的興趣,美感經驗包括認知及情緒上過程。資訊處理模型 前分類時將美感區分為藝術品及情感的活動,透過察覺(perceptual)、含蓄經驗 整合(implicit memory integration)、明確分類(explicit classification)、認知掌握 (congitive mastering)、評價(evaluation)五種不同的過程,最後以美感判斷與 美感情緒作為兩種輸出模式。美感判斷來自認知的評價,而美感情緒則是此模型 附帶產生的結果。
貳、 美感教育
針對美感品味能力,許多學者紛紛提出美感教育的重要性及實施方式。美感 教育的目的希望能夠提升情意方面的美感活動。國內學者陳木金(2009)曾經談 論到「美感教育」就是希望讓受教者能夠感受到「對美的欣賞力」、「對美的感受 力」,並能自己產生「對美的創造力」,並參與其中追尋美感的經驗的一種教育活 動。透過美感教育活動,能提供陶冶學生的感性欣賞、品味能力及批判能力,獲 得美感經驗。黃壬來(2009)也提出美感教育的重要課題應該著重在:培育具有 審美品味態度的現代人、強調生活修為及環境美化、以美感為基礎推展美學經濟 並採啟發式的美感教育方式。此外,藉由美感教育能夠提升美感素質,劉榮豐 (2008)認為美感素養應著重在自我察覺能力與美感品味心靈的發展,並從中進一步探討生活的意義與目標並實現精神價值。Smith(2005)認為美感教育意味 著藝術教育課程,可發展美感能力在創造及鑑賞藝術,並藉由美感概念或原則培 養與藝術感覺相關內容的教學。但是美感教育的目的可能在自然、人類環境及每 天的活動都息息相關,但非全指藝術的生活方式。希望透過藝術的課程,應用在 人類的生活中,以提升美感教育。 如何實施美感教育呢?國內學者張俊傑(1992)指出「美感教育」應包含視 覺藝術、聽覺藝術、綜合藝術三個層面之外,還需要融入情意方面的學習。張俊 傑學者還進一步提出美感教育需要具備以下幾點目標:提升感性品味、知性的陶 冶、改善行為實踐、提升文化發展境界及呈現完美的學習結果。此外,Broudy (1987)在美感教育的理論與實踐這篇文章中提到:學生必須學習藝術方面的美 感察覺能力,為了達成這個目的,教學上必須學習美感察覺的字彙,在音樂的音 調學習方面,必須有準確的標記,但在視覺藝術上並沒有明顯的控制。美感察覺 能力可藉由四個層面學習:物體感覺屬性的學習(顏色、形狀、直線)、正式屬 性(平衡、押韻)、科技屬性、表現屬性(情緒)(Hewitt&Rush,1987)。Broudy 也提及藝術史是美感教育的主要源頭,除了依時間先後發展方面,還要重視鑑賞 的藝術評論中的原則。美感教育中的藝術評論,在課程中常和藝術鑑賞有關,這 類課程通常方法上較偏向歷史層面探討,但是在藝術作品上則包含明確及含蓄的 判斷。
參、 美感評量的內涵
Clark、Day 與 Greer(1987)提倡學科本位的藝術教育理論(DBAE),該理 論希望將藝術成唯一門正式學科,希望使學生發展出瞭解藝術、欣賞與藝術表現 的基本知能。Clark,Day,&Greer 認為藝術能力並非自然成長的成果,而是學習的 結果,因此藝術的相關能力必須藉由學習所得;DBAE 藝術教育理論所使用的教 材來自於美學、藝術批評、藝術史及藝術創作四類。根據教學目標,依據四個領域準則進行客觀評量。DBAE 的教育目標太過著重藝術學科知識,易忽略文化差 異及生活上的連結。因此,Hamblen(1997)提出了第二代的學科本位藝術教育 (neo DBAE),根據 DBAE 的缺失,提出了三項新觀點: (1)擴充課程內容,課 程內容加入新興議題,如:女性主義、社區環境議題的融入,逐漸呈現重視多元 的後現代主義觀點。(2)著重全面性的藝術教育(3)評量兼採量化與質化方式, NeoDBAE 重視藝術之外在(或工具性)價值。 依據教育部藝術與人文學習成效評量(即藝術教育評量網)—九年級素養指 標,將藝術與人文領域區分為音樂、視覺藝術、表演藝術、綜合性四類,在音樂 類中希望培養學生熟悉一種樂器,能個別或與他人唱奏樂曲、並能主動探索並樂 於分享個人對音樂的觀點;在視覺藝術類中希望能讓學生理解藝術的元素,並能 運用在鑑賞與創作上;在表演藝術類中,希望能透過表演活動,培養觀察及解決 問題能力、並能透過肢體等方式表達自我情感與想法;在綜合性方面,希望學生 能夠運用藝術批評的方法、辨識及欣賞不同類型的藝術、理解藝術在不同文化脈 絡的特色、表現對藝術文化的認同及尊重。綜合以上所言,教育部提倡九年一貫 藝術與人文領域的目標,希望藉由教育期望學生可以具備以下三項能力 (如圖 1): (1)探索與表現:主要是能運用媒材與形式,從事藝術表現。 (2)審美與理解:主要是能體認各種藝術價值、風格及其文化脈絡。 (3)實踐與應用:能了解藝術與生活的關連,認識藝術行業,能身體力行, 實踐於生活中。 Armstrong(1994)將藝術評量領域分為內容及行為兩部份,內容層面依據學 科本位藝術教育(DBAE)所提到的四個領域:美學、藝術評論、藝術史及藝術 創作。行為層面則包括: (1) 知道(know)。 (2) 察覺(perceive) 。 (3) 組織(organize)。
(4) 探索(inquiry)。 (5) 評價(value)。 (6) 操作(manipulate)。 (7) 合作互動(cooperate/interact)。 Karen Hamblen(1985)針對審美素養提出了一個有爭議的概念模型,內容提 到七個美學主題可以被討論到: (1)類型(type) (2)媒體與科技(media and
technoligy) (3)觀眾(audience) (4)範圍(context) (5)時間與空間(timespace)
(6)藝匠(artisan) (7)功能(function),而每個主題都會經歷六個階段過程:
敘述(description)、討論(discussion) 、標準(criteria) 、理論(theory) 、後設理 論(metatheory)、多元學科(multidisciplinary) 。 綜合以上所言,DBAE 架構太過偏重在學科知識的美感評量,缺乏對美感的 文化層面及生活上的應用,因此此架構涵蓋的美學範圍較為狹小;NeoDBAE 雖 依據 DBAE 的缺點,將課程架構融入了新興議題與全面性的藝術教育,但較重視 藝術之外在(或工具性)價值,較無法深入了解個人對於美感的內在察覺;教育 部所擬定的藝術與人文評量架構下的課程主軸與目標結構,透過「探索與表現」、 「審美與理解」、「實踐與應用」這三面向的目標,希望培育出學生成為創作者、 鑑賞者、以及有感知的藝術生活實踐者,兼重美感的內在察覺亦著重在外在的表 現,較能綜合 DBAE 與 NeoDBAE 的優點。 藉由美感品味能力的提升,希望能提供陶冶學生的感性欣賞、品味能力及批 判能力,以獲得美感經驗。指標內涵須以更具體可觀察的指標,才能讓我們從中 更直接地觀察到美感品味能力,而教育部藝術與人文評量架構便具備了這些特 色,除了在架構下規劃三大具體面向之外,並在各面向下編定了具體的行為指標 細項。因此,本研究將採用教育部所擬定的藝術與人文評量架構下的「探索與表 現」、「審美與理解」、「實踐與應用」這三面向與其他學者的論點,訂定大學生美 感品味能力量表。
圖 1 「藝術與人文」課程主軸與目標結構(教育部藝術教育評量網) 其實,每個人或多或少都具有美感品味能力,只是程度上的差異而已,根據 McManus 與 Furnham(2006)的研究中,認為性別與美感活動及美感態度沒有直 接相關。因此本研究將於量表編製時且施測過後,運用 DIF 來檢核男女生在美感 品味能力上是否有顯著差異結果,作為後續研究的參考。
第二節 量表編製原則與做法
社會科學或行為科學家所感興趣的眾多研究變項中,大多數都是無法直接觀 察的,如動機、情緒、興趣和感覺…等。但某些變項,例如性別,是能夠透過現 存的紀錄被正確地認定。然而,這些無法被直接觀察的變項,就必須依據其他的 測量方式決定。因此,發展可信賴、有效及可使用的量表便是最佳可行的方式。 透過量表方式所反映出的重要現象或概念,通常稱為「潛在變項」。 王俊明(1999)提出編製量表時,編製者首要步驟必須擬定一份編製量表的 計畫,此計劃包括蒐集相關的資料、編製的進度、樣本的決定及編製所需的時間 等。計畫擬定後,便開始針對量表的性質進行相關資料的蒐集。舉例來說:成就動機量表歸類為人格方面的量表,編製者就必須從人格心理學的理論或是既有的 量表中去蒐集。 量表編製必須植基於實質理論之下,換言之,通常量表的編製都是參考某一 學者的看法,或是綜合數個學者所提的理論擬出編製量表的架構。倘若該份量表 有若干分量表,編製者也必須清楚的構思量表的內容,應先將定義擬出。此外, 所要測量的概念是否可以與其他概念間有明確的區分性 。 一旦確立形成新量表目的之後,編製者便開始著手建構測量工具。首先,第 一步驟必須建構一個足夠大的樣本,以備將來可以用來建立一份正式量表。在此 步驟中,必須注意構成同一量表的問題,都必須能夠反映形成這個量表的潛在變 項。每個問題的實質內容也應該簡潔地反映出所要測量的概念,多個問題會比單 一問題建構出更可靠的測量強度,但這些問題中都必須共同呈現出編製者所要測 量的概念。建構出量表樣本後,邀請專家學者檢視問題間是否可以鞏固量表定義 及符合單一概念的原則。 樣本建構後,編製者將進行預試階段。編製者必須尋找一些受試者先對此份 量表進行預試,以了解量表題目的可用性。預試結束後,編製者將進行題目分析。 本研究將以試題反應理論進行試題分析,作為正式量表的選題依據。只要合乎標 準的試題都可列入正式量表的題目,倘若經由項目分析過後的題數都適合,則由 高到低選出預定擬定的題數。量表編製的最後一個步驟,便是建立信度及效度。 信度,意指測驗結果的可靠程度,具有信度的量表具有一致性(consistency)、 穩定性(stability)、可靠性(dependability)及預測性(predictability)。具有信度的量 表,經過多次的測驗,會呈現相當一致的結果。在信度的考驗上,常使用穩定性 係數(重測信度)及內部一致性係數(Cronbach α、折半信度)兩種。重測信度 是指相同受試者針對同一份量表施測,前後兩次測驗分數作積差相關所得的數 值,兩次結果相關性越高,代表越具穩定性。倘若,只根據一次測驗結果作為估 計信度的方法則屬於內部一致性信度,一般常用的係數為Cronbach α係數。其公
式如下: ÷ ÷ ÷ ÷ ø ö ç ç ç ç è æ =
å
=s
s
2 x n 1 i 2 i 1 1 n n a (1) 其中,α表示測驗的估計信度係數,n為題數,s
i 2 為每道試題得分的變異數,s
2 x 為測驗總分的變異數。所得到的Cronbach α值越高,則代表測驗的內容越趨於 一致。此外,還可透過折半信度來估計信度。折半信度是將題目分成兩半分別求 得兩個總分(隨機方式或奇偶對半),經積差相關法的計算求得兩半測驗分數間 的相關係數。由於折半信度只是使用半份測驗的信度,因此常會低估原來的測驗 信度,必須進一步透過斯布校正公式(SpearmanBrown formula)還原信度。 效度是指能夠有效的測量出所要測量的特質程度。在效度的考驗上,可使用 效標關聯效度及建構效度兩種。效標關聯效度是透過實證分析方法研究測驗分數 與外在效標關聯性的一種指標。所謂的外在效標,指測驗所要預測的某些行為或 標準,測驗分數與外在效標間相關越高,即表示效標關聯效度越高。此外,建構 效度則是透過團體對照法或因素分析法來估計。團體對照法將學生區分為高分組 與低分組兩組,然後進行平均數差異性考驗,假如高分組的平均得分顯著高於低 分組平均得分,代表此份量表能有效的區分。依據因素分析法,我們可以從一堆 試題中抽出少數幾個共同因素(common factors),用以反映或代表這堆試題的共 同結構,並求得每道試題與每個共同因素之間的相關係數,稱為「因素負荷量」 (factor loading)(余民寧,2002)。第三節 Rasch 模式
在一份測驗中,測驗分數裡常含有相當程度的測量誤差(measurementerror)。依據古典測驗理論(classical test theory,簡稱 CTT)假設:受試者具有 某種潛在特質,無法單獨由一次的測驗的實得分數表示,必須由無數次測驗上所 得的實得分數,以平均數來表示,得到的數值為「真實分數」;而實際上,單獨 一次測量所得的實得分數總會與真實分數上產生一些差距,這些差距稱為「隨機 誤差分數」 (random error score) ,或 「誤差」(error)。以數學公式表示: c =t + e ;
x 表示實得分數,t 代表真實分數,e 代表誤差分數。由於古典測驗理論的試題分 析量數屬於樣本依賴(sample dependent),在實用上較為不便,因此本研究不予 採用。 為了克服古典測驗理論的缺失,才有試題反應理論 (item response theory, IRT) 的誕生。試題反應模式(item response models, IRT)是透過潛在特質、試題特性 與可觀察的反應變項三者之間所產生的機率關係。潛在特質代表著受試者的能力 或態度,以q 表示;試題特性則表示試題難度、鑑別度等特性;可觀察反應變項 來自於受試者的答對或答對情形。以二元計分模式,常用於分析選擇提資料的三 參數模式為例: (2) n
q 、 a i 、 b i 、 c i 分別表示受試者的能力、鑑別度、難度及猜測度等參數。
在IRT中,若將各題的鑑別度均設定為 1,猜測度均設定為 0,此時便成為 單參數模式,或稱為Rasch模式。表示如下: (3) Rasch模式具有等距以及客觀的特性,如果量表可以符合Rasch模式的預期, 則表示量表所建構出的量尺是等距且客觀的(王文中, 2004)。 在社會科學中,常透過問卷、量表、晤談等方式來測量情緒、興趣、人格等 潛在特質。每道試題中都必須具備客觀特性,不會因為試題因素而有所不同,每 )] ( exp[ 1 )] ( exp[ ) 1 ( ) , , , 1 ( i n i i n i i i i i i n ni b a b a c c c b a X P - + - × - + = = q q q ) exp( 1 ) exp( ) , 1 ( i n i n i n ni b b b X P - + - = = q q q
道試題間的選項,也必須具備等距的特性,各選項間的差異是相同的。在本研究 中,採取Rasch模式進行大學生美感品味能力量表的分析。在評定量尺中,通常 會有多點計分的情形出現,受試者通常會被要求逐一對各式題中幾個選項中,選 出最吻合自己的情況。在本研究所使用的量表採用李克特氏五點計分模式,此模 式由Andrich於1978年提出,適用於試題反應資料之間具有次序大小關係的情況, 例如:非常同意(5分)、同意(4分)、沒意見(3分)、不同意(2分) 、非常不同 意(1分) 。在IRT中,評定量尺模式(rating scale model, RSM;Andrich, 1978)與 部分得分模式(partial scale model,PCM,Masters, 1982)常被用來分析多點計分的 資料(Masters & Wright, 1984)。在RSM中,受試者n在第i題中得到j分比j1的勝率 (odds)的對數為: ( )
(
i j)
n 1 j ni nij b P P log = q + t ÷ ÷ ø ö ç ç è æ (6) nijP 和 P ni ( ) j 1 為受試者n在第i題上得j分和j1分的機率, b i 是第i題的整體難度 (overall
difficulty), t j是第j個閾參數(threshold parameter)。RSM假設每道試題均有一個 整體難度 b i ,且要求所有試題都必須共享一套閾參數。為了解決量尺的不確定 性,RSM將整份測驗的難度平均設定為0,且將閾參數的總和亦設為0。此外,參 數 t j在RSM模式中是固定效果,與受試者或試題均沒有交互作用,也就是說受試 者在作答每道試題時, t j都是一樣的。也就是說所有的試題都使用相同一套評定 量尺,即受試者在回答量表試題時,對於各選項之間的差異都會具有相同的判斷。
第三章 研究設計與實施
本章旨在說明本研究之方法與設計,分別就研究架構與設計、研究對象及研 究工具一共三節分別予以說明。第一節 研究架構與設計
壹、 研究架構
根據上述之研究動機、目的及文獻探討,綜合相關理論,擬訂研究架構。本 研究之研究架構如圖 2 所示。本研究量表分析,以大學生為受試對象,並依據受 試類別之背景變項為自變項,而以大學生美感品味能力指標為依變項。透過專家 建構專家效度之後,進行預試與正式施測,最後再以 Rasch 模式分析大學生美感 品味能力量表。 圖 2 研究架構圖 大學生美感品味能力指標預試量表 專家學者建構專家效度 分析美感品味能力指標預試量表 編製美感品味能力指標正式量表 分析美感品味能力指標正式量表貳、研究設計
本研究依據研究目的,採用下列方法進行大學生美感品味能力量表的研究: 一、 文獻分析:進行美感品味相關文獻的蒐集、整理、歸納並分析,作為 本次研究中理論基礎與研究設計的依據來源。 二、 量表調查:針對大學生,分別抽取某大學,從各學院中隨機抽測一個 系所中的一個班級作為樣本,以本研究建構之「大學生美感品味能力量表」進行 調查。量表之內容包括: (1)學生個人基本資料; (2)大學生美感品味能力量表 內容。本研究採用描述性統計及其他統計方法進行分析。第二節 研究對象
本研究之大學生美感品味量表一共抽取某一大學中,分別隨機抽取一個系所 中的一個班級及抽取通識中心學生作為樣本受試者。壹、 預試樣本
本次研究實際發放預試樣本數為 400 份,實際有效回收份數會比原先設定發 放之份數來得少,此為問卷回收正常現象,並刪除無效受試者(如做答題目過少 者)。因此本次研究預試樣本共回收 279 份。整體來說,本次預試樣本回收率達 70%。貳、 正式樣本
本次研究實際發放正式樣本數為 1336 份,因刪除無效受試者(如做答題目 過少者或作答反應皆相同者),故實際的受試者人數比原先作答受試者來得少。 因此本次正式樣本共回收 1277 份。整體來說,本次正式樣本回收率高達 96%。第三節 研究工具
壹、大學生美感品味能力量表
一、量表編製依據說明 黑格爾(Hegel,George Wilhelm Friedrich, 17701831)說「美是理念的感性顯 現」,他認為美必須包含各別事物外在現象及其所顯現的理念或真理,在達成內 外一致表現後以感性形式呈現於意識、人的感官、感覺對象時,才具有審美意義 而構成現實的美,將百事萬物的感動內化於心,最終達到精神美的層次,並能體 現於生命之中。具體行為上,人類則主要藉由五感-視覺、聽覺、嗅覺、味覺、 皮膚感覺(包含觸覺、痛覺、溫覺與冷覺)等五種感覺進行美感體驗。綜言之, 本研究融入教育部九年一貫教育「藝術與人文領域」中對於學生應具備之三個指 標--「探索與表現」、「審美與理解」與「實踐與應用」以及多位學者的觀點。緣 此,本研究將美感品味定義如下:透過五感的探索,理解美學與社會文化的關係, 拓展藝術賞析的經驗,達到美的培養與實踐,並建立個人審美觀,成為一種生活 態度。 二、美感品味能力量表內涵 在本研究中,將美感品味能力量表的內涵一共分成三個分量表,合計 25 道 試題,且分述其主要內涵與行為指標如下: (一)認知與察覺:在此分量表中一共編製了七道試題,其行為指標為: 1、了解美感的特定概念及藝術媒材與資源。 2、其他學科間的聯繫。 3、察覺地方藝術文化。 4、藝術與生活的關係。 (二)探索與審美:此分量表一共編製九道試題,其行為指標為:1、五感的體驗美感。 2、藝文資訊的獲得。 3、以正確的觀念和適當的藝術用語及態度進行鑑賞。 (三)實踐與應用:此分量表一共編製九道試題,其行為指標為: 1、運用學習累積的藝術知能、培養創作才能與美育專才。 2、表現對藝術文化尊重、關懷與認同。 3、能美化生活空間。
貳、建立專家內容效度
量表問卷初稿完成之後,編製內容效度之「專家意見調查表」,邀請專家學 者針對大學生美感品味能力指標各分量表內涵及適切性,進行修正,藉以建構各 分量表之代表性;在內容效度問卷中採取「適合」、「不適合」、「修改後適合」 三種等級,勾選其中一個最符合專家個人所認同的方式。此方式僅以鑑別各問卷 分量表中文字敘述是否符合各層面的概念內涵為主,並以不改變指標量表中項目 與原意為原則,依據指標效度之專家回覆意見,研究者逐題審視專家回覆意見, 據以修訂預試量表的文字敘述。參、研究軟體
ConQuest 是一種適用在試題反應的電腦程式軟體,它提供廣泛的試題反應 模型分析。ConQuest 可以應用在執行試題分析、差異試題功能、評估者的影響、 估計潛在的相關性和檢測向度。 ConQuest 由 Wu、Adams 和 Wilson(2007)所發展,可應用於二元計分或多元 計分模式的 Rasch 模式。ConQuest 中使用邊緣最大概似估計法(MML)進行試題參 數估計,最大概似估計法(MLE)、期望後驗估計法(EAP) 、加權概似估計法(WLE) 以及潛在估計法(latent)進行能力參數估計。運用範圍漸廣,已逐漸成為 Rasch 分 析的主流程式。(余民寧, 2009)第四章 研究結果
本章將進行研究結果的分析,一共分成兩節分別予以說明。第一節為預試量 表信效度與 Rasch 分析,第二節則為正式量表信效度與 Rasch 分析。第一節 預試量表信效度與 Rasch 分析
在本研究中,運用 Mplus3.0 軟體進行驗證性因素分析(confirmatory factor analysis, CFA),CFA 的目的則在檢驗研究者所提出的理論模式是否可以透過研究 過程所蒐集得到的資料來獲得證實。當理論模式與觀察資料十分吻合時,我們將 可宣稱理論模式與實際資料達到吻合的狀態,用以考驗此份預試量表的整體效 度;並透過 ConQuest 軟體對預試量表中各分量表進行 Rasch 模式檢驗。將預試 的分析結果,排除品質較不良的試題,取決試題品質優劣的標準為:模式量表適 合度、模式試題的適合度以及是否含有 DIF 試題。一般大學常包含多個核心能 力,因此較不適宜在每個分量表中保留過多的試題,如:大學生填答教學滿意度 量表時,也大約在 10 道試題左右。因此,本研究的正式量表以 10 道試題作為最 終版本。壹、預試量表的效度
透過 Mplus3.0 進行驗證性因素分析,此為測量效度最常用方法。本次研究將 參考非基準的配合指標,用以測量模式適配改進比率的程度,即 TuckerLewis 指 標(TLI)作為評估驗證性因素分析的適合度。Heck & Thomas(2000)建議當 TLI(>.90)時,表示該模式越能與建構效度相符合。從預試資料分析結果得知 TLI 值為 0.862,與整體模式適配度的標準值相比,稍微低出標準值範圍。依據預試量表的效度分析結果,雖不盡理想,但與標準值相差不遠,以下將 進行 Rasch 模式檢驗及 DIF 考檢核,刪除不良試題,應可提升量表的效度。
貳、RSM 的結果分析與比較
預試量表的分析結果將進行 Rasch 分析中的 RSM 模式,以信度、模式適合 度,並考量試題難度估計值及進行差異試題功能(differential item functionin g, DIF) 分析,作為正式量表選題依據。預試量表受試者人數為 279 人、題數為 25 題, 預試分析結果分別列於表 1 與表 2。 一、信度: 本研究中,採用條件信度(conditional reliability; Raju, Price, Oshima & Nering, 2007) ,也就是個人化的信度。原理係計算出所有受試者的能力估計值的變異數 與每個受試者能力估計標準誤的平方,計算出每個受試者的個別信度,並再將所 有受試者所得的信度求其平均值,亦即為平均信度,即為本次研究中量表的信度 估計。本次預試量表,所得到的信度值為 0.91,信度值表現極佳,代表著本次預 試測驗結果的可靠性與一致性。 二、模式適合度比較: 本研究中採用 RSM 模式進行分析,因 RSM 具有等距且客觀的特點,較適合 用於評等量表中;在此模式下,總共估計 29 個參數,其中包括 25 個試題難度參 數、受試者能力分配變異數及 3 個階難度參數。在適合度檢驗方面,常用的是均 方誤(mean square error, MNSQ)或加權均方誤(weighted mean square error, MNSQ)適配統計量兩種。均方誤是指將所有作答者在該題的標準化殘差之平方 和除以作答人數;加權均方誤是將所有作答者在該題的標準化殘差之平方以其變 異數加權後再加總,最後再除以作答人數。依據 Linacre 及 Wright(1994)的看 法,對於評定量尺而言,MNSQ 的值以 0.6~1.4 之間是合理可接受的範圍,即受 試者在此試題的作答反應結果符合模式預期,即表示該試題與該向度是吻合的。 因研究中並未考慮極端值影響,因此選擇均方誤作為適配統計量。表 1 顯示在 RSM 模式下參數估計值與試題適配度,依據結果顯示,預試量表 25 道試題中,有 3 道試題高於適配合理範圍值,即試題 1 (1.83)、試題 2 (1.67)、試題 23 (1.68)。 三、各試題難度估計值比較: 在 RSM 的分析中,其試題難度的估計值界於1.090 ~ 0.274 之間,除試題 2 (0.274)難度最難之外,其餘試題難度值大多低於 0,即表示試題難度偏易,而 以試題 6(1.090)難度最低。 表 1 RSM 的參數估計值與試題適配度:大學生美感品味能力預試量表 試題 ESTIMATE ERROR MNSQ(未加權) MNSQ(加權) 1 0.782 0.07 1.83 1.72 2 0.274 0.07 1.67 1.66 3 0.958 0.08 1.13 1.03 4 0.410 0.07 0.96 1.04 5 0.481 0.07 0.72 0.73 6 1.090 0.08 0.99 0.98 7 0.947 0.08 1.22 1.07 8 0.440 0.07 0.80 0.84 9 0.355 0.07 0.64 0.65 10 0.455 0.07 0.72 0.75 11 0.579 0.07 0.65 0.64 12 0.227 0.07 0.71 0.77 13 1.023 0.08 1.12 1.15 14 0.663 0.07 0.73 0.72 15 0.553 0.07 0.80 0.81 16 0.227 0.07 0.88 0.92 17 0.626 0.07 0.97 1 18 0.145 0.07 0.95 0.97 19 0.276 0.07 0.69 0.71 20 0.281 0.07 0.69 0.77 21 0.212 0.07 1.16 1.12 22 0.594 0.07 1.14 1.08 23 0.866 0.08 1.68 1.59 24 0.092 0.07 0.73 0.74 25 0.345 0.07 1.36 1.43
四、差異試題功能分析 一份測驗經常會進行多群體間的比較(如性別、種族差異),此時必須確定 該份測驗對於不同群體,所測量的概念是否一致。倘若該道試題在做答反應上明 顯出現有利或不利情形,此時,我們便稱該道試題具有「差異試題功能」 。本研 究利用 ConQuest 軟體進行性別 DIF 分析,將受試者區分為兩個群體,即男生與 女生,檢核各試題是否因受性別影響而導致 DIF 存在。 透過 ConQuest 軟體,可計算出每題 DIF 量的全距,Wang(2008)在研究中 提及若全距量小於 0.5 (即 0.5 個 logits) ,代表此題無 DIF 存在。若以第一題為例: 男生的 DIF 值為 0.03,女生的 DIF 值為0.03,求得兩者之間的全距為 0.06,全距 量小於 0.5(即 0.5 個 logits) ,便代表此試題不具有 DIF;若全距量大於 0.5(即 0.5 個 logits) ,則代表此試題具有 DIF,為品質不良試題,應予以刪除。表 2 表示 性別 DIF 參數估計值的結果,由表中結果顯示本研究的預試量表中 25 道試題, 全距量皆小於 0.5 個 logits,即代表整份預試量表皆沒有 DIF 試題。
表 2 性別 DIF 參數估計值:大學生美感品味能力預試量表 DIF 參數估計值 題號 總難度值 男生 女生 全距 1 0.19 0.03 0.03 0.06 2 0.24 0.06 0.06 0.12 分 3 0.16 0.06 0.06 0.12 量 4 0.04 0.03 0.03 0.06 表 5 0.01 0.04 0.04 0.08 一 6 0.09 0.13 0.13 0.26 7 0.22 0.12 0.12 0.24 8 0.05 0.02 0.02 0.04 9 0.10 0.03 0.03 0.06 分 10 0.04 0.02 0.02 0.04 量 11 0.05 0.07 0.07 0.14 表 12 0.17 0.05 0.05 0.1 二 13 0.32 0.14 0.14 0.28 14 0.04 0.03 0.03 0.06 15 0.13 0.16 0.16 0.32 16 0.16 0.04 0.04 0.08 17 0.11 0.01 0.01 0.02 18 0.22 0.10 0.10 0.2 分 19 0.13 0.03 0.03 0.06 量 20 0.11 0.02 0.02 0.04 表 21 0.24 0.04 0.04 0.08 三 22 0.05 0.06 0.06 0.12 23 0.19 0.11 0.11 0.22 24 0.24 0.10 0.10 0.2 25 0.02 0.07 0.07 0.14 五、正式量表試題 本預試量表一共 25 道試題,分成三個分量表:認知與察覺(試題 1 至 7)、 探索與審美(試題 8 至 16)及實踐與應用(試題 17 至 25)。一般大學常包含多
個核心能力,因此較不適宜在每個分量表中保留過多的試題。因此,本研究的正 式量表以 10 道試題作為最終版本。 透過模式試題適合度中的 MNSQ 值,可以發現試題 1、試題 2 及試題 23 量 表較不適配;並將所有試題進行 DIF 檢核後,結果顯示此份預試量表並未有 DIF 試題;並從各道試題難易度作為判斷保留正式試題依據時,且須配合涵蓋各分量 表中的子向度。 分量表一「認知與察覺」,包含四個子向度,試題 4 為測量第一個子向度試 題,其難度值為0.410 且 DIF 量為 0.06,故保留此試題作為第一個子向度試題。 第二子向度中,包含試題 6 與試題 7,因試題 6 為整份預試量表中難度值最低, 具代表性,故保留試題 6。試題 3 及試題 5 皆在測量第三個子向度,此兩題難度 值分別為0.958、0.481,DIF 量為 0.12、0.08,為了平衡該分量表的難易度,故 此子向度選擇保留難度值較低的試題 3。第四個子向度中含試題 1 與試題 2,雖 因兩題 MNSQ 值並未與此分量表達到適配,但因考量試題 2 在整份試題中難度 值最高且透過質性分析後,該試題較符合子向度的行為指標-察覺地方藝術文 化,故此向度保留試題 2。本分量表一共保留 4 道試題,試題 2、試題 3、試題 4 與試題 6。 分量表二「探索與審美」,一共包含三個子向度。第一子向度為試題 8 與試 題 11,其試題難度為0.440、0.579,因考量難度因素,故保留難度值適中的試題 11。第二子向度行為指標內涵為藝文資訊的獲得,代表試題為試題 12 與試題 16, 其難度值皆為0.227、0.227,DIF 值為 1、0.08,選擇保留 DIF 量較小的試題 16 做為該向度試題。第三子向度,包含試題 9、試題 10、試題 13、試題 14 與試題 15,其試題難度為0.355、0.455、1.023、0.663、0.553,為了平衡分量表的難 易度且透過質性分析試題,試題 13「參與藝文活動時我會注意應有的儀態,如: 儀容、舉止、聲音、服裝」較能涵蓋該向度的行為指標,故此子向度保留難度值
分量表三「實踐與應用」,一共包含三個子向度。第一個子向度為試題 17、 試題 18 與試題 24,其難度值分別為0.626、0.145、0.092,故此向度選擇保留 試題難度值適中的試題 18 作為該向度試題。第二個子向度為試題 19、試題 20、 試題 21 與試題 22 四題,其難度值為0.276、-0.281、0.212、0.594,DIF 量為 0.06、 0.04、0.08、0.12,因此選擇保留難度值較低且考量 DIF 量,故決定保留試題 20 作為第二子向度的試題。在第三子向度中,行為指標為能美化生活空間,其涵蓋 的試題有試題 23 與試題 25 ,而其試題難度值為0.866 、0.345 ,因試題 23 的 MNSQ 值高於合理範圍值,透過質性檢視試題,試題 25「我會美化自己的生活空間」較 試題 23「我會留意自己的服裝儀容及生活環境,讓他人覺得乾淨整潔」更能符合 代表性,故此子向度中選擇保留試題 25。 因此,本研究最終的正式量表試題,分別選取試題 2、試題 3、試題 4、試題 6、試題 11、試題 13、試題 16、試題 18、試題 20 與試題 25,合計一共 10 道試 題作為正式量表的試題。
第二節 正式量表信效度與 Rasch 分析
壹、正式量表的效度
透過 Mplus3.0 進行驗證性因素分析(CFA),用來評估驗證性因素分析的適合 度時,主要參考 TLI 指標(>0.9)作為評估效度與模式的適合度。從正式資料分 析結果中得知 TLI 值為 0.972,依適配指標顯示,效度的考驗上,正式施測的結 果皆優於預試分析,顯現正式量表的品質大幅提升。貳、RSM 模式的結果分析
正式量表的分析結果亦將進行 Rasch 分析中的 RSM 模式,以信度、模式適合度,並考量試題難度估計值及進行差異試題功能(differential item functioning,
分別列於表 3、表 4。 一、信度: 正式量表的研究中,同樣採用條件信度 (conditional reliability) ,也就是個 人化的信度作為信度值的計算。本次正式量表,所得到的信度值為 0.85,因題數 只有 10 題較預試量表來得少,因此信度值降低為正常現象。此次正式量表的信 度值表現仍屬不錯,代表著本次測驗結果的可靠性與一致性。 二、模式試題適合度比較: 本正式量表的研究中亦採用 RSM 模式進行分析,因 RSM 具有等距且客觀的 特點,較適合用於評等量表中;在此模式下,總共估計 14 個參數,其中包括 10 個試題難度參數、受試者能力分配變異數及 3 個階難度參數。在適合度檢驗方面, 仍使用均方誤(mean square error, MNSQ)作為模式適配統計量。依據表 3 結果 顯示,正式量表 10 道試題中,皆在合理的 0.6~1.4 的範圍中,表示受試者在此試 題的作答反應結果符合模式預期,即表示該試題與該向度是吻合的。 表 3 RSM 的參數估計值與試題適配度:大學生美感品味能力正式量表 試題 ESTIMATE ERROR MNSQ(未加權) MNSQ(加權) 1 0.75 0.04 1.19 1.19 2 0.33 0.04 1.04 1.01 3 0.88 0.04 0.74 0.74 4 0.96 0.04 1.05 1.05 5 1.04 0.04 1.11 1.06 6 1.70 0.04 0.95 0.98 7 0.45 0.04 0.93 0.91 8 0.25 0.04 1.28 1.27 9 0.67 0.04 0.83 0.84 10 0.50 0.04 1.05 1.03
三、各試題難度估計值比較: 正式量表中各試題難度估計值(如表 5), 可以發現到居多試題難度值皆低 於 0,也就是試題難度偏易。就整份量表試題而言,試題 8(0.25,即原預試量表 試題 2)的難度估計值最高,即試題難度偏難;而試題 6(1.70,即原預試量表 試題 13)的難度估計值最低,即試題難度偏易。 五、差異試題功能分析 將正式量表試題進行 DIF 檢核,仍採用 ConQuest 軟體做性別 DIF 分析,檢 驗各試題是否受性別影響而導致 DIF 存在。依據 DIF 全距計算結果,若全距量大 於 0.5 個 logits,則代表此試題具有 DIF,為品質不良試題,應予以刪除。本次正 式量表研究,10 題試題皆未具有 DIF。結果如表 4 所示: 表 4 性別 DIF 參數估計值:大學生美感品味能力正式量表 DIF 參數估計值 題 號 男生(標準誤) 女生 全距 1 0.01(0.02) 0.01 0.02 2 0.07(0.02) 0.07 0.14 3 0.04(0.02) 0.04 0.08 4 0.00(0.02) 0.00 0 5 0.00(0.02) 0.00 0 6 0.02(0.02) 0.02 0.04 7 0.01(0.02) 0.01 0.02 8 0.04(0.02) 0.04 0.08 9 0.04(0.02) 0.04 0.08 10 0.01(0.02) 0.01 0.02
第五章 結論與建議
第一節 結論
壹、美感品味能力量表的信效度
本研究中,結合多位學者理論與教育部編定藝術與人文學習成效評量架構下編製 大學生美感品味能力量表,並經由專家效度修正後,本量表一共分為三大分量表:認 知與察覺、探究與審美及實踐與應用,並編擬出大學生美感品味能力預試量表,一共 有 25 道試題。本研究中,預試資料採用 Rasch 分析中的 RSM 模式進行分析,信度值 為 0.91,顯示本次測驗的可靠信與一致性。而效度部份,經驗證性因素分析考驗後, TLI 值為 0.862,則略低於標準值。 因考量各大學多擁有數個核心能力,每一個核心能力下較不宜包含多道試題,因 此依據量化數據資料及專家建議保留較具代表性的 10 道題目作為正式量表。再經 Rasch 分析後,在 RSM 模式下的信度為 0.85,較預試資料來得低,主因是因為正式量 表題數較少,導致信度值降低屬正常現象。因此本次正式資料的信度值表現仍屬不錯; 而效度部份,經驗證性因素分析考驗後,TLI 值為 0.972,以適配指標顯示,模式的適 配度結果大致良好,因此,正式量表的信效度都達到良好的表現。貳、RSM 模式的適配度
本研究預試量表中,採用 Rasch 分析中的 RSM 模式進行模式適合度分析,因 RSM 具有等距且客觀的特點,較適合用於評等量表中;在此模式下,總共估計 29 個參數, 其中包括 25 個試題難度參數、受試者能力分配變異數及 3 個階難度參數。在試題適配 度結果,發現一共有三道試題的 MNSQ 值高於合理可接受範圍;在正式量表中,在 RSM 模式下,總共估計 14 個參數,其中包括 10 個試題難度參數、受試者能力分配變 異數及 3 個階難度參數。在試題適配度結果中,正式量表中 10 道試題的 MNSQ 的數 值皆在合理可接受的 0.6~1.4 範圍中,即表示受試者在此試題的作答反應結果符合模式參、試題的難度分布及 DIF 分析
採用 RSM 分析試題難度時,發現整份量表中居多試題難度值低於 0,即表示試題 難度偏易;且不論是預試量表或是正式量表,結果都顯示出試題 2 的難度值最高。 在 DIF 檢測中,欲透過檢核性別因素是否會影響作答正確率,而產生試題差異功 能。預試量表與正式量表的結果皆顯示,各題的 DIF 量皆小於 0.5logits,即各試題是 不具性別 DIF 的影響,亦即試題是不受到性別因素而產生差異試題功能。第二節 建議
壹、增加試題難度以區分受試者能力高低
一份測驗中,過多偏難或偏易的試題常會造成測驗上的誤差,影響測驗的品質。 本研究的試題難度分析結果,發現居多試題難度值皆低於 0,即試題偏易,缺乏難度 值較高的試題,因此較無法區辨出受試者能力高低。因此建議後續研究可以增加難度 值較高的試題,能更精確的區分受試者的能力高低。貳、施測對象可擴及其他大學
隨著大學生的視野逐漸開拓,使他們對美感與情意的開發充滿著渴望與好奇,「美 感品味能力」已逐漸成為大學生重要核心能力之ㄧ。本研究為了方便取樣,施測對象 僅單一大學作為研究樣本。因此,在研究推論上有其限制性,建議後續研究可將此量 表推廣至其他大學,檢核目前國內大學生在美感品味能力上的普遍表現。參考文獻
壹、中文
王文中 (2004)。Rasch 測量理論與其在教育和心理之應用。教育與心理研究, 27,637 – 694。 王俊明 (1999) 。問卷與量表的編製及分析方法。載於張至滿、王俊明主編:體育測 驗與評價(139158 頁) 。台北市:中華民國體育學會。 吳京玲 (2009) 。全國性大學生核心能力指標建構初探。2009 海峽兩岸高等教育永續 發展學術研討會。 余民寧 (2009)。試題反應理論(IRT)及其應用。台北:心理出版社。 余民寧 (2002)。教育測驗與評量-成就測驗與教學評量。台北:心理出版社。 呂燕卿 (2005)。從藝術與人文課程綱要省思學生的藝術基本素養。教育研究月 刊,第 130 期,頁 119128。 施慶麟、王文中 (2006)。評定量尺之 Rasch 分析。教育與心理研究,29 卷 2 期,頁 399421。 陳木金 (2009)。優質世界公民通識教育在大學實踐的芻議-以政大書院推動為例。國 家教育研究院舉辦「公民社會與國家教育政策與制度學術研討會」論文集, 134148。 陳木金 (1998)。從教師美育教學談情意教育的實施。北縣教育,第 22 期,頁 2428. 陳木金 (1996)。建立學校美育評鑑指標之研究。國立政治大學學報,第 72 輯, 頁 83120。 張俊傑(1992)。建立美育的基本觀念。載於高雄師範大學主辦學校美感教育國 際學術研討會論文 。 張麗麗 (2003) 。藝術與人文學習領域的教學評量,載於黃壬來主編,藝術與人文教 育。臺北:桂冠。 教育部。藝術教育評量網。取自 arteducation.creed.ntnu.edu.tw/rating8_2.php?no=61 黃壬來 (2006)。國際視覺藝術教育趨勢。「2006 全國藝術教育展」藝術教育專題研黃壬來 (2003)。藝術與人文教育。台北:桂冠圖書出版公司。 劉豐榮 (2008)。當前美感教育方向之新思維:精神性取向全人美感教育理念初探。 教師天地,153,1015。
貳、西文
Andrich, D.(1978).A reting formulation for ordered response categories. Psychome terka,43,561573. Armstrong, C. L. (1994). Designing assessment in art. Reston, Virginia: National Art Education Association.Baumgarten, A.G.( 1750). Aesthetica. Main:Frankfurt.
Broudy, H. S.( 1987). Theory and Practice in Aesthetic Education. A Journal of Issues and
Research, 28(4), 198205.
Clark, G. A., Day, M. D., & Greer, W. D. (1987). Disciplinebase art education: Becoming student of art. The Journal of Aesthetic Education, 21(2), 129193.
Greer, W. D.( 1987).A Structure of Discipline Concepts for DBAE. Studies in Art
Education, 28, No. 4 (Summer, 1987), pp. 227233.
Hamblen, K. A. (1997). Second Generation DBAE. Visual Arts Research,
23(2), 98106. Hamble, K.( 1985). Developing aesthetic literacy through contested concepts. Art Education ,Vol. 38, No. 5 (Sep., 1985), pp. 1924 . Helmut, L., Benno ,B., Andries, O., &Dorothee ,A.( 2004). A model of aesthetic appreciation and aesthetic Judgments. British Journal of Psychology, 95, 489–508 Heck, R. H., & Thomas, S. L. (2000). An introduction to multilevel modeling techniques. Mahwah, NJ: Lawrence Erlbaum Associates.
James, O. Y.( 2009). Relativism, Standards and Aesthetic Judgements. International
Journal of Philosophical Studies, 17(2), 221–231.
Masters, G. N.( 1982).A Rasch model for partial credit scoring. Psychome
terka,47,149194.
Masters, G. N., & Wright, B. D. (1984). The essential process in a family of measure ment models. Psychometrika, 49, 529544.
McManus, I. C.& Furnham , A.( 2006). Aesthetic activities and aesthetic
attitudes:Influences of education, background and personality on interest and involvement in the arts. British Journal of Psychology, 97, 555–587.
Raju, N. S.,Price, L. R.,Oshima, T . C.,Nering, M. L.(2007). Standardized Conditional SEM: A Case for Conditional Reliability. Applied Psychological Measurement,31(3).
Smith, R. A. (2005). Aesthetic education: Questions and issues. Arts Education Policy
Review, 106 (3), 1933.
Wang, W. C.( 2008). Assessment of Differential Item Functionin. Journal of Applied
Measurement, 9(4). Wang, W. C., Wilson, M. R.,& Shih, C.L.( 2006). Modeling Randomness in Judging Rating Scaleswith a RandomEffects Rating Scale Model. Journal of Educational Measurement,43(4),335353. Wu, M. L., Adams, R. J., Wilson, M. R. & Haldane, S. A. (2007). ACER ConQuest:Generalized item response modeling software(2nd ed.). Hawthorn, Australia:Australian Council for Educational Research.