設計類科大學生想像力測驗之編製

全文

(1)國立臺中教育大學教育測驗統計研究所理學碩士論文. 指導教授：施慶麟. 博士. 指導教授：楊志堅. 博士. 設計類科大學生想像力測驗之編製. 研究生：陳繼成. 撰. 中華民國一００年六月.

(2) 致謝兩年的研究所生涯，如同白駒過隙般一閃而逝。在我研究的啟蒙階段，很幸運的身邊總是有許多的貴人。首先，我必需先向指導教授施慶麟博士及楊志堅博士致上最誠摯的感謝。在兩位老師的悉心指導之下，除了讓我一窺測驗統計學門的奧妙與趣味外，更開啟了我對研究的熱忱。最重要的是，藉由不斷的討論與思辯，我學會了面對問題的處理方式以及待人處事的正確態度。本論文的完成，學長姐們給我的幫助不容忽視。在專業領域上，良庭學長與我是互相砥礪的夥伴，在經驗的傳承上則是我所敬重的前輩。無論是在論文的寫作抑或是生活的點滴，都使我獲益良多。國瑋學姊不分晝夜的給我即時的問題答覆，不論在我論文的寫作以及研究與分析上均有莫大的助益。對於我僅能於此致上謝意，我感到十分的惋惜。實驗室的夥伴惠靖、所上的學姊家蓁、班上的同學南逸、逸豪、珮慈、亭堯與佳誼等，均為我共同努力的戰友。一同面對投稿的壓力、生活上的不愉快以及寫不出來的作業。在我遭受挫折與沮喪時給我支持與協助，在我研究順遂與充滿期待時給我祝福與提醒。我想世間能遇見的好朋友莫過於此。有了大家的相伴，我才能走過這一切的荊棘與迎面而來的芬芳。更重要的是，我的家人一直在我身後給我支持與鼓勵。爸爸、媽媽、弟弟、妹妹給我無條件的支持與全力的配合。然而由於課業繁忙，無法經常回台北陪伴家人則是我研究所生涯中最大的遺憾。不論身處而地，家人總是包容我的一切，以我為榮。在我的心目中，家人永遠是我最重要的資產。最後，在此感謝所有協助本測驗之編製、施測、評分以及給予建議的相關單位及人員，適時的給我建議與各方面的協助，使研究得以順利進行。. 繼成 2011.06.24. I.

(3) 摘要本研究的目的在於編製設計類科大學生的想像力測驗。在理論基礎部分，除了托倫斯於 1966 年以吉爾福德的理論為基礎發展了目前使用最廣的創造力測驗 TTCT(Torrance Test of Creative Thinking )外，本研究亦採用維高斯基的理論，認為想像力除了創新的能力外，亦包含了與現實的結合。此外，評定想像力的方式有許多種，研究者與以往多數文獻同樣採用作品評定法來針對想像力進行測驗。然而這個方法的缺點是評分者的主觀性可能會影響測驗的品質，因此本研究採用試題反應理論中的多面向模式與評分者效果來進行評估。題目的編製標準是以維高斯基想像力與現實的四個結合規則為基礎，讓受評者對這些題目進行作品的產出。研究者並根據吉爾福德、維高斯基等學者的理論整合出五個指標進行評分。研究結果顯示評分者在測驗中的確扮演著不可忽視的角色，然而在本研究中儘管評分者佔有重要的角色，但是不同評分者之間的差異較小，顯示本測驗在評分者效果上控制的不錯。然而在各估計值中，Model-Data Fit 較差，研究者認為是樣本數過小所引起，此為本研究之限制。. 關鍵字：想像力、試題反應理論、多面向模式、評分者效果. II.

(4) Abstract This study develops an assessment of imagination for university student based on Torrance’s (1966) and Vygotsky’s (1978) theory. Torrance (1966) developed the test of creative thinking (i.e. TTCT) based on the divergent thinking proposed by Guilford, and Vygotsky (1978) which stated that the imagination is the ability of linking to the fact instead of innovation. The measure for imagination used in this study is the “judgment of products”, which has been adapted for a long time but also known for its serious drawback of subjectivity and the subject may affect test the merits of quality. In order to exclude the difference between rater’s subjectivity and the effect of the subject from this measure and explore for possible interactions, many-facet model (MFM) in item response theory (IRT) is introduced to analyze our data. Our preliminary result shows that difference between rater’s subjectivity is non-ignorable. However, despite the rater effect in this study who played an important role, but the differences between the raters are minimum, indicate that the test well-controlled in this regard. The model-data fit is not as well as expected, the researchers believe is caused by the small sample size, it’s also the limitation of this study.. Keywords: Imagination, Item Response Theory, Many-Facet Model, Rater Effect. III.

(5) 目錄致謝 ................................................................................................................................. I 摘要 ................................................................................................................................II Abstract ....................................................................................................................... III 目錄 .............................................................................................................................. IV 表目錄 ............................................................................................................................ V 圖目錄 ............................................................................................................................ V 第一章、緒論 ................................................................................................................. 1 第一節、研究動機 ..................................................................................................1 第二節、研究目的 ..................................................................................................2 第三節、名詞定義與名詞解釋 ..............................................................................3 第二章、文獻探討 ......................................................................................................... 4 第一節、想像力 ......................................................................................................4 第二節、想像力的測量 ..........................................................................................7 第三節、試題反應理論 ........................................................................................10 第三章、研究方法 ....................................................................................................... 13 第一節、研究流程 ................................................................................................13 第二節、題目編製與評分標準 ............................................................................14 第三節、研究工具與結果分析 ............................................................................16 第四章、研究結果 ....................................................................................................... 18 第一節、樣本描述 ................................................................................................18 第二節、試題反應理論之多面向模式分析結果 ................................................19 第三節、試題反應理論之受試者能力分析結果 ................................................20 第四節、試題反應理論之測驗訊息函數 ............................................................21 第五章、討論與限制 ................................................................................................... 23 第一節、結果討論 ................................................................................................23 第二節、研究限制與未來展望 ............................................................................26 參考文獻 ....................................................................................................................... 28. IV.

(6) 表目錄表 1 樣本描述表 ..........................................................................................................18 表 2 各參數估計表 ......................................................................................................20 表 3 受試者能力統計表 ..............................................................................................20 表 4 受試者能力表 ......................................................................................................21. 圖目錄圖 1 研究流程圖 ..........................................................................................................14 圖 2 評定結構圖 ..........................................................................................................16 圖 3 評分者A之測驗訊息函數曲線 ...........................................................................22 圖 4 評分者B之測驗訊息函數曲線 ...........................................................................22 圖 5 能力與答對機率圖 ..............................................................................................24. V.

(7) 第一章、緒論本研究旨在發展一份以設計類科之大學生為主體之測驗，主要測量之特質為其想像力，名為設計類科大學生想像力測驗。針對此測驗進行試題反應理論之分析，增加對此測驗特性之瞭解，最後以此為依據，做為測驗優缺點之指標，並依據指標進行測驗之修改，以編製出適合設計類科大學生之想像力測驗。. 第一節、研究動機在日漸多元的教育制度下，想像力的重要性逐漸的顯露出來。不論是學習成就抑或是人際關係的擴展，想像力皆佔有舉足輕重的角色（Eckhoff & Urbach, 2008; Husnu & Crisp, 2010）。假若想像力不復存在於人類世界，則人類幾千年來的文明發展將停滯不前。想像力提供創造性活動的基礎，屬於文化生活、藝術、科學與技術創新上重要的成分。從這個角度上來說，我們生活上的一切都是經由我們親手創造的，因此我們可以這樣認定：人類的文明世界與大自然的不同是，他是由我們人類藉由想像力與創造力創造出來的（Vygotsky, trans. 2004）。Vygotsky（trans. 2004）認為人類大腦除了儲存以往經驗的功能之外，還有其他重要而不可或缺的功能，也就是所謂的結合與創造性活動。因此，根據上述學者們的想法，研究者認為，人類的生活不僅僅只是記憶與應用知識的能力，想像力亦為生存必需的能力之一。如果缺乏想像力，人類將被電腦所取代。想像力，與創造力的關係密不可分，Vygotsky (trans. 2004) 認為任何能夠提供新的東西的行為即為創造性行為，想像力則是人類腦部進行創造性行為的能力，亦即創造性行為的實行基礎。因此，想像力所涵蓋的範圍比創造力更為廣泛，不再侷限於創造出來的產物與其行為之能力，而是在腦中思考創造性行為的歷程即為想像力。. 1.

(8) 第二節、研究目的想像力對人類之發展重要性是無庸置疑的，因此將想像力量化之概念的重要性亦日益增加。擴散性思考測驗可觀察受試者於創造力上量化出來的資料（Runco, 1991; Torrance, 1987），此類型測驗最普遍為世人所接受的代表即為托倫斯創造力測驗（Torrance Tests of Creative Thinking, TTCT）。TTCT 是創造力之父 Torrance（1966）所編製，至今經過了四次的修改（Kim, 2006），被翻譯成超過 35 國語言流通於世界各地（Davis, 1997），是最常被引用的創造力測驗（Lissitz & Willhoft, 1985）。TTCT 主要是以 Guilford（1956）的智力結構論（Structure of the Intellect, SI）中的擴散性思維（Divergent Production）為主要理論基礎，認為擴散性思維為一種存取記憶的能力，能夠找到大量的符合某些簡單標準之訊息。舉例來說，如果要找出符合〝圓圈〞此標準的東西，我們就會產生很多與〝圓圈〞相關的訊息。擴散性思維是一種認知，是一種創造力的潛力（Runco, 1993）。擴散性思維測驗則是用來測量這種潛力的測驗（Fishkin & Johnson, 1998; Hunsaker & Callahan, 1995; Mouchiroud & Lubart, 2001; Runco, 1986）。雖然 TTCT 是一個使用很廣泛，並且兼具信、效度，受到各界所使用的良好測驗（Kim, 2006），然而他終究為針對創造力所編製的測驗，即使在很多面向與方面與想像力有雷同之處，仍非想像力測驗。因此研究者試圖結合 Vygotsky 對於想像力的想法與 Guilford 擴散性思考之概念發展出想像力測驗。擴散性思維與收斂性思維（convergent thinking）有本質上的不同，收斂性思維是根據情境從舊有的記憶中搜尋固定的答案，他包含一般的問題解決的能力，跟擴散性思維的差異為他有固定的答案（Guilford, 1956）。在想像力的測量上，除了擴散性思考測驗之外，最直觀的測量方式為產品評定，很顯然的讓受試者產生一個以上之想像力產品，並藉由評定此產品進行受試者想像力之測. 2.

(9) 量，是最為普遍的方式（Hocevar, 1981）。然而不論是擴散性思維測驗抑或是藉由評定產品來測量受試者之想像力，皆因沒有固定答案的特性，而往往借重評分者的評分。在實際做法上即是加上評分標準，將受試所作答之反應或產品進行評分。然而在這一過程中，評分者的主觀成分之影響是極大。在這樣的前提下，試題反應理論（item response theory, IRT）可將評分者效果模式化，是較為適合針對此類型測驗進行分析測驗理論。因此研究者將使用試題反應理論對大學生想像力測驗進行分析，以瞭解測驗之特性與其適用範圍。本研究的研究目的為：一、結合 Vygotsky 與 Guilford 等學者的理論，編製設計類科大學生想像力測驗。二、使用試題反應理論對設計類科大學生想像力測驗進行分析。三、探討設計類科大學生想像力測驗之特性與適用範圍。. 第三節、名詞定義與名詞解釋由於想像力有許多不同的學者試圖使用不同的角度去解釋，亦有不同的解釋方法與理解方式，本研究根據 Vygotsky 的理論，將想像力定義為「在腦中的創造性行為」。. 3.

(10) 第二章、文獻探討以往的學者們是如何看待想像力呢？既然想像力對人類是如此的重要，那面對這種無法立即觀察到的心理特質，該如何去測量？學者們是如何測量的？以下將針對這些部分進行文獻探討與批判，據以編製適用於設計類科大學生的想像力測驗。此外，在針對設計類科的大學生進行想像力測驗的施測後，研究者將使用試題反應理論對作答資料進行分析，以瞭解測驗以及試題的特性與優缺點。. 第一節、想像力想像力（imagination）與人類日常生活息息相關，Eckhoff 與 Urbach（2008）認為想像力是人類的生活的基礎，在日常生活中是不可或缺的。Vygotsky（trans. 2004）指出人類的行為分成兩類：一種是從過去的經驗提取的認知行為，另外一種則是以結合之前經驗元素所產生之創造性行為。根據 Vygotsky 的理論，想像力與日常生活的關係分為以下四種規則，而這四種規則正是想像力發展的基礎。以下將介紹 Vygotsky 所主張的四個規則：規則一是最重要也是最基本的規則，並且同時控制想像力的運作。此規則的主要運作如下，想像力的創性活動依賴著豐富日常生活經驗，因為日常生活的經驗提供了大量想像力的材料。Vygotsky 認為人類不可能沒有以過去的任何的經驗做為元素然後產生想像力。舉例來說，糖果屋也許是大家耳熟能詳的童話故事，初次接觸這個故事的人們可能會讚嘆這個作者的想像力是如此的豐富。然而其中的糖果與房子皆是生活中隨處可見的物品，這些元素皆是從作者生活經驗取得。經驗越豐富的人，想像力的材料也越豐富。上述的例子中，如果所認識糖果的種類越豐富，能想像出來的糖果屋自然也越豪華；反之如果完全不知道糖果是什麼，則房子只是一般的房子而已，更遑論. 4.

(11) 想像出來美輪美奐的糖果屋了！規則二所提到想像力與現實間之連結是比較不同的，即使規則二是以規則一為基礎，然而卻比想像力元素與經驗間直接的連結還要複雜，最後的產物是想像與現實的複合體。在此規則中包含了想像力元素的轉換，而此元素的來源可以為他人的經驗（也就是所謂的二手經驗）。舉例來說，一個從未離開家鄉的兒童，正津津有味的聆聽前天才從埃及回來的遠親敘說著有趣的旅程以及壯觀的金字塔。這個兒童的腦海中逐漸浮現出埃及炙熱的天氣、黃塵滾滾的沙漠以及用巨大磚頭砌成的三角錐形狀的金字塔。在這個例子中說明了兒童不需要親自有過去埃及的經歷，即可透過二手經驗來產生想像。然而需要注意的是，此類想像與現實間之結合依舊需要以既往的經驗為前提。以上述的例子來說，如果兒童並沒有天氣冷熱、沙漠乾燥抑或是三角錐與磚頭等的概念，那麼上述之想像力便無法產生。想像力與現實間之第三種規則是情緒。現實中的情緒與想像力是互相依賴的，情緒是現實的一部分並且足以影響想像力。例如，小孩對於黑暗的感覺多是令人恐懼的，因此對小孩來說這樣的恐懼可能會產生許多不同的想像。所有想像力的形式都包含情感的元素，也就是說每一個想像力的建構都包括了感情的成分。即使這個建構跟現實生活沒有相關，但是他喚起的情感卻依然是真實的感覺，一個人真正的感情經歷。情緒會與現實的影像有所關聯。與情緒一同被聯想的影像通常會與自己創造出來情緒性的影像結合。舉例來說，一個小孩走進昏暗的房間，可能產生衣服的掛勾上有個人或是強盜打破房子的幻覺。這個強盜的形象是被小孩運用想像力創造出來的而非真實的，但是孩子的恐懼的經驗卻是真實的。相似的情境在每一個幻想的建構中發生，這種心理學上的規律可以像我們解釋為什麼藝術創作的想像力可以對我們產生強烈的情感。最後一個想像力與現實間的規則，與上述的三個規則非常相關，卻也是 5.

(12) 完全不同的形式。這個規則的本質是，想像力的建構在整體上展現新的東西，這些東西不曾在人類的經驗中出現過，亦不曾與現實的世界存在著相關。然而，這新的東西一旦被產生出來，就確實的存在世界上，並且開始對其它的事物造成影響。也許我們可以說想像力的產生有遵循一個循環的路徑：人們從現實中取得想像力的元素，經過人類內在的處理之後，這些元素被完全的改造並轉換為想像力的產品。最後當這些想像力的產品成為物質形式之後就會轉成現實，此時這個產品可以影響其他事物，他就成為了可被取得的想像力元素。這是想像力運作的一個完整的週期。 Vygotsky 在想像力與現實的關係上提出四個規則之後，並進一步的探討想像力的歷程。透過不斷的成長與經歷，日常生活的經驗也逐漸的累積，對於任何一件事物都會有自己的想法與看法，而這些屬於我們自己的生活經歷，正是我們想像力材料的來源之一。任何一個複雜的整體，都是由數個更小的部分所組成，而最小的這個單位我們稱之為想像力的元素。在想像力的歷程中，解離（Dissociation）與聯合（Association）是兩個不可或缺的組成部分。解離為打破複雜的整體，分離出一個或多個不同的想像力元素。在這個過程中，這些想像力的元素被分離出來，有些被保留、有些被遺忘。而這個部分，是想像力產生的重要條件之一。聯合則是指將元素整合統一，他可以將元素以不同的數量、型態與形式進行整合。並成為另外一個複雜的整體。然而此歷程並非想像力歷程的全部，而是只限於內部的歷程，如上文所提，想像力亦包含將想像力轉換成現實。想像力的歷程除了解離與聯合之外，是否有其他的因素？針對想像力，也許比較少有學者討論這一部分。不過很明確的，想像力是屬於人類能力的一部分。從這個角度來看，人類智力發展的理論也許可以提供一些端倪。Guilford （1967）以 Thurstone（1938）的智力群因論（group-factor theory）為基礎進行 6.

(13) 智力因素的研究，提出了一個 Thurstone 尚未提及的因子，創造性思考。Guilford 在其智力結構模型（structure-of-intellect model, SOI）中，提到智力分為三個面向，分別是操作（operations）、內容（contents）與產物（products）。由於智力並非本篇探討重點，因此只介紹 SOI 模式中與想像力相關之擴散性思維（divergent thinking）。在 SOI 模式中，擴散性思維指的是從記憶中檢索出符合特定種類的物件。例如在我們必須為某事物命名時，就會思索各種符合特質的名稱。整理 Guilford（1956，1959，1960，1986）的理論，認為創造性思考涉及發散性思維，強調流暢性（fluency）、靈活性（flexibility）、原創性（originality）和闡述（elaboration）。著名的托倫氏創造力測驗（Torrance Tests of Creative Thinking, TTCT）即以此為基礎進行發展。關於想像力的定義與近似想像力的一些理論發展至今已有多年的歷史，每位學者都有其支持的學派與想法。研究者認為想像力應該像是 Vygotsky 所提，必須有解離與聯合想像力元素的概念，亦需如 Guilford 擴散性思考的特質，因此研究者在上文中僅整理此兩位學者的立論，並以此做為此想像力測驗的基礎。. 第二節、想像力的測量提到與想像力相關的測驗，創造力之父 Torrance 於 1966 年發展的托倫氏創造力測驗（Torrance tests of creative thinking, TTCT）是最廣為世人所接受並且使用的（Davis, 1997）。此測驗也是以擴散性思考測驗的理念來編製，分為語文與圖片兩個部分。TTCT 在 1974、1984、1990 與 1998 年被修改了 4 次，它在教育領域經常被使用。然而 Chase（1985）認為 TTCT 並不能完全解釋 Torrance 對創造力的定義，當然 Torrance 並沒有提及此份測驗可以完全解釋創造力的向度，也沒有表示應該使用來做為創造力的唯一依據（Treffinger, 1985）。Torrance （1974）認為在 TTCT 上表現高分並不代表創造性行為發生的機率高。Torrance. 7.

(14) 認為人類創造性行為的發生與創造力的動機與技術相關（Torrance, 1990, 1998; Torrance & Ball, 1984）。創造力與想像力皆屬於人類內在的心理特質，不論是 Guilford 所認為的屬於智力的一部分，抑或是 Vygotsky 所認為的一種心理歷程，他所代表的能量皆非可以直接觀察到的，因此如何測量此類心理特質是個亟需探討的議題。測量此類心理活動的方式有許多種，亦有學者對此進行討論。Hocevar（1981）與 Hocevar & Bachelor（1989）提出的分類方式最為廣泛，分成擴散性思考測驗（test of divergent thinking）、態度與興趣量表（attitude and interest inventories）、人格量表（personality inventories）、傳記式問卷（biographical inventories）、教師評定（teacher nomination）、同儕評定（peer nomination）、照護者評定（supervisor ratings）、作品評定（judgment of products）、專家的特質（eminence）與創造力活動與成就之自陳式報告（self-reported creative activities and achievements）。擴散性思考測驗在創造力上是被應用最廣泛的測驗（Hocevar，1981）。它是以 Guilford（1956）提出的智力結構模型為基礎。他認為創造的能力包含了許多的因子（流暢性、原創性…等）。擴散性思考測驗與一般傳統的測驗最大的區別是，它需要眾多的反應來取代正確的反應。此類測驗的應用有 TTCT 與威廉氏創造力測驗等。有些研究認為態度與興趣測驗可以測量此類型的心理特質，這個論點的基礎建立在人類可以用態度與興趣來表達創造性的活動（Hocevar, 1981）。例如 Guilford-Zimmerman Interest Scale 內包含了創造力興趣量表。有些研究指出，相較於認知能力，個人特質比較能反應出創造力，因此人格量表被用來測量創造性人格。傳記式問卷假定人類的行為受到過往的經驗的影響，因此個人傳記可用來測量創造的能力（Buel, 1965; Buel, Albright, & Glennon, 1966; McDermid, 1965; Owens, Schumacher, & Clark, 1957）。此類測驗即是利用個人自傳描述之過往經 8.

(15) 驗來判定此人在創造性行為上的能力。另外，他人的評定（老師、同儕或其他專家）也是一種測量此類特質的方式之一，Haddon 與 Lytton（1971）認為教師的評定是創造性思考常用的標準；Hocevar（1981）也發現同儕的評定也是可用來進行的指標之一。很明顯的，創造力或想像力需要產生一些作品，特別是對於設計類科的大學生而言。因此，如何評定這些作品也成了評量這方面能力的指標之一。從一個或多個產品來識別或判定人類創造力是一個涵蓋大部分的研究和樣本的取向（Hocevar, 1981），這個取向的代表為一個鮮為人知的測驗是 Foster 於 1971 年發展的，測量的內容包括數學、物理、戲劇、文學與音樂等面向，是一個具有極大野心的測驗。每一個面向的產品皆有三個評分標準：流暢性（fluency）、靈活性（flexibility）與原創性（originality），然而此取向卻有一個很大的限制，在評定產品的過程中經常伴隨著很高的評分者主觀性（Hocevar, 1981）。想像力的測驗型態種類紛多，每一種取向皆有其適用範圍與特性。Vygotsky （trans. 2004）在想像力與現實的關係中的最後一個規則是將想像力與現實做結合。研究者認為如果必須測量想像力，就不能忽略這個重點，因此，研究者捨棄 Guilford 的擴散性思考測驗，採用作品評定法來做為本研究測驗之型態。然而 Guilford 對於擴散性思考的定義卻是不容忽視，Foster（1971）所發展之測驗亦採用 Guilford 的定義。因此，本研究將 Guilford 的定義之一：原創力（originality）視為評定測驗分數高低的其中一項指標。然而上文中有提及此類測驗方法有個致命的缺點：評分者的主觀性很高。因此本研究除了尋求相關領域之專家來進行評分之外，亦考慮使用試題反應理論（item response theory, IRT）中關於探討評分者效果（rater effect）的模式來進行資料分析，以期在此階段能夠判斷出評分者效果在此份測驗上的影響，下一節研究者將介紹試題反應理論及評分者效果。. 9.

(16) 第三節、試題反應理論雖然測驗自古以來就存在著，但直至 1905 年 Binet 與 Simon 發展智力測驗，才出現最早被發展出來的心理測驗。至今所發展出來的測驗的理論便是起源於此。最早的測驗理論之概念起源於 Gulliksen （1950）的著作《Theory of mental test》，其測驗理論發展至今仍佔有一定的地位。然而僅僅發展幾十年的理論，難免會有些不足與其限制，因此新的測驗理論應運而生。為了彌補這些不足， Lord（1968）率先提出試題反應理論中參數的估算法與理論之見解，並於 1980 出版第一本以試題反應理論為名的專書，自此開始，試題反應理論步入時代潮流。試題反應理論主要是以個別試題的觀點來解釋測驗分數的涵義，以此為基礎，試題反應理論中各理論架構也為眾多學者所探討。由於本研究使用的想像力測驗型態為作品的評定，因此需要有多位的評分者針對作品進行評分，藉以評估作品的優劣，故而評分者的嚴苛程度對於作品評定的重要性更是不容忽視。以往在探討評分者的研究通常是在古典測驗理論（classic test theory, CTT）的架構下進行，然而古典測驗理論有其缺點，其樣本依賴與試題依賴的狀況會導致測驗結果的分析與解釋產生問題，試題反應理論可以克服此限制（Adams, Wilson, & Wang, 1997），因此本研究將選擇試題反應理論中的模式來進行資料分析。透過文獻的探討，以下本研究將針對試題反應理論中探討評分者的模式－多面向模式（many-facet model, MFM）進行介紹。 Linacre 於 1989 年提出多面向模式，主要是將評分者的嚴苛程度置入 Rasch 模式（Rasch，1960）中，成為一個典型的三面向模式（three-facet model），此模式為 Rsach 模式的延伸。公式如下：. 10.

(17) p  log nir1  = θ n − β i − Dr ，  pnir 0 . （公式 1）. 其中θn 表示受評者的潛在能力值、βi 則是代表試題的難度、Dr 則是評分者的嚴厲程度。pnir1 與 pnir0 分別是受試者 n 在試題 i 與評分者 r 的情況下得 1 分的機率與得 0 分的機率。此模式亦可延伸為適用多分題的形態：   p log nirk  = θ n − β i − τ k − Dr ，  p  nir ( k −1) . （公式 2）. 在公式 2 中，θn 表示受評者的潛在能力值、βi 則是代表試題的難度、τk 為階難度、Dr 則是評分者的嚴厲程度。pnirk 與 pnir（k-1）分別是受試者 n 在試題 i 與評分者 r 的情況下得 k 分的機率與得 k-1 分的機率。公式 2 是屬於評等量尺模式（rating scale model, RSM）的延伸，評等量尺模式的重要特性是假設每一道試題的階難度皆相等，因此τk 與試題 i 無關，如此可以有效減少參數個數，然與資料的適配情形通常不理想。如果每一道試題的階難度不相等，也就是說試題的階難度隨著試題的不同而異時，公式可改寫如下：  p  log nirk  = θ n − δ i − τ ik − Dr ， p   nir ( k −1) . （公式 3）. 公式 3 與公式 2 的差別為階難度τ之差異。公式 3 中階難度τik 隨著試題而改變，而公式 2 則否，此模式為部分計分模式（partial credit model, PCM）之延伸。在本研究中，設計類科大學生想像力測驗的作答反應為一份作品。從評分者的角度來看，每一份測驗的作品皆可視為一份測驗，透過針對不同的評分標準進行評分，每一個評分的標準可視為一道試題。亦即每次的評分可視為評分者在每一個評分標準上的作答反應，從這個面向來探討，似乎使用一般心理量表常用的李克特氏量表（Likert Scales）來解讀較為合適，基於在試題反應理論 11.

(18) 中評等量尺模式的特性最適合用來分析李克特氏量表，因此本研究將採用評等量尺模式延伸（公式 2）之公式來對設計類科大學生想像力測驗進行分析。在試題反應理論中，訊息函數（information function）扮演著重要角色，可以做為描述試題或測驗以及比較測驗相對效能的實用方法之依據。因此在此研究中，研究者使用測驗訊息函數（test information function）來了解設計類科大學生想像力測驗之適用範圍。測驗訊息函數為在某個能力值上各別試題訊息函數（item information function）之總和。Samejima (1969, 1972)提出多分題試題訊息函數之定義公式。評等量尺模式之試題訊息之公式如下（Baker, 2004, p220-230）： m. I item (θ ) = ∑ k =1. [P (θ )]. 2. ' k. Pk (θ ). − Pk'' (θ ). （公式 4）. 在公式 4 中，Iitem(θ)為試題訊息函數，Pk(θ)為能力值為θ的受試者在該試題上得到 k 分之機率。Pk’(θ)為 Pk(θ)之一階導函數、Pk’’(θ)為 Pk(θ)之二階導函數。測驗訊息函數則為所有試題訊息函數之加總，公式如下： I test (θ ) =. i. ∑I. item =1. item. （公式 5）. 此研究使用公式 4 與公式 5 進行測驗試題訊息之分析與計算，以瞭解設計類科大學生想像力測驗之適用範圍。. 12.

(19) 第三章、研究方法本研究整理以往學者們的研究，針對想像力進行探討，選取適切之測量方式，期待能測量人類想像力之能力。並選取適切之測驗分析法，針對此測驗進行更進一步的分析，以期能精確之描述此測驗之特質與適用範圍，進一步對測驗進行解釋。大學生想像力測驗主要是以評分者對於受評者的作品進行評分的方式來進行。評分指標分成五個，各研究細節於本章各節討論之。. 第一節、研究流程本研究主要流程如下圖 1，首先透過文獻探討的方式建構想像力之定義，唯有在想像力已定義的前提下，後面的分析才有理論基礎以及後續的意義。之後，本研究將根據想像力的定義以及 Vygotsky 的理論進行問卷試題的編製。本研究編製之測驗題本包含一道實作題。在樣本的選取方面，為了配合專家的評分，本研究選取國立某科技大學設計學院創意生活設計系之大學生為樣本。在評分者進行評分時，由研究者與專家討論評分向度，而評分的標準亦經由研究者根據不同學者的理論與需求來確立，詳細介紹於本章第二節。之後由不同評分者分別針對受試者的作品進行評分，以確保評分之客觀。值得一提的是，本研究旨在探討將評分者效果模式化，因此只取兩位評分者做為代表，不另增加評分者數量。最後回收已評分之題本後再進行試題的分析、討論與論文撰寫。. 13.

(20) 圖 1 研究流程圖. 第二節、題目編製與評分標準在選定施測樣本前，題目的編製與評定作品的評分標準是很重要的工作之一。因此，研究者整理不同學者之研究並整理出自己的想法進行題目的編製與作品評定的標準，最後再尋求相關領域專家的評定，以期能精準的測量研究者欲測量之特質，本節將介紹題目編製與評分標準之確立。. 壹、題目編製由於想像力除了創新之外，亦需與現實結合的能力，因此研究者進行題目的編製時，參考不同的元素，並且以 Vygotsky 想像力與現實的四個規則為基礎，期待題目能夠符合四個規則。研究者在設計題目的時候將經驗（過往經驗及二手經驗）、情感與產品輸出等元素置入題本。題本之題目為設計鮮奶包裝上的標誌，並希望受試者以兒童的喜愛與健康快樂為主軸（完整之題目請參見附錄）。在這個題目中，除了牛奶為生活經驗的基礎之外、快樂與健康這兩個概念亦分別包含了情緒與抽象的概念，最後產出生活中實際可使用的產品。因此研究者將這樣的題目帶入題本中。題目除了研究者主觀的進行編製外，亦經由兩位專家進行評估，並以此做為專家效度之基礎。. 14.

(21) 貳、評分標準本研究根據以往學者們的研究，將想像力視為一種創新能力的心理歷程，然而這種心理歷程必須是可以與現實進行結合的。並且採用 Guilford 的概念，認為想像力不僅僅是創新而已，亦包含精進力（補充新觀念與組織成相關概念群的能力）與流暢力（產生多少可能性的構想與觀念）。在是否與現實結合的部分，增加一項指標，內容為是否能與評分者引起共鳴。因此評分標準分為五項：構圖完整性、色彩多樣性、創作新穎性、主題適切性與想法趣味性。在構圖完整性中，評分的標準為物件數量是否多元豐富；在色彩多樣性中，顏色是否豐富多樣亦為評分標準，這兩個標準主要是描述受評者能產生多少可能性的構想與觀念。在創作新穎性之評分標準中，則是以原創性做為理論基礎；主題適切性主要是評定主題內容是否契合，文字補充更助理解，此為精進力（補充新觀念與組織成相關概念群的能力）的表現；最後想法趣味性則是評定產品是評定作品是否能與評分者產生共鳴。在這個指標中，不直接讓評分者評「應用性」而使用「趣味性」是使用雙盲設計來降低評分者主觀的影響。由於此題之題目為 LOGO 的設計，兒童的喜好是很大的關鍵點，因此研究者認為評分者對作品趣味性越高，此作品越能應用到實際生活上。所以將此指標視為能否與現實做結合之評定標準。評定結構圖如下圖 2 所示。評分者經由五種評分標準對受評者之作品進行評分，並藉此瞭解受評者潛在之能力。. 15.

(22) 圖 2 評定結構圖. 第三節、研究工具與結果分析在施測結束之後，分析之工具與結果分析之方法是更為重要的，本研究將使用軟體 ConQuest 針對測驗結果進行分析。本節介紹分析之工具 ConQuest 軟體以及結果分析之方法。. 壹、研究工具本研究藉由電腦軟體 ConQuest 進行試題反應理論中評分者效應的相關參數的估計。ConQuest 是 Wu，Adams 與 Wilson（2007）配合多向度隨機係數多項洛基模式（ multidimensional random coef ﬁcients. multinomial logit model,. MRCMLM；Adams, Wilson, & Wu, 1997）模式所創之軟體。可以計算試題反應以及潛在回歸相關模式的軟體。他提供了一些可做修改的彈性，以配合不同的模式。ConQuest 主要是分析的模型是 Rasch Model 以及其延伸模式（Rasch family）。 ConQuest 使用最大邊際概似法（marginal maximum likelihood estimates,. 16.

(23) MMLE)、Bock 與 Aitken（1981）的高斯積分法（Gauss-Hermite quadrature）以及 Volodin 與 Adams（1995）的蒙地卡羅法（Monte Carlo method）進行試題參數之估計。能力值的估計則是使用 EAP ability estimate（Lord, 1983,1984）。. 貳、結果分析本研究使用 Rasch Model 下的延伸模式(公式 2)加上題目來進行評分者與試題難度的估算，判定不同評分者在設計類科大學生想像力測驗上的效果是否不同；其次將分析五種評分指標在此份測驗上的意義與重要性，最後繪製測驗訊息函數，藉以瞭解此測驗之適用範圍與限制。. 17.

(24) 第四章、研究結果本研究結果主要分成兩個部分，樣本描述與試題反應理論的多面向（facet）模式分析，樣本描述主要是根據受試者的背景變項與測驗的回收率來進行統計。在多面向模式分析中，本研究主要以軟體 ConQuest 所呈現之報表為主要解釋內容，細項將於各節詳細敘述。. 第一節、樣本描述大學生想像力測驗主要是以某科技大學之大學生為樣本，62 位學生將針對題本進行施測。62 位學生中男生佔 16 位，女生為 46 位，男女比大約為 1:3。有 59 位學生繳回，其中男生有 15 位，女生有 44 位。回收率達 90%。不論與性別，其回收百分比皆高於九成，相關樣本描述如下表 1。. 表 1 樣本描述表題本施測總人數. 62. 男性. 16. 女性. 46. 回收人數 / 回收百分比. 58 / 92%. 男性 / 回收百分比. 15 / 94%. 女性 / 回收百分比. 44 / 96%. 18.

(25) 第二節、試題反應理論之多面向模式分析結果多面向模式分析結果主要以軟體 ConQuest 所呈現的數據為主。研究者整理為下頁表 2。三個面向分別為評分者、評分指標與受試者能力。在評分者方面， A 與 B 評分者之嚴苛度估計值分別為-0.73 與-1.04，MNSQ 分別為 1.83 與 1.77，顯示兩位評分者之嚴苛度均較低，評分者 B 之嚴苛度更是比評分者 A 稍低，不過兩位評分者之間的差異稍小。在五項評分標準中構圖完整性之估計值為-0.07， MNSQ 為 0.48、色彩多樣性之估計值為 0.22，MNSQ 為 0.81、想法新穎性估計值為 0.04，MNSQ 為 0.76、主題適切性估計值為 0.11，MNSQ 為 0.70，最後想法趣味性亦因量尺不確定性問題，不進行估計，而是以五項標準的估計值平均為 0 來進行計算，其值為-0.31，MNSQ 為 1.24。最後，在階難度方面，由於是使用 RSM 之延伸模式，因此共用一組階難度，第一階之估計值為-2.38，MNSQ 為 0.99、第二階估計值為-2.13，MNSQ 為 1.24、第三階估計值為 1.16，MNSQ 為 1.256，最後一階估計值為 3.35，MNSQ 為 1.12。. 19.

(26) 表 2 各參數估計表估計值 MNSQ 評分者. 評分標準. A. -0.73. 1.83. B 構圖完整性. -1.04 -0.07. 1.77 0.48. 色彩多樣性. 0.22 0.04. 0.81 0.76. 想法趣味性. 0.11 -0.31. 0.70 1.24. 1 2. -2.38 -2.13. 0.99 1.24. 3 4. 1.16 3.35. 1.26 1.12. 想法新穎性主題適切性. 階難度. 第三節、試題反應理論之受試者能力分析結果受試者能力分析結果主要以軟體 ConQuest 所呈現的數據為主。研究者整理為下表 4。受試者能力之描述統計量如下表 3，平均能力為 0.05，變異數為 1.35，最小值為-2.27，最大值為 2.54。. 表 3 受試者能力統計表統計量. 數值. 平均數. 0.05. 標準差. 1.16. 變異數. 1.35. 最大值. 2.54. 最小值. -2.27. 全距. 4.81. 20.

(27) 表 4 受試者能力表受試者. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 能力值 -0.82 -1.69 -1.26. 0.55. -2.08 -0.82. 1.41. 1.41. 0.34. 1.41. se 0.46 受試者 11 能力值 2.31. 0.45. 0.47. 0.46. 0.44. 0.46. 0.47. 0.47. 0.47. 0.47. 12. 13. 14. 15. 16. 17. 18. 19. 20. 0.76. 0.55. -2.08. 0.11. 0.37. -0.60 -0.37 -0.82 -1.26. SE 0.47 受試者 21 能力值 -1.26. 0.46. 0.46. 0.44. 0.48. 0.47. 0.47. 0.49. 0.46. 0.47. 22. 23. 24. 25. 26. 27. 28. 29. 30. 0.34. 1.19. -0.37 -0.60 -0.37 -0.37. 0.76. -0.37 -1.04. SE 0.47 受試者 31 能力值 0.37. 0.47. 0.47. 0.49. 0.47. 0.49. 0.49. 0.46. 0.49. 0.47. 32. 33. 34. 35. 36. 37. 38. 39. 40. 1.86. -0.13 -0.37. 0.34. 0.34. 1.41. -0.60. 2.09. -0.82. SE 0.47 受試者 41 能力值 0.76. 0.48. 0.49. 0.49. 0.47. 0.47. 0.47. 0.47. 0.47. 0.46. 42. 43. 44. 45. 46. 47. 48. 49. 50. 1.64. 1.64. 0.55. 2.54. 0.76. -0.13 -1.26 -1.04 -2.27. SE 0.46 受試者 51 能力值 -0.13. 0.48. 0.48. 0.46. 0.47. 0.46. 0.49. 0.47. 0.47. 0.43. 52. 53. 54. 55. 56. 57. 58. 59. 60. 1.41. 0.11. 1.19. -0.82. 0.76. 0.76. -1.26 -1.89. SE 0.49 受試者 61 能力值 -*. 0.47. 0.48. 0.47. 0.46. 0.46. 0.46. 0.47. -*. 0.44. 62 -*. *Missing Data. 第四節、試題反應理論之測驗訊息函數在測驗訊息函數方面，此研究根據不同的能力值與不同的評分者計算出測驗之訊息函數，如下圖 3 與圖 4 所示，縱座標為測驗訊息函數量，橫坐標為能力值。可發現訊息函數呈現雙峰，代表測驗訊息在低能力與高能力下較高。亦即此測驗較能區辨高能力與低能力之群體。圖 3 與圖 4 表示不同的評分者下此測驗之訊息函數。圖 3 與圖 4 十分的相近，這代表不論在評分者 A 與 B 這樣的趨勢皆存在。. 21.

(28) 圖 3 評分者 A 之測驗訊息函數曲線. 圖 4 評分者 B 之測驗訊息函數曲線. 22.

(29) 第五章、討論與限制第一節、結果討論大學生想像力測驗之分析結果我們可以從以下幾個角度來看：各參數之估計值、Model-Data Fit 以及此分析結果在測驗上所代表的意義。. 壹、各參數之估計值首先是評分者參數之估計，-0.73 與-1.04 兩個數值純粹從統計上來看是顯著的(p<0.01)，也就是說這樣的數值是有意義的不等於 0。從試題反應理論的角度來看，在其他變項皆固定的情況下（指標、學生與階難度）受試者得分高低會受到評分者不同的影響。在本研究中，評分者 B 的嚴苛度數值比較小，是屬於比較寬鬆的，因此如果由評分者 B 進行評分，學生將比較容易得到高分。第二組估計值為評分標準的估計值，從統計上來看這些數值是顯著的 (p<0.01)，也就是不等於 0。從試題反應理論的公式上來看，我們可以把評分標準看成測驗中的試題，只要再加上階難度我們就可以算出任何一位受試者得分的狀況。最後一組參數為階難度參數，評等量尺的特性為整份測驗共用一組階難度，他控制每位受試者得到不同分數的難易度，從公式上來說，能力越高之受試者得到高分（4 分）之機率越高，反之得到低分（0 分）機率則越高。舉例來說，假設今天能力為θ的受試者進行作答，由評分者 A 進行評分，那他在創作新穎性這一個指標上得到 k 分的機率我們就可以用公式來計算：  P  log k  = θ − 評分者A(-0.73) − 創作新穎性指標(0.04) − 階難度  Pk − 1 . 其中能力值θ越大，得到 4 分的機率越高，如下圖 3 所示。橫座標為能力值，縱座標為達到該分之機率。. 23.

(30) 圖 5 能力與答對機率圖. 貳、Model-Data Fit 在試題反應理論下分析資料，每一個估計值除了誤差與顯著性之外，另外還有一個指標，主要是探討模式與資料的適配度，此指標為 MNSQ。在設計類科大學生想像力測驗的試題反應理論分析結果中，我們測的各面向(評分者、評分指標與階難度)之 MNSQ 與一般所認定的值(0.6-1.4)有所差距(如上表 2)。此結果反應出模式與資料的適配度不如預期。造成這種現象的可能原因有很多種，除了不適合用此模式來分析這筆資料外，樣本人數過少與試題品質不佳都有可能造成此現象的產生。由於本量表經過多位專家的檢視，因此不排除這樣的結果為樣本數所造成的影響。. 參、分析結果與大學生想像力測驗的關聯性大學生想像力測驗主要期待編製一份可以測量出大學生想像力之測驗，因此在分析過後，研究者重新檢視分析結果與測驗編製之關聯性。首先，是評分者效果的部分，雖然研究者知道評分者效果在想像力測驗中是存在的，然而研究者的目的為控制評分者所產生的影響，儘管這樣的效果存在，如果研究者可. 24.

(31) 以在計分時將這樣的效果討論進去，可以說成功的控制了評分者效果。從另外一個角度來看，兩位評分者之間的差異為 0.31，以此數值來解釋，兩位評分者在此測驗中效果有所不同，評分者 B 之嚴厲程度較低。接著是指標方面之探討，每個指標都有其對應的難度值，表示受試者在這些指標上拿分數的容易程度。值得一提的，即使各道試題之適配度指標（MNSQ）雖然都在標準內，但是部分指標非常接近臨界值，另外加上估計之誤差皆很大，這代表估計值不是非常的準確。針對這個狀況，研究者懷疑是樣本人數過少所引起。最後為階難度方面之探討，由上圖 5 可發現不論受試者能力值為何，得到 1 分的機率較低，即使在能力值-2.6 至-3.1 的高峰階段也儘比得 0 分與得 2 分支機率高一點點，此現象表示 1 分在此測驗中無法很精確的區辨受試者能力，因此可以考慮將此點數拿掉，將整份測驗改為四點記分。另外相同的階難度估計值之誤差亦非常大。此種現象發生之主要原因應同上段所探討的，樣本人數的影響。在受試者的能力值方面，研究者使用同一套軟體的 EAP 法進行能力估計，由於為了解決量尺不確定性的問題，設定受試者平均能力為 0。估出來的結果顯示受試者能力平均為 0.11，變異數為 1.53。研究者認為變異數略大主要是由抽樣誤差所造成。研究者認為樣本不具代表性與樣本數過小是主要的研究限制。在測驗訊息函數方面，可以看到不論是評分者 A 或是評分者 B，在受試者能力值為-3 的時後可達到最高，這意味著此測驗在低能力值上具有區辨的能力。其次在能力值為 1.5 的時後出現另外一個高峰，表示此測驗在受試者能力值為 1.5 時亦有不錯的表現。因此設計類科大學生想像力測驗之較為適合區辨出高能力與低能力之受試者，對於能力平庸者表現較差。至此，大學生想像力測驗的分析也告一段落，最後 ConQuest 提供相當於 25.

(32) 古典測驗理論中信度的值，也是在各測驗編製中無法忽略的一個重要指標。大學生想像力測驗的信度值為 0.780，加上具有專家效度，本測驗可謂兼具信、效度之優良測驗。. 第二節、研究限制與未來展望壹、研究限制上文中提及 Model-Data Fit 不如預期可能是樣本數過小所引起，研究者認為這一點為本研究之限制之一。為了解決這個問題，研究者認為只需要控制好抽樣，採取適切的抽樣方法與抽樣數量即可克服這樣的問題。其次，目前任何一種測量方法與分析方法皆會有其限制與誤差，這是不可避免的，即使試題反應理論是為了克服古典測驗理論的缺點而發展，但是其複雜的統計模式與運算增添了分析的難度，即使目前的估算法已發展行之有年，相對應的電腦套裝軟體也如雨後春筍般冒出，但是估計值與其誤差的考量亦是相關研究人員所需關注的重點。因此在解釋上更是不得不慎。. 貳、未來展望大學生想像力測驗的發展到這邊已經有一定的雛型了，但是測驗的編製分析與發展並不應止於此。未來的發展有下列各點：首先，應該增加抽樣的樣本來源除了增加樣本數之外，更應該增加樣本的代表性，不但可以使分析的結果更精準，分析完成後所得的結果亦更可以推估至母群。其次是在進行評分者效果的探討的時候，本研究只使用兩位評分者，然而在真正的社會環境中，只有兩位的評分者是較無說服力的，因此除了增加樣本的來源之外，增加數位相關領域之評分者亦為重要的方向。第三，本研究評分者間差異較少的情況是否是評分者之間的同質性較高? 抑或是因為已經給予評分標準所影響?這也許是在探討評分者效果時可以討論 26.

(33) 的重點之一。最後，設計類科大學生想像力測驗評分的指標雖然固定，但是皆由評分者進行評分，亦即評分者主觀意識可能影響結果。在本研究中雖然成功的控制了此變項，但是如果能夠將評分方法標準化，往後皆交由電腦進行評分，不但可以排除評分者的主觀意識，亦可大幅降低人事成本，此為大學生想像力測驗往前發展的一大步。. 27.

(34) 參考文獻 Adams, R. J., Wilson, M. R., & Wang, W.-C. (1997). The multidimensional random coefﬁcients multinomial logit model. Applied Psychological Measurement, 21, 1–23. Baker, F. B. (2004). Item Response Theory - Parameter Estimation Techniques. North Carolina: Marcel Dekker. Ball, O. E., & Torrance, E. P. (1984). Streamlines scoring workbook: Figural A. Bensenville, IL: Scholastic Testing Service, Inc. Binet, A., & Simon, T. (1905). Methodes nouvelles pour le diagnostic du niveau intellectuel des anormaux. Annee Psychologique, 11, 191-244. Buel, W. D. (1965). Biographical data and the identification of creative research personnel. Journal of Applied Psychology, 49(5), 318-321. Buel, W. D., Albright, L. E., & Glennon, J. R. (1966). A note on the generality and cross-validity of personal history for identifying creative research scientists. Journal of Applied Psychology, 50(3), 217-219. Bock, R.D., and Aitken, M. 1981. Marginal maximum likelihood estimation of item parameters: An application of the EM algorithm. Psychometrika, 46, 443–59. Chase, C. I. (1985). Review of the torrance tests of creative thinking. In J. V. Mitchell Jr. (Ed.), The ninth mental measurements yearbook (pp. 1631–1632). Lincoln: University of Nebraska, Buros Institute of Mental Measurements. Davis, G. A. (1997). Identifying creative students and measuring creativity. In N. Colangelo & G. A. Davis (Eds.), Handbook of gifted education (pp. 269–281). Needham Heights, MA: Viacom.. 28.

(35) Eckhoff, A., & Urbach, J. (2008). Understanding imaginative thinking during childhood: Sociocultural conceptions of creativity and imaginative thought. Early Childhood Education Journal, 36(2), 179-185. Fishkin, A. S., & Johnson, A. S. (1998). Who is creative? Identifying children’s creative abilities. Roeper Review,21(1), 40-46. Guilford, J. P. (1956). The structure of intellect. Psychological Bulletin, 53(4), 267-293. Guilford, J. P. (1959). Personality. New York: McGraw-Hill. Guilford, J. (1960). Basic conceptual problems in the psychology of thinking. Annals of The New York Academy Of Sciences, 916-21. Guilford, J. P. (1967). The nature of human intelligence. New York, NY US: McGraw-Hill. Guilford, J. P. (1986). Creative talents: Their nature, uses and development. Buffalo, NY: Bearly Ltd. Gulliksen, H. (1950). Theory of Mental Tests. New York:Wiley. Haddon, F. A., & Lytton, H. H. (1971). Primary education and divergent thinking abilities: Four years on. British Journal of Educational Psychology, 41(2), 136-147. Hocevar, D. (1981). Measurement of creativity: Review and critique. Journal of Personality Assessment, 45(5), 450-464. Hocevar, D., & Bachelor, P. (1989). A taxonomy and critique of measurements used in the study of creativity. In J. A. Glover, R. R. Ronning, C. R. Reynolds, J. A. Glover, R. R. Ronning, C. R. Reynolds (Eds.) , Handbook of creativity (pp. 53-75). New York, NY US: Plenum Press.. 29.

(36) Hunsaker, S.L., & Callahan, C. M. (1995). Creativity and giftedness: Published instruments uses and abuses.Gifted Child Quarterly, 39, 110-114. Husnu, S., & Crisp, R. J. (2010). Elaboration enhances the imagined contact effect. Journal of Experimental Social Psychology, 46(6), 943-950. Kim, K. (2006). Can we trust creativity tests? A review of the torrance tests of creative thinking (TTCT). Creativity Research Journal, 18(1), 3-14. Linacre, J. M. (1989). Many-facet Rasch measurement. Chicago, Illinois: MESA Press. Lissitz, R. W., & Willhoft, J. L. (1985). A methodological study of the Torrance Tests of Creativity. Journal of Educational Measurement, 22, 1–111. Lord, F., & Novick, M. (1968). Statistical theories of mental tests. New York: Addison- Wesley. Lord, F.M. (1983). Unbiased estimators of ability parameters, of their variance, and parallelforms reliability. Psychometrika, 48, 233–45. Lord, F.M. (1984). Maximum likelihood and Bayesian parameter estimation in item response theory. Research Report RR-84-30-ONR. Princeton, New Jersey: Educational Testing Service. McDermid, C. D. (1965). Some correlates of creativity in engineering personnel. Journal of Applied Psychology, 49(1), 14-19. Millar, G. W. (2002). The Torrance kids at mid-life: Selected case studies of creative behavior. Westport, CT US: Ablex Publishing. Mouchiroud, C., & Lubart, T. (2001). Children’s original thinking: an empirical examination of alternative measures derived from divergent thinking tasks. Journal of Genetic Psychology, 162(4), 382-401. Owens, W. A., Schumacher, C. F., & Clark, J. B. (1957). The measurement of creativity in machine design. Journal of Applied Psychology, 41(5), 297-302. 30.

(37) Rasch, G. (1980). Probability models for some intelligence and attainment tests. Chicago: The University of Chicago Press. (Original edition was published in 1960 by the Danish Institute for Educational Research, Copenhagen) Runco, M. A. (1993). Divergent thinking, creativity, and giftedness. Gifted Child Quarterly, 37, 16-22. Runco, M. A. (1986). Flexibility and originality in children’s divergent thinking. Journal of Psychology, 120(4), 345-352. Runco, M.A. (1991). Divergent thinking. Norwood, NJ: Ablex Press. Samejima, F. (1969). Estimation of latent ability using a response pattern of graded scores. Psychometrika Monograph Supplement, 34(4, Pt. 2). Samejima, F. (1972). A general model for free-response data. Psychometrika Monograph Supplement, 37(1, Pt. 2). Thurstone, L. L. (1938). Primary mental abilities. Chicago: University of Chicago Press. Torrance, E. P. (1966). The Torrance Tests of Creative Thinking-Norms-Technical Manual Research Edition-Verbal Tests, Forms A and B-Figural Tests, Forms A and B. Princeton, NJ: Personnel Press. Torrance, E. P. (1987). Teaching for creativity. In S. G. Isaksen (Ed.), Frontiers of creativity research: Beyond the basics (pp. 189-215). Buffalo, NY: Beady Limited. Torrance, E. P. (1990). The Torrance tests of creative thinking norms—technical manual figural (streamlined) forms A & B. Bensenville, IL: Scholastic Testing Service, Inc. Torrance, E. P. (1998). The Torrance tests of creative thinking norms—technical manual figural (streamlined) forms A & B. Bensenville, IL: Scholastic Testing 31.

(38) Service, Inc. Treffinger, D. J. (1985). Review of the torrance tests of creative thinking. In J. V. Mitchell Jr. (Ed.), The ninth mental measurements yearbook (pp. 1632–1634). Lincoln: University of Nebraska, Buros Institute of Mental Measurements. Volodin, N.A., and Adams, R.J. 1995. Identifying and estimating a D-dimensional item response model. Paper presented at the International Objective Measurement Workshop, University of California. April, Berkeley, California. Vygotsky, L. S. (trans. 2004). Imagination and creativity in childhood. Journal of Russian & East European Psychology, 42(1), 7-97. Wu, M. L., Adams, R. J. & Wilson, M. R.(2007). ACER ConQuest Version 2.0. Australian: Acer Press.. 32.

(39)