結構化教師甄試口試之相關系列研究 (III)

(1)

行政院國家科學委員會專題研究計畫成果報告

結構化教師甄試口試之相關系列研究 (III)

研究成果報告(精簡版)

計畫類別：個別型計畫編號： NSC 95-2413-H-004-006- 執行期間： 95 年 08 月 01 日至 96 年 12 月 31 日執行單位：國立政治大學教育學系計畫主持人：胡悅倫共同主持人：余民寧計畫參與人員：博士班研究生-兼任助理：陳世芬、李仁豪報告附件：出席國際會議研究心得報告及發表論文處理方式：本計畫可公開查詢

中華民國 96 年 12 月 12 日

(2)

行政院國家科學委員會補助專題研究計畫

ˇ 成果報告

□期中進度報告

結構化教師甄試口試之相關系列研究（Ⅲ）

計畫類別：

ˇ

個別型計畫 □整合型計劃

計畫編號：NSC

95-2413-H-004-006-執行期間：95 年 8 月 1 日至 96 年 12 月 31 日

計畫主持人：胡悅倫

共同主持人：余民寧

計畫參與人員：

兼任助理陳世芬(博士班學生)、兼任助理李仁豪(博士班學生)

成果報告類型(依經費核定清單規定繳交)：

ˇ

精簡報告

□完整報告

本成果報告包括以下應繳交之附件：

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

ˇ

出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

處理方式：除產學合作研究計畫、提升產業技術及人才培育研究計畫、

列管計畫及下列情形者外，得立即公開查詢

□涉及專利或其他智慧財產權，□一年□二年後可公開查詢

執行單位：

中

華

民

國

九

十

六

年

十

二

月

十

二

日

(3)

壹、前言

教師甄試口試之目的在選擇有潛力且具專業知能的優秀教師，因此，在口試過程中，口試題目即扮演著關鍵性的角色。但是，面對這些關鍵性的題目，社會大眾對它的瞭解微乎其微，而且相較於筆試題目，極少有人願意針對口試題目做深入的探討。觀之目前心理計量研究的重點，大都放在探討筆試題目的信度、效度、抑或鑑別度等相關議題，甚至有人認為口試題目所在乎的不是題目本身的內容，而是在口試過程中，應試者的反應或是人格特質。然而，口試題目是否為一值得探討的議題呢？相信讀者很有興趣瞭解此一問題的答案。口試在人事甄選中一直扮演著舉足輕重，幾乎無可取代，此乃因其能測量到其他方法不可得到的特質。這些特質大致上可區分成三大類別（Gatewood & Field, 2001）：（1）人際關係；（2）組織公民行為；（3）專業工作知能。在人際關係方面，如社交能力及語言流暢度。無庸置疑地，良好的人際關係及語言能力，對個人在人際網路的建立及組織目標的達成，具有關鍵性的影響力，也間接及直接影響個人的生涯發展。其次，在組織公民行為方面，是指個人在組織中，願意多付出心力，以維護社群良好的互動或發展。此種特質，也說明一個人的獨立性、誠實、穩定性及堅持度。此種特質通常可在口試中,與應試者討論其工作習性、工作完成度、或工作環境後瞭解得知。除了人際關係能力及組織公民行為之外，口試最為特別的地方，在於它可以成功的測量出專業工作知能。關於工作上的專業知識，若其答案是簡短而制式的，那麼筆試將是較佳的選擇。但若涉及複雜的專業行為，如工廠中的機械操作，或是在學校中教學方法的運用，則口試將會是較好的選擇。研究者以為，假如口試委員少，或者應試者少，題目也少，那麼口試題目被研究的價值性則小。畢竟口試在乎的是個人特質、人際關係、組織公民行為、專業工作行為等特質。但若現在某種口試有上千題，或者數千題的口試題目，則其代表的意義就全然不同了。目前研究者因從事教師甄試的相關議題研究，在同一年度已蒐集到4901題的口試題目。其中86.59%（4244題）乃透過台北縣聯合教師甄試委員會中78位口試委員，詢問將近兩千多名的應試者，當中每位應試者的口試時間僅有6-10分鐘，而78位委員花了將近八小時的口試時間所得到的資料。換言之，同一天內有78個人對同一個主題——甄選優良教師，進行腦力激盪所得到的結果，研究者認為這是一個非常珍貴的資料。對於一個心理測驗研究者而言，這無疑是個寶物。套句徐志摩的話「數大便是美」。相信許多讀者皆同意這個觀點。而這些題目的總合，是否能反應出人事心理學對口試的期待，亦即這些口試題目真能測到「人際關係」、「組織公民行為」及「專業工作知能」嗎？這些疑惑皆讓口試成為一個有趣且具價值的研究議題。另外，研究者認為這些口試題目到底透露出何種訊息？口試委員心中都在想些什麼？是一樣或是不一樣的議題？或是個人的，抑或是環境的？是教室中的班級經營，抑或是當前熱門的教育政策問題？是行政服務抑或是教學能力？是教育專業知識抑或是個人生涯規劃？而哪些類別是最常被詢問的的問題？而哪些類別是與教師工作最有關聯的呢?而哪些類別是應試者最難回答的呢?相信許多讀者亦跟研究者一樣，對這些問題背後的答案有所期待。目前，在口試議題的研究上，研究者已從第一階段4901題中凝聚組合成十六個次類別，其中包含一類為無法歸類，但在分類的過程中，卻碰到以下幾個瓶頸：(1)每一類下的題目

(4)

數仍然太多太雜，難以瞭解。例如，「教學能力」有649題，「自我介紹」有675題，「班級經營」有853題等，其中有完全重複的，有部分雷同的，亦有完全不同的。(2)目前這些口試題目均是以文字的方式出現，究竟該如何以質量並重的研究方法，勾勒出一個完整的圖像，可供敘說、討論與研究? (3)到底這些口試題目背後隱藏著何種理念？而這些理念又如何聚斂成一個可用以描繪未來優秀教師的完整圖像？為解決上述這些瓶頸，且為國內口試研究奠定完整的理論基礎，研究者決定應用概念構圖的方法----結構化概念形成法（structured conceptualization），針對口試題庫進行系統性研究，故本研究之具體目的如下：一、應用概念構圖法，具體呈現口試題目的圖像。二、透過口試題目圖像的描述，深入瞭解口試委員腦海中的抽象知識表徵，以幫助日後口試甄選活動的進行。

貳、文獻探討

一、口試

口試乃是教師甄試的重要關鍵，其結果往往決定一位教師的錄取與否。而一位教師的晉用卻又關係著千萬學子的學習生涯。欲求孩子能在學校快樂成長、享受學習，甚至卓然有成，師資的良窳乃是一件不容忽視的課題。是故，口試的重要性則是不言而喻。在口試的過程，所有的應試者無不卯足全力地，希望在短短的口試中脫穎而出，雀屏中選。而在決勝的關鍵時刻中，應試者必須在口試委員面前將其背景合宜地展現出來，對於口試委員所提之問題，應試者須極力展現其專業的程度。換言之，在口試過程，應試者必須將其知識與能力轉化到工作上，同時能展現個人在人格與專業上的優勢，期能達到工作上的要求 (Murray, 1999; Ream, 2000)。教師甄試面談應試者必須能展現解決問題的能力，統合專業的技能及永續智能成長的可能性。就某程度而言，經由面談的過程應試者越能回答越多的問題，則口試委員則可做出越有效的決定（Sdetsky ＆ Pell,1980）。面談並不只是在蒐集應試者的知識，更重要的是了解其運用知識的能力（Roberts, 1987）。有學者認為，一位應試者必要讓人感受到充滿活力、值得信賴、願意與他人合作，甚至是願意勤奮工作的（Braun, 1990）。通常大部分的候選人都是進入試場的前幾分鐘就已經被決定，而其後的時間大概只是再度的確認當初的決定（Braun, 1990; Murray, 1999; Sharp ＆ Sharp, 1997）。其實對大部分的校長而言，通常在口試之前對某些職務的人選都有個特定的圖像（Sharp ＆ Sharp, 1997）。因此除了對候選人的再度確認之外，口試委員在整個口試的過程就是在尋找該工作適合的候選人特質。在口試的技巧上，80/20 的黃金原則顯然非常適用。Kirkwood 與 Ralston (1999)強烈的建議。應試者要能在口試期佔去大部分的時間，才是致勝的關鍵。也就是說，在整個口試期間應試者最好能佔用 80％的談話；而口試委員則佔用 20％的時間。換句話說，對於口試委員的問題，應試者越能回答或愈能提供詳細的訊息，顯然被錄取的機會就比較大。筆者以為，口試最重要還是要回歸到口試是否有效的議題上，這也是社會大眾最關心的焦點。而在效度上的研究，發現口試結構化程度有助於提升口試的效度。「結構化面試」

(5)

英文譯為”structured interview”，亦稱為標準化（standardized）、指導性（guided）、系統性 (systematic)或是組型式(patterned)面試。結構化面試之所以能提升面試效度，在於面試委員對於決定該問何種問題與如何評價應試者的反映有一套完整架構。由後設分析研究更證實非結構面試的效度大約是在 0.14 到 0.30 之間，但是，一旦面試結構化後，其效度可增加至 0.35 至 0.62（Campion, Palmer, & Campion, 1997； Huffcutt & Arthur, 1994; Hunter & Hunter, 1984; Marchese & Muchinsky, 1993; McDaniel, Whetzel, Schmidt, & Maurer, 1994; Wiesner & Cronshaw, 1988; Wright, Lichtenfels, & Pursell, 1989），亦即結構式面試的效度是非結構式面試的二倍。

而在結構化的口試中，人事心理學在面談甄試的研究成果豐富；觀之國外對於結構化面試的文獻（如 Burnett, Fan, Motowidlo, ＆ Degroot, 1998；Campion,Palmer, ＆Campion, 1997；Huffcutt ＆Woehr, 1999；Janz,1982；McDaniel, Whetzel, Schmidt, ＆Maurer, 1994; Motowidlo, Carter, Dunnette, Tippins, Werner, Burnett, ＆ Vaughan, 1992；Wiesner ＆ Cronshaw, 1988; Wright, Lichtenfels, & Pursell, 1989），其中 Campion, Palmer ＆ Campion （1997）提出的十五項影響結構性面試的因素整理的最為詳盡，而其中與面試題目有關的因素如後： 1.面試題目擬定結構性面試的題目必須奠基於重要事件(critical incidents)的「工作分析」。所謂「工作分析」即該工作領域的專家學者使用問卷調查或專家座談方式，分析特定工作的重要細節，使能對工作的內容有一提綱挈領的瞭解。透過「工作分析」的步驟，面試委員便能掌握特定工作必須具備的能力，亦能針對這些必要的能力或重點發展出面試問題形式及內容，藉由這些問題的詢問，使應試者表現出這些問題相對應的能力或特質，以利面試委員做出反映應試者真實性的評分，達到選才之目的。「工作分析」不僅允許面試委員獲得應試者行為

有關的工作樣本的資訊（Dipboye & Gaugler, 1993），也強化了與工作有關之訊息數量，使重要訊息均能被納入考量。 2.應試者均被詢問相同之問題面試結構化程度取決於面試委員的提問標準化。而提問標準化即為面試委員針對每位應試者依相同的順序詢問相同的問題，若面試委員使用相同的語言詢問，更能提高結構化的程度。雖然高度結構化的面試效度很理想，但實際運作卻很困難，因為難保應試者不會洩露相關訊息給後續應試者，然而，使用相同的問題是將面試從「討論」轉向「科學性測量」的重要關鍵（Campion, Palmer, & Campion, 1997）。因此，如何克服實際困難，使用相同問題是提升面試效度的必要步驟（Schriesheim, Solomon, & Kopelman, 1989）。

3.即興問題或後續追問的處理一般而言，面試著重應試者與面試委員的動態互動歷程，在面試過程中，面試委員有時會不按既定的問題發問，或者會針對應試者先前的回答，額外或臨時提問一些與工作內容無關的問題，目的可能是為了獲得更多有用的訊息，以利決策評分。但是這些互動歷程卻容易讓面試委員在訊息收集上產生偏誤（Dipboye, 1994; Jelf, 1999）。為了避免不必要的訊息進入面試中，並提升面試的結構性，對於即興問題應該避免，而後續追問也應該扣緊主題，同時每一位應試者都能獲得相同的追問與澄清的機會。 4.問題形式與內容

(6)

早期研究（Janz, 1982; McDaniel et al., 1994; Motowidlo et al., 1992; Motowidlo, Dunnette,

& Carter, 1990）將面試問題形式歸納為六種：如「情境式問題」、「過去行為問題」、「背景

式問題」、「與工作知識有關的問題」、「真實工作的模擬」「心理特質問題」等。研究者亦發

現：以「情境式問題」及「過去行為問題」的面試效度最佳，而「心理特質問題」的面試效度最低（Janz, 1982； McDaniel et al., 1994）。其中情境問題的效度建立在目標或意圖與未來行為的關係上（Locke & Latham, 1984）；而過去行為問題的效度通常是假定過去行為是未來行為良好的預測因子（Mumford & Stokes, 1992）；心理特質問題十分模稜兩可，卻足以讓應試者表現出令人喜愛的態度或避免表現出缺點（Campion, Palmer, & Campion,

1997）。Taylor 與 Small (2002)後設分析進一步顯示，過去行為問題的平均效度高於情境問題（0.63 vs. 0.47）。 5.面試的時間與題數一如測驗長度對測驗信度的影響，當測驗長度愈長時，信度愈好；而信度愈佳，效度也會隨之提高。同理，面談的時間與題數的增加時，面談的效度也會增加。面談長度是一個基本，但又常被忽視的因素，在合理的時間下，「面談時間」與「面談題數」的增加導致

結構性較佳，因為較長的面談可獲得有關應試者較多的資訊（Campion, Palmer, & Campion, 1997）。過去的研究並未特別重視面談長度對面談結構性的影響，Campion、Palmer 與 Campion（1997）所收集到的近 200 篇有關面談研究的文獻中，只有 38 個研究報告面談的時間，其範圍在 3 至 120 分鐘間，而平均面談時間是 38.75 分鐘；並且只有 14 個研究報告面談的問題題數，其範圍在 4 至 34 題間，而平均題數是 16.50 題。但沒有一篇研究對所選擇的面談長度做解釋。至於，到底要多少時間及多少題目，目前尚無定論，有待學者進一步研究。是故，由面試題目的擬定、詢問方式、後續問題的處理，形式與內容，甚至是面試的時間與題數，都與口試結構化程度息息相關。而要提升口試結構化程度，方能增進口試的效度。然而要改進口試結構化程度的要項中，最困擾口試委員的工作，莫過於面試題目的擬定（胡悅倫，2007）。目前台灣教師甄試口試，為了保密的原則，面試委員通常在口試的前幾天才接到通知。到時間集合，頂多會前討論，並沒有所謂的面談訓練，或工作分析以擬定口試問題（胡悅倫，2007）。理想上，口試問題的擬定，最好是由工作分析得之。但，工作分析乃為一浩大的工程。其實也有人注意到，有關口試的題目在職場上的專家，就經常寫許多的面試問題，如：經理或是面試委員（Janz, 1982; Latham et al., 1980; Orpen, 1985; Roth ＆Campion, 1992）。但大部分的論文並沒有很詳細的說明口試題目是如何擬定的，所以顯然口試題目大部分都是由研究者自己撰寫（Palmer ＆ Campion, 1997）。而筆者以為，這正是學術研究上的缺口。目前，在論述教師甄試的研究中（Mondak, 2004; Hinderman, 2004），研究者在從事口試問題研發過程，的確是經由文獻探討，先瞭解所謂優秀教師，或稱效能教師（effective teacher）的可能性定義，而後依此定義再由研究者自行研發口試題目。是故，此種方式，一方面無法脫離他人思考的窠臼；另一方面，口試題目缺乏真實性，無法瞭解專家或口試委員對工作信念的看法，而在教師甄試，即是專家對教師此一職務的看法。是故，本研究分析教師甄試口試題目的內容，或許也可以解決目前國內教師甄試中所遇到的困境。目前國內教師甄試文獻在通俗性期刊或教育雜誌方面，其重點大多聚焦在公平性的問

(7)

題上。這些文章非嚴謹的研究報告或實證性論文，但多以口試委員或應試者觀點發表，多少能反應口試委員及應試者的心聲（如：石弘毅，2000；宋慶瑋，2003；陳坤德，1999；陳維貞，2001；楊素菱，2004；蘇鈺琦，2004）。對教師甄選評分的標準、公平性及口試委員的聘任方式提出質疑（石弘毅，2000；宋慶瑋，2003；陳維貞，2001；蘇鈺琦，2004），並認為口試和試教的評分流於主觀，建議有效增加評量者的客觀性（楊素菱，2004）；亦有認為甄選過程粗糙，甄選結果不具公信力的（蘇鈺琦，2004）。這些通俗性期刊或教育雜誌的文章，因非嚴謹的研究報告或實證性論文，故其客觀性及說服力仍嫌不足。國內針對教師甄選之相關研究頗多，研究的範圍廣及教師甄選的制度、甄選程序、甄選標準、甄選成效、甄選主辦單位、甄選委員遴聘、應試者資格…（李居憲，1998；呂祥羲，2002；吳福春，2002；李慶宗，2001；李燕綺，1999；胡文仲，2004；姜智棟，2003；張喬媚，1998；葉連祺，1997；劉秀蓮，2004；劉佳鵑，2003；蔡秉修，2002；蘇婉芬， 2004；蘇鈺琦，2004）。只是這些研究多就教師甄選的制度面進行剖析及檢討，鮮少針對於甄選的過程中最受質疑的口試進行探究；更遑論對口試題目做分析，了解面試委員的背後知識表徵，及其教育意涵。是故，本研究之重要性不言而喻。

二、結構化概念形成法

一般而言，在計畫或評鑑某件專案的過程中，最困難的問題或步驟，可能是面對如何將原本是南轅北轍的各種原始構想予以明確地概念化，以作為後續活動的遵循依據。換言之，在計畫的過程中，研究者會期望能夠將構成計畫的主要目的和目標、需求、資源、和量能或其他元素等，予以形成概念並表徵出來；在評鑑的過程中，可能需要將有關聯的方案或處理方法、樣品、情境、測量、和結果等，也能形成概念並具象表徵出來。在此，所謂的概念形成（conceptualization），即是指將各式各樣的想法、創意觀點、預感及其表徵方

式，以某種明確、客觀的形式清楚表達出來的意思（Trochim, 1985; Trochim & Linton, 1986）。本研究在此所採用的結構化概念形成法，即是一種運用概念構圖（concept mapping）方法將眾多原始構想予以結構化形成的最佳工具（Trochim, 1989a; 1989b; 1989c）。這種結

構化的概念形成過程，不僅可以提供一般性的概念架構（conceptual framework），以導引團

體成員在專案計畫與評鑑初期即可形成理論與概念，更可以作為一種研究方法或研究工具，以幫助發展或進行適當的問題解決。概念構圖在這方面的應用，是結合概念圖及其他足以表徵與解釋各式各樣觀點的圖形表徵方式（程序如同 Novak & Gowin（1984）所述的概念構圖方式），並且增加卡片歸類（card sorting）與評分程序（Rosenberg & Kim, 1975），以及兩種多變量統計分析技術（multivariate statistical methods）──即多元度量法

（multidimensional scaling）（Davison, 1983; Kruskal & Wish, 1978）和群集分析（cluster analysis）（Anderberg, 1973; Everitt, 1980），共同應用在分析這種圖形資料所提供的訊息和結果上，以具體的操作型定義步驟方式和衍生出來的概念表徵過程，來達成結構化的概念形成目的（余民寧, 1997; Trochim & Linton, 1986）。

目前，國內運用結構化概念形成法於創新研究專案的例子，已屢見不鮮，例如：吳政達、郭昭佑（1997）應用到國小教科書評鑑標準的建構上、郭昭佑（2000）應用到國中校務評鑑指標的建構上等。由這些應用成果可知，在在顯示結構化概念形成法具有十足的應用潛力。本研究即是基於此理念，擬採用作為本研究的核心方法。

(8)

參、研究方法

一、研究對象

由於教師甄試辦理時程各縣市的重疊性高，故在蒐集資料上無法全面施測，故本研究以立意抽樣方式，選擇台北縣與高雄縣聯合教師甄試應試者做為主要的受試者，再輔以一所台北市自辦完全中學教師甄試應試者人員。其中台北縣的聯合教師甄試考場分設於五個學校，分別為永平高中、錦和高中、永和國中、中和國中、福和國中，而台北市自辦教師甄試則以萬芳高中為主。是故，本研究樣本涵蓋自辦、公辦兩種方式，以及北高兩個地區。希望藉此方式，得以對不同辦理方式、不同地區的教師甄試口試題目有整體性的瞭解。本研究資料蒐集以問卷調查方式為主，請應試者在口試結束後，將口試的題目記錄下來，共收到 4901 道題目，形成教師甄試口試題庫。而其中台北縣聯合甄選題目共佔 86.59 ％（4244 題）。之後，由研究者、專家教授，以及三位具有十年教學經驗的在職國/高中教師，以教育現場實務經驗，先選定一所學校的口試題目，歷經十次的共同討論研究，形成共識分析，建構十六項主類別。而第十七類為無法歸類，其中無法歸類者為語意不清或是答非所問者，合計為 177 題，佔總題數的 3.61﹪。之後，依循相同分類之標準，再進行其他試場口試題目之歸類。各類別的名稱及題數詳如表 1：表 1 教師甄試口試題庫十六大類組次數分配項次主類別口試題目數百分比 1. 班級經營 853 17.40% 2. 自我介紹 675 13.77% 3. 教學能力 649 13.24% 4. 行政服務 463 9.45% 5. 過去表現 390 7.96% 6. 教育理念 367 7.49% 7. 教育政策 317 6.48% 8. 輔導知能 309 6.30% 9. 專業知識 239 4.88% 10. 實習教師 177 3.61% 11. 學校環境 165 3.37% 12. 個人價值 42 0.86% 13. 人際關係 31 0.63% 14. 生涯規劃 30 0.61% 15. 資源支援 11 0.22% 16. 休閒生活 6 0.12%

(9)

表 1 教師甄試口試題庫十六大類組次數分配項次主類別口試題目數百分比 1. 班級經營 853 17.40% 2. 自我介紹 675 13.77% 3. 教學能力 649 13.24% 4. 行政服務 463 9.45% 5. 過去表現 390 7.96% 6. 教育理念 367 7.49% 7. 教育政策 317 6.48% 8. 輔導知能 309 6.30% 17. 無法歸類 177 3.61% 總計 4901 100﹪ 自表 1 可知，最常發問的口試題目類別之次數，前三項分別是：「班級經營」853 題（17.40 ％）、「自我介紹」675 題（13.77％）、「教學能力」649 題（13.24％）。其它中間類別依序為：「行政服務」463 題（9.45％）、「過去表現」390 題（7.96％）、「教育理念」367 題（7.49 ％）、「教育政策」317 題（6.47％）、「輔導知能」306 題（6.24％）、「專業知識」239 題（4.88 ％）、「實習教師」177 題（3.61％）、「無法歸類」177 題（3.61％）、「學校環境」136 題（2.77 ％）。而使用次數不到 1％的類別則依序為：「個人價值」42 題（0.86％）、「人際關係」31 題（0.63％）、「生涯規劃」30 題（0.61％）、「校園安全」29 題（0.59％）、「資源支援」11 題（0.22％）、「資源支援」11 題（0.22％）、「時事問題」3 題（0.06％）。再者，從口試題目的分類折線圖可看出三點結論（如圖 1）： 1.同一區域但不同試場（口試委員）的題目分配彼此很相似，從台北縣五個公辦教師聯合甄試口試題目可以得知。 2.公辦與自辦的口試題目分配，大致而言，非常相似(除班級經營的類別外)，可由台北縣五個公辦試場與台北市萬芳高中自辦試場得知。 3.不同區域的口試題目分配非常相似，可從台北縣、臺北市及高雄縣得知。由上述可知，口試問題的分佈情形是相當相似的。也就是說，口試問題的類型不受到試場（口試委員）、甄選方式、區域等因素的影響，所以大家最關注的議題大都集中在班級經營、自我介紹、教學能力、行政能力、過去表現等。最不常被重視的議題是「校園安全」、「資源支援」、「休閒生活」、「時事問題」等。此一重要的研究結果確立口試題庫的可行性。未來若欲增加題目，以充實題庫的豐富性，建議以現場錄音口試題目的方式，較能完整記錄口試題目的原貌。不過口試事關考生權益，口試現場採集方式，知易行難。是故，能對整個考場做實際問卷調查已實屬不易。

(10)

口試題目折線圖(200題以上) 0 50 100 150 200 250 班級經營自我介紹教學能力行政服務過去表現教育理念教育政策輔導知能專業知識主類別題數福和國中萬芳高中永平高中錦和高中永和國中中和國中高雄縣圖 1 口試題目的分類折線圖

二、結構化概念構圖之分析

基於上述之研究目的與文獻分析，本研究擬以結構化概念形成法進行兩階段的分析，茲扼要陳述如下（余民寧，1997）：階段一：以概念構圖法，瞭解十六大主要類別，所聚斂出的抽象知識表徵，以描繪未來優秀教師的具體圖像。階段二：以概念構圖法，分析各類別中典型代表之口試題目，並了解各類別所隱含的教育理念。

(一)準備

在這個階段中，主要的工作項目有二： 1.挑選參與者 本研究選取 2 位大學教授、3 位國中校長、2 位國中主任(或組長)、7 位不同科別之國中資深教師、5 位不同科別之國中初任教師，以及 1 位國中家長等共 20 名利害關係人（stakeholders），作為本研究之團隊成員。在教授、國中校長、主任及資深教師方面，均具有至少十五次以上的口試評審經驗，初任教師則具有參加口試的經驗，而家長則為參與觀察者。在此，選擇此團隊成員的標準，是在促使團體成員性質達到最大異質化為目的，並確保成員的多樣性及代表性。為使此參與者能對本研究慎重其事，每位參與分類口試題目的人員，本研究稱為審題委員。 2.篩選典型代表題目

(11)

扣除無法歸類或語意不清之題目，就目前的有效口試題目可粗略分為十六大類組。擬請不同的專家，進行兩大步驟，篩選出每一大類組的題目，控制在一百題以內，以便後續作業的處理。步驟一：刪除重複題目。即視每種題目單獨出現的情形，將類似的題目組成一群，本研究大約粗略分成十六類組。此一步驟，已由研究者及三位資深教師完成。步驟二：就每一組群中，撰寫一題概念化題目做為代表。就一群組的題目，選出最能代表某一概念化的題目，作為典型代表題。此一步驟請五位資深（均具 20 場以上口試經驗）專家處理之。在資料檢核上，將每一概念化題目，以小組討論的方式審查，逐一確認概念化題目的合理性。以下將舉例說明如何將原始題目歸納成一組概念的題目，如:原始題為「如何將六大議題融入教學？」、「如何將兩性議題融入教學？」、「如何將環境議題融入教學？」、「如何將七二水災融入教學？」、「如何將自己的課外經驗融入課程？」，而其概念化題目為「如何將○○議題(六大議題、社會議題、個人專長等)融入教學？」

(二)陳述典型代表題

為了考量將來資料分析時的電腦容量及人為力量一次所能處理的數量，我們可以限定以一百個不同典型代表題為最大的處理量。接下來，分別將這些典型代表題直接登錄在 3 x 5 吋的卡片上，每張卡片僅能登錄一個典型代表題，以方便後續的資料處理。由於口試題目的來源，是以應試者考完口試後，在試場外填寫的。故，某些句子不通順的情況，擬請國文老師一名，將所有的句子，在不更改原意下，潤飾成為明確易懂的語句。

（三）典型代表題的結構化

在這個階段中，主要的工作項目有二： 1.典型代表題的歸類與資料登錄

一旦完成上述步驟，接下來，即可參照 Rosenberg & Kim（1975）所建議的非結構性卡片分類程序（unstructured card sorting procedure）來進行分類整理工作。

首先，研究者要求每位審題委員「以自己感到最有意義的方式」，將上述登錄在卡片中的每個典型代表題，進行歸類整理。在歸類整理過程中，審題委員必須遵守下列幾項規則的限制： A.每個典型代表題只可以被歸到某一類之中（亦即，每個典型代表題不可以同時被歸到二類裡）； B.所有的典型代表題不可以全部被歸在同一類之中； C.也不可以將所有的典型代表題各自獨立歸成一類（雖然如此，但其中有某些典型代表題可以單獨歸成一類）。除了遵照上述的限制外，審題委員愛怎麼歸類就怎麼歸類，但每種歸類行為都必須依

(12)

照審題委員自己覺得最意義的方式而進行者。因此，審題委員可以發現歸類的方式有許多種，但每一種歸類方式對他們而言，都是有意義的。也許，審題委員需要多練習歸類幾次，才能決定最後他所滿意的歸類結果。一旦每位審題委員完成他的歸類工作，所完成的結果必須加總起來。這有兩項作法如下：第一，將每位審題委員的歸類結果，登錄到與所歸類的典型代表題數目相等的方格或矩陣中，該矩陣中的細格內元素值只有兩種：0 與 1；其中，1 表示某位審題委員將某個行與列的典型代表題歸在同一類別上的意思，而 0 即表示某位審題委員不將某個行與列的典型代表題歸在同一類別的意思。第二，資料登錄之後，係以「二元化對稱近似矩陣」方式輸出，每一位審題委員有一張輸出的矩陣資料表，然後，將個別的歸類矩陣資料加總起來，以獲得一個整體的近似矩陣資料表。這個最後完成的近似矩陣資料表，即為某個概念領域的相關結構，因為它可以提供所有審題委員如何歸類所有關點的訊息。在該矩陣中的元素數值愈大，即表示愈多的人以相同的方式將兩個不同典型代表題歸為同一類，它隱含著這些典型代表題在某種程度上是概念相似的；反之，矩陣中的元素數值愈小，即表示較少的人以相同的方式將兩個不同典型代表題歸為同一類，它即隱含著這些典型代表題在概念上是較不相同的。 2.典型代表題的評定 其次，根據「回答上的困難度」、「與工作表現的關聯度」兩個問項，要求受試者針對每個典型代表題進行四點評定量表式的評定，以彰顯每個典型代表題的重要性、優先性。對每個典型代表題而言，至少我們可以獲得評定結果的團體平均數，或其他可進行描述統計分析的訊息資料。另外，每一個題目的代表題數，亦可作為一種評定依據。只是此一評定，可由原始資料計算得知，無需審題委員再費時評定之。故，本研究中各典型代表題的相對重要性，係由下列三項指標的測量決定：「題目與優秀教師工作表現之關聯性」、「代表題數」、「回答的困難度」。

（四）典型代表題的表徵

這個步驟的任務主要在進行概念圖的計算，有三項工作要做： 1.進行多元度量法分析 針對上述步驟所得的近似矩陣資料表，進行二向度的非參數多元度量法（nonparametric

multidimensional scaling）分析。這項分析結果將可獲得一個估計點圖（point map）。

2.進行群集分析

接著，根據上述多元度量法分析後，以所求得每個估計點在二向度構圖上的座標值，作為進行群集分析的輸入資料，並採用華德氏（Ward's）的階層群集分析法（hierarchical cluster analysis），找出少數的幾個群集（clusters），形成一些群集圖（cluster map），再看看每個群集圖內到底包含哪些典型代表題，以方便後續的解釋工作。

(13)

3.計算估計點圖和群集圖的平均評定值

一旦獲得上述分析後的兩種構圖，一為估計點圖，另一為群集圖；接著，便是計算每

個典型代表題的平均評定值，稱為「估計點評定圖」（point rating map），以及每個群集的平

均評定值，稱為「群集評定圖」（cluster rating map）。算法很簡單，只要將所有審題委員在

每個典型代表題上的四點評定量表評定值加總起來，再除以審題委員的總人數，即可得估計點的平均評定值；若將每一群集內的各個典型代表題的所有評定值加總起來，再除以該群集內的典型代表題數目，即可獲得群集的平均評定值。

（五）概念圖的解釋

在這個階段中，主要的工作即是針對下列項目進行解釋：（1）典型代表題清單：即由所有審題委員所提出的原始典型代表題的彙整清單。（2）群集清單：即經由群集分析後，被歸到同一群集內的所有典型代表題清單，研究者將試圖針對每個群集分別予以命名，以達以簡馭繁的解釋效果。（3）估計點圖：即經由多元度量法分析後所得的估計點構圖，研究者可分別予以標號，以方便解釋。（4）群集圖：即經由群集分析所歸類而成的群集構圖。（5）估計點評定圖：即已計算出平均評定值的估計點評定圖，根據這個圖的平均值大小，研究者可以看出到底是哪個典型代表題最受審題委員們的重視。（6）群集評定圖：即已計算出平均評定值的群集評定圖，根據這個圖的平均值大小，研究者可以看出到底是哪個群集是構成這整體概念形成的核心概念。根據上述幾項解釋重點，研究者再與審題委員共同討論，以檢驗圖中比較接近的群集是否比較疏遠的群集，在概念上較近似於所有審題委員所認可者。如果不是，研究者可與審題委員共同找出造成這種差異的進一步可能解釋。幾經修正討論後，終可獲致一個經過命名的群集圖，足以代表整個結構化概念形成過程的主要概念架構，同時，也是概念構圖過程的最基本結果。

肆、結論與討論

一、典型代表問題清單及其重要性

教師甄試口試的目的，即是在甄選未來具有潛力的優秀教師。因此，本研究根據結構化概念形成法的分析結果，將可供教師甄試口試使用的原始典型代表題目，經過群集分析的結果，呈現在如表 2 及圖 2 裡。表 2 所示，即是群集分析的群數凝聚的過程。由表中「係數」一欄內的數值顯示，選取 2 或 4 群都可能是個理想解；不過選擇 2 群的解，比較無法進行有意義的解釋，並且也與實際的教育概念不符，因此，本研究斟酌圖 2 所示的樹狀圖分佈之後，決定選取 4 群的解，以符合理論涵義，並能做有意義的詮釋。因此，本研究決定選擇這十六大類別口試題

(14)

目可以形成四大面向區塊，作為本研究群集分析的較佳解。表 2 群集分析中的群數凝聚過程階段組合集群係數先出現的階段集群下一階段集群1 集群2 集群1 集群2 1 1 2 1.000 0 0 3 2 14 16 .988 0 0 4 3 1 3 .947 1 0 7 4 14 15 .930 2 0 12 5 10 12 .913 0 0 9 6 5 7 .911 0 0 13 7 1 9 .888 3 0 10 8 4 11 .883 0 0 10 9 8 10 .857 0 5 13 10 1 4 .797 7 8 15 11 6 13 .763 0 0 12 12 6 14 .671 11 4 14 13 5 8 .492 6 9 14 14 5 6 .422 13 12 15 15 1 5 .264 10 14 0 C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ 專業知識Case 1 1 教學能力Case 2 2 輔導知能Case 3 3 班級經營Case 9 9 教育理念Case 4 4 教育政策Case 11 11 休閒生活Case 14 14 生涯規劃Case 16 16 個人價值Case 15 15 自我介紹Case 6 6 人際關係Case 13 13 過去表現Case 5 5 實習教師Case 7 7 資源支援Case 10 10 學校環境Case 12 12 行政服務Case 8 8 圖2 群集分析的樹狀圖分佈接著，將這經由群集分析所得的四個群集，拿給 20 名利害關係人去針對各群集加以命名討論之後，教師甄試口試用的問題共計可形成四大面向（dimensions）的典型問題，這四

(15)

大面向分別取名為：（1）教師專業知能面向（含「教學能力」、「班級經營」、「專業知識」、「教育理念」、「輔導知能」、「教育政策」等類別）；（2）公民組織行為面向（含「行政服務」、「資源支持」、「學校環境」等類別）；（3）個人先備知能面向（含「過去表現」、「實習教師」等類別）；（4）個人核心價值面向（含「人際關係」、「個人價值」、「生涯規劃」、「自我介紹」、「休閒生活」等類別）。其中，各群集的命名及其所含類別，如表 3 所示。表 3 教師甄試口試題目的四大面向關聯性及其回答困難度口試口試面向平均面向關聯性平均面向難度類別類別題數各主類典型代表題平均類別關聯性(SD) 平均類別難度(SD) 教班級經營 853 42 3.16(.79) 2.02(.88) 師教學能力 649 73 2.99(.86) 2.02(.90) 專輔導知能 309 27 2.91(.85) 2.15(.90) 業教育理念 367 34 2.89(.87) 1.99(.93) 知教育政策 317 16 2.78(.91) 2.30(.89) 能 2.98 2.06 專業知識 239 41 2.76(.91) 1.98(.92) 實習教師 177 9 2.95(.88) 1.37(.59) 個人先備知能 2.85 1.44 過去表現 390 14 2.81(.87) 1.47(.71) 個人自我介紹 675 12 2.84(.91) 1.67(.85) 核人際關係 31 16 2.67(.97) 1.98(.97) 心個人價值 42 20 2.65(.92) 1.69(.82) 價休閒生活 6 5 2.52(.86) 1.18(.50) 值 2.8 1.67 生涯規劃 30 6 2.39(.97) 1.50(.77) 公民行政服務 463 23 2.83(.82) 1.97(.93) 組織資源支援 11 7 2.73(.82) 2.20(.94) 行為 2.72 1.95 學校環境 165 11 2.40(.91) 1.87(.98) 註：1.關聯性量表為四點量表，「1 到 4 分」各代表「非常不相關、不相關、有相關、非常相關」。 2.困難度量表為四點量表，「1 到 4 分」各代表「不困難、有點困難、很困難、極困難」。 3.平均類別關聯性及平均類別難度以典型代表題為計算基礎。 4.平均面向的關聯性及困難性則是以各口試類別題作為基礎之加權平均數。根據這四大面向的典型問題，審題委員逐一評比每一口試題目在與「優秀教師工作表現之關聯性」、「回答的困難度」等指標上的關係，並在加權平均計算之後，獲得如表 3 所示的結果。表 3 所示，即為四大面向與其內含十六個類別的平均關聯性與平均難度指標值。若從該題口試題目與「優秀教師工作之關聯性」角度來看，由於本研究採用四點評定量表，結果顯示教師甄試口試用的問題所形成的四大面向其平均數均大於量表分數的期望值（即 2.5），亦即，大部分的教師認為此四個面向與「優秀教師工作表現之關連性」皆有高度相關。因此，若以「優秀教師工作表現之關聯性」為判準，則教師甄試口試時，應該優先考量「教師專業知能面向」，之後考量「個人先備知能面向」、「個人核心價值面向」、「公民組織行為面向」等問題。若從該題口試題目在「回答的困難度」角度來看，結果顯示教師甄試口試用的問題所形成的四大面向其平均數均小於量表分數的期望值（即 2.5），亦即，大部分的教師認為此四個面向問題的困難度均不至於太難而無法回答。此外，若以「回答的

(16)

困難度」為判準，則教師甄試口試時應該以「教師專業知能面向」、「公民組織行為面向」的問題為口試的核心問題，其次才是「個人核心價值面向」與「個人先備知能面向」兩個面向的題目。由此可見，教師甄試在進行口試時，應該包含「教師專業知能面向」、「個人先備知能面向」、「個人核心價值面向」、和「公民組織行為面向」四個面向的問題為口試的核心問題。在實務應用上，可以參考表 1 所示，進行如下的建議事項。當口試委員欲詢問問題時，在有關「教師專業知能面向」的問題上，可以依序詢問參加甄試者有關其「班級經營」、「教學能力」、「輔導知能」、「教育理念」、「教育政策」、和「專業知識」等類別的題目，因為這些類別的題目與優秀教師的工作表現最有關係；在有關「個人先備知能」的問題上，則可以詢問參加甄試者有關其「實習教師」與「過去表現」等類別的題目，因為這些類別的題目與優秀教師的工作表現也是最有關係的；而在有關「個人核心價值面向」的問題上，則可以詢問參加甄試者有關其「自我介紹」、「人際關係」、「個人價值」、「休閒生活」、和「生涯規劃」等類別的題目，因為這些類別的題目與優秀教師的工作表現也是有關係的；而在有關「公民組織行為面向」的問題上，則可以詢問參加甄試者有關其「行政服務」、「資源支援」、和「學校環境」等類別的題目，因為這些類別的題目與優秀教師的工作表現也是有關係的。其次，在上述十六個類別的口試問題中，每一類別裡至少有 6 題（即「休閒生活」類別）至 853 題（即「班級經營」類別）的題目可供參考詢問，口試委員只要根據每一題目與「優秀教師工作表現之關聯性」的重要程度，依序或隨機抽取問題來詢問均可。此外，另一個在實務應用上的策略，即是口試委員也可以考慮這些口試題目在「回答的困難度」上的觀點，逐一依序詢問「教師專業知能面向」、「公民組織行為面向」、「個人核心價值面向」、「個人先備知能面向」等面向的問題。以下則依據每個面向裡各類題目的困難度，建議詢問甄試者問題之順序：當在詢問「教師專業知能面向」的問題時，口試委員可以依序詢問參加甄試者有關「教育政策」、「輔導知能」、「班級經營」、「教學能力」、「教育理念」、和「專業知識」等類別的題目（其中「班級經營」與「教學能力」優先順序一致）；在詢問「公民組織行為面向」的問題時，則可以依序詢問參加甄試者有關「資源支援」、「行政服務」、和「學校環境」等類別的題目；在詢問「個人核心價值面向」的問題時，則可以依序詢問參加甄試者有關「人際關係」、「個人價值」、「自我介紹」、「生涯規劃」、和「休閒生活」等類別的題目；而在詢問「個人先備知能」的問題時，則可以依序詢問參加甄試者有關「過去表現」與「實習教師」等類別的題目。其次，在上述十六個類別的口試問題中，每一類別裡至少有 6 題（即「休閒生活」類別）至 853 題（即「班級經營」類別）的題目可供參考詢問，口試委員只要根據每一題目在「回答的困難度」上的程度，依序或隨機抽取問題來詢問均可。在整個研究過程，本人覺得最興奮的事情是，雖然口試委員沒有受過人事心理學面談理論的訓練，但經過研究以後，發現目前的結果，非常符合人事心理學中對面談的期待。簡言之，經過研究，這些口試題目真的能夠測到筆試所不能涵括的面向，如「人際關係」、「公民組織行為」及「專業工作知能」（Gatewood ＆ Field,2001），並且在教育領域發展出更細緻的具體內容。讀者可以了解到所謂的「人際關係」，可以相對應於本研究中「個人核心價值」的面向，對於教師工作的範疇中，「個人核心價值」包含「休閒生活」、「生涯規劃」、「個人價值」、「自我介紹」、「人際關係」。因此之所謂的「個人核心價值」，除了人事心理學

(17)

提到「人際關係」，又包括一些更廣泛的議題。換言之，教師甄試中，個人核心價值的面像是比單一「人際關係」更完整。而就「公民組織行為」的面向，在教師工作的領域裡，則包含「資源支持」、「學校支持環境」、「行政服務」，相較於人事心理學所談到的面談中「公民組織行為」的特質，讓人更了解到教師領域中所須公民組織行為的特質。而在「專業工作知能」上，本研究所整理的「教師專業知能」面向共包括「專業知識」、「教學能力」、「輔導知識」、「班級經營」、「教育理念」、「教育改革」，也就是說，在教育職場上，教師除了須具有一般的專業知識以外，還需要了解輔導學生的知識，熟悉班級經營的技巧，隨時注意教育政策的改變。雖然經結果分析「整個」口試題目，在廣度（四大面向）及深度（各面向下包含的內容）均有不錯的發現。但是筆者之見，口試最大的敗筆乃是每場口試的時間只有 10~15 分鐘，而且給每位應試者只有 3~5 題（胡悅倫， 2007），就要決定一位教師的錄用與否，實在是一件危險的事情。相較於平均面談時間 38.75 分鐘（Campion, Palmer, ＆ Campion, 1997），則相去甚遠。在緊迫的口試時間的限制下，口試的內容必定非常侷限，而這對口試的效度必然大打折扣，至少連內容效度都要受到嚴重的考驗。未來最好在口試之前能對口試面向有所共識，使得口試無論在「教育專業知能」、「個人核心價值」、「個人先備知識」甚至「公民組織行為」上都能有合理的分配，使得口試更臻完善。

二、典型代表問題的圖像

概念構圖的主要功能，是以可目視的具體圖像，使讀者瞭解整個教師甄試口試所包含的教育意義，並顯示出其各個面向之間的關係及其相對重要性。如圖 3 所示，我們可以瞭解到，在教師專業中，如「教學能力」、「班級經營」、「專業知識」、「教育理念」、「輔導知能」、和「教育政策」等，是一組概念（即「教師專業知能面向」）；而「行政服務」、「資源支援」、和「學校環境」，則為另外一個概念聚落（即「公民組織行為面向」）；而「過去表現」與「實習教師」，則又是另一概念區塊（即「個人先備知能面向」）；另外，「人際關係」、「個人價值」、「生涯規劃」、「自我介紹」、和「休閒生活」等，則又是另一個概念集群（即「個人核心價值面向」）。其中，各個區塊的高度，即表示與優秀教師工作表現的關聯性，而區塊面積，即代表題數的多寡；因此，區塊高度愈高者，代表其與教師工作表現的關聯性愈高，而面積愈大者，則表示其可被用作口試的題目數量愈多。另外，由圖 3 所示亦可瞭解到，與優秀教師工作表現關聯性最高的口試題目類別，亦即是工作關聯性平均數最高之前五項，分別是：「班級經營」、「教學能力」、「實習教師」、「輔導知能」、「教育理念」等；而最常被問到的題目類別（亦即是題數最多者），則分別是：「班級經營」、「自我介紹」、「教學能力」、和「行政服務」等；但也可以知道，「自我介紹」雖是最常被問到的口試題目類別，但卻與優秀教師工作表現的關聯性只居中間程度而已，而「實習教師經驗」雖然是較少被問到的口試題目類別，但與優秀教師工作表現的關聯性卻是較高的；而對參加甄試的人而言，「教育政策」、「資源支援」、「班級經營」、「教學能力」、「輔導知能」、「行政服務」等口試題目類別，卻是較難以回答的問題，這亦顯見與「教師專業知能面向」與「公民組織行為面向」有關的題目，都是比較難以回答的問題。所以說，概念構圖在整個研究問題的具體圖像呈現上，是一種非常淺顯易懂、有效、且簡潔的溝通工具。由概念構圖所隱含的涵義可知，讀者將可以瞭解到：（1）教師甄試口試所應該包含的領域為何；（2）各領域之間的彼此關係及其相對的重要性為何；以及（3）更重要的是，它可以用圖形來表徵所欲研究的概念涵義。

(18)

有關教師甄試實証性的研究非常有限。與本研究最相近的研究有兩篇博士論文： 1.Mondak（2004）所撰寫的「在教師甄選的影響因素」；2.Hindman（2004）所撰寫的「效能教師與教師甄選的連結---教師甄選的發展草案」。本研究與上述兩篇文章共同之處，均是在討論「在教師甄試中，如何選出優秀或有效能的教師？」；換言之，二者均在討論「教師甄試口試」與「優秀教師」（或稱效能教師）之間的關係，試圖希望經由前者的程序能得到後者的結果。在 Mondak 則經由文獻探討方式先將所謂效能教師的特質分成四大組群（教學、人格、對學生的態度，及教師資格），擬出 35 道題目，以了解學校行政主管與教師在教師甄選上，對各個效能教師特質看法上的相似程度。而 Hinderman 亦採同樣的文獻探討的方式。首先，暸解文獻中「效能教師」的看法，找出五大面向，如人格特質、班級經營、教學組織（organization for instruction）、教學傳送（instructional delivery）及評量。其次，並依此擬 84 道題目。最後，對 300 名實際參與甄選的校長，依「最不滿意」至「典範」等四個類別，評等以上 84 題關鍵性的效能教師特質。誠如 Hinderman 在研究限制所述，即使翻遍效能教師的文獻資料，仍舊沒辦法給效能教師下一定明確的定義。而 Stronge（2002）亦提出同樣的看法：教師的效能是一被籠統模糊提出定義的概念。是的，效能教師或優秀教師乃是一個籠統的概念；但，愈籠統、爭議，則愈是需要用更多元的角度切入；而又因其在教師甄選口試的關鍵性，則愈是需要被關切。是故，本研究從真正面試委員的題目著手，以質量並重的概念構法，聚歛出優秀教師或效能教師的圖像，以期提供一個更完整而豐富的觀點。筆者以為，相較於過去的研究，本研究有兩項優勢：1.在研究方法上，有別於傳統方式，由上而下，先由別人的觀點，即從文獻探討中，暸解對效能教師的看法，然後進行調查。如此容易陷在別人對優秀教師（或效能教師）思想窠臼中，無法有創新。事實上，亦證明其研究結果較無個人的洞見。而本研究則是由下而上，先由調查面試委員所問的題目，集合成十大類，然後經由概念構圖聚歛出四大面向。是故，此種資料礦採（data mining）的確讓結果不一樣。2.在研究成果上，本研究結果所聚歛出效能教師或優秀教師，其內容更具教師的生態的觀點，強調教師與環境之間的關係，例如「組織公民行為」的面向。此面向則不見於效能教師的特質相關文獻中。而在效能教師特質中，最常被提及的「教師專業知能」與本研究的面向最為相似。但，除了「輔導知能」、「班級經營」、「教學理念」… 等教室中教師教學能力外，本研究也期待一位好的老師，應對環境中的「教育政策」有自己的看法。另外，Mondak 與 Hinderman 雖然亦提到一位效能教師該具有「人格特質」與本研究的「個人核心價值」相似，但本研究的內容更完備。例如，本研究在這個面向包括「個人價值」、「生涯規劃」甚至是「休閒生活」。是故，本研究在研究方法及研究結果的確略勝一籌。綜合上述，目前的研究資料豐富而多元，故，教師甄試口試題目當然值得研究！但部分的總合是不是等於全部呢？換句話說，是不是問了這些問題後，一個完整的優秀教師圖像就出現了呢？這個問題則有待教育哲學、教育社會學，甚至是教育心理學等，相關教育領域的學者，反思此一深刻的議題。

(19)

高度為平均類別關聯性 ＜2.39 2 .39- 2.51 2.51 - 2.63 2.63 –2.75 2.75 –2.87 2.87 –2.99 2.99 - 3.11 3.11 -3.23 面積代表題數；高度代表平均類別關聯性

圖 2. 教師甄試口試題目概念構圖之圖示法

專業知識教育理念休閒生活生涯規劃個人價值人際關係過去表現行政服務資源支援學校環境班級經營教學能力輔導知能教育政策自我介紹實習教師過去表現

(20)

參考文獻

石弘毅（2000）。如何辦好教師甄選。師友，400, 44-47。 余民寧（1997）。有意義的學習：概念構圖之研究。臺北：商鼎。 李居憲（1998）。國民小學實施教師甄選制度之研究。國立屏東師範學院國民教育研究所 碩士論文，未出版。 呂祥羲（2002）。我國小學教師甄選成效之研究。暨南國際大學教育政策與行政研究所碩 士論文，未出版。吳政達、郭昭佑（1997）。概念構圖法在國民小學教科書評鑑標準建構之應用。教育與心理 研究，20 期(下冊)，217-242。 吳福春（2002）。國中教師甄選相關問題研究─以台南縣市為例。臺南師範學院教師在職 進修教育行政碩士學位班碩士論文，未出版。 宋慶瑋（2003）。教師甄選的愛恨情仇。師友，436, 32-35。 李慶宗（2001）。國民中學教師甄選制度之研究。國立臺灣師範大學教育研究所碩士論文， 未出版。 李燕綺（1999）。國中教師選聘過程之研究。國立臺灣師範大學公民訓育研究所碩士論文， 未出版。 胡文仲（2004）。國民小學職前教師對教師甄選制度之意見調查研究---以雲林縣為例。國 立嘉義大學國民教育研究所碩士論文，未出版。 胡悅倫（2007）。結構化教師甄試口試之初步調查。教育心理學報，審稿中。 胡悅倫、陳世芬、呂秋萍（2007）。教師甄試面試結構化問卷之編製。測驗年刊，印刷中。 姜智棟（2003）。國民小學教師甄選之研究－以雲林縣為例。南華大學非營利事業管理研 究所碩士論文，未出版。郭昭佑（2000）。概念構圖法在評鑑指標建構上之應用--以國民中學校務評鑑指標建構為例。 教育政策論壇，3 卷（2 期），173-203。 陳坤德（1999）。高職教師甄選經驗談。職教園地雜誌，88, 24-25。 陳維貞（2001）。教師甄選經驗談。國教之友，53(2), 15-18。 張喬媚（1998）。國小教師甄選制度之研究。臺南師範學院國民教育研究所碩士論文，未 出版。 楊素菱（2004）。談教師甄選現況及其改進之道。師說，183, 5-8。 葉連祺（1997）。我國中小學教師甄試之研究。教育資料文摘，39(6), 44-64。 劉秀蓮（2004）。國民小學教師甄選制度實施現況及其改進意見之研究。屏東師範學院教 育行政研究所碩士論文，未出版。 劉佳鵑（2003）。國民中學教師甄選與遷調制度之政策評估－以嘉義市國民中學為例。國 立中正大學政治學研究所碩士論文，未出版。 蔡秉修（2002）。國中生活科技教師甄選之研究。國立臺灣師範大學工業科技教育研究所 碩士論文，未出版。 蘇婉芬（2004）。教師甄選作業調查結果摘要及因應策略。中國統計通訊，15(11), 19-26。 蘇鈺琦（2004）。談國小教師甄選制度。教師之友，43(5), 81-89。

Anderberg, M. R. (1973). Cluster analysis for applications. New York: Academic Press.

Braun, J. (1990). Getting a job: Perceptions of successful applicants for teaching positions. Action

in Teacher Education, 12(2), 44-54.

(21)

Personnel Psychology, 51, 375-396.

Campion, M. A., Palmer, D. K., & Campion, J. E. (1997). A review of structure in the selection interview. Personnel Psychology, 50, 655-702.

Davison, M. L. (1983). Multidimensional scaling. New York: John Wiley & Sons.

Dipboye RL, Gaugler BB.(1993). Cognitive and behavioral processes in the selection interview.

In Schmitt, N., & Borman, W. C, Associates (Eds.) ,Personal selection in organizations (pp.135-170). San Francisco: Jossey-Bass

Dipboye RL.(1994). Structured and unstructured selection interviews：Beyond the job-fit model. In Ferris GR（Ed.）,Research in personnel and human resources management：Vol.12 （pp.79-123). Greenwich, CT：JAI Press.

Everitt, B. (1980). Cluster analysis (2nd ed.). New York: John Wiley & Sons.

Gatewood, R. D., & Field, H. S. (2001). Human Resource Selection. Orlando, FL: Harcourt College Publication.

Hunter, J. E., & Hunter, R. F. (1984). The validity and utility of alternative predictors of job performance. Psychological Bulletin, 96, 72-98.

Huffcutt, A., & Arthur, W. Jr. (1994). Hunter and Hunter (1984) revisited: Interview validity for entry-level jobs. Journal of Applied Psychology, 79, 184-190.

Huffcutt, A. I., & Woehr, D. J. (1999). Further analysis of employment interview validity: A quantitative evaluation of interviewer-related structuring methods. Journal of

Organizational Behavior, 20, 549-560.

Hindman, J. L. (2004). The connection between qualities of effective teachers and selection interviews: The development of a teacher selection interview protocol. Dissertation

Abstracts International (UMI No. 3118184).

Janz, T. (1982). Initial comparisons of patterned behavior description interviews versus unstructured interviews. Journal of Applied Psychology, 67, 577-580.

Jelf, G. S. (1999). A narrative review of post-1989 employment interview research. Journal of

Business and Psychology, 14(1), 25-58.

Jennifer Lilliston Hinderman（2004）. The connection between qualities of effective teachers and

selection interviews：The development of a teacher selection interview protocol. The college

of William and Mary in Virginia.

Kirkwood, W. G., ＆ Ralston, S. M. (1999). Inviting meaningful applicant performances in the employment interviews. The Journal of Business Communication, 36(1), 55-76.

Kruskal, J. B., & Wish, M. (1978). Multidimensional scaling. Beverly Hills, CA: Sage.

Latham, G. P., Saari, L. M., Pursell, E. D., & Campion, M. A. (1980). The situational interview. Journal of Applied Psychology, 65, 422-427.

Locke, E. A., & Latham, G. P. (1984). Goal-setting: A motivational technique that works. Englewood Cliffs, NJ: Prentice-Hall.

Mondak. (2004). Influences on Teacher Selection (Virginia Polytechnic Institute and State University, 2004). Dissertation Abstracts International, 65 , 201.

Marchese, M. C., & Muchinsky, P. M. (1993). The validity of the employment interview: A meta-analysis. International Journal of Selection and Assessment, 1, 18-26.

McDaniel, M. A., Whetzel, D. L., Schmidt, F. L., & Maurer, S. (1994). The validity of

(22)

Psychology, 79, 599-616.

Motowidlo, S. J., Carter, G. W., Dunnette, M. D., Tippins, N., Werner, S., Burnett, J. R., & Vaughan, M. J. (1992). Studies of the structured behavioral interview. Journal of Applied

Psychology, 77, 571-587.

Motowidlo, S. J., Dunnette, M. D., & Carter, G. W. (1990). An alternative selection procedure: The low-fidelity simulation. Journal of Applied Psychology, 75, 640-647.

Murray, J. P. (1999). Interviewing to hire competent community college faculty. Community

College Review. 27(1),41-56.

Mumford, M. D., & Stokes, G. S. (1992). Developmental determinants of individual action: Theory and practice in applying background measures. In M. D. Dunnette ;& L. M. Hough (Eds.), Handbook of industrial and organizational psychology: Vol.3 (2nded., pp. 61-138). Palo Alto, CA: Consulting Psychologists Press.

Novak, J. D., & Gowin, D. B. (1984). Learning how to learn. Cambridge, London: Cambridge University Press.

Orpen, C. (1985). Patterned behavior description interviews versus unstructured interviews：A comparative validity study. Journal of Applied Psychology,70,774-776.

Ream, R., (2000). Why are manhole covers round？Information Today, 17(5),26-27. Roberts, J., (1987). Standardizing the process: How to make the most of teacher interviews.

NASSP Bulletin, 71, 103-108.

Roth, P. L, & Campion, J. E. (1992). An analysis of the predictive power of the panel interview and pre-employment tests. Journal of Occupational and Organizational Psychological

Bulletin, 65 ,51-60.

Rosenberg, S., & Kim, M. P. (1975). The method of sorting as a data-gathering procedure in multivariate research. Multivariate Behavioral Research, 10, 489-502.

Sadetsky , I., ＆Pell, A. R., (1980). Interviewing and selecting elementary school teachers and

administrative personnel. Huntington, NY: Personnel Publications.

Sharp, H., & Sharp, W. (1997). From field experience to full-time teaching：Letting teachers

know how to face interviews and what to expect on the job. Paper presented at the Annual

Meeting of the Association of Teacher Educators, Washington, D. C.

Schriesheim, C. A., Solomon, E., & Kopelman, R. E. (1989). Grouped versus randomized format: An investigation of scale convergent and discriminant validity using LISREL confirmatory factor analysis. Applied Psychological Measurement, 13, 19-32.

Stronge, J. H. (2002). Qualities of effective teachers. Alexandria, VA: Association for supervision and Curriculum Development.

Taylor, P. J., & Small, B. (2002). Asking applicants what they would do versus

what they did do: A meta-analytic comparison of situational and past behaviour employment interview questions. Journal of Occupational and Organizational Psychology, 75, 277-294. Trochim, W. M. K. (1985). Pattern matching, validity, and conceptualization in program

evaluation. Evaluation Review, 9, 575-604.

Trochim, W. M. K. (1989a). An introduction to concept mapping for planning and evaluation.

Evaluation and Program Planning, 12, 1-16.

Trochim, W. M. K. (1989b). Concept mapping: Soft science or hard art? Evaluation and Program

(23)

Trochim, W. M. K. (1989c). Outcome pattern matching and program theory. Evaluation and

Program Planning, 12, 355-366.

Trochim, W. M., & Linton, R. (1986). Conceptualization for evaluation and planning. Evaluation

and Program Planning, 9, 289-308.

Wiesner, W. H., & Cronshaw, S. F. (1988）. The moderating impact of interview format and degree of structure on the validity of the employment interview. Journal of Occupational

Psychology, 61, 275-290.

Wright, P. M., Lichtenfels, P. A., & Pursell, E. D. (1989). The structured interview: Additional studies and a meta-analysis. Journal of Occupational Psychology, 62, 191-199.

(24)

計劃成果自評

一、教師甄試口試用的題目，具有四大面向，十六大類別的題目可資使用。這四大面向，代表著一位優秀教師所應該具備的四大能力領域；每一個能力領域內，各具有兩至六個能力類別；每一個能力類別內，各具有題數多寡不一的口試題目。這樣的口試題目，可以自成一套標準化的口試題庫，足供各級學校爾後在辦理教師甄選活動時，作為口試問題的參考之用。二、對於口試題庫的建立，若欲讓口試題目能對不同試場(口試委員)、甄選方式、區域等因素之分配考驗，未來研究應提出更具體之量化數據，方能更有說服性。三、致於口試題目在效度之建立，除採用橫斷式研究法對不同地區及不同試場之題項分析其相似度與異質性外，未來研究可朝縱貫式研究法，比較優秀及劣質教師後續追蹤，方能判定前置口試題目之鑑別效度。四、由於這四大能力領域、十六種能力類別的口試用題目，均已獲取其與優秀教師工作之關聯性的指標值，因此，它們可以被分類及排序，並製作成優秀教師評鑑檢核表（evaluation checklist for the outstanding teachers），以供學校作為年度評鑑教師行為表現的工具。五、由本研究所獲得的口試面向、類別、與問題等架構，亦可供作規劃師資培育課程的參考大綱，或作為辦理師資培育的「最後一哩」（last mile）教育之用，以落實教育實習的目的，縮短初任教師適應教師生涯的差距。六、在未來的研究上，亦可根據本研究對實務應用的涵義，給予口試委員提出最佳面談訓練的有效處方，亦即把面談訓練的重點放在如何設計「口試題目的擬定」及「定錨評量」的問題上。七、由於口試題目的內容豐富，且概念構圖法又是一個質量並重的方法學，因此，未來的研究也可以朝向編製實用的評量工具著手。例如，「班級經營」類別即有 853 題口試題目可用，其中，有的是具有理論性的問題，有的則是非常實務的問題。因此，可以利用這些題目當成是編製量表的重要題幹，然後，再運用概念構圖及其他測驗編製的技術等方法，去驗證其效度和信度，則一份可用來評量教師「班級經營」能力的量表，即由然而生。至於其他類別問題的研究，亦同。

(25)

行政院國家科學委員會補助國內專家學者出席國際學術會議報告

96 年 7 月 15 日報告人姓名余民寧(共同主持人) 服務機構及職稱國立政治大學教育學系教授時間會議地點 96/07/09~96/07/13 日本本會核定補助文號計畫編號：NSC 95-2413-H-004-006 會議名稱 (中文)心理計量社群國際會議

(英文)The 72ndAnnual Meeting of the Psychometric Society 發表

論文題目

(中文)層級二單位數目對多層次結構方程式模型有影響嗎？

(英文) Does Number of Level-2 Units in Multilevel Structural Equation Modeling Matter?

報告內容應包括下列各項： 一、參加會議經過 本次會議與會人員眾多，也有不少來自台灣等地的亞裔人士，在簡單的報到手續後，大家便進入禮堂，大會在主席簡單致辭後，由國際知名的計量大師針對脊迴歸之最新數理公式發展發表專題演講，接著便開始我們的論文發表。在論文發表期間，有多位學者前來索取本人論文之相關資料，並詢問相關的研究細節。此外，個人國科會研究主題如結構化教師甄試口試亦吸引許多學者之關注。許多東西方學者皆相當感興趣，透過面對面的溝通，彼此亦留下聯繫的方式，並開啟日後跨文化比較與合作之契機，實為此行最大的收穫。而本人在會中亦巧遇到多年不見之好朋友，其在國外學術界有驚人的成就。 二、與會心得 本人從國外發表的文章中開拓了研究視野，獲得許多建設性的建議與知識。此外，亦認識了幾位在此領域的國際友人，拓展了人際關係，有助未來的研究順利進行與合作關係。 三、建 議未來可以多鼓勵年輕學者至少參加一次國外舉行的國際會議，以開拓視野，激發努力向上的意志力，對過內的學術有一定的提升作用。 四、攜回資料名稱及內容 IMPS2007 會議手冊、名片、當地傳統手工藝品 五、其 他無

(26)

Does Number of Level-2 Units in Multilevel Structural Equation

Modeling Matter?

Ren-Hau Li

Science Education Center, National Taiwan Normal University [email protected]

Min-Ning Yu Yueh-Luen Hu National Chengchi University,

Taiwan

Abstract

How to determine the number of level-2 units in multilevel structural equation modeling (MSEM) as a standard applied to nested or hierarchical data structure was still unknown. This research used Canada data in the large database “Programme for International Student Assessment 2003”(PISA 2003) to check the model-fit indexes and parameters stability in our proposed empirical example processed by MSEM under different numbers of level-2 units. Our proposed example model was first be handled to fit Canada data (26884 students, 948 schools), and then the stabilities of the estimated parameters in the example model under 120, 240, 360, 480, 600, 720, 840 level-2 units were compared. Level-1 units in each school less than 10 students will be crossed out in advance. Besides, intraclass correlations of all variables were controlled in a specified range in different numbers of level-2 units. Finally, we found the ratio of the number of level-2 units relative to the number of estimated parameters of between-level in the multilevel model were 8:1.

(27)

1. Introduction

“Multilevel”is an important concept in survey data collection and analyses. When research data are collected from hierarchical sampling design, or when nested data structure are obtained due to cluster sampling or multi-stage sampling, traditional statistical analysis methodology would be improper for these data [1-3]. This kind of data derived from clustered or hierarchical sampling designs should be better analyzed by the statistical methods considering data property with clustered, hierarchical or multilevel characteristics. When multilevel characteristics of data are dealt with traditional statistical analysis, the chi-square test of model fit is often inflated, particularly for data with large intraclass correlation (ICC), large group sizes, and highly correlated variables; therefore better fit statistics can not be provided [4-7].

In this study, we would focus on the number of level-2 units in multilevel analysis. When number of between-level groups gradually increased, the inadmissible solutions gradually decreased [8]. Although more level-2 units could be beneficial to obtain admissible solutions and to reduce biases of estimates and standard errors [8], there were no guidelines for us to follow. As a matter of fact, even the appropriate sample size in the traditional structural equation modeling analysis thus far has been inconclusive. An exhaustive examination of the effects on structural equation modeling based on maximum likelihood estimator by Monte Carlo simulation showed that samples fewer than 100 subjects were destructive to ML estimator and larger than 200 subjects were suggested [9]. Tanaka pointed out that there was some agreement on sample-size appropriateness by considering the ratio of the number of subjects to the number of parameters estimated in structural equation modeling with latent variables [10]. Although he did not offer a suggestion about the ratio, he actually explained why the transformation from concerning the ratio of the number of subjects to the number of variables in multiple regression analysis to concerning the ratio of the number of subjects to the number of parameters estimated. Kline indicated that although no absolute standards in the literature of structural equation modeling were offered on the ratio, he suggested the ratio 20:1 be a desirable goal and the ratio of 10:1 be a more realistic target [11].

In regard with the number of level-2 units in multilevel structural equation modeling, in general, though no conclusive suggestion is followed, a larger sample size was usually recommended and preferred [12] that ICC calculated from a small number of groups might not produce reliable estimates and it would be most useful when calculated based on beyond 30 groups. In addition, some studies suggested 50 to 100 groups with at least two individuals nested within each group for multilevel covariance structure modeling [3,4], but the complexity of model was not taken into account in their suggestions. Hence, even groups less than 50 may be enough to get a good model fit. For example, in a study [6] where multilevel confirmatory factor analysis model was used to extract one factor from four measurement items on motivation, and a surprising good model fit of group-level structure based on only 39 groups. However, in another study where two factors with six measurement indexes were modeled in within-level model and only one factor in between-level model, the finding showed that inadmissible estimate problem occurred in the between-level model when group-level sample size was small (50 groups in his research) and ICC was low [8]. Hence, a conclusion was made that the group-level sample size at least 100 would be a better way to deal data with unbalanced groups under Muthén’s