「斷裂時代中的量化研究:統計方法學的 興起與未來」回應文
溫福星
東吳大學國際經營與貿易學系
在邱皓政教授的「斷裂時代中的量化研究:統計方法學的興起與未來」一 文中,主要提及當今社會科學的五種主要統計方法:「IRT」、「SEM」、「MLM」、
「Fuzzy」與「Bayesian」的緣起,並與傳統的方法作一比較。很難得的是,要 將這五種方法同時呈現在一篇文章中,自有相當難度,可見邱教授統計方法功 力之深厚。除此之外,邱教授並從國家圖書館的最近 20 年來碩博士論文所使用 這五種統計方法,進行與對應學門領域的分類,除了反應這五種統計方法使用 的時間數列趨勢外,也相當程度反應不同領域學門的使用習慣,讓我們瞭解到 現在的主流統計方法是什麼。邱教授並在文章後半段,將前面所述的所有測量、
統計與方法學的概念匯集呈現在一棵枝葉茂盛且根部深植土中的大樹,闡述了 之間的先後與關連。最後在文章結尾處提出了統計、測量與方法學的α、β與 γ 的隱喻,除了與文章前半段的五種統計方法相呼應外,也為αβγ量化研究學刊作 一深入淺出的發刊詞介紹與鮮明清楚的學刊定位。
不僅如此,邱教授在「斷裂時代中的量化研究」緒論開場的雙城記,意有 所指對應現代「IRT」、「SEM」、「MLM」、「Fuzzy」與「Bayesian」統計方法(個 人姑且稱現代與古典的對照),如果我們會這些方法,就是活在這現代統計方法 的城牆內,面對國際期刊這些方法的大量使用,您可以輕易閱讀游刃有餘,並 可以南爭北討攻城掠地。如果我們不會這些方法,甚至還沒有耳聞,則我們就 是還依然沈浸於古典方法的城堡中,不知深處在時間洪流中的我們已經慢慢的 被逝去。這不意味古典統計方法的不好與不對,古典統計方法也有不斷的創新 與進步,結合簡單清晰的觀念仍然有助於知識真諦的探索,但處在尖端科技眾 多的統計套裝軟體之前,面對「IRT」、「SEM」、「MLM」、「Fuzzy」與「Bayesian」
的應用,根本會使不上力,加上越來越複雜的資料結構,古典的方法似乎不敷 使用。在現代與古典的城堡之間,我們必須作一抉擇,這會涉及到我們對統計
方法的學習方法與態度的改變,但是不變的是 αβγ的統計、測量與方法學的概 念,它仍是這兩個城堡的核心價值所在。
邱教授文章中,個人覺得已經將社會科學所使用的統計方法整合了十之八 九,但針對商學與資訊管理領域中常使用的「Time Series」與「Artificial Neural Network」卻未有著墨。類神經網路在 10 幾年前也曾風行一陣子,特別是在圖 形辨識與預測上的應用,也常常與多變量統計分析方法進行比較。而時間數列 也一樣有類似現代與古典的區分,雖然都強調預測,但都是可以運用在理論的 建構。除了過去我們常聽見的是 ARIMA 外,現在有 ARCH(Engle, 1982)、GARCH
(Bollerslev, 1986)、Cointegration(Granger & Engle, 1987)與 VAR 等,而 Engle 與 Granger 更因為這些新方法而獲得 2003 年諾貝爾經濟學獎的肯定。不僅如此,
這些時間數列的原理與特性也被應用在 SEM 與 MLM 上面(Hamaker, Dolan, &
Molenaar, 2002;van Buuren, 1997)。當然新興的統計方法也不斷的被提出,他們 的共同點都是為了解決現有方法無法或不適而起。以心理學背景的邱教授為文 整理社會科學常用的五種統計、測量與方法學工具,應該是相當完整,若以這 樣財金與管理領域的統計方法知識要求,未免過於嚴苛。
在「斷裂時代中的量化研究:統計方法學的興起與未來」中,個人覺得邱 教授另一個貢獻為,作了起頭的示範,將現代國外越來越發達的這五種統計方 法學工具整合在這篇文章中,並將其緣起精簡的介紹。底下,即以個人對這五 種統計方法的認知與瞭解,對邱教授這篇文章這五種統計方法的現況發展作一 簡要的敘述。
「IRT」、「SEM」、「MLM」、「Fuzzy」與「Bayesian」,前三者除了是測量 與統計外,其實有很濃厚的方法學味道。而後兩者之前應用在社會科學不多,
而是廣泛出現在自動控制、網路與統計科學的領域。但是,這些統計方法在台 灣逐漸成為社會科學研究學者在學術研究上的主要工具。這五種統計方法的思 維已經在邱教授文中已有介紹,不在此贅述。這些方法都有一個共同的特徵就 是統計原理較過去的多變量分析要艱深、所用統計符號要比以前更複雜,以貝 氏統計為例,過去對於參數的看法是認為常數,但在貝氏統計理論下,有事前 機率分配與事後機率分配之分,因此參數可以有機率分配:事前機率分配。當 然在操作上,會用到許多的機率密度函數,大學的初等統計所教的機率分配都 會在貝氏理統計中出現。而統計運算法則都以線性代數的向量與矩陣符號代 替,為了能快且準確求得結果,不斷有新的演算法出現,例如 EM 與 MCMC 等。
這樣的統計方法要能在「統計白話運動」中普及,有一定的難度,但至少還可
以達到「統計實用主義」的目的。不過,這些統計方法的起源都是會了解決人 類實際所遇到的問題而來,更接近我們所蒐集資料的特性、以及對問題的認識、
對答案的推理,當然更貼近研究方法。
個人理解,除了模糊統計外,在文獻上其它的四種統計方法好像越來越有 統整的趨勢。在台灣模糊統計的社會科學應用中,有吳柏林(1997,2005)、林 原宏(與鄭舜仁、吳柏林)(2003,2006)與游森期(2007a,2007b)等學者致 力於模糊問卷、模糊時間數列、模糊統計的應用與推廣。不過中外皆然,大量 研究還是在理工方面,我們家電產品中的洗衣機、冷氣機就是最好的應用實例。
事實上,模糊概念比較貼近人類的思維模式,但是在數學的表達與運算上卻是 這五種統計方法中最難理解的地方,也較難和其它四種統計方法相連結。
而在「IRT」、「SEM」、「MLM」、與「Bayesian」四種統計方法中,Muthén
(1978)一開始就研究二元變項的因素分析與結構方程模式,當二元變項結合 SEM 之後,IRT 可以以二參數邏輯斯形式出現在 Mplus 裡(Muthén & Muthén, 2004)。最近,IRT 又與 MLM 結合,Raudenbush、Johnson 與 Sampson(2003)
介紹了多層次 Rasch 模型在犯罪行為上的應用。Jöreskog(2002-2005)最近幾年 致力於次序變項的 SEM(Jöreskog & Moustaki, 2001),亦研究截斷資料的分析,
把 LISREL 軟體功能發揮到極致。不僅如此,在其 LISREL 軟體中也結合了
「MLM」,不僅可以處理多層次迴歸分析外,也可以進行多層次 SEM。研究多 層次 SEM 學者相當多,當然首推 Muthén。Muthén(1991,1994)在 10 多年前 就研究多層次 CFA 與多層次 SEM,其發展的軟體 Mplus 皆可以執行這些功能。
除了上述學者外,在「IRT」、「SEM」與「MLM」三方面的研究有相當成果還 有 Skrondal 與 Rabe-Hesketh(2004),他們所提出的 GLLAMM 模式可以處理類 別、次序與連續資料的「MLM」、「SEM」,以及多層次 SEM,並將傳統多層次 SEM 更往前邁進一步,允許上層變項(或構念)可以對下層變項(或構念)產 生影響。不僅如此,他們和 Muthén 一樣,盡可能處理各種不同量尺的變項,特 別是能將不同量尺的變項出現在同一個分析模式中。最近 2007 年 3 月新發行一 本專書:「Bayesian Structural Equation Modeling」,作者是香港中文大學統計系 李錫欽教授(Lee, 2007),書中介紹了貝氏與貝氏如何應用在 SEM 中。Lee 很早 就研究貝氏(Lee, 1981),20 年來一直將貝氏運用在 CFA 與 SEM 中。除此之外,
Lee 在多層次 SEM 中也佔有一席之地,當然書中亦有貝氏多層次結構方程模式,
在 SEM 裡是屬於重量級學者。事實上,現有的「MLM」就利用到貝氏理論,特 別是 Empirical Bayes 的使用,當我們想從 mixed 或是 composite 模式的估計結果
來求第一層的迴歸係數時,就是利用到貝氏估計法,在 HLM 軟體中用到就是這 個方法。而許多軟體中的 MCMC 演算法法也是利用貝氏理論,甚至 AMOS6.0 版中也有貝氏估計法(Arbuckle, 1995-2005)。上述這些學者都是屬於理論模式 的開創者,不僅如此,他們也利用其開創的方法進行不少的實證文獻,而其它 商管領域的研究者更是在其研究領域大量使用這些方法。
除了上述四種個人較為熟悉的方法外,而國際期刊的重要統計方法還有一 種,就是屬於完全類別變項的資料分析:潛在類別分析。Muthén (2001)特別結 合了上述統計方法,發展出 mixture modeling 來,其應用領域亦相當的廣。而提 到潛在類別變項的研究,不能不提及 Vermunt(2003),不僅致力研究潛在類別 因素分析、潛在類別集群分析與潛在類別迴歸分析,他更將潛在類別分析推展 到多層次潛在類別變項分析的層次。
筆者才疏學淺,利用約一頁篇幅介紹當代這些方法的現況有點班門弄斧,
目的無他,剛好在邱教授的文章中可以做出一點點的延伸。在邱教授文章中提 及國內近幾年來統計方法的使用趨勢,是個量的分析,希望藉由個人小小的介 紹,提出這些統計方法的應用範疇,當作質的補充,回應邱教授的「斷裂時代 中的量化研究:統計方法學的興起與未來」。
參考文獻
吳柏林(1997)。社會科學研究中的模糊邏輯與模糊統計分析。《國立政治大學 研究通訊》,7 , 17-38.
吳柏林(2005)。《模糊統計導論:方法與應用》。台北:五南。
林原宏、鄭舜仁、吳柏林(2003)。模糊眾數及其在教育與心理評量分析之應用。
《中國統計學報》41(1),39-66.
林原宏譯(2006)。《模糊統計》。台北:五南。
Arbuckle, J. (1995-2005). Amos 6.0 user’s guide. Spring House, PA: Amos Development Corporation.
Bollerslev, T.(1986). Generalized autoregressive conditional heteroskedasticity, Journal of Econometrics, 31, 307-327.
Engle, R. (1982). Autoregressive conditional heteroskedasticity with estimates of the variance of U.K. Inflation, Econometrica 50. 987-1008.
Engle, R., & Granger, C.W.J. (1987), Co-integration and error correction:
representation, estimation and testing, Econometrica, 55, 251-276.
Hamaker, E. L., Dolan, C. V., & Molenaar, P. C. (2002). On the nature of SEM estimates of ARMA parameters. Structural Equation Modeling, 9(3), 347-368.
Jöreskog, K. G. (2002-2005). Structural equation modeling with ordinal variables using LISREL. Available at
www.ssicentral.com/lisrel/techdocs.ordinal.pdf.
Jöreskog, K. G., & Moustaki, I. (2001). Factor analysis of ordinal variables: A comparison of three Approaches. Multivariate Behavioral Research, 36, 347-387.
Lee, S.Y. (1981). A Bayesian approach to confirmatory factor analysis.
Psychometrika, 46, 153-160.
Lee, S.Y. (1990). Multilevel analysis of structural equation models. Biometrika, 77, 763-772.
Lee, S.Y. (2007). Structural Equation Modelling: A Bayesian Approach. N.Y.: Wiley.
Muthén, B. (1978). Contributions to factor analysis of dichotomous variables.
Psychometrika, 43, 551 -560.
Muthén, B. (1991). Multilevel factor analysis of class and student achievement
Muthén, B. (1991). Multilevel factor analysis of class and student achievement