• 沒有找到結果。

第三章 研究方法

3.3 應用

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

為數(p×1) 不可觀察的誤差項,由於各 εi 是專屬於對應之變數 X1,故又 稱為特定因素(Specific factor)。

至於因素模式參數之估計,常使用三種方法,包括主成分法(Principal component methods)、主因素法(Principal factor method)、及最大概似法 (Maximum likehood method)。而本研究係採用主成分法,即利用線性方程 式將所有變項加以線性合併(linear combination),計算所有變項共同解釋的 變異量,此線性組合稱為主要成份。經多次嘗試後,其對共變數矩陣維度 有較佳的縮減效果。茲將因素分析的步驟簡略說明如下:

(1).計算各變數間的積差相關係數,組成一相關矩陣,並估計共同性。

(2).因素模式的選定。

(3).因素抽取方法為主成分法,並只抽取至特徵值(Eigenvalue)大於 0.5 之 因素。

(4).因素軸的旋轉,目的在使每個變數只歸屬於一個或少數幾個因素,促使 因素結構簡單化,以得到已轉軸因素之負荷量,方便因素之命名。

本研究係採正交旋轉之最大變異法(Varimax rotation)。其可使轉軸後每 一共同因素本身內的因素負荷量之差,儘量達到最大,讓因素與因素之間 沒有相關,因素軸之間的夾角等於 90 度,可使因素之間提供的訊息不易 重疊,獨立性高。以利於共同因素之辨認和命名,並使因素結構達到簡單 化之目的。

3.3 應用

本研究論文將運用語料庫語言學的方法處理口語及書面語的語體變異,

以電腦化的方式處理語料庫及統計分析,運用中文斷詞系統、現代漢語語 料庫詞頻統計將語料自動斷詞、詞類標記及統計累積詞類詞頻等,將取代

19

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

傳統人工檢視語料的方式完成語料處理。並且同時間計算出每個語言特徵 在每條語料中的出現的頻率,於本論文中所使用的語言特徵可參見附錄二,

觀察口語及書面語語料中的詞彙特性以作為語言特徵的羅列。

圖一、書面語料語言特徵統計摘錄

接著再使用因素分析統計語料中的共現語言特徵,解開語體變異的原 因。因素分析(factor analysis)是 Biber「多面向方法」於文本分析中主要的 統計工具;先將出現頻率過少的語言特徵刪除,以利運算時的正確性,將 刪減過的 52 個語言特徵運用因素分析將大量的語料變數簡化至幾組共現 特徵,而由統計分析下的共現語言特徵就稱為因素。其中 SPSS 操作步驟 如下所列。

1. 數據載入→統計分析→維度縮減 →因子,即會出現因素分析的對 話視窗。

2. 將所要進行因素分析的變項,勾選移至右邊的變數視窗中。

3. 點選右上角描述性統計量的按鈕,會出現對應的視窗。

4. 在描述性統計量的視窗中的統計中勾選未轉軸之統計量,在相關矩 陣中勾選 KMO 和 Bartlett’s 球型檢定等兩項,按繼續按鈕回到因

20

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

素分析對話視窗,點選萃取按鈕,會出現因素分析:萃取的對話視 窗。

5. 在因素分析:萃取的對話視窗中,選取主成分選項,點選陡坡圖選 項,再按繼續按鈕回到因素分析對話視窗,點選轉軸按鈕,會出現 因素分析:轉軸法的對話視窗。

6. 在因素分析:轉軸法的對話視窗中方法內勾選最大變異法選項,按 繼續按鈕回到因素分析對話視窗,點選分數按鈕,會出現因素分析:

產生因素分數的對話視窗。

7. 在因素分析:產生因素分數的對話視窗內,勾選因素儲存為變數中 的 Anderson Rubin 因子分析估計法和顯示因素分數係數矩陣兩項,

按繼續按鈕回到因素分析對話視窗,點選選項按鈕,會出現因素分 析:選項的對話視窗

8. 在因素分析:選項的對話視窗內,於係數顯示格式內勾選依據因素 負荷排序選項,按繼續按鈕回到因素分析對話視窗,點選 OK 按 鈕,即會進行因素分析統計程序。

每個因素都代表語料中所皆共有的語言變化現象。建立相關矩陣是因 素分析的第一個步驟,相關的大小表示兩個語言特徵之間共變的程度。本 研究使用主成分法 (principal components analysis) 萃取因素。同時考慮特 徵值 (eigenvalue) 及陡坡圖 (scree plot) 得出四因素解,五因素解,六因 素解為可能的因素個數。分別考慮四因素解,五因素解,六因素解後,決 定以四因素為最佳因素解。

此篇論文將檢視語言特徵及句法形式於語料中所呈現出的頻率予以統 計,希冀能解開口語及書面語間的使用方式。面向則是因素經過解釋的結 果,因素的解釋是基於共現的語言特徵之間有共通的溝通假設;從這些共 通的假設可能具備情境的、社會的或認知的功能。故從多面向探究語體於

21

NCCU Corpus of Spoken Chinese)作為口語語體的會話語料來源,如表三。

再者筆者欲包括不同面向的語料進行分析,故加上從各式會議的實際紀錄

M003-CN-NF-FF-YY 日常會話 00:14:

10