• 沒有找到結果。

第三章   研究流程、架構與實驗方法

3.4   實驗說明與實驗數據正規化

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

3.4   實驗說明與實驗數據正規化

漢語語言的詞類種類多樣,每一種詞類的意義極廣,用法多種且繁複。本研 究以資訊領域的方法及角度來觀察語言本身所具有的結構性,故在探討語言的結 構時,並不會優先以語意、語用的角度作詞彙上的觀察考量;若是以語言學的角 度透過語意作為結構上的觀察,例如:情態動詞“要(D)”本身在不同的語句中 可能含有兩種以上不同的意思。在a 語句中,情態動詞“要(D)”為表現義務的 情態用法,或者說是主語給予受語的一種指令;而在b 語句中,情態動詞“要 (D)”則表現主語自身的動力情態,即主語本身即將發生的行為動作。

a.父母希望孩子們要認真念書。

b.我等等要去醫院做健康檢查。

若以資訊科學的角度來觀察,上述a、b 語句兩者的情態動詞“要(D)”將會被 統計為一種詞彙,此時必須再多選擇語句中的其他詞彙與情態動詞“要(D)”搭 配,才能夠進一步的分析兩者情態動詞“要(D)”之間的差異。

本研究選擇聚焦在人稱代詞、情態動詞、動詞所構成的評估指標,將分別探討 單以人稱代詞、情態動詞、動詞,以及兩兩詞性組合而成的指標:人稱代詞與情態 動詞、情態動詞與動詞、人稱代詞與動詞,以及人稱代詞與情態動詞與動詞三類詞 性組合而成的指標結構進行該結構在文本上的分析。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

然而在研究語料文本時,統計每個文本中單字或詞彙的出現次數是非常普遍的 研究作法,學者依照文本中單字或詞彙的出現次數來觀察該單字或詞彙在文本中的 重要性或者是隱藏意涵,甚多者在統計結果中加以過濾後,即是以此來決定該篇文 本所謂的關鍵字。然而在不同語料文本的比較中,若欲觀察相同單字或詞彙在不同 語料文本的表現,研究上必須考量語料文本中單字或詞彙的數量,如果數量差距甚 大則不能以該單字或詞彙出現在其文本中的次數作為比較的標準。因此,在表3.4.1 中所表現的數據皆為在該特定文本中所表現出的絕對數據,若是將不同語料文本並 列比較,將會因為文本大小的不同造成觀察的角度有所偏差(洪千惠,2011)。

為了能夠將同一個詞彙在不同文本間做比較,本研究將文本的規模進行正規 化,以每百萬詞出現詞彙次數作為正規化後之單位(Biber, 2006)(白明弘、吳鑑 城、簡盈妮、黃淑齡、林慶隆,2016),以利詞彙之間相對頻率的呈現。依照選定 詞彙在文本中出現的次數為𝐶",文本字數總數量為𝑆$,所求為正規化後之詞彙頻率

為𝐹",計算公式為公式3.4.1 所示。

𝐹

"

= 𝐶

"

𝑆

$

×10

*

公式 3.4.1、計算詞彙在不同文本間之相對頻率

以中央研究院平衡語料庫中的“藝術”及“社會”以及漢語平衡語料庫全文 (scs_all)為例,表 3.4.1 顯示各個情態動詞在文本中的絕對次數,以詞彙第一列“可

(D)”為例,絕對次數的相對關係為:scs_all >社會>藝術,其中 scs_all 之絕對次數 亦是藝術之絕對次數的10 倍以上。再看到正規化後的表 3.4.2 即顯示出絕對次數在 文本經過正規化後產生的差異,同樣以詞彙第一列“可(D)”為例,文本詞彙絕對 次數的相對關係變為:藝術>scs_all >社會,其中正規化前 scs_all 之次數約為社會 之次數的3 倍,而經過正規化後可以發現兩個文本的次數大約相同。以上可以看出

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

34

詞彙 SCS_ALL 藝術 社會 可(D) 891.25 1064.35 835.68 可以(D) 992.76 969.43 842.67 必須(D) 343.57 340.08 435.23 要(D) 1529.27 1056.13 1309.77 能(D) 1150.62 1244.48 1088.32 能夠(D) 166.63 135.29 164.17

得(D) 140.94 105.39 138.77 須(D) 71.89 100.16 101.43 會(D) 1480.91 985.87 1226.07 當(D) 16.75 12.71 15.34 該(D) 121.79 88.20 92.74 需(D) 63.23 80.72 75.86 應(D) 368.86 393.15 586.95 應當(D) 11.11 6.73 14.83 應該(D) 284.66 229.46 298.16

表 3.4.2、經過正規化後之統計資料數據(單位:次/百萬詞)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y