• 沒有找到結果。

第三章   研究流程、架構與實驗方法

3.3   實驗

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

3.3   實驗

3.3.1   擷取詞彙規則

傳統對於語境之定義即為語言環境,它包括許多語言因素(例如:上下文、對 象。)或非語言因素(例如:時間、空間。),又可以解釋為人們交際過程中使用 來理解或應用所依賴的各種言詞表現;從另一個角度來看,語境對於語言會產生一 種制約的作用,因此,交際語言中所表達的語義、語言的結構形式、語言風格等方 面,都將限定在一個語境的範圍之內。有別於傳統文本研究所觀察的文本語境,本 研究的實驗指標定位在一個概括性的研究角度,不局限於某一特定範圍內的文句,

而是針對整體文本的掃描。

本實驗首先針對詞彙截取的規則為只要文本內詞彙符合兩個原則即擷取,一者 為詞彙字形的部分,其二為詞彙經過中研院中文斷詞系統斷詞後的詞性標記符合者 擷取規則者。

人稱代詞的部分,字形須符合單數或複數,並且為第一人稱、第二人稱、第三 人稱之人稱代名詞,並且詞性標記為“(Nh)”之詞彙,即:我們、你們、他們、她 們、我、你、他、她,作為指標使用之人稱代詞,即表3.3.1 所示。

情態動詞的部分,字形為根據學者Li(2006)發表對於情態動詞的分類框架下所 整理的漢語常用情態動詞,而詞性標記須為“(D)”之詞彙,即表 3.3.2 所示。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

3.3.2   以人稱代詞、情態動詞及動詞交互搭配之指標設計

首先是單詞指標,本研究利用屬於代名詞子類之人稱代詞以及情態動詞與動詞 三者作為分析文本的元素;單詞指標共三種,為單以三大詞性類別分別對文本進行 基本的統計運算。雙詞指標為從三類詞性中進行兩兩詞性合併而得到另外三種更嚴 謹的指標形式。最後是三詞指標,延續雙詞指標的合併規則,三詞指標來自三大類 詞性元素在文本文句中合併出現的情況,其需要特別注意的地方在於詞彙與詞彙之 間需相鄰出現,故在於擷取的過程中必須考慮詞彙之間並不會被標點符號斷開,共 一種。

基本上,對於兩兩詞彙在文句中緊鄰出現的結構情況,我們可以推測這兩個詞 彙有可能具有極強的連結關係或所謂的共現關係,共現關係是出自語言學用語,通 常隱含有某種共同關係或是巧合的意義,或也可以是指某兩個一組的詞彙一前一後 出現(且高於正常)的次數。在語言學中的解讀中,字詞共現的關係越高往往意味 著兩個字詞的相關性越強,或是其具有一致的論述背景。本研究欲觀察此七種指標 在不同文本下所呈現的統計結果是否可以讓研究者對未來的文本研究有更清楚的研 究方向。

此外,當對動詞的篩選設定除了上述詞性的條件情況下,從文字上很難從單一 個字的動詞來猜測本身的意義,例如:“讓(VL)”、“做(VC)”,所以為了能讓動 詞意義更加明確,本實驗將同時刪去單一字的動詞,並作比較。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31