第五章 文字中的特別字詞與停頓標記關係之統計
5.1 從詞綴觀察停頓分佈之統計
共有 121 個,後接詞綴有 195 個。在 本節我們將直觀文字資料中,前、後詞綴與其接頭、接尾詞連接。因此第一步便 著手統計前、後接詞綴與其接頭、接尾詞個別停頓標記的數量,程度請見下表 5-1-1 與 5-1-2
表 5-1-1:前詞綴與接頭詞之 Break type 統計表節錄
前詞綴 字詞 “B0" “B1" “B2-1" “B2-2" “B3" “B4"
標 , 江振宇 標記停 類型的模 標註停
, B
4。其 B0 代表 hl ed 表 normal 表人 分辨的
代 表 人 可 分 辨 的
phrase(PPh)邊界,B4 代表 breath group/prosodic phrase group(BG/PG)邊界。
我們目前建立的詞綴表中,前接詞綴
新 one 2 13 0 0 0 0
more 2 3 0 0 0 0
… … … …
… … … …
大 one 3 31 2 0 0 0
more 7 33 0 0 0 0
… … … …
表 5-1-2:後詞綴與接尾詞之 Break type 統計表節錄
後詞綴 字詞 “B0" “B1" “B2-1" “B2-2" “B3" “B4"
地 one 1 27 2 1 0 0
more 0 4 0 0 0 0
… … … … … … … …
到 one 0 16 0 0 0 0
more 4 141 0 0 0 0
… … … …
上面兩表的第 中,標 著〝 B1〞 -1〞 〞、 B4〞,在 表 5-1-1 中表示前詞綴與其後接頭詞兩者間的相接點的停頓標記,在表 5-1-2 中表示後詞綴與其前接尾詞兩者間的相接點的停頓標記。
由上述兩表可觀察到,前詞綴與其接頭詞、後詞綴與其接尾詞兩者的停頓 標記多為〝B0〞與〝B1〞,說明了,前詞綴與其接頭詞之間沒有很長的停頓,後 詞綴
詞緊密相接而已嗎?
為了探討詞綴與前後文的關係,我們對語料庫進行一次人工觀察,發現某 些詞綴不單單只跟其接頭、接尾詞緊密相接,某些詞綴還會有很高的機率與上下 文斷開,因此我們接著統計詞綴與前後文的停頓標記,請看下表 5-1-3 及 5-1-4
一列 記 B0〞、〝 、〝B2 、〝B2-2 〝B3〞、〝
與其接尾詞之間同樣的也沒有很長的停頓,偶爾只有短暫的停頓或是強調重 音的形式,其餘幾乎皆是緊密相接的,這與我們的直覺也相當一致。
詞綴因點綴其他詞而成一新詞,所以上面的統計只是更進一步使我們確信 這些詞的確屬於詞綴。但詞綴不僅能與其他詞相接出現,也能單獨出現,那詞綴 在什麼情況下會是詞綴呢?詞綴這麼特殊的詞,其停頓的特徵真的只與其接頭、
尾
表 5-1-3:前詞綴與前後文之停頓標記統計節錄 不 Null non minor major
Null 0 98 4 0 non 0 141 11 0 minor 0 210 7 0 major 0 60 6 0
表 5-1-4:後詞綴與前後文之停頓標記統計節錄 人 Null non minor major
Null 0 0 0 0 non 0 166 102 136 minor 0 4 1 0 major 0 0 0 0
如按照原本分為六類停頓標記做統計,因為各別的數量過少,對於未來的研究,
實質上並無太大的幫助,因此將六類合併為三類做統計,〝B0〞與〝B1〞併為一 類成〝non〞代表沒有停頓,
經由上面的統計 "、“全"、
“共"不僅有很高的比例與後詞相接, 高 前接 。而後詞綴
“地"、“ “隊 感"、“ "、
、 "、 、“ “物 “心"、“出"
相 還有 比例 詞斷
果 ,後詞綴有一類其詞類很特別“Ng",我 在下 記
前 後
前 後
〝B2-1〞與〝B2-2〞併為一類成〝minor〞代表有短 暫的停頓,〝B3〞與〝B4〞併為一類成〝major〞代表有較長的停頓,〝Null〞代 表前後文為標點符號或同為句子啟始。
發現,前接詞綴當中的“不"、“可"、“無 也有較 的比例與 詞斷開
當中的“面"、 黨"、 "、“力"、“ 家 “權"、
“者"、“場" “人 “額" 員"、 "、 、“到"
等不僅會與前詞 接, 較高的 會與後 開。
在統計的結 當中 們 一節討論
此詞類的停頓標 。