• 沒有找到結果。

第四章 實驗結果與分析

第一節 特徵詞之分析與討論

在特徵詞的擷取上本論文是先利用中研院剖析器進行剖析,從中抓取 head Na 和第三章第三節所提的「塗裝」及「作工」;分群上則分出「身體」、「整體」及

「配件(或意義不明)」三個群,並利用投票的方式將之分群,相關之 kappa 數據 於第三章第三節有詳細說明。總計分至「身體」的有 65 個不重複的詞,分至「整 體」的有 135 個不重複的詞和分至「配件(或意義不明)」的有 161 個不重複的詞。

表 19 到 21 分別為節錄本實驗收集之「身體」、「整體」及「配件(或意義不明)」

的資料庫,完整列表於附錄中。

51

表 21:分群為「配件(或意義不明)」之詞彙(節錄 50 個)

刀鋒 上衣 小冊子 引擎 日記本

外套 吊帶襪 羽毛 衣服 衣襬

坐墊 羽尾 步槍 披風 法杖

泳衣 玩偶 玫瑰 金屬 指甲油

書包 書桌 氣孔 配件 高跟鞋

排氣管 推進器 梯子 袖子 帽子

握柄 椅子 項鍊 裝飾品 過膝襪

飾品 槍托 緊身衣 墜飾 澎澎裙

皺褶 緞帶 蝴蝶結 輪胎 燈籠

刀超帥 屁屁讚 偏幼 鳩 貓耳超讚

表 21 下方用雙行線分隔的為意義不明的詞彙,其中大多數為有「超」字、

人名、專有名詞或其他問題,導致中研院剖析器判斷錯誤,如「這貓耳超讚的」

一句,人工標註特徵詞會為「貓耳」,意見詞會為「讚」,但是在中研院剖析器 中會受到中間的「超」干擾,導致特徵詞抓取為「貓耳超讚」,如圖 29 所示;

其他類似例子還有圖 30 所示的「這把槍超滿意」的「槍超」、圖 31 所示的「刀 超帥的啦」的「刀超帥」和圖 32 所示的「超帥的啦」的「超帥」等。

圖 29:「這貓耳娘超讚的」之剖析結果

53

圖 30:「這把槍超滿意」之剖析結果

圖 31:「刀超帥的啦」之剖析結果

圖 32:「超帥的啦」之剖析結果

因人名關係而導致的剖析錯誤如「鳩」,在圖 33 中原句為「這隻小鳩很可愛」,

其中小鳩為該產品的名字,正式名字為羽瀬川 小鳩,故普遍會暱稱之「小鳩」,

但由於人名並無法正確剖析出來,因此會被標示為特徵詞的「鳩」和意見詞的

「小」。

其他相關的例句如圖 34 的「牛鬼真的是可愛到犯規了」的「牛」和「鬼」、

圖 35 的「五十鈴怎麼可能有這麼嬌羞的表情」的「鈴」。

圖 33:「這隻小鳩很可愛」之剖析結果

圖 34:「牛鬼真的是可愛到犯規了」之剖析結果

55

圖 35:「五十鈴怎麼可能有這麼嬌羞的表情」之剖析結果

最後是專有名詞或結構不完善導致擷取錯誤的例子,例如圖 36 中的「完全 不馬虎的 EX 咖哩棒」,其中的「EX 咖哩棒」(「Excalibur」的音譯),在剖析器 中會將之剖析為「咖哩」和「棒」;自謙詞則是屬於比較特殊的狀況,如圖 37「話 說那支蓮蓬頭真的讓鉛筆覺得是多餘的」中的「鉛筆」為評論者的自謙詞。結構 不完善的例句則如圖 38「機身塗裝呈現非常柔和的霧面卡其迷彩配色」中的「霧」

和「面卡」。

圖 36:「完全不馬虎的 EX 咖哩棒」之剖析結果

圖 37:「話說那支蓮蓬頭真的讓鉛筆覺得是多餘的」之剖析結果

圖 38:「機身塗裝呈現非常柔和的霧面卡其迷彩配色」之剖析結果 如圖 38 所示,正確的剖析應為:機身/塗裝/呈現/非常/柔和/的/霧面/卡其/迷 彩/配色。由於意義不明的範圍非常廣,或許是剖析器錯誤導致,或許是該詞彙無

57

法被定義為「身體」或「整體」,而歸類為「配件」又顯得模稜兩可。與配件一 樣無法定義出一個明確的範圍,故將兩者合在一起。在訓練資料中總計 29 個屬 於意義不明的詞彙。

在測試部分總計有 67 個未出現在訓練集之特徵詞,利用「物以類聚」之規 則分群後,並請三人進行投票,受測者兩兩比較表及 kappa 值如表 22~表 25 所示。

表 22:受測者 A 與受測者 B 之比較表

A

B

45 1 46

11 10 21

56 11 67

表 23:受測者 A 與受測者 C 之比較表

A

C

51 2 53

5 9 14

56 11 67

表 24:受測者 B 與受測者 C 之比較表

59

Precision Recall F-score

接下來對沒有出現於訓練資料之詞彙進行探討,總計有 73 個詞彙,扣除掉

Test Data(not in training data) Test Data

Precision Recall F-score

相關文件