第四章 實驗結果與分析
第一節 選取種子詞彙的結果分析
種子詞彙經由第三章所介紹的四個規則分別擷取出來,其中規則(一)所擷取 出來的內容為 68 個正向詞彙,詞性皆為狀態類及物動詞(Vi),在此列出一部分如 下表 4-1:
表 4-1:30 個正向極性種子詞彙
理想 細膩 突出 靈光 重要
稱職 合理 複雜 驚喜 老謀深算
開心 好 血腥 對 自然
完善 精彩 大快人心 適當 豪華
刺激 入流 有趣 爽 俗
盡責 完整 好看 明顯 緊張
規則(一)誤判極性的詞彙共有 7 個,分別是:『邪惡』、『沉重』、『假』、『糟』、
『血腥』、『俗』、『任性』等,而在這些詞彙當中,雖然從結果比對上是誤判的,
不過在還原整段句子的使用方法後,我們發現到整段句子的涵意確實是負向極性 層面的,但是卻因為修飾的主詞不同而造成誤判的情況,例如:『邪惡』的原型 句子為,『電影的史諾總統感覺很不邪惡,跟小說裡的形象一比,電影版的總統 顯得多麼和藹可親』,這裡的邪惡因為是形容反派角色,所以被判定成正向極性 詞彙才是正確的,而這個問題或許在把電影類別領域再縮小時就可以改善。
規則(二)主要也是負責擷取狀態類及物動詞(Vi),只是在這個規則中擷取出來 的大部分皆為負向極性詞彙,只有極少部分為正向極性詞彙,其中負向極性詞彙 擷取出 87 個,正向極性詞彙有 3 個,下面列出負向極性詞彙 30 個如表 4-2:
表 4-2:30 個負向極性種子詞彙
雷同 失落 出乎意料 過份 做作
假 不耐煩 說不過去 惆悵 來不及
先入為主 可惜 風趣 冠冕堂皇 灑狗血
牽強 噁心 尷尬 無聊 悶
平凡 還好 冷掉 矛盾 失色
嚴苛 格格不入 矬 突兀 失望
規則(二)誤判極性的詞彙共有 6 個,分別是:『出乎意料』、『好奇』、『驚喜』、
『入流』、『合理』、『對勁』,上述這 3 個詞彙皆已經在規則(一)中被擷取出來,所 以在此就直接忽略。
經過這兩種規則的擷取後,整理出同時出現在正向極性與負向極性的種子詞 彙,總共有 5 個,分別是:『驚喜』、『假』、『複雜』、『強』、『沉重』,不過目前本 研究只將這 5 個詞彙,獨立出來暫時不做任何處理。
規則(三)用與規則(一)相同的規則擷取出動作及物動詞(Vt),共 16 個而且沒 有任何判定錯誤的情況發生,如下表 4-3:
表 4-3:正向極性動作及物動詞(Vt)共 16 個
承認 忠於 負責 合乎
喜歡 習慣 理解 欣賞
靠近 感動 適用 融入
期待 跳脫出 討好 著重
規則(四)目標是擷取出所有動詞 V,只要符合規則即可被擷取出來,正負向 詞彙皆有可能出現,總共擷取出共 44 個正向極性詞彙,和 1 個負向極性詞彙為
『難看(Vi)』。
其中有 9 個字是與規則(一)所擷取出的正向極性狀態類及物動詞(Vi)重複,分 別為『突出』、『稱職』、『清楚』、『開心』、『好』、『精彩』、『好看』、『完整』、『值 得』等 9 個。另有 1 個詞彙與規則(二)擷取出的負向極性狀態類及物動詞(Vi)重複 為『出乎意料』。下表 4-4 列出被判定為正向極性狀態類及物動詞(Vi)並皆除去重
複詞彙,共 34 個。
表 4-4:規則(四)擷取正向極性狀態類及物動詞(Vi)
沉悶 犯法 不錯 簡單 感人
貼切 難得 傑出 深入 好聽
成功 熱門 普通 好笑 有餘
歡樂 搞笑 圓滿 正式 好玩
流暢 亮眼 重現 友善 好奇
無可厚非 活靈活現 中規中矩 恰到好處 扳回一城
了不起 有意思 笑 貴
在當中判斷錯誤的有 2 個詞彙,分別是:『沉悶』、『犯法』。有 1 個詞彙被判 定為正向極性,與規則(二)判定為負向極性的結果出現矛盾,此詞彙為:『出乎意 料』,因為表 4-4 已經去除重複詞彙所以『出乎意料』不會出現在此,納入同時出 現在正向極性與負向極性種子詞彙的區塊,新增後為 6 個詞,並等待下一階段處 理。
規則(四)擷取的動作及物動詞(Vt)有 15 個皆為正向極性詞彙,只有 1 個詞彙 與規則(三)擷取出的動作及物動詞(Vt)重複為『感動』,和 1 個負向極性詞彙為『壞 (Vt)』,總共 16 個詞彙,只有 1 個判定錯誤為『心疼』。如下表 4-5:
表 4-5:規則(四)擷取動作及物動詞(Vt)
意外 心疼 終戰 明瞭 推薦
領導 認同 贊同 鼓勵 發揮
驚奇 享受 透露 愛
在此特別說明『意外』這個詞彙為何會給予正向極性,『意外』在描述一件 事件發生時,往往是帶有驚嘆讓人意想不到的意思,而在電影領域中用在描述劇 情方面使用由其為最多,所以在此給予其正向極性的分類。
規則(四)擷取的狀態不及物動詞(Vh)和其他動詞(V)共 16 個,其中正向極性詞 彙共 16 個,其中有 5 個詞彙與之前擷取的(Vi)或(Vt)重複分別為『好玩』、『好笑』、
『成功』、『突出』、『流暢』等 5 個,另有 3 個詞彙判定錯誤的,分別為『可惜』、
『悲涼』、『惡作劇』等 3 個,而在擷取負向極性詞彙方面,只擷取出了 1 個『可 惜』,也就是『可惜』這個詞彙在此規則(四)中,同時被擷取出來符合兩種極性,
納入出現在正向極性與負向極性種子詞彙的區塊,新增後為 7 個詞,並等待下一 階段處理。如下表 4-6:
表 4-6:規則(四)擷取的狀態不及物動詞(Vh)和其他動詞(V)
可惜(具雙極性) 悲涼 緊湊 寫實
安穩 乾淨 帥 美
捧場 惡作劇 加分
在第一階段結束之後,針對跨極性的詞彙共 7 個詞彙,根據各自符合規則的 多寡進行分類,不過此步驟只有『可惜』這個詞彙的負向正向比例為 2:1,被分 類到負向極性,其餘的皆為 1:1 無法決定。