• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

5.2 實驗結果與討論

本小節將開始介紹,效果較佳的參數組合,以及其比較討論,我們在實驗中共選 出了一組原始參數組合以及八組較佳的參數組合作比較與討論,如表 5.1 和表 5.2 所示,在八組參數組合中,準確率大約落在 60%上下,而最好的參數組合是 組合五,其準確率為 63.25%,效果較差的組合為組合二,其準確率為 57.54%,

差了大約 5 個百分點,下列將開始介紹各項參數組中,各項特徵之重要性分析與 探討。

我們從組合一及組合二中看到,主被動判斷特徵和數字覆蓋率兩特徵中,對 於推論判斷是相對於其他特徵來說幫助較大的,分別是 1.6、1.7 和 1.6、1.9,我 們從對照組及組合一和組合二的準確率可以發現,藉由提高主被動判斷特徵,相 關句可能有存在與論述句主被動關係相反的論述,但兩句子所要表達和傳遞的資 訊很有可能是相同的,因此透過該特徵可以將其反向的關係修正,而在數字覆蓋 率中,我們可以猜測出在論述句及相關句中,因為語料的特性,可能存在了許多 的數字資訊,諸如年分、月分、量詞等等,因此在比對其數字資訊上將可提升其 準確度,而門檻中我們觀察到兩個門檻值皆為負數,-1.4 和-3.5,這項資訊代表 所有的分數加總是較偏於負向的總和,也就是說,某些特徵值在分布上可能多分 布於負數,因此在門檻值上,將之調整為負數也較利於答案的判斷;而準確率方 面兩組合個別為 62.70%和 57.54%雖然都是較佳的參數組合,但正確率也差了約 5 個百分點,因為各項參數選定的差距不多,所以我們可以藉此推論出在門檻值 的選定部分,組合二的-3.5 略低,為導致準確率下降的主因。

Training data Results 2

原始組合 組合一 組合二 組合三

Training data Results 2

組合五 組合六 組合七 組合八

的關係相反,那對於推論的判斷還是反向的關係,例如 Peter is attracted to Mary 和 Peter attracts Mary 中,兩句子的主詞及受詞皆為 Peter 和 Mary,但在句意上,

因為兩句子一個為主動一個為被動,因此句意上會完全反向,但透過此二特徵, 都相同則他們的關係也應該是反向的關係,以下為例:Jeter loves playing baseball 和 Jeter hates playing baseball,兩句子中的主詞和受詞都相同,但中間存在了反 向因子 loves 和 hates,因此句意相反,但如果又調高主詞和受詞覆蓋率的參數分

我們在初次舉辦的 NTCIR-RITE VAL 子任務中,在三隊參賽者中,拿到第 二名的名次,其中第一名的準確率約落在 54%,這也意味著主辦單位在訓練與測

NTCIR RITE-VAL Test data Results

組合一 組合二 組合三

N 1. Awards ceremony is now seen live in more than 150 countries and it started in 1943.

Y 2. South America's Amazon River is the largest river in the world

N 3. The Boeing 777 is a large, wide-body airliner with four wing-mounted engines.

Y 4. A video game is an electronic game that involves human interaction on a video device.

Y 5. U.S. President Barack Obama launched a campaign called Educate to Innovate on 23 September 2009,.

Y 6. Capitalism is the means of production that largely privately owned and operated for profit.

相關文件