• 沒有找到結果。

探討混合不同摘要模型的方法 3

N/A
N/A
Protected

Academic year: 2021

Share "探討混合不同摘要模型的方法 3"

Copied!
2
0
0

加載中.... (立即查看全文)

全文

(1)

60

第 6 章 結論與展望

6.1 結論

本論文於自動摘要方面,在逐字比對方式上應用隱藏式馬可夫模型(Hidden Markov Model, HMM)做為摘要模型,並分為 HMM-Type1 及 HMM-Type2 二 種類型;在概念比對上提出嵌入式潛藏語意分析(embedded LSA)與主題混合 模型(Topical Mixture Model, TMM)做為摘要模型;在自動摘要評估上,提出 以改良型字錯誤率(modified Character Error Rate, m-CER)為基礎的平均精確度

(Mean Average Precision, MAP)評估方式,以解決自動轉寫與人工轉寫文件因 斷句不一致,所造成摘要結果無法評估相關的問題。

經由實驗結果顯示,於特徵單位比較上:使用雙音節與雙字時,其結果優於 使用詞為特徵單位;於摘要模型比較上:使用隱藏式馬可夫模型或主題混合模型 其結果較其它常見方法有顯著的提升,同時主題混合模型在幾乎所有情況下均較 隱藏式馬可夫模型來得佳。

此外對於隱藏式馬可夫模型-型一使用字句擴展能有效增進摘要正確率;對 於隱藏式馬可夫模型-型二與主題混合模型中做字句移除,在人工轉寫文件上均 有效提升摘要結果,然而在自動轉寫上,因辨識錯誤及斷句不同,抵銷了其結果,

但是可以發現在辨識率上升時,其結果有所提升。

另一方面,在主題混合模型的初始化使用均勻分佈,在低摘要比例下有較佳 的結果。

最後本論文提出主題混合模型分類器,初步實驗結果顯示,主題混合模型分 類器較常見 K-最近鄰(K-Nearest-Neighbor, KNN)分類器在 MicroF 與 MacroF 分類結果上,有些微的提升;然經過自動摘要前處理後,此二者的分類結果均略 顯降低,進一步的來說,自動摘要雖然提升了自動分類文件的效率,卻因損失一 些分類資訊,使分類的結果降低。

(2)

61

6.2 未來展望

在摘要模型上:

1. 依據文件屬性,動態結合屬性資訊(如新聞開頭、結論段落為重要字 句)

2. 探討混合不同摘要模型的方法

3. 結合更多自然語言方面的資訊,如詞性(Power of Speech, POS)

4. 結合語音聲學上特性,如:音高、能量等

5. 結合分類資訊進行摘要,使自動摘要能具體幫助分類器做分類 在分類器上:

1. 對主題混合模型,進行特徵抽取,以選取具有代表性的字詞 2. 探探與其它分類器結合的可能性

自動摘要技術,在資訊爆炸時代裡愈顯重要,在與其它相關科技結合後,如 語音辨識,我們可能擁有手機留言自動摘要服務、一台能自動摘要廣播新聞的數 位收音機等,這些都將可能於未來逐步實現。

參考文獻

相關文件

研究不同的、新的教學方法/模式 試教行動 Æ 分享經驗 Æ

在軟體的使用方面,使用 Simulink 來進行。Simulink 是一種分析與模擬動態

表 2.1 停車場經營管理模型之之實證應用相關文獻整理 學者 內容 研究方法 結論

樹、與隨機森林等三種機器學習的分析方法,比較探討模型之預測效果,並獲得以隨機森林

則巢式 Logit 模型可簡化為多項 Logit 模型。在分析時,巢式 Logit 模型及 多項 Logit 模型皆可以分析多方案指標之聯合選擇,唯巢式 Logit

Tunnel excavation works on the support of the simulation analysis, three-dimensional finite element method is widely used method of calculating, However, this

step5-3: 數字格式可設定摘要的頁碼格式(再此將摘要頁頁碼格式設定為羅馬數 字小寫),另外還要設定 頁碼編排方式,選擇 起始頁碼 為

The core of the verification environment is the fault injection tool that can inject the transient and permanent faults into VHDL models of digital systems at chip, RTL and