• 沒有找到結果。

系統架構 系統架構 系統架構 系統架構

在文檔中 中文作文寫作輔助系統 (頁 30-36)

4.3 4.3

4.3 系統架構 系統架構 系統架構 系統架構

4.3.1 4.3.1 4.3.1

4.3.1 候選關鍵詞串列候選關鍵詞串列候選關鍵詞串列集候選關鍵詞串列集集 集

如前文所述,一個關鍵詞串列可視為一篇文章的骨幹,由於每篇文章的關 鍵詞密度相差不大,因此一篇文章愈長,其所萃取出的關鍵詞串列也愈長,所以 我們可藉由關鍵詞串列的長短來控制合成文章的長度(總字數)。改良系統提供三 種關鍵詞串列長度:較短(10 個關鍵詞)、中等(20 個關鍵詞)、較長(30 個關鍵 詞)供使用者選擇。候選關鍵詞串列的產生的方式是:從已經分離好的作文語料 庫中隨機挑選數個關鍵詞串列,並擷取每個串列的前n個詞。我們將選出來的關 鍵詞串列記為 Sel_list,其中第 i 個關鍵詞記為 Sel_list(i),直接從語料庫作文萃 取關鍵詞串列的好處是可以確保一個關鍵詞和其左右鄰近其他關鍵詞在語意上 的關聯性,這避開了兩個關鍵詞因關聯性不高而無法連結成一個句子的窘境。

4.3 4.3 4.3

4.3.2.2.2.2 候選填充字串候選填充字串候選填充字串集候選填充字串集集 集

有了關鍵詞串列,便可為這個串列填入填充字串,改良系統提供的方法是:

SCandi Sel list i i S string k j j

Keyword list k j Sel list i Keyword list k j Sel list i

j Keyword list k for all k

圖 8 "同學"及"喜歡"對應的候選填充字串集 者的負擔。考慮Sel_list(k)和Sel_list(k+1)及其所對應,屬於SCandi(i,i+1)的一個 填充字串S_string(i)[j,j+1],在直覺上我們認為關鍵詞串列Keyword_list(i)的第j+2 個關鍵詞若與 Sel_list(k+2)相同,則此填充字串在語意上與現有串列搭配度應該

單就位置而言,假設作文語料庫中文章的關鍵詞密度相差不大,S_string(i )[2,3]1 可能會優於S_string(i )[15,16]2 ,這是因為S_string(i )[2,3]1 通常會比較符合文章首

文句出現在合成文章的一開始。而Total_score( S_string(k)[j,j+1] ) = NS + PS,我 們依據Total_score對SCandi(i,i+1)裡的候選填充字串排序。圖9為填充字串"都 非

次顯示10 個關鍵詞串列供使用者選擇,使用者可按更新鍵更新系統顯示的候選 關鍵詞串列集。第二個步驟是預設合成文章顯示以及合成文章的修改。關鍵詞串 列一旦選定便可決定兩兩相鄰關鍵詞間的所有的候選填充字串集,這些填充字串 集經過排序後,由系統各自從排名前五項的填充字串中隨機挑選一項出來合成系 統的預設文章。當然,系統預設文章可能不是整篇都很通順,因此,本系統提供 機制,讓使用者可找出相鄰兩個關鍵詞間所對應的其他填充字串集,以便讓使用 者修改預設文章,系統介面將在 5.2 節詳述。圖 10 為第一個步驟的選擇視窗,

反白的部份為挑選的關鍵詞串列;依據此關鍵詞串列產生的預設合成文章則如圖 11所示;而圖12則顯示圖11中可填於"下課"及"通常"間的其他候選填充字串,

由於系統預設所選的填充字串未必適當,故系統提供可讓使用者做替換的其他選 項。

圖 10 第一個步驟 - 候選關鍵詞串列選擇

圖 11 第二個步驟 - 預設合成文章顯示

圖 12 "下課"及"通常"的候選填充字串

第五章 第五章 第五章

第五章、 、 、 、系統比較 系統比較 系統比較 系統比較與 與 與 與討論 討論 討論 討論

本章將對作文寫作輔助系統的原型系統以及進一步改良後的合成系統進行 比較與分析,觀察改良後的系統是否確實改善原本系統的缺點,並且保留優點。

在文檔中 中文作文寫作輔助系統 (頁 30-36)

相關文件