• 沒有找到結果。

萃取與使用提示資料

在文檔中 部落格文章寫作輔助系統 (頁 36-41)

第三章、 系統設計

3.7 萃取與使用提示資料

產生文章提示的流程示意圖,如下圖 3-9 所示。當系統完成分析核心關鍵詞 彙的動作,會將結果組成查詢字串(Clause Query or Sentence Query),並至 Google Blog Search Engine[2]尋找符合的部落格文章作為給予使用者的參考。

依照查詢字串的不同,所取得的參考資訊亦有所差別。若提供的查詢字串是來自 子句的核心關鍵詞,則系統會收集到一系列相關聯的句子(Set of Sentences),

結果如圖 3-10 黃色方框,並計算每個候選句的分數,最後再將高分數的句子當 作提示訊息。如果查詢字串的來源是由句子生成,則會取得用字遣詞類似的段落 文章(Set of Paragraphs),如圖 3-10 紅色區域,表示所描述的主題即有可能 相同。系統將這些段落經過事前訓練好的預測模型(SVM Predict Model),並 且為每個段落標上對應的文章類別(Label Category),如圖 3-10 棕色線條,

用意是提供主題分類,讓使用者能夠針對目前寫作的方向選取相關提示訊息。

圖3-9:參考提示產生的過程。

29

圖3-10:Google Blog Search Result Example。

我們以查詢字串的種類作為提示分類之依據,將系統所產生的參考資訊劃分 為兩種型別,子句與句子提示。下列為各類提示計算分數的詳細方式,並舉範例 與圖解說明之:

1. 子句提示(Clause Reference)

藉由此類查詢字串所收尋的結果,會從網路上獲得相關的句子。系統將根據 查詢字串中的核心關鍵詞彙作為評分的標準。下圖 3-11,為子句類型查詢字 串計算分數的實際範例:

查詢字串:"天氣 * 適合 踏青"

取得資料:今天天氣非常的適合踏青,是晴朗無雲的好天氣。

計分方式:○1 查詢字串完整出現於資料中,「天氣…適合踏青」,代表與使 用者所撰寫的子句有非常高的相似程度,系統會給予該句極高 的分數(Score A),如下圖紅色區域。

Paragraph

Sentence

S V Label:Travel M

30

2 只有查詢字串的部分詞彙出現於資料中,「天氣」、「適合」

或「踏青」,系統會給予基本分數(Score B),如下圖綠色方塊。

3 (Score A) ≫ (Score B)

最後該句子的分數為所有獲得分數的加總,(Score A) + (Score B),當所有 的句子都計算出各自總分,系統會自動挑選較高的項目成為提供使用者參考 寫作的提示。

圖3-11:查詢子串為「"天氣 * 適合 踏青"」的提示句分數。

2. 句子提示(Sentence Reference)

若以完整句子的核心關鍵詞作為查詢字串,可以由部落格搜尋引擎取得相關 聯的段落文章。首先,系統會利用支援向量機模型預測所有段落,並標上對 應的主題類別。而後,將擁有相同類別的段落收集起來,再以句點切割成提 示句,分別計算每個句子的分數,並按照分數高低排序。下圖 3-12,為句子 類型查詢字串的計算範例:

查詢字串:晴朗 郊遊

訓練特徵:{今天, 天氣, 家人}

取得資料:今天是個晴朗無雲的好天氣,適合全家人出門郊遊。

計分方式:○1

今天天氣非常的適合踏青,是晴朗無雲的好天氣。

當系統於句中尋找到「晴朗」、「郊遊」,會給予較高的分數 (Score A),表示該資料與目前寫作的方向有某種程度的相似,

如下圖藍色方框。

Match Whole Query Match one Entry

𝐒𝐜𝐨𝐫𝐞 𝐀 𝐒𝐜𝐨𝐫𝐞 𝐁

31 的 Speech Repair[22]作為提示選取介面的設計雛型,將所有句子中的組成單元 切割成字元單位,並按照原始句中的順序排列,如:「今天天氣真好」經過處理

Match Feature Terms Match Query Terms

𝟑 × (𝐒𝐜𝐨𝐫𝐞 𝐁) 𝟐 × (𝐒𝐜𝐨𝐫𝐞 𝐀)

32

圖3-13:系統提示的使用方式。

我們去八斗子「潮境公園」情人湖玩,

1.

2.

Show Tips

Using Tips User Writes Down

Tips

Output

33

在文檔中 部落格文章寫作輔助系統 (頁 36-41)

相關文件