研究計畫委員提問 - 以LSTM深度神經網路語言模型建構英文課程重點摘要

問題 1. 建議準則一、二、三改為演算法一、二。

在 3.2 節，我們已將此所有提到準則字詞都修改為演算法，包含圖片以及內文。

問題 2. Pcr、Tcr、Cp名詞應重新定義。

在 3.2 節，我們個別重新定義 Pcr為以投影檔句子為基礎的匹配比率、

Tcr為以文字稿句子為基礎的匹配比率、Cp為句子間的近似匹配分數。

問題 3. 說明逗號斷句的情境。

在 3.1 節已補充說明逗號斷句的情境。逗號斷句門檻須符合句子之字詞總數大於 10 個以上，才允以切割。

問題 4. 建議結果呈現，將原文列出。

於 4.4 節中，我們加入原始文字稿，以及各摘要器所產生的摘要結果，

並進一步說明各摘要器所產生摘要的優缺點。

問題 5. 圖 3-2 的準則一中，Pcr為何要由 0.6 作為起始值?是否有文獻佐證?

因演算法是本論文自己提出，並不會有任何文獻可以進一步佐證，但在 3.2 節加入以下說明，本論文使用近似句子匹配方法來計算兩者句子之間的相符程度，因採用完全匹配句子的方式會受到大小寫字母、標點符號、

空白間隔等差異，而導致錯誤匹配，並在 4.2.1 節中加入參數設定研究，能

證明設定演算法參數的理由。

問題 6. 圖 3-2 的準則一中，應該是至 0.1 停止，而非 1.0 停止。

此錯誤已於圖 3-2 修正。

問題 7. 神經網路語言模型之 LSTM，是如何產生摘要? 監督式還是非監督式?

LSTM 神經網路語言模型能預測句子是否屬於重要句子的類別，因此會預測句子不同類別的機率值，本論文進一步排序預測機率，並計算投影片的字詞數作為擷取摘要的字詞上限，透過抽取最高的預測機率句子視為摘要，並達到字詞上限就停止，形成最後的摘要。

嚴格來說兩者方法都有用到，首先會使用到非監督式的預訓練來構建神經網路，來發現有效的特徵，之後再採用監督式方法的反向傳播以區分有標籤資料的特徵。

問題 8. google 的影音字幕就是一種語音識別，只是它是離線式的，不是即時識別。因此你可能要將影音字幕移除，或者加上參考文獻供讀者瞭解你所指為何。

經由我們上網查證之後，就如同委員所述，兩者背後機制是相同的，

差別在於一個是線上即時分析，一個是離線式，因此此段話已經移除。

問題 9. LSTM 為 RNN 的一種，所以你可能要去查閱 RNN 用在監督式及非監督式的差異。

RNN 用於非監督式方法時，會增加額外的非監督式演算法進一步對 RNN 模型區別資料集的序列，並分群它們為多個群集。因此網路會根據特定學習規則的使用，自動的檢測一些輸入序列相關的概念(Klapper-Rybicka et al. 2001)，並在網路輸出中，作為有關於輸入資料最大化的相關資訊 (Schraudolph 1995)；用於監督式方法時，必須事先擁有已知類別的資料集，

透過 RNN 發現有效的特徵，再採用監督式方法的反向傳播以區隔有標籤資料的特徵。

問題 10. 是否有文獻探討不同領域適用的摘要法?

近幾年已有許多學者採用不同架構及不同領域的文件來產生摘要，

Urvashi(2016)建立一個 RNN 類神經網路為基礎的文件摘要，用於有關於計算語言學的學術性出版領域的 Anthology Reference Corpus(ACL)²¹資料庫。

Zhenpeng(2016)建立兩層分層式的 LSTM 模型架構，以百萬個信號媒體新聞文章(Signal Media One-Million News Articles)²²為資料集來產生摘要，有助於對新聞文章進行研究。Chopra et al.(2016)試著對抽象式句子摘要問題來建構一個新的卷積關注為基礎的條件式的遞歸神經網路，其模型透過 Gigaword²³ 語料庫進行訓練，此語料庫是來自於 7 個新聞來源的文件。

問題 11. 目前的評估只有 ROUGE-1 的結果，應該補上 ROUGE-2、ROUGE-3

21 資料來源：http://acl-arc.comp.nus.edu.sg/。

22 資料來源：http://research.signalmedia.co/datasets.html/。

23 資料來源：https://catalog.ldc.upenn.edu/ldc2003t05/。

的。

在 3.5 章節中，我們增加 ROUGE-2、ROUGE-3 的結果說明，並透過例子的方式來進一步說明。

在文檔中以LSTM深度神經網路語言模型建構英文課程重點摘要 (頁 70-73)