問題 1. 建議準則一、二、三改為演算法一、二。
在 3.2 節,我們已將此所有提到準則字詞都修改為演算法,包含圖片以 及內文。
問題 2. Pcr、Tcr、Cp名詞應重新定義。
在 3.2 節,我們個別重新定義 Pcr為以投影檔句子為基礎的匹配比率、
Tcr為以文字稿句子為基礎的匹配比率、Cp為句子間的近似匹配分數。
問題 3. 說明逗號斷句的情境。
在 3.1 節已補充說明逗號斷句的情境。逗號斷句門檻須符合句子之字詞 總數大於 10 個以上,才允以切割。
問題 4. 建議結果呈現,將原文列出。
於 4.4 節中,我們加入原始文字稿,以及各摘要器所產生的摘要結果,
並進一步說明各摘要器所產生摘要的優缺點。
問題 5. 圖 3-2 的準則一中,Pcr為何要由 0.6 作為起始值?是否有文獻佐證?
因演算法是本論文自己提出,並不會有任何文獻可以進一步佐證,但 在 3.2 節加入以下說明,本論文使用近似句子匹配方法來計算兩者句子之間 的相符程度,因採用完全匹配句子的方式會受到大小寫字母、標點符號、
空白間隔等差異,而導致錯誤匹配,並在 4.2.1 節中加入參數設定研究,能
證明設定演算法參數的理由。
問題 6. 圖 3-2 的準則一中,應該是至 0.1 停止,而非 1.0 停止。
此錯誤已於圖 3-2 修正。
問題 7. 神經網路語言模型之 LSTM,是如何產生摘要? 監督式還是非監督 式?
LSTM 神經網路語言模型能預測句子是否屬於重要句子的類別,因此 會預測句子不同類別的機率值,本論文進一步排序預測機率,並計算投影 片的字詞數作為擷取摘要的字詞上限,透過抽取最高的預測機率句子視為 摘要,並達到字詞上限就停止,形成最後的摘要。
嚴格來說兩者方法都有用到,首先會使用到非監督式的預訓練來構建 神經網路,來發現有效的特徵,之後再採用監督式方法的反向傳播以區分 有標籤資料的特徵。
問題 8. google 的影音字幕就是一種語音識別,只是它是離線式的,不是即 時識別。 因此你可能要將影音字幕移除,或者加上參考文獻供讀者瞭解你 所指為何。
經由我們上網查證之後,就如同委員所述,兩者背後機制是相同的,
差別在於一個是線上即時分析,一個是離線式,因此此段話已經移除。
問題 9. LSTM 為 RNN 的一種,所以你可能要去查閱 RNN 用在監督式及非 監督式的差異。
RNN 用於非監督式方法時,會增加額外的非監督式演算法進一步對 RNN 模型區別資料集的序列,並分群它們為多個群集。因此網路會根據特 定學習規則的使用,自動的檢測一些輸入序列相關的概念(Klapper-Rybicka et al. 2001),並在網路輸出中,作為有關於輸入資料最大化的相關資訊 (Schraudolph 1995);用於監督式方法時,必須事先擁有已知類別的資料集,
透過 RNN 發現有效的特徵,再採用監督式方法的反向傳播以區隔有標籤資 料的特徵。
問題 10. 是否有文獻探討不同領域適用的摘要法?
近幾年已有許多學者採用不同架構及不同領域的文件來產生摘要,
Urvashi(2016)建立一個 RNN 類神經網路為基礎的文件摘要,用於有關於計 算語言學的學術性出版領域的 Anthology Reference Corpus(ACL)21資料庫。
Zhenpeng(2016)建立兩層分層式的 LSTM 模型架構,以百萬個信號媒體新聞 文章(Signal Media One-Million News Articles)22為資料集來產生摘要,有助於 對新聞文章進行研究。Chopra et al.(2016)試著對抽象式句子摘要問題來建構 一個新的卷積關注為基礎的條件式的遞歸神經網路,其模型透過 Gigaword23 語料庫進行訓練,此語料庫是來自於 7 個新聞來源的文件。
問題 11. 目前的評估只有 ROUGE-1 的結果,應該補上 ROUGE-2、ROUGE-3
21 資料來源:http://acl-arc.comp.nus.edu.sg/。
22 資料來源:http://research.signalmedia.co/datasets.html/。
23 資料來源:https://catalog.ldc.upenn.edu/ldc2003t05/。
的。
在 3.5 章節中,我們增加 ROUGE-2、ROUGE-3 的結果說明,並透過例 子的方式來進一步說明。