• 沒有找到結果。

第四章 關鍵詞彙分析工具功能與介面

4.10 W ORD 2 VEC 介面說明

立 政 治 大 學

Na tiona

l Ch engchi University

圖 4.30 新青年第 1~8 卷符合主題結果的相關句 html 檔案

4.10 Word2vec 介面說明

使用者可將關鍵詞彙藉由 word2vec 功能找出符合語料的主題。此介面共有三個 必選選項,此功能才能執行出結果,否則會如圖 4.4 顯示錯誤訊息視窗。

4.10.1 Word2vec 功能執行

選項一為文本位置,使用者需選擇待處理的中文語料資料夾。選項二為儲存位置,

使用者自行決定要將結果檔案放置在何處。選項三請選擇功能,因為在 word2vec 中提供了兩種功能。功能一為找出與關鍵詞彙關聯度較高的詞彙,故在關鍵詞檔 位置中選取關鍵詞檔所在的位置。功能二為運用群聚方式將語料詞彙聚合,故使 用者分別透過兩個拉霸選擇輸出群聚數量與每一個群聚中包含關鍵詞彙數量。

Word2vec 中的兩種功能分別產成一個結果檔。功能一結果輸出與關鍵詞相 近的詞彙,如圖 4.32 顯示關鍵詞彙「阶级」關聯度較強的詞彙為「劳动者」、「资 产」、「资本家」、「生产」、「劳工」、「德谟」、「组成」、「资产者」、「产业」、「无产 阶级」等。功能二結果如圖 4.33 顯示輸出群聚的詞彙。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 4.31 word2vec 介面說明

圖 4.32 新青年第 1~8 卷與關鍵詞彙周圍詞彙

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 4.33 新青年第 1~8 卷 word2vec 分群結果

4.10.2 Word2vec 相關句執行

此外使用者可以藉由 word2vec 兩種功能所產生的詞彙關聯結果,找出符合結果 的相關句子予以輔助觀察,使用者藉由點選 word2vec 中「列出與群聚相符的句 子」按鈕,開啟如圖 4.34 找相關句的功能視窗,共有七個必選選項。選項一為 輸入透過 word2vec 功能所得到結果的所在資料夾。選項二為文本位置,需選擇 待處理的中文語料資料夾。選項三為儲存位置,使用者自行決定要將結果檔案放 置在何處。選項四為使用者需要選擇斷句的方法,如:句號、逗號、分號、或自 行輸入需要的符號等。假如文本原先已經斷句,使用者可以選擇「不需將文本斷 句」選項。選項五為透過「相關句包含關鍵詞彙數」右邊拉霸選擇輸出的相關句 中期望包含幾個 word2vec 結果的詞彙。選項六為選擇輸出包含關鍵詞彙為相關 句或是相關句與相關段落形式,當使用者只希望看到相關句的結果則選擇「輸出 相關句」;但希望看到的是一個段落的形式時,則選擇「輸出段落:段落中需包 含多少相關句才輸出段落(請在後方輸入百分比)」此一選項並在後方的方框輸入 數值。選項七為選擇 word2vec 結果檔為何種功能所產生的。

在找 word2vec 相關句功能中會分別對與關鍵詞彙相關聯詞彙、K-means 聚 合的結果產生兩個檔案(一個為 csv 檔、一個為 html 檔),共計四個檔案。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 4.34 找 word2vec 結果相關句介面說明

圖 4.35 新青年第 1~8 卷包含關鍵詞彙與周圍詞彙的相關句 csv 檔

圖 4.36 新青年第 1~8 卷包含關鍵詞彙與周圍詞彙的相關句 html 檔

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

圖 4.37 新青年第 1~8 卷 word2vec 分群結果相關句 csv 檔

圖 4.38 新青年第 1~8 卷 word2vec 分群結果相關句 html 檔

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

相關文件