• 沒有找到結果。

圖 28:MOOC 學院語意分析散佈圖

以每則貼⽂或新聞為單位並編號,經 SVD 分析其語意後,由象限散布圖繪製,

可以發現學堂在線與 MOOC 學院,兩平台業者在微博的使⽤中,其語意分析散布 圖各個點分散較為廣泛,代表其貼⽂⽤詞較為靈活多元,如學堂在線之貼⽂可以包 涵每⽇的學習線上簽:「學堂⽇簽 - 來⾃@學堂線上 http://t.cn/R5X1m0h」,也 包括了每⽇話題向使⽤者的提問:「#今⽇話題# 網游讓年輕⼈荒廢了很多時間,

為什麼沒有被限制發展?」。以其散布圖中最左邊的編號 3250 貼⽂,其內容為:

「【今⽇話題】冷嗎?」,⽽上⽅象限之編號 819 貼⽂為:「#今⽇話題#⼈⽣是 什麼?」。MOOC 學院之 618 號貼⽂則是:「[拜拜][拜拜][拜拜]」。4558 號貼⽂則 是:「#深夜⼩⽪鞭#Deadline is coming…」可以辨別出整體範圍內中語意較為特別 的貼⽂,尤其在社群媒體貼⽂短字數的特性下,短字數就形成⼀個語意主題,其落 差更為明顯。⽽以傳統媒體中的⼈民網,其編號 251 新聞標題為:「⾹港“翻轉課

堂” 酷炫⼗⾜」,⽽圖中最右上⾓ 164 號標題則是「廣西邊防總隊盤活政治⼯作促 進部隊全⾯發展」。⽽聯合新聞網則是以編號 23 號新聞「⼩時數理差 鄭崇華遇恩 師才開竅」與 2 號新聞「Google 搭哈佛 推線上課程」為象限兩端,其內⽂語意差 異未較⼈民網如此明顯。

第四節、dendrogram 字詞群聚樹狀圖

經過斷詞後的資料來源內有各式各樣的字詞,字詞之間的關係以及重要程度,

可以群聚樹狀圖(dendrogram)顯⽰字詞的 TF-IDF 權重計算結果相近關係,在垂 直距離上則則可以看出該字詞對於此媒體平台的重要性⾼低(可參照⽐對本章第

⼆節內容)。本節將資料來源剔除⼀個字組成的單字詞「你」、「課」、「上」等

⽂字,配合視覺化呈現結果,適度篩選⽂字組成之矩陣組成,使其視覺結果在群聚 樹狀圖上更有直觀意義。

圖 29:⼈民網字詞群聚樹狀圖

圖 30:聯合新聞網字詞群聚樹狀圖

圖 31:台⼤ MOOC 字詞群聚樹狀圖

圖 32:eWant 字詞群聚樹狀圖

圖 33:ShareCourse 字詞群聚樹狀圖

圖 34:Openedu 字詞群聚樹狀圖

圖 35:中國⼤學 MOOC 字詞群聚樹狀圖

圖 36:學堂在線字詞群聚樹狀圖

圖 37:MOOC 學院字詞群聚樹狀圖

從群聚階層樹狀圖可以看出傳統媒體在兩岸對於 MOOC 的譯名使⽤,分別 為「磨課師」、「慕課」,皆各⾃代表了兩⽅資料範圍內重要性⾼的代表名詞,意 指若新聞或⽂件中若出現「慕課」,可以推測在本研究範圍內是由屬於中國的傳統 媒體報導可能性極⾼。社群媒體中台灣的 ShareCourse 特別著重宣傳「物聯網」課 程,微博使⽤則可以看到中國⼤學 MOOC ⼩編對於使⽤者的「早安」關懷,或是 MOOC 學院「⽪鞭」督促學習的重要性程度較⾼,但「晚安」⼀詞的使⽤則在學 堂在線較為頻繁與常態。

第五節、apiori 關聯分析共現詞組

本研究以 R 軟體之關聯分析中的 apriori 關聯分析,剔除前三節研究結果常⾒

之單字詞:「的」、「在」、「http」等雜訊,以及將字詞⾧度 2 以下的詞彙剔除,

將各個平台與媒體中最常⼀起出現的字詞化為連結關係圖,運⽤ ggplot 套件中的 graph ⽅法,將字詞與字詞間共同出現之頻率⽀持度化為圓點,⽀持度⾼低反應同 時字詞出現⾼低的程度⾼低,與圓點的⼤⼩程度成正⽐,意即字詞與字詞連線間的 圓點愈⼤,其共同出現機會愈⾼,也就代表該研究範圍內之特定共同出現的字詞 組。並在圖下列出各媒體平台依⽀持度排序的前 10 名字詞組組合。

圖 38:⼈民網關聯分析共現詞組

圖 39:聯合新聞網關聯分析共現詞組

圖 40:台⼤ MOOC 關聯分析共現詞組 cousera、learn

2016、

41:eWant 關聯分析共現詞組

mnetcourseinfo、 mooccourse

mnetcourseinfo、 mooccourse

圖 42:ShareCourse 關聯分析共現詞組

表 29

ShareCourse 共現詞組前 10 名

support 0.125 0.102 0.089 0.082 0.081 字詞組 2016、

進⼀步

2016、 清華⼤學

清華⼤學、

進⼀步

2016、 清華⼤學、

進⼀步

goo、 進⼀步

support 0.044 0.04 0.037 0.037 0.033 字詞組 IOT、

物聯網

net、 sharecourse

2016、 goo

物聯網、

清華⼤學

進⼀步、

讓學⽣

圖 43:Openedu 關聯分析共現詞組

圖 44:中國⼤學 MOOC 關聯分析共現詞組

圖 45:學堂在線關聯分析共現詞組

表 32

學堂在線共現詞組前 10 名

support 0.050 0.031 0.028 0.017 0.011 字詞組 MOOC、

學堂線上

RqdfzFh、 學堂線上

清華⼤學、

學堂線上

MOOC、 清華⼤學

MOOC、 清華⼤學、

學堂線上 support 0.01 0.01 0.008 0.007 0.007 字詞組 清華⼤學、

獎學⾦

Rfd、 rQV

研究⽣、

清華⼤學

筆記本、

學堂線上

2015年、

學堂線上

圖 46:MOOC 學院關聯分析共現詞組

CouseraChina、 MOOC

以上藉由視覺化呈現共現詞組的⽅法,觀察到各個平台普遍是以 MOOC 為中

⼼,來與其他詞彙關聯使⽤。在社群媒體使⽤上最為獨特的是中國⼤學 MOOC 會 以「MOOCer」來稱呼使⽤者,⽽ eWant 則推測因貼⽂數量較少,以及內容中頻繁 地在貼⽂後⽅加上平台課程的報名網⾴,因此使得共現詞組的部分以及視覺化結 果皆是英⽂字母組成之單字。傳統媒體的部分聯合新聞網⽤語較不以 MOOC 為中

⼼相關連,⼈民網則是以 MOOC 為中⼼點連結其他⽤詞。

第六節、LDA 字詞主題模型

⾃然語⾔處理(NLP)中的 LDA 運算⽅法原理,可以針對特殊專業領域的⽂

字資料找出相對應的主題⽂集,⽽其中建⽴語意模型的部分有多種運算⽅法,較為 廣泛使⽤的屬 Gibbs 取樣⽅法。本⼩節透過R軟體內 topicmodels 的套件協助,先 對該平台或媒體⽂字資料做主題複雜度(perplexity)與主題可能性(log-likelihood)

計算, 將數據值化成圖表,對照複雜最低以及可能性最⾼的主題數量,在可能範 圍內決定主題數量為多少後,取該主題前五名詞彙(除去單字詞:的、線、課等等),

形成 Gibbs 主題模型圖。可以透過此模型觀察到各個平台或媒體由五個字詞組成 的語意主題,⽽此五個字詞中,也有可能與其他語意主題相關連,如此此字詞就會 與其他主題以同⼀個字詞在圖上相交,也有可能有兩個以上的交會點。

表 34

⼈民網 LDA 字詞主題模型

表 35

聯合新聞網 LDA 字詞主題模型

表 36

台⼤ MOOC LDA 字詞主題模型

表 37

eWant LDA 字詞主題模型

表 38

ShareCourse LDA 字詞主題模型

表 39

Openedu LDA 字詞主題模型

表 40

中國⼤學 MOOC LDA 字詞主題模型

表 41

學堂在線 LDA 字詞主題模型

表 42

MOOC 學院 LDA 字詞主題模型

此⽅法結果與上⼀節 apriori 共現詞組結果相呼應,各平台媒體由 MOOC 為 中⼼字詞,向外發展其他語意主題。本節呈現之模型資訊量更多,可清楚各個媒體 平台由哪些關鍵字詞來形成⼀個主題。各平台幾乎皆有「程式語⾔」、「電腦」、

「⼤數據」等字詞與 MOOC 相連,顯⽰各平台媒體在宣傳 MOOC 課程或是提及 MOOC 本⾝之相關概念時,以程式語⾔,電腦相關課程為普遍出現的課程類別。

傳統媒體的報導則看得到其他課程宣傳外的⽤語,如「科普」、「⼈才」、「試點」

等,顯⽰其媒體報導主題可能包含了科學普及、⼈才培訓、國家教育開放試點計畫 宣傳等。對於研究問題⼆:各個媒體平台之⽂本內容差異為何?則可以透過此⽅法 具體瞭解傳統媒體之報導主題,⽽對於社群媒體的⽤語「直播」、「今⽇話題」或 是平台上主打的課程類⽬為電腦科學、程式語⾔等。

第七節、Word2vec⾃定義議題趨勢分析

word2vec 為 Google 於 2013 年釋出的電腦學習開源程式碼,以神經網路原 理與詞袋模式,給予定義之語料庫內每個字詞⼀個餘弦向量,藉由向量值的⼤⼩⽐

較,可以給予電腦辨讀相關字詞的能⼒。R軟體裡以 WordVectors 套件援⽤此演算 法,本研究將研究範圍內採集到之所有⽂字資料作為語料庫,再以「個⼈化學習」、

「企業培訓」、「⾼等教育改⾰」為三個議題類⽬,由電腦列出最為相關之前 20 位字詞,再將此 20 位字詞以⾃編寫之函數,查詢各個平台或媒體,以貼⽂或新聞 為單位,是否有包含此議題主題之字詞,最後將此議題主題字詞清單查尋結果,化 為個別媒體平台之三個議題主題⽐例。

⾸先將研究範圍內⽂字資料輸⼊,以此為語料庫訓練電腦。「個⼈化學習」議 題主題以拆分為「使⽤者」以及「學習」兩字詞為代表,各得出 10 位字詞,共計 20 名字詞。「企業培訓」則化為「企業」、「培訓」,「⾼等教育改⾰」則是「教 育」、和「改⾰」,得出以下經語意訓練過後電腦辨讀出的三個議題主題字詞清單。

1. 個⼈化學習(使⽤者+學習):

表 43

個⼈化學習議題類⽬相關字詞

使⽤者 ⽤⼾ 介⾯ 接入 data 效能 瀏覽 訂⼾ 在職

進修

管理員

學習 課程 和 MOOC yz 課 互助 Itsukay 求知

廈⾨⼤學

2. 企業培訓(企業+培訓):

表 44

企業培訓議題類⽬相關字詞

企業 估算 營運 投融資 信貸 興衰 ⾏業 為⽬標 利潤 經營

培訓 資質 全員 中⼩學校 先導 機構 縣級 分級 ⾏政部

研修

3. ⾼等教育改⾰(教育+改⾰):

表 45

⾼等教育改⾰議題類⽬相關字詞

改⾰ 深化 推進 實施⽅案 實施 硬骨頭 中長期 部屬 ⼗八屆 三中全

教育 ⾼等教育 中長期 成⼈教育 公平 推動 教育管

此⽅法是以監督式學習⽅式訓練電腦給予出研究設定之相關議題字詞,與前 部分⼩節之⾮監督式探索資料⽅式不同。各個平台媒體業者的⽂本中,三個議題類

⽬皆以個⼈化學習的相關字詞⽐例最⾼。在⾼等教育改⾰類⽬上,社群媒體中以台 灣的 Openedu ⽐例最⾼,傳統媒體則是中國的⼈民網。Openedu 是由逢甲⼤學與 中央⼤學合作,與台灣教育部有較為直接的合作關係。⼈民網則是以中共國家黨報 對企業培訓議題類⽬做前後期資料劃分的卡⽅檢定(Pearson's chi-squared test),

以辨別是否各媒體平台發⽂內容在後期是否具有升⾼,且達統計檢驗顯著效果的

表 47

相關文件