• 沒有找到結果。

第三章 優質標註及達人標註萃取機制設計

第二節 標註熱門程度決定機制

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

36

第二節 標註熱門程度決定機制

本研究依據「改良式標註評比機制」計算每則標註之「標註分數」,而本節 所介紹之「標註熱門程度決定機制」則是根據模糊推論技術來推論每一則標註之 熱門程度可信度,並進一步使用該機制及「標註分數」來發展「優質標註萃取」

與「達人標註萃取」機制,下面詳述建置的詳細過程。

一、 標註熱門程度決定機制

本研究主要係透過標註「最近被點擊時間間隔」與「平均被點擊時間」兩項 因素,以模糊推論來決定每一則標註熱門程度的可信度,並基於此一可信度值來 發展「優質標註萃取」與「達人標註萃取」機制,以下詳述整個方法的細節。

首先,假設每個標註被點擊的時間分佈如圖 3-3 所示,式 3 - 6 中定義了「最 近被點擊時間間隔」T1 與「平均被點擊時間」T2 兩個考量之標註熱門程度輸入 因素計算方式,其中 T1代表該標註目前到上次被點擊時間的間隔;T2則是該標 註多久被點擊一次的時間。顯而易見的是,T1 值越小代表該標註最近仍然有人 點擊觀看;T2 之值越小,即代表該標註具有較多的點擊觀看次數,兩者均可作 為量化每一則標註熱門程度的考量因素。

式 3 - 6

圖 3-3 標註被點擊時間分佈示意圖

T

1

= t

k

t

k-1

T

2

= ( t

k

t

1

) / k

‧‧‧ ‧‧‧

t

1

t

2

t

3

t

4

t

5

t

6

t

k-1

t k

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

37

接著定義輸入、輸出變數之模糊語意集合,其中兩個輸入變數「最近被點擊 時間間隔」T1 = {S,M,L},語意變數示意值整理如表 3-1 所示;「平均被點擊 時間」T2 = {S,M,L},語意變數示意值整理如表 3-2 所示。而輸出變數「標註 熱門程度可信度」C = {VLCD,LCD,MCD,HCD,VHCD},語意變數示意值 整理如表 3-3 所示。

表 3-1

「最近被點擊時間間隔」T1之模糊語意集合表

語意變數 表示

短 S

中 M

長 L

表 3-2

「平均被點擊時間」T2之模糊語意集合表

語意變數 表示

短 S

中 M

長 L

表 3-3

標註熱門程度可信度 C 之模糊語意集合表

語意變數 表示

非常不可信 (Very Low Confidence Degree) VLCD 不可信 (Low Confidence Degree) LCD 普通 (Moderate Confidence Degree) MCD 可信 (High Confidence Degree) HCD 非常可信 (Very High Confidence Degree) VHCD

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

38

(一) 模糊隸屬函數

本研究 T1與 T2模糊隸屬函數之決定,係透過 K-means 分群演算法得到,系 統會藉由蒐集學習者所撰寫的每則標註包括 T1與 T2的熱門程度資訊,進行短、

中、長三群之自動分群,所得之每一個分群的中心點即可自動決定 T1與 T2模糊 隸屬函數,如圖 3. 4 示。圖 3-4 中的 C1、C2、C3分別代表三個分群的中心點,

本研究將 Min 至 C2訂為語意變數 S 之模糊歸屬函數區間;C1至 C3訂為語意變 數 M 之模糊歸屬函數區間;C2至 Max 訂為語意變數 L 之模糊歸屬函數區間。而 輸出變數 C 之模糊隸屬函數如圖 3-5 所示。圖 3. 5 中輸出變數熱門程度可信度 0 至 0.25 視為語意變數 VLCD 之模糊歸屬函數區間;0 至 0.5 視為語意變數 LCD 之模糊歸屬函數區間;0.25 至 0.75 視為語意變數 MCD 之模糊歸屬函數區間;0.5 至 1 視為語意變數 HCD 之模糊歸屬函數區間;0.75 至 1 視為語意變數 VHCD 之 模糊歸屬函數區間。

圖 3-4 T1與 T2之模糊隸屬函數

圖 3-5 語意變數 C 之模糊隸屬函數

Min Max

1

S M L

c

1

c

2

c

3

1

0 0.25 0.5 0.75 1

VLCD LCD MCD HCD VHCD

採用 Mamdani 模糊模型的[最大-最小合成法]來進行模糊推論,Mamdani 模糊模 型的推論運作,是將模糊集合交集運算取[最小值法],用於 if 部分前提部取[and]

(Mamdani)

Min Max

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

40

利用 Mamdani 模糊模型進行模糊推論所得的輸出量是一模糊函數,所以需 將模糊推論之結果轉化為精確值μ,其中𝑥𝑖 為對應離散值、𝜇(𝑥𝑖)為隸屬值,而此 過程稱為解模糊化,這裡採用的解模糊方法為重心法,如式 3 - 7 所示。

µ =

� 𝑥� 𝜇(𝑥𝑖 ∙ 𝜇(𝑥𝑖)

𝑖)

=

隸屬值與對應離散值的乘積和

隸屬值和 式 3 - 7

二、 結合標註熱門程度可信度萃取出「優質標註」與「達 人標註」

本研究藉由前面式 3 - 5 與式 3 - 7 所得到的「標註分數 S」及「標註熱門程 度可信度之精確值μ」,發展「優質標註萃取」以及「達人標註萃取」機制。下 面簡要敘述這兩個萃取機制之運算過程。

(一) 優質標註萃取

「優質標註萃取」係透過本研究改良之「標註品質評比機制」取得每個 標註的「標註分數」後,再透過標註熱門程度可信度解模糊後之精確值μ 來 調整很少被點擊瀏覽及很久未被瀏覽標註的「標註分數」,最後將超過本研究 所設定門檻值之標註視為優質標註,並將其推薦給學習者並顯示在學習者觀 看之數位閱讀文本中,其餘未達門檻之標註則予以隱藏不加以呈現。

計算方式如式 3 - 8 所示,其中 QA(Quality Annotation)為優值標註之 集合、B 為滿足 S 與μ 乘積值超過門檻值 TH 之集合、S 為標註分數、μ 為模 糊推論精確值,TH 則是系統設定之門檻值(Threshold)。

{QA ∈ B | S ∙ µ ≥ TH}

式 3 - 8

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

下列舉兩個例子進行優質標註簡易計算說明:

(1) 標註分數 1.2 * 熱門程度可信度精確值 0.25 = 0.3 < 0.6 (不呈現) (2) 標註分數 1.2 * 熱門程度可信度精確值 0.75 = 0.9 > 0.6 (呈現)

達人標註萃取

在此機制中,系統針對每個學習者所撰寫的個別標註,進一步透過標註 熱門程度可信度解模糊後之精確值μ,來調整很少被點擊瀏覽及很久未被瀏 覽標註的「標註分數」,據此計算出每一個學習者所有貢獻標註所獲得調整過 後的「標註分數」總和,經由最大到最小的排序後即可找出前幾名的標註達 人,所有標註達人所標示位置的標註稱為達人標註,本研究僅顯示前五名標 註達人所標註位置的所有標註給其他學習者進行閱讀學習。標註達人計算方 式如式 3 - 9 所示,其中 AE(Annotation Expert)為標註達人排行榜之集合、

E 為滿足 sortTop5()之集合、m 為所有進行標註閱讀活動之人數,S(i,j)為第 i 個人的第 j 個標註的分數、μ(i,j)為第 i 個人的第 j 個標註的標註熱門程度可 信度解模糊後之精確值,N 則是第 i 個人的所有標註個數。

�AE ∈ E | 𝑠𝑠𝑠𝑠𝑠𝑠𝑠5 �

𝑁𝑗=1 SN𝑖,𝑗 ∙ 𝜇𝑖,𝑗

�� 𝑖 = 1,2, … … , 𝑚

式 3 - 9

下列舉兩個例子進行優質標註簡易計算說明:

(1) A 同學有三個標註,[(0.8*0.5) + (1.2*0.75) + (0.9*0.5)] / 3 = 0.58 (2) B 同學有兩個標註,[(0.9*0.75) + (0.8*0.75)] / 2 = 0.6375

(由上述例子得知,B 同學整體標註分數之平均較 A 同學高,所以有較高的 機會進入標註達人排行榜)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

42