標註熱門程度決定機制 - 優質標註及達人標註萃取機制設計 - 優質標註萃取機制提昇閱讀成效之研究：以合作式閱讀標註系統為例

第三章優質標註及達人標註萃取機制設計

第二節標註熱門程度決定機制

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節標註熱門程度決定機制

本研究依據「改良式標註評比機制」計算每則標註之「標註分數」，而本節所介紹之「標註熱門程度決定機制」則是根據模糊推論技術來推論每一則標註之熱門程度可信度，並進一步使用該機制及「標註分數」來發展「優質標註萃取」

與「達人標註萃取」機制，下面詳述建置的詳細過程。

一、標註熱門程度決定機制

本研究主要係透過標註「最近被點擊時間間隔」與「平均被點擊時間」兩項因素，以模糊推論來決定每一則標註熱門程度的可信度，並基於此一可信度值來發展「優質標註萃取」與「達人標註萃取」機制，以下詳述整個方法的細節。

首先，假設每個標註被點擊的時間分佈如圖 3-3 所示，式 3 - 6 中定義了「最近被點擊時間間隔」T₁ 與「平均被點擊時間」T₂ 兩個考量之標註熱門程度輸入因素計算方式，其中 T1代表該標註目前到上次被點擊時間的間隔；T2則是該標註多久被點擊一次的時間。顯而易見的是，T₁ 值越小代表該標註最近仍然有人點擊觀看；T2 之值越小，即代表該標註具有較多的點擊觀看次數，兩者均可作為量化每一則標註熱門程度的考量因素。

式 3 - 6

圖 3-3 標註被點擊時間分佈示意圖

T

= t

– t

k-1

T

= ( t

– t

) ／ k

‧‧‧ ‧‧‧

t

k-1

t _k

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

接著定義輸入、輸出變數之模糊語意集合，其中兩個輸入變數「最近被點擊時間間隔」T1 = {S，M，L}，語意變數示意值整理如表 3-1 所示；「平均被點擊時間」T₂ = {S，M，L}，語意變數示意值整理如表 3-2 所示。而輸出變數「標註熱門程度可信度」C = {VLCD，LCD，MCD，HCD，VHCD}，語意變數示意值整理如表 3-3 所示。

表 3-1

「最近被點擊時間間隔」T₁之模糊語意集合表

語意變數表示

短 S

中 M

長 L

表 3-2

「平均被點擊時間」T₂之模糊語意集合表

語意變數表示

短 S

中 M

長 L

表 3-3

標註熱門程度可信度 C 之模糊語意集合表

語意變數表示

非常不可信 (Very Low Confidence Degree) VLCD 不可信 (Low Confidence Degree) LCD 普通 (Moderate Confidence Degree) MCD 可信 (High Confidence Degree) HCD 非常可信 (Very High Confidence Degree) VHCD

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

(一) 模糊隸屬函數

本研究 T1與 T2模糊隸屬函數之決定，係透過 K-means 分群演算法得到，系統會藉由蒐集學習者所撰寫的每則標註包括 T₁與 T₂的熱門程度資訊，進行短、

中、長三群之自動分群，所得之每一個分群的中心點即可自動決定 T1與 T2模糊隸屬函數，如圖 3. 4 示。圖 3-4 中的 C₁、C₂、C₃分別代表三個分群的中心點，

本研究將 Min 至 C2訂為語意變數 S 之模糊歸屬函數區間；C1至 C3訂為語意變數 M 之模糊歸屬函數區間；C₂至 Max 訂為語意變數 L 之模糊歸屬函數區間。而輸出變數 C 之模糊隸屬函數如圖 3-5 所示。圖 3. 5 中輸出變數熱門程度可信度 0 至 0.25 視為語意變數 VLCD 之模糊歸屬函數區間；0 至 0.5 視為語意變數 LCD 之模糊歸屬函數區間；0.25 至 0.75 視為語意變數 MCD 之模糊歸屬函數區間；0.5 至 1 視為語意變數 HCD 之模糊歸屬函數區間；0.75 至 1 視為語意變數 VHCD 之模糊歸屬函數區間。

圖 3-4 T1與 T2之模糊隸屬函數

圖 3-5 語意變數 C 之模糊隸屬函數

Min Max

1

^S ^M ^L

c

1 0 0.25 0.5 0.75 1

VLCD LCD MCD HCD VHCD

‧

採用 Mamdani 模糊模型的[最大-最小合成法]來進行模糊推論，Mamdani 模糊模型的推論運作，是將模糊集合交集運算取[最小值法]，用於 if 部分前提部取[and]

(Mamdani)

Min Max

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

利用 Mamdani 模糊模型進行模糊推論所得的輸出量是一模糊函數，所以需將模糊推論之結果轉化為精確值μ，其中𝑥_𝑖為對應離散值、𝜇(𝑥_𝑖)為隸屬值，而此過程稱為解模糊化，這裡採用的解模糊方法為重心法，如式 3 - 7 所示。

µ =

^{� 𝑥}_{� 𝜇(𝑥}^𝑖^{∙ 𝜇(𝑥}^𝑖⁾

𝑖)

=

隸屬值與對應離散值的乘積和

隸屬值和式 3 - 7

二、結合標註熱門程度可信度萃取出「優質標註」與「達人標註」

本研究藉由前面式 3 - 5 與式 3 - 7 所得到的「標註分數 S」及「標註熱門程度可信度之精確值μ」，發展「優質標註萃取」以及「達人標註萃取」機制。下面簡要敘述這兩個萃取機制之運算過程。

(一) 優質標註萃取

「優質標註萃取」係透過本研究改良之「標註品質評比機制」取得每個標註的「標註分數」後，再透過標註熱門程度可信度解模糊後之精確值μ 來調整很少被點擊瀏覽及很久未被瀏覽標註的「標註分數」，最後將超過本研究所設定門檻值之標註視為優質標註，並將其推薦給學習者並顯示在學習者觀看之數位閱讀文本中，其餘未達門檻之標註則予以隱藏不加以呈現。

計算方式如式 3 - 8 所示，其中 QA（Quality Annotation）為優值標註之集合、B 為滿足 S 與μ 乘積值超過門檻值 TH 之集合、S 為標註分數、μ 為模糊推論精確值，TH 則是系統設定之門檻值（Threshold）。

{QA ∈ B | S ∙ µ ≥ TH}

式 3 - 8

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

下列舉兩個例子進行優質標註簡易計算說明：

(1) 標註分數 1.2 * 熱門程度可信度精確值 0.25 = 0.3 < 0.6 (不呈現) (2) 標註分數 1.2 * 熱門程度可信度精確值 0.75 = 0.9 > 0.6 (呈現)

達人標註萃取

在此機制中，系統針對每個學習者所撰寫的個別標註，進一步透過標註熱門程度可信度解模糊後之精確值μ，來調整很少被點擊瀏覽及很久未被瀏覽標註的「標註分數」，據此計算出每一個學習者所有貢獻標註所獲得調整過後的「標註分數」總和，經由最大到最小的排序後即可找出前幾名的標註達人，所有標註達人所標示位置的標註稱為達人標註，本研究僅顯示前五名標註達人所標註位置的所有標註給其他學習者進行閱讀學習。標註達人計算方式如式 3 - 9 所示，其中 AE（Annotation Expert）為標註達人排行榜之集合、

E 為滿足 sortTop5()之集合、m 為所有進行標註閱讀活動之人數，S(i,j)為第 i 個人的第 j 個標註的分數、μ(i,j)為第 i 個人的第 j 個標註的標註熱門程度可信度解模糊後之精確值，N 則是第 i 個人的所有標註個數。

�AE ∈ E | 𝑠𝑠𝑠𝑠𝑠𝑠𝑠5 �

^∑^𝑁^𝑗=1^S_N^𝑖,𝑗^{∙ 𝜇}^𝑖,𝑗

�� 𝑖 = 1,2, … … , 𝑚

式 3 - 9

下列舉兩個例子進行優質標註簡易計算說明：

(1) A 同學有三個標註，[(0.8*0.5) + (1.2*0.75) + (0.9*0.5)] / 3 = 0.58 (2) B 同學有兩個標註，[(0.9*0.75) + (0.8*0.75)] / 2 = 0.6375

(由上述例子得知，B 同學整體標註分數之平均較 A 同學高，所以有較高的機會進入標註達人排行榜)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中優質標註萃取機制提昇閱讀成效之研究：以合作式閱讀標註系統為例 - 政大學術集成 (頁 48-54)

標註熱門程度決定機制

第三章 優質標註及達人標註萃取機制設計

第二節 標註熱門程度決定機制

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節 標註熱門程度決定機制

一、 標註熱門程度決定機制

T

= t

– t

T

= ( t

– t

) ／ k

t

t

t

t

t

t

t

t k

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

1

c

c

c

1

0 0.25 0.5 0.75 1

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

µ =

=

二、 結合標註熱門程度可信度萃取出「優質標註」與「達 人標註」

{QA ∈ B | S ∙ µ ≥ TH}

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

�AE ∈ E | 𝑠𝑠𝑠𝑠𝑠𝑠𝑠5 �

�� 𝑖 = 1,2, … … , 𝑚

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章優質標註及達人標註萃取機制設計

第二節標註熱門程度決定機制

立政治大學

第二節標註熱門程度決定機制

一、標註熱門程度決定機制

t _k

立政治大學

立政治大學

立政治大學

二、結合標註熱門程度可信度萃取出「優質標註」與「達人標註」

立政治大學

立政治大學