以CIT結構為基礎之漸進式關聯規則探勘方法
全文
(2) 規則。 而漸進式資料探勘可以縮短整個資料探 勘時間,花最少的時間進行探勘,得到相同的 探勘效果。以持續動態改變的交易資料庫為 例,資料內容包括新增資料和刪除舊有資料。 本研究針對交易資料庫,提出一個以類別繼承 樹狀結構(Class Inheritance Tree, CIT)[3]為基 礎的關聯規則漸進式探勘法 ICIT(Incremental CIT),其目標旨在處理資料庫發生增加或刪除 交易資料等異動時,只需掃瞄異動的資料庫部 分,隨之調整 CIT 結構,使它能符合更新後的 資料庫中之交易資料內容。因此,透過調整後 的 CIT 結構便能找到更新資料庫後的高頻項 目集,進而探勘出關聯規則,而不需要再重新 掃瞄整個更新後的資料庫。 本研究將整個結構分為五大部分。第二節 為文獻探討,文獻探討的前半部分為現有的漸 進式探勘方法做個概括性的介紹與分析,後半 段將介紹 Changchien 及 Lu[3]提出的類別繼承 樹 狀 結 構 為基 礎 的 關聯 規則 資 料 探 勘演 算 法。第三節說明本研究所提出的 ICIT 漸進式 關聯規則探勘方法,並在第四節以一個實例說 明 ICIT 對資料庫異動的調整。最後在結論的 部分,總結此方法的貢獻與未來研究上可供改 善的方向與建議。. 二、文獻探討 關聯規則探勘研究可分為下列兩個子問 題:(1) 找出高頻項目集:符合最小支持度, 及(2) 產生資料庫的關聯規則:符合最小信賴 度。雖然關聯規則挖掘可以自動從資料庫中找 出有用的資訊,但是對資料庫系統而言,利用 傳統Apriori 演算法作關聯規則挖掘是一件相 當耗費時間的工作。因為它需要重複掃描資料 庫,花費過多的I/O時間於讀取資料庫,而且 需要產生大量的候選項目集。而隨著資料量增 長,近年已經有許多尋找高頻項目集的漸進式 探 勘 方 法 被 提 出 。 其 中 , 在 1996 年 D. W. Cheung所發表之FUP(Fast Update)演算法[4]最 早提出針對動態資料庫進行漸進式探勘的概 念。它以Apriori[2]為基礎而建構,藉由儲存舊 有關聯規則與相關資訊,以減少在資料庫異動 後需掃瞄原始資料庫的次數,可達成快速更新 關聯規則之目標,但是缺點在於只考慮到資料 庫新增的情況。接著,在1997年已更進一步改 良的FUP2演算法[5]中,能同時解決資料庫新 增、刪除與修改之情況,但因演算法本身在資 料量龐大時仍需掃瞄資料庫多次,以至於效率 依 舊無 法提昇 。 DUP演算法 [7]利用 之前 的 DLG演算法建立關聯圖(association graph)產生 高頻項目集,可降低候選項目集產生之數量,. 減少磁碟的讀取,但其建立之Bit-Map會隨著 資料庫中項目的增加而快速成長,需要大量的 儲存空間。論文[11]中提出的MMS_UP演算法 亦類似FUP演算法,但其目的是要解決不同項 目用不同的最小支持度門檻值來進行關聯規 則探勘。論文[10]所提出之方法概念為:當一 個項目集本身並非高頻項目集,但其子項目集 合每個皆為高頻項目集時,就可能會較其他非 高頻項目集容易成為高頻項目集,此時稱該項 目集為一個Negative Border。因為保留原始資 料庫中所有的高頻項目集和Negative Border, 以及其支持度計數值等相關資訊,所以除了掃 瞄異動的資料庫外,最多只需掃瞄原始資料庫 一 次 。 王 慶 堯 [1] 定 義 了 一 個 “ 準 大 項 目 集”(Pre-large)的觀念,必須另外訂定一個低於 最小支持度的門檻值,以保留高頻項目集與準 大項目集,目的在於為了減少FUP演算法在處 理高頻項目與非高頻項目間轉換的問題。在 2001年Change Hung Lee等人提出的SWF演算 法[8]與FUP2一樣皆採用類似Apriori-like的方 法,其精神在於產生長度為2之候選項目集的 數量會逼近長度為2的高頻項目集數量,再加 上 配 合 DHP 演 算 法 [9] 中 的 scan reduction 技 術,大量減少候選項目集之數量與產生時間, 也縮短掃瞄原始資料庫的時間,但在產生高頻 項目集時仍需掃瞄原始資料庫。上述方法皆保 留先前的探勘結果,以空間換取時間的策略來 達到提升探勘效率之目的,且最多只需掃瞄資 料庫兩次。 而本研究根據改良自 rough set [6]之基本 概念,以具有繼承觀念 CIT 結構為基礎的關聯 規則探勘方法,提出漸進式關聯規則探勘方法 以提升探勘之效能,並降低儲存空間以建立關 聯規則。該方法主要分五個基本步驟[3],分別 為: (1) 產 生 條 件 等 值 類 別 (cause equivalence classes, CEC) 與 決 定 等 值 類 別 (decision equivalence classes, DEC) 假設選擇資料庫的欄位屬性A做為條件 屬性(condition attribute),選擇屬性X做為決定 屬性(decision attribute)。在欄位屬性A中,當 紀錄編號(TID)第2、3、5筆紀錄的值皆等於2 時,就可以用CECA2={2, 3, 5}來表示,即為一 個條件等值類別;而決定等值類別也是相同的 概念。 (2) 建立類別繼承樹(CIT) 將上述所得的等值類別集,依建構節點的 規則建立CIT結構,以樹狀結構來表現它們之 間的關聯性,做為找尋關聯規則的依據。 (3) 找出下限近似值規則(lower approximation rules) 即一組可以表示條件等值類別完全被包.
(3) 含於決定等值類別之關聯規則就稱為下限近 似規則,此類的規則皆具有滿足最小支援度及 100%的信賴度(confidence, CF)。. CIT 結構,因此,我們提出針對 CIT 結構進行 調整與維護的 ICIT 演算法。. (4) 找出上限近似值規則(upper approximation rules)並計算信賴度. 三、以 CIT 結構為基礎之漸進式關聯 規則探勘方法 - ICIT. 即一組可以表示條件等值類別完全被包 含於決定等值類別的關聯規則就稱為下限近 似規則,此類的規則皆滿足最小支援度及信賴 度。其信賴度的計算公式如下:. CF =. Num( X ∩ I ( x)) Num( I ( x)). (1). 其中, CF ∈ [0, 1] ,I(x)表示條件等值類別,X 表示決定等值類別。. (5) 產生多維屬性關聯規則(multiple attributes association rules)並計算信賴度 從上述的步驟中所找到的都是一維屬性 關聯規則(single attributes association rules),必 須滿足使用者定義的最小支援度才可建立。從 所有的高頻項目集中可再進一步找尋可組合 連結的部分,找出多維屬性關聯規則,並計算 這些規則的信賴度。 而 CIT 所定義的節點結構如圖 1 所示, 以下 ICIT 所採用之範例說明將以圖 2 的簡略 圖示加以描述。. Node[] Node_object[] Parent* Child* Brother* Contain[] Relative[] 圖 1 CIT之節點結構. Nid ={EC} Atti 圖 2 ICIT之節點表示 其中,Node[]記錄每個節點之 ID,即 Nid , id = 1,…n;Node_object[] 為所有類別中的特 徵值(object),即等值類別集 ECs。而 Parent* 做 為指向該節點的父節點的指標、 Child* 做為 指向該節點第一個子節點的指標、Brother* 則 做 為 指 向 該節 點 第 一個 兄弟 節 點 的 指標 。 Contain[] 中記錄含有此節點之所有項目屬性 值(attribute),以 Atti 表示,並以 Relative[]記錄 此節點中所包含的部分共同項目。 在 CIT 的結構中,所有節點儲存的內容都 是符合最小支持度門檻值的高頻項目集,但是 當資料庫的資料有更動時,將導致某些節點不 再符合門檻值,或是需要再加入新的節點,為 了 避 免 必 須因 資 料 庫異 動而 重 新 建 構新 的. 本節將介紹本研究所提出的 ICIT(Incremental CIT),以CIT結構為基礎之漸 進式關聯規則探勘法,說明如何調整CIT結構 以達到高頻項目集的漸進式探勘。此演算法可 適用於資料庫的新增、刪除,以及同時有交易 資料庫新增與刪除等異動時的漸進式探勘方 法。 (一) 基本概念 本研究之方法保留原始CIT結構,根據其 節點定義與演算法可知,其從根節點到葉節點 間 的 等 值 類別 節 點 乃是 建構 在 繼 承 的觀 念 上,從資料庫交易紀錄中之產品項目所得的所 有等值類別集,依照建構CIT所定義之規則建 構成一棵類別繼承樹,透過樹狀結構呈現它們 的繼承及關聯性,以做為尋找關聯規則之依 據。然而,當原有資料庫 DB中的交易資料有 新增或是刪除的變動時,仍需要再次掃瞄資料 庫以重新建立CIT結構,使用者也需要等待一 段時間才能得到新的規則。因此,本研究針對 CIT的節點結構,提出ICIT的演算法,可在資 料庫發生新增、刪除與異動交易時,不需再重 新掃瞄整個資料庫即可有效率地動態調整節 點之順序,使它能隨時保存最新的資訊,而不 用浪費過多的I/O時間來重新建構CIT。 本研究方法要求必須在前一次探勘原始 資料庫後儲存以下資訊:. 1. 2.. 未符合最小支持度門檻值的等值類別資訊 依照原始資料庫所建構而成的CIT結構. 需要保留第一項資訊之目的,主要是為了 在資料庫產生異動後,不需再回去掃瞄原始資 料庫便能快速計算出更新後的資料庫中,有那 些是符合最小支持度的常見項目集,用以判斷 是否需調整先前所建的 CIT 結構。 (二) ICIT結構調整維護方法 為隨著資料庫的變動而達到局部調整CIT 的目的,CIT結構調整方法包含以下三大步驟:. Step1. 產生條件、決定等值類別與備選等值類 別(Potential Equivalence Classes, PEC) 先依序掃瞄資料庫以產生條件與決定等 值類別,並將未符合最小支持度門檻值(即等.
(4) 值類別中特徵值之數量必須大於或等於資料 庫所有紀錄筆數乘上使用者設定的最小支援 度)的等值類別存入備選等值類別集中,直到 因為資料庫產生異動而使備選等值類別集滿 足最低門檻值時才可被建立成節點存入CIT結 構。. Step2. 建立CIT結構並調整節點順序 將第一步驟產生符合最小支持度之條件 與決定等值類別建構成CIT節點,以樹狀結構 呈現資料庫之屬性值間的關聯性。以下參考 CIT的定義與演算法所制訂之節點建立規則以 作為建構CIT結構之依據:. ■ Rule 1 插入現存節點. ■ Rule 6 插入關係節點(Relative node, Rnode) 當 Wnode 擁 有 比 其 父 節 點 還 多 的 特 徵 值,就需要另外再連結到關係節點。若該關係 節點已存在,則可直接在Wnode與關係節點間 建立關係連結;反之則需再建立新的關係節點 並連結至 Wnode ,以利於探勘上限近似值規 則。舉例來說,目前已有現存節點N7={2, 4}, 當輸入一個新的Wnode值為{2, 4, 5, 6}時,除 了將此節點列為N7的子節點外,另外需要再連 結到N10={5}和N11={6}的關係節點;假使在現 存的CIT結構並未存在節點N11={6},則必須另 外建立新節點後再設定連結。. Step3. 處理異動資料於CIT結構之調整與維護. 一個等待插入至CIT結構中的等值類別稱 為等候類別(Waiting class, Wclass);一個已經 存 在 於 CIT 中 的 節 點 稱 為現 存 節 點 (Existing node, Enode) 。當等候類別與現存節點相符 時,即可直接置入該節點而不需另外建立新節 點。. CIT結構建構完成後,當資料庫發生變動 時,就必須利用ICIT所定義的維護規則對CIT 結構中節點進行調整與維護。異動資料產生 時,資料庫可能同時需要進行紀錄的新增與刪 除動作,透過ICIT方法來對CIT結構進行調整 即可同時處理新增與刪除的異動,維護方法包 含下面所述三個步驟:. ■ Rule 2 建立新的等候節點. (1) 產生條件等值類別、決定等值類別. 若找不到任何符合等候類別的現存節 點,就需建立一個包含此等候類別的新節點, 稱為等候節點(Waiting node, Wnode)。. 先掃瞄異動資料庫(db+、db ),依序產生 條件等值類別與決定等值類別。此時,若備選 等值類別在資料庫異動後達到滿足門檻值條 件者,則取出該備選等值類別合併新的CEC成 為等候類別。. ■ Rule 3 建立新的父節點(parent node) 若 有 個 Wnode 的 特 徵 值 完 全 包 含 於 Enode,則需將Wnode節點置入CIT結構,使之 成為Enode之父節點。例如有一個Wnode為{2, 4, 5},而CIT結構中現存節點N3={2, 4, 5},則 將此Wnode往上提升為N3之父節點。. ■ Rule 4 連結等候節點做為父節點的子節點 (child node) 若 有 個 Enode 的 特 徵 值 完 全 包 含 於 Wnode,則將 Wnode節點連結至 Enode,使之 成為 Enode之子節點。例如有一個Wnode之值 為{2, 3, 5, 6},而CIT結構中有現存節點N4={2, 3, 5},則將此Wnode建立在N4之下連結成為其 子節點。. ■ Rule 5 連結等候節點為現存節點的兄弟節 點(brother node) 若 Wnode 未 能 完 全 包 含 於 任 一 Enode 之 中,但是它們皆擁有共同的起始特徵值 (object),如此便可將Wnode連結為Enode之兄 弟節點,如N1={2, 3, 5}與N3={2, 4, 5}都有特徵 值“2”為共同的起始特徵值。. -. (2) 將異動資料加入 CIT 節點或從 CIT 節點中 扣除,並儲存備選等值類別 將屬性特徵值與等候類別相符的現存節 點取出,在現有的特徵值之後加入等候類別中 新增加的特徵值,接著檢查現存節點中是否含 有必須刪除的特徵值,予以扣除。若更新後的 現存節點變成無法滿足最小支援度門檻值,則 直接移置備選等值類別集中。下面為產生異動 資料時可能發生的情況與處理方式:. ■ Case 1 If ni ∉ N i and {EC ' } − {EC} = φ 假設以ni與Ni表示目前等候類別與所有現 存節點的項目屬性Atti; {EC '} 和 {EC} 則分別 代表等候類別與現存節點之等值類別中的特 徵值。若等候類別中之項目屬性不屬於任何一 個現存節點,而且等候類別中的特徵值也找不 到與現存節點相符者,則視為必須產生新增之 等候節點,並連結關係節點。. ■ Case 2 If ni ∉ N i and {EC ' } = {EC} 若等候類別中之項目屬性不屬於任何一.
(5) 個現存節點,但與某個現存節點有完全相同的 特徵值;或是發生異動後,與某個現存節點具 備完全相同的特徵值,此時必須取出相符的現 存節點,直接將等候類別中的項目屬性加到現 存節點中,修改項目屬性為 N i = N i ∪ ni 。. ■ Case 3 If ni ∈ N i and {EC ' } − {EC} ≠ φ 假如等候類別的項目屬性與某個現存節 點相同,即表示該項目屬性之等值類別已存在 於原先的CIT結構中,但是其特徵值不同,也 就是在等候類別中存有欲新增的特徵值,所以 必須取出此現存節點,修改等值類別中的特徵 值為 {EC} = {EC} ∪ {EC '} ,更新現存節點中 的特徵值。在此可能會發生一個例外狀況,若 更新後的現存節點與其他的現存節點擁有的 等值類別完全相同者,則合併成一個現存節 點。. ■ Case 4 If ni ∈ Ni and ni ≠ Ni and {EC '} − {EC} ≠ φ 等候類別的項目屬性雖然屬於某個現存 節點,而且在等候類別中存有欲新增的特徵 值,但現存節點中含有其他的項目屬性,如 ni , n j ,此時必須從現存節點中移除 ni ,產生 一個等候節點存放等候類別中的項目屬性及 特徵值,其特徵值為 {EC} = {EC} ∪ {EC ' } , 項目屬性為 ni 。. (3) 調整CIT結構中節點的順序 最後,再將更新後的現存節點放回 CIT 結 構中。視第一個特徵值做為父節點,將現存節 點連結至該節點下成為子節點,依建立節點與 維護規則調整節點的順序,即可產生擁有更新 後資料庫的 CIT 結構。. 四、範例說明 在本節中,我們將以一個範例來說明本研 究所提出的ICIT探勘方法。這裡所舉的範例同 [3],假設原始資料庫DB中有十筆紀錄,如表 1 所示,共有七個欄位屬性,假設條件屬性為欄 位A到欄位D,而決定屬性為欄位X、Y及Z, 關聯規則探勘之最小支持度設定為20%。. Step1. 產生條件、決定等值類別與備選等值類別 由於最小支持度設定為20%,因此門檻值 為資料庫總筆數10乘上 20%等於 2,即表示等 值類別中的特徵值需達到2個以上才可成為條 件等值類別置入 CIT 結構中,以確保 CIT結構. 中存放的皆為高頻項目集。 表 1 原始資料庫. TID 1 2 3 4 5 6 7 8 9 10. A 1 3 4 2 4 4 3 2 2 1. B 2 1 2 3 4 3 1 4 3 2. C 4 2 3 1 3 2 4 1 1 2. D 3 3 2 4 2 3 3 4 1 4. X 2 2 1 2 3 1 3 3 4 2. Y 3 2 1 3 2 3 2 4 1 1. Z 3 3 1 2 1 1 3 2 2 3. (1) 產生條件等值類別(CEC) CECA1= {1,10}, CECA2= {4, 8, 9}, CECA3= {2, 7}, CECA4= {3, 5, 6}, CECB1= {2, 7}, CECB2= {1, 3, 10}, CECB3= {4, 6, 9}, CECB4= {5, 8}, CECC1= {4, 8, 9}, CECC2= {2, 6, 10}, CECC3= {3, 5}, CECC4= {1, 7}, CECD2= {3, 5}, CECD3= {1, 2, 6, 7}, CECD4= {4, 8, 10} (2) 產生決定等值類別(DEC) DECX1= {3, 6}, DECX2= {1, 2, 4, 10}, DECX3= {5, 7, 8}, DECY1= {3, 9, 10}, DECY2= {2, 5, 7}, DECY3= {1, 4, 6}, DECZ1= {3, 5, 6}, DECZ3= {4, 8, 9}, DECZ4= {1, 2, 7, 10} (3) 產生備選等值類別 DECD1= {9}, DECX4= {9}, DECY4= {8}, DECZ2= {3} 上述四個等值類別皆僅有一個特徵值,並 未達到最小支持度門檻值 2 ,因此被移置到 PEC中,留待將來因發生資料異動而達到滿足 門檻值之條件時,可再取出與條件等值類別合 併成為等候類別,不需再花費 I/O資源掃瞄原 始資料庫,即可快速處理動態的資料庫變動。. Step2. 建立漸進式CIT結構並調整節點順序 利用上一步驟產生符合最小支持度之條 件與決定等值類別建構CIT結構,如圖 3。. Step3. 處理異動資料於CIT結構之調整與維護 假設經過一段時間之後,因資料具時效性 之因素而產生部分的資料異動,資料庫需要刪 除前三筆紀錄TID = {1, 2, 3},並新增五筆資料 紀錄,如表 2所示。.
(6) 圖 3 原始資料庫之類別繼承樹. (2) 將異動資料加入 CIT 節點或從 CIT 節點中 扣除,並儲存備選等值類別. 表 2 新增資料紀錄(db+). TID 11 12 13 14 15. A 3 2 1 2 4. B 4 4 2 1 3. C 4 1 4 3 2. D 3 1 2 1 3. X 2 3 4 2 1. Y 4 2 1 3 2. Z 1 4 2 3 4. (1) 產生異動資料之等值類別 a. 產生條件等值類別 CECA1= {13}, CECA2= {12, 14}, CECA3= {11}, CECA4= {15}, CECB1= {14}, CECB2= {13}, CECB3= {15}, CECB4= {11, 12}, CECC1= {12}, CECC2= {15}, CECC3= {14}, CECC4= {11, 13}, CECD1= {9, 12,14}, CECD2= {13}, CECD3= {11,15} b. 產生決定等值類別 DECX1= {15}, DECX2= {11, 14}, DECX3= {12}, DECX4= {9, 13}, DECY1= {13}, DECY2= {12, 15}, DECY3= {14}, DECY4= {8, 11}, DECZ1= {11}, DECZ2= {3, 13}, DECZ3= {14}, DECZ4= {12, 15}. 透過ICIT探勘方法定義之規則,可同時處 理異動資料的新增與刪除。以下列舉四個例子 來 說 明 ICIT 對 資 料 庫 之 異 動 資 料 的 處 理 方 式,如表 3所示。 表 3 處理異動資料的四種情況. Case 1. 加入CECD1={9, 12, 14} 產生新節點N32={9, 12, 14}. Case 2. 加入CECB2={13},刪除TID={1, 3} 合併現存節點屬性值為A1, B2.
(7) Case 3. 加入CECA1={13},刪除TID={1}. Case 4. 加入CECA3={11},刪除TID={2} 產生新節點N28={7, 11}. 最後,經過 ICIT 而調整的結構如下圖 4, 呈現依更新後資料庫而建的漸進式類別繼承 樹,其關係節點之連結部分以虛線表示。. 五、結論與未來研究方向 本研究提出一個高頻項目集的漸進式探 勘方法 ICIT,此方法不需要重複掃瞄原始資料 庫,即可找出異動後的資料庫中正確且完整的 高頻項目集。本研究方法採用 CIT 結構來保留 原資料庫中的高頻項目集,並另外儲存備選等 值類別,即小於最小支持度門檻值的等值類 別,以方便在資料庫產生變動時,快速調整、 維護 CIT 節點,不需再重建整個 CIT 結構, 可加速關聯規則的產生。利用具有繼承觀念的 CIT 結構除了可以探勘資料庫欄位間的關聯 關係,亦可進行購物籃分析的關聯探勘。 由於利用 CIT 結構與記載的資訊內容有 別於其他的樹狀結構,因此所需花費的儲存空 間可能相對地多於其他的樹狀結構,如 FP-tree。對於 ICIT 相較其他漸進式探勘演算 法尋找關聯規則上,是否有明顯的效率提昇? 或需進一步改良?或是能否善加利用所紀錄 的資訊應用於解決其他問題?在未來都值得 進一步加以探討。. 圖 4 更新後資料庫之類別繼承樹.
(8) 六、參考文獻 [1]. 王慶堯 , 洪宗貝 , “利用準大項目集之漸 進式資料挖掘,” 義守大學資訊工程所碩 士論文, 2000.. [2]. R. Agrawal and R. Srikant, “Fast Algorithm for Mining Assoication Rule in Large Databases,” in Proc. of the 20th International Conference on Very Large DataBases, pp. 487-499, Santiago, Chile, September 1994.. [3]. S. W. Changchien and T. C. Lu, “A New Efficient Association Rules Mining Method Using Class Inheritance Tree (CIT), ” in Proc. of the 12th International Conference on Information Management, 2001.. [4]. D.W. Cheung, J. Han, V.T. Ng, and C.Y. Wong, “Maintenance of Discovered Association Rules in Large Databases: An Incremental Update Technique,” in Proc. of the 12th International Conference on Data Engineering, pp. 106-114, February 1996.. [5]. D.W. Cheung, S.D. Lee, and Benjamin Kao, “A General Incremental Technique for Maintaining Discovered Association Rules,” in Proc. of the 5th International Conference on Database Systems for Advanced Applications, pp. 185-194, April 1-4 1997.. [6]. M. Delgado, D. Sanchez, M. J. Martin-Bautista and M.A. Vila, “Mining association rules with improved semantics in medical databases,” Artificial Intelligence in Medicine, vol.21, pp. 241-245, 2001.. [7]. G. Lee, K.L. Lee, and A.L.P. Chen, “Efficient Graph-Based Algorithms for Discovering and Maintaining Association Rules in Large Databases,” Knowledge and Information Systems, Springer-Verlag, Vol. 3, pp. 338-355, 2001.. [8]. H. Lee, C.-R. Lin, and M.-S. Chen, “Sliding-Win Algorithm for Incremental Mining,” in Proc. of the ACM 10th International Conference on Information and Knowledge Management, November 5-10, 2001.. [9]. J. S. Park, M. S. Chen, and P. S. Yu, “An Effective Hash Based Algorithm for Mining Association Rules,” in Proc. ACM SIGMOD, pp. 175-186, 1995.. [10]. S. Thomas, S. Bodagala, K. Alsabti, and S. Ranka, “An Efficient Algorithm for the Incremental Updation of Association Rules in Large Databases,” in Proc. of 3rd International conference on Knowledge Discovery and Data Mining, New Port Beach, California, pp. 263-266, August 1997.. [11]. M.C. Tseng, W.Y. Lin, and B.C. Chien, “Maintenance of Generalized Association Rules with Multiple Minimum Supports,” Joint 9th IFSA World Congress and 20th NAFIPS International Conference, vol.3, pp. 1294-1299, 2001..
(9)
數據
相關文件
We try to explore category and association rules of customer questions by applying customer analysis and the combination of data mining and rough set theory.. We use customer
in Proceedings of the 20th International Conference on Very Large Data
According to the related researches the methods to mine association rules, they need too much time to implement their algorithms; therefore, this thesis proposes an efficient
(1999), "Mining Association Rules with Multiple Minimum Supports," Proceedings of ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego,
介面最佳化之資料探勘模組是利用 Apriori 演算法探勘出操作者操作介面之 關聯式法則,而後以法則的型態儲存於介面最佳化知識庫中。當有
Soille, “Watershed in Digital Spaces: An Efficient Algorithm Based on Immersion Simulations,” IEEE Transactions on Pattern Analysis and Machine Intelligence,
C., “Robust and Efficient Algorithm for Optical Flow Computation,” Proceeding of IEEE International Conference on Computer Vision, pp. “Determining Optical Flow.” Artificial
[16] Goto, M., Muraoka, Y., “A real-time beat tracking system for audio signals,” In Proceedings of the International Computer Music Conference, Computer Music.. and Muraoka, Y.,