• 沒有找到結果。

二、 文獻探討

2.2 資料探勘

2.2.4 關聯法則探勘

關聯法則最早是由Agrawal在 1993 年[16]所提出,主要是在龐大的交易資料中尋 找出令人感到有興趣的關係或關聯。最典型的例子為市場購物籃分析,以條碼記錄的 超市為例,可在原始顧客購物記錄中,以關聯法則來分析顧客購物的習慣,改變市場 中物品的擺設或使用廣告等方法增加顧客消費。關聯法則探勘是資料探勘中普遍被使 用的技術,也是本研究所使用的研究技術。關聯法則的問題定義:令I=﹛i1,i2,…im﹜ 為商品的項目item;D為交易項目集合,每一筆交易項目集為T=﹛t1,t2,…tn﹜, T⊆ I。

關聯法則的形式為X Y,X,Y I 且X和Y的交集為空集合,X為條件句;Y為結論句。

關聯法則X Y都有一個信心水準c%,信心水準c為P(X∩Y/X),X Y也有一個支持 度s%,支持度s 為p(X∩Y);每一個關聯法則都必須滿足事先設定的兩個參數值,最 小支持度(minimum support)與最小信心水準(minimum confidence)。最小支持度和 資料庫中交易總數的乘積即為最小支持個數(minimum support count)。例如下表有一 網路交易資料庫[14],分別有交易編號與商品編號兩欄:

⇒ ⊂

⇒ ⇒

表2.1 網路交易資料表(範例說明)

其中apriori-gen(Lk-1)副函式的主要的最重要的動作,就是將 Lk 的項目組合,經過聯 結之後,產生下一階段的候選項目組 Ck+1,以提供主函式繼續往下搜尋資料庫的項 目組之用,而 subset(Ck, t)函式用來判斷部分交易項目 t 是否包含在候選項目組 Ck 內,也就是在判別t 是否為 Ck 的子集合。Apriori 演算法由單一項目組(1-itemset)開 始,逐層產生相關項目組。此過程分為兩個階段,第一個階段為產生新的項目集,若 相關項目的長度為k,則稱為候選 k-項目集,記為 Ck;第二階段為搜尋資料庫中 Ck 的 支持度是否大於使用者最初設定的最小支持度門檻值的限制,符合條件的項目集 Ck 便稱為大項目集,稱為k-項目集,記為 Lk 而不符合最小支持度限制的 Ck 項目集則 刪除。以表2.1 為例可以利用 Apriori 演算法來找出關聯規則:

(1) 訂定最小支持度與最小信心水準。

(2) Apriori 演算法將所有資料項皆視為候選項目,先計算每一個候選項目集的支 持個數,將出現個數大於或等於最小支持度的大型項集合留下,在進行下一階段 的篩選。假設 X 和 Y 是兩個型項目 2-項目集,X={I, II}且 Y={I, III}。X 集合的第 一項編號 X[1]=I ,Y 集合的第一項編號 Y[1]=I,而 X 集合的第二項編號 X[2]=II

<Y[2]=III,符合結合的條件,因此 X 和 Y 結合成一個候選 3-項目集{I, II, III},

其中集合中的先後順序並不代表任何意義,故為了避免重複,結合條件必須考慮 X[2]<Y[2]。

(3) 由前一個步驟篩選出的大型項集合,再從其中產生下一個階段的大型項集 合。關聯組合的出現次數,用同樣的方法剔除弱關聯性的候選物項組合。承上述 所形成之候選 3-項目集{I, II, III},而此項目集包含三個 2-項目集{I, II},{II, III},{I, III},若是{II, III}不是大型項目集則{I, II, III}必定不是大型項目集,如果{II, III}

是大型項目集,則{I, II, III}必須透過讀取資料庫來計算支持度來判斷是否為大型 項目集。

(4)直到下一個階段無法產生任何大型項集合為止,最後留下的強關聯性候選物項 組合即為整個資料中物項高頻的關聯資訊。

本研究將依循上述方法將重大墜落職業災害中的勞工不安全行為、不安全狀況和不良 安全管理制度進行分析。首先由於這些狀況與原因都是一段文字敘述,所以必須將勞 工不安全行為、不安全狀況和不良安全管理制度這幾項轉換成編碼之後再使用資料探 勘軟體Weka[17]中的 Apriori 法則進行關聯法則探勘。Weka 這套免費軟體是以 JAVA 寫成,其中包含了許多關聯法則、分群分類等的演算法,Weka 在分析統計以及 data mining 方面的應用相當足夠,對於一些簡單大量的資料,這套軟體所能做的相關分析 已是相當足夠的了。省去了程式設計的麻煩,並且這些演算法種類繁多,可對不同屬 性的資料,如 numeric(數值型)、nominal(離散型)的資料做分析。Weka 系統擁有進行 資料挖掘任務的圖形用戶介面,有助於理解模型,是一個實用並且深受歡迎的工具,

目前已有許多國內外大專院校採用Weka 軟體來發表期刊[18-22],其可信度是被國際 公認的。

第三章、研究方法與流程 3.1 研究流程

本研究的研究流程分為以下六個步驟,首先整理相關文獻以瞭解國內外墜落職災 的主要原因,再將行政院勞工委員會於民國90-94 年 324 件重大職業災害案例加以分 析整理之後,提出五個研究項目。利用weka 軟體進行關聯法則探勘,在此 weka 軟體 採用 Apriori 作為關聯法則的演算法,最後評估關聯法則的可信度並印證研究項目成 立與否。

整理墜落職災相關文獻

圖3.1 研究流程圖 尋 找 與 研 究 項 目 相 關 的

法 則 並 進 行 關 聯 法 則 使用 weka 軟體 進行關聯法則探勘

印證研究項目成立與 資料前置處理 資料表格化及資料淨化

整理分析案例 提出五個研究項目 蒐集台灣營造業重大墜落

工安事件的文件資料-

本研究之研究流程如上圖所示,分別說明如下:

‹ 1.確定研究的題目後整理相關的文獻、書籍和資料。

‹ 2.蒐集台灣營造業墜落工安事件的資料以及資料探勘的技術應用。

‹ 3 整裡及分析收集到的墜落工安事件,配合參考現行台灣營造業安全管理 狀況,對於導致災害發生的主要原因,提出五的研究項目進行探討。

‹ 4.將資料形式轉換以供後續資料探勘軟體分析,資料轉換過程包括資料潔 淨和資料編碼,亦即把原始文件資料轉換成軟體可以使用的形式,再進行 資料探勘。

‹ 5. 將處理過的資料輸入資料探勘軟體 weka 中進行關聯分析。

‹ 6. 找出與研究項目相關的關聯法則,並對關聯法則的可靠度進行評估 。

‹ 7. 使用經過評估的關聯法則來印證研究項目成立與否。

3.2 研究項目之操作性定義

行政院勞工委員會將營造業重大墜落工安事件以文字檔的方式紀錄,記載的項目 包括行業種類、災害類型、媒介物、罹災情形、災害發生經過、災害發生的直接原因、

間接原因、基本原因和災害防止對策,詳細的內容請參看附錄一。本篇論文從分析324 件重大墜落工安事件的文件記錄,認為文件中記載的職災間接原因和基本原因是致災 的關鍵因素,所以將針對這兩者進行分析。而在季節與災害發生的時間上則是以統計 分析來觀察是否有特殊之處,以下是災害發生時間與致災因素的分類與定義:

1. 致災關鍵原因分類與定義

關於職災的記錄方式,台灣與美國均採取美國國家標準協會(ANSI Z16.2-1962)所訂 的標準,將事故分為三大原因:

1.直接原因:非預期的能量溢出或危害物溢出 2.間接原因:不安全行為和不安全狀況

3.不良管理

因為在直接原因的記錄上,本研究採取的所有案例皆為墜落,所以分析的標的將著重 在職災報告中的間接原因和基本原因兩者,其中間接原因又分為「不安全狀況」和「勞 工不安全行」為兩項;不安全狀況指的是發生事故時,施工的不安全環境;勞工不安 全行為則是指勞工自身的不安全動作;基本原因則是指不良的安全管理制度。以下為 文件記錄中「不安全狀況」、「不良安全管理制度」和「勞工不安全行為」的主要分類。

(1)不安全狀況:

依據行政院勞工委員會於民國 90-94 年間 324 件重大墜落工安事件中的分

類,本論文將墜落災害發生的不安全狀況歸納為以下 15 項 (以下項目包括 雖設置但未依規定設置者):

1. 未設置能使勞工安全上下之設備。

2. 勞工於橫隔兩地之通行時,未設置適當之通行設備。

3. 未設置適當強度,且寬度在三十公分以上之踏板。

4. 於有墜落危險之場所,未設警告標示,禁止人員通行進入。

5. 未設置護欄、護蓋或安全護網或拉設安全母索 等防護設備。

6. 未設有適當強度之圍欄、握把、覆蓋等防護措施。

7. 未使勞工使用安全帽、安全帶和未帶妥(沒人監督)。

8. 未設置施工架或工作台和雖設置但不符合規範。

9. 為設置或未將安全支撐妥為固定。

10. 使用電動工具外殼絕緣不良,造物拆除作業時未切斷電源。

11. 使用移動式起重機時,未將吊掛平台固定,或不以吊物為限,卻乘載 及吊升勞工從事作業。

12. 機械、設備使用未符合原廠規定、過期或未依規定安裝失效。

13. 能見度差,未設自動照明設備。

14. 其他(個數太少)。

15. 無或無法作判斷。

(2)不良安全管理制度:

美國國家標準協會(ANSI Z16.2-1962)定義基本原因為不良的安全管理制 度,本論文分析行政院勞工委員會重大墜落工安事件中所採用的類別,基本 原因分類歸納為以下 7 項:

1.未實施健康管理

2.未設置勞工安全衛生管理人員來訂定墜落災害防止計畫辦理規劃和督導 安全衛生設施之檢點與檢查(或未確實督導)。

3.未確實實施自動檢查,或者記錄不確實。

4.未於事前,依勞工安全衛生法及有關安全衛生規定告知承攬人工作環境 危害因素。

5.有共同作業情形,未設置協議組織,並指定工作場所負責人,擔任指揮 及協調之工作,工作之連繫與調整和工作場所之巡視。

6.未確實對勞工辦理勞工安全衛生教育訓練,以致勞工對危害認知不足。

7.安全衛生工作守則未向檢查機構核備並落實實施(包括未訂立安全衛生 手則)。

(3)勞工不安全行為:

行政院勞委會在勞工不安全行為之分析,經由重大職災調查報告之彙整分析 發現,最主要之不安全行為集中在勞工未使用個人安全防護具(34.9%)、使 安全裝置失效(15.3%)、不當操作設備(14.8%)、不安全的位置或姿勢

(10%)、未遵循安全及警告措施(9.5%)等,以上行為佔所有不安全行為

(10%)、未遵循安全及警告措施(9.5%)等,以上行為佔所有不安全行為

相關文件