• 沒有找到結果。

三、 研究方法與流程

3.5 關聯法則評估方法

本 節 首 先 會 介 紹 本 篇 論 文 使 用 的 三 種 關 聯 法 則 評 估 方 法 , 第 一 種 是 Support-confidence 方法;第二種是 Interest factor 評估法;第三種是 Interest factor - Support (IS) 評估法,但這三種方法所代表的意義各不相同,在最後會詳細說明評 估方法使用的流程以及代表的意義。

一、Support-confidence 方法

在 2.2.4 章節中介紹Apriori 演算法的精神是使用前一階段所發掘的大型項目集來產 生下一階段的大型項目集;訂定特定的門檻值,最小信心水準(minimum confidence) 和最小支持度(minimum support)之後,依此循序漸進的方式,找出資料庫中項目的 關係。換句話說即是使用資料探勘軟體進行關聯法則分析,會得到非常多的關聯法 則,Apriori 演算法會先選取信心水準和支持度高於研究者所設定最低門檻值的關聯 法則,通過門檻值的A→B 關聯法則是令人感興趣的。本篇論文將最小支持度設為 0.1 ,只要支持度大於 10%的關聯法則就認為是令人感興趣的法則。

Support-confidence 評估方法的缺點是僅考慮 A→B 單向關聯度,也就是僅考慮 p(AUB)在 p(A)中出現的機會,不足以代表 A 和 B 兩者的關聯度;再加上其本身評 估方法的限制,所以本篇研究採取 IS 評估法補其不足之處,以下用購買咖啡和茶 的例子[13]來說明。

Support-confidence 評估方法的限制:

如表3.2,假設買茶又買咖啡的人佔買茶顧客裡面的 75%,也就是說買茶的顧客也

『未落實某安全管理制度』,使用上述咖啡和茶的概念,可以反方向探討『設置某 安全措施』或『落實某安全管理制度』可以降低多少比例的不安全狀況或勞工不安 全行為發生。

Interest factor 評估方法的限制:

使用Interest factor 評估法判斷兩者間的關係時,也有其使用限制[13],本論文以{p, q}和{r, s}兩對數字在文章中出現的數目的例子說明,以下分別為{p, q}和{r, s} IS 評估法衡量 A 和 B 之間的關聯結果相同於 cosine measure,是衡量 vector-space 模型最廣泛使用的方法。IS 評估法則主要是用來衡量資料非對稱雙變數的工具,IS

評估法的公式: 幾何平均,同時考慮雙向信心水準,比起 Support-confidence 評估方法,可以更客 觀評估A 和 B 兩者的關聯度:

四、研究項目評估之門檻值設定:

在Support-confidence 評估方法和 IS 評估法的使用上,使用者必須設定門檻值,由 於國內外尚無研究使用關聯法則探勘來探討營造業重大墜落職災的相關文獻,因此

從圖 3.2 可以看出一對一關聯法則信心水準的分佈狀況,有三個波峰的現象。依據 此三個波峰的分佈情形,本篇論文在高度關聯的門檻值是取第二個波峰和第三個波 峰的中間點 0.6,中度關聯的門檻值取第一個波峰和第二個波峰的中間點 0.3,0.3 以下即為低度關聯。

表3.5 Confidence,IS 門檻值設定表。

Confidence,IS 門檻值 關聯性 0.6-1 高度關聯 0.3-0.6 中度關聯 0-0.3 低度關聯

五、研究項目之評估流程:

評估關聯法則時,由於圖 3.2 是統計所有一對一的關聯法則的信心水準分佈情 形,呈現三個波峰的現象,在初步 confidence 的評估上是取第二和第三波峰中間的值 0.6 作為 confidence-support 評估法的門檻值,大於 0.6 則判斷是可能有高度關聯存在 的有趣法則;第二步以 IS 評估法作篩選,IS 評估法同時考慮雙向的信心水準 A→B 和 B→A,即IS(A,B)= c(AB)×c(BA),是比 confidence 評估法更客觀的衡量方法,

另外在 IS 門檻值的設定上,由於目前國內外尚無研究有相關的研究,本論文在 IS 門 檻值的設定上亦參考圖 3.2 的信心水準分佈圖,同樣與 confidence 採取 0.6,0.3 為判斷 的門檻值;當 IS 值大於 0.6 則判斷兩者之間具有高度關聯,在實務上即表示 A 和 B 兩者的結合度很高,也就是 A 的出現幾乎都會伴隨 B 的出現

例如:假設「勞工未接受安全衛生教育訓練」與「勞工有不安全行為」的關聯,

若是 IS>0.6 則兩者屬於高度關聯,在實務上的意義即為「勞工有不安全行為」,「勞 工未接受安全衛生教育訓練」兩者的結合度很高,幾乎可以判斷「勞工未接受安全 衛生教育訓練」出現就會伴隨「勞工有不安全行為」出現。

本篇論文的研究目的除了瞭解研究項目中兩者的關聯性之外,更希望能夠得知 研究項目中兩者之間是否具有因果關係,例如 IS( A→B)=0.8>0.6,兩者結合度幾 乎達一致,但是卻無法說明A 的出現機率增加(減少)是否會連帶使 B 的出現機率增 加(減少)。所以在第三部分使用 Interest factor 來分析兩者的因果關係,例如:假設在 上述的例子中,「勞工未接受安全衛生教育訓練」與「勞工有不安全行為」有高度關 聯,若能再進一步確認「勞工未接受安全衛生教育訓練」與「勞工有不安全行為」

兩者具有正相關,表示「勞工未接受安全衛生教育訓練」比例上升,「勞工不安全行 為」也會上升;換句話說只要降低「勞工未接受安全衛生教育訓練」的情況,那「勞 工有不安全行為」的情況也會減少,對於防災措施可以提供更具體的意見。綜合以

上,本篇論文的評估方法使用流程如下圖:

判斷 Confidence 是否大於 0.6

判斷 IS 屬於何種關聯 (判斷研究項目的關聯性為何)

以 Interest Factor 分析 研究項目

圖3.3 關聯法則評估流程圖。

第四章、研究結果與分析 4.1 研究結果

本節將對第三章的資料分類結果進行關聯法則探勘,使用的工具是 weka 軟體,

本節將分為四個部分,4.1.1 節為致災主要原因的分析和描述,將不安全行為、不安全 狀況和不良安全管理制度的統計結果以圖表呈現;4.1.2 節為資料探勘的關聯法則及信 心水準,從資料探勘結果中找出所需的關聯法則和信心水準;4.1.3 節為研究項目之信 心水準和IS 值;4.1.4 節為職災時間基本描述,以圖表呈現職災發生時間統計結果。

4.1.1、致災主要原因的分析和描述

本篇論文將營造業 324 件重大墜落職業災害的致災原因,不安全狀況(間接原 因)、不良安全管理制度(基本原因)和勞工不安全行為,轉成表格形式後置於附 錄二,此章節以圖表形式表現各致災原因的的統計結果:

(1) 不安全狀況:

由圖4.1 初步的統計分析可以得知,第五項【未設置護欄、護蓋或安全護網或拉設 安全母索 等防護設備】、第七項【未使勞工使用安全帽、安全帶或為戴妥(沒人監 督)】為事故發生時最常出現的不安全狀況,個數分別為 187、188。其他項不安全 狀況的個數皆不超出 50,不到總個案數的 15%,不列入探討項目;另外第七項【未 使勞工使用安全帽、安全帶或為戴妥(沒人監督)】在幾個年度的文件記錄中同時 也被界定為不安全行為,為避免混淆,不列為不安全狀況的探討項目。本論文主要 採取第五項【未設置護欄、護蓋或安全護網或拉設安全母索 等防護設備】作為 weka 軟體在不安全狀況上的分析。

90-94年不安全狀況統計圖

0 50 100 150 200

a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 a12 a13 a14 a15 編碼

次數

圖 4.1 民國 90~94 年 營造業墜落事故不安全情況長條圖。

不安全狀況 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 a12 a13 a14 a15

件數 21 1 40 10 187 12 188 40 2 3 4 10 5 46 11

(2) 不良安全管理制度:

圖 4.2 初步統計分析可以得知,第三項【未確實實施自動檢查,或者記錄不確實】

第六項【未對勞工辦理勞工安全衛生教育訓練,勞工危害認知不足(包括訓練不確 實)】和第七項【安全衛生工作守則未向檢查機構核備並落實實施(包括未訂立安 全衛生手則)】為事故發生時最常出現的不良安全管理制度,個數分別是 208、242 和 217,其餘各項除第一項【未實施健康管理】個案數少於 50 之外,其餘個案數皆 超過 100 個。

90-94年 不良管理制度統計圖

0 50 100 150 200 250 300

b1 b2 b3 b4 b5 b6 b7 b8

次數

不良管理制度 b1 b2 b3 b4 b5 b6 b7 b8 件數 45 151 208 134 160 242 217 5 圖4.2 民國 90~94 年 營造業墜落事故中不良管理制度長條圖。

表4.2 民國 90~94 年 營造業墜落事故不良管理制度統計資料 表4.1 民國 90~94 年 營造業墜落事故不安全情況統計資料表。

(3) 勞工不安全行為

324 件重大墜落工安事件的文件記錄中,將近半數的文件沒有詳述勞工不安全行為 是屬於何種,而且本研究的目的主要是在探討何種因素會導致勞工不安全行為的發 生,所以將勞工不安全行為分為「有」和「無」兩項來探討。

90-94 勞工不安全行為統計圖

0 50 100 150 200 250 300

1 2

次數

編碼

不安全行為 c1 0 件數 249 75

表4.3 民國 90~94 年 營造業墜落事故勞工不安全行為統計資料表。

圖4.3 民國 90~94 年 營造業墜落事故勞工不安全行為長條圖。

4.1.2、研究項目的信心水準

將 3.4 章節中經過編碼的事故原因輸入 weka 軟體進行關聯法則探勘,產生非常多 的關聯法則,本研究僅選取部分關聯項目較少的法則置於附錄七.二。本節主要是 選出與六個研究項目有關的關聯法則進行探討,詳情請參閱附錄七.一。

研究項目一、「未設置安全衛生管理人員」與「勞工有不安全行為」的關聯性。

研究項目一(b2→c1)關聯法則的信心水準 c(b2→ c1)=0.79。

研究項目二、「未設置安全衛生管理人員」和「勞工未接受安全教育訓練」的關聯 性。

研究項目二(b2→b6)的關聯法則的信心水準 c(b2→ b6)=0.8。

研究項目三、「勞工未接受安全衛生教育訓練」和「勞工有不安全行為」的關聯性。

研究項目三(b6→ c1)關聯法則的信心水準 c(b6→ c1)=0.76。

研究項目四、「安全衛生工作守則未向檢查機構核備並落實的公司」和「勞工未接 受安全教育訓練」的關聯性。

研究項目四(b7→b6)關聯法則的信心水準 c( b7→ b6)=0.84。

研究項目五、「未設置安全衛生管理人員」與「未設置護欄、護蓋或安全護網或拉 設安全母索等防護設備」的關聯性。

研究項目五(b2→ a5)關聯法則的信心水準 c( b2→ a5)=0.59。

研究項目六、「未設置安全衛生管理人員」與「未確實實施自動檢查,或者記錄不 確實」的關聯性。

研究項目五(b2→ b3)關聯法則的信心水準 c( b2→ b3)=0.77。

依據這六個研究項目,我們已計算出個別的信心水準。再依據設定的門檻值,將最 低信心水準設為0.6,除此之外,研究項目的關聯性最後必須要由 IS 值來判斷,因 為根據3.5 章節得知如果只依靠信心水準做評估還不能夠完全代表 A 和 B 兩者之間 的關聯度。

4.1.3、研究項目之評估結果

(1)研究項目一:「未設置安全衛生管理人員」與「勞工有不安全行為」的關聯性。

研究項目一:(b2→c1)的關聯法則,計算出的 confidence 和 IS measure 的值分別

研究項目一:(b2→c1)的關聯法則,計算出的 confidence 和 IS measure 的值分別

相關文件