在決策樹的結果方面將所有規則進行整理可以發現,開始吸菸年齡對青少 年是否持續吸菸行為、喝酒行為造成很大的影響,其中以 12、13 歲開始吸菸的 年齡居多,即國小六年級、國中年級的學生居多,所以家長應該特別注意這階 段青少年的行為模式,不要讓孩子從年輕就染上不良的壞習慣,影響他們一生 的健康。
而在青年部分本研究探勘出嚼檳榔、性別、喝酒程度為影響吸菸行為的重 要因素,其中嚼檳榔是最重要的因素。吸菸為影響嚼檳榔行為的最重要因素。
吸菸、嚼檳榔為影響喝酒行為的重要因素。在性別方面可以了解到男性染上非 健康行為的機率比女性多,也可以知道吸菸影響喝酒及嚼檳榔行為非常大,嚼 檳榔影響吸菸行為很大,由此可證可以了解到吸菸、嚼檳榔、喝酒此三項行為 間是會互相影響的。
在中壯年部分,性別為影響吸菸行為的最重要因素,顯示男女吸菸與否差 異非常大。吸菸為影響嚼檳榔行為的重要因素;吸菸、性別、嚼檳榔為影響喝酒 行為的重要因素。在性別方面可以分析出不同性別的人會有不同的吸菸狀況,
男性為吸菸超過 5 包的,女性則為沒有吸菸,而從以上結果也可以看出在此年 齡群裡此三種行為之間也是會互相影響的。然而在學歷和其行為是否受同學、
朋友、家人影響並無發現出其相關性、這是由於數據中空值與遺漏值佔大多數 而稀釋掉其他影響因子,導致無任何學歷和其行為是否受同學、朋友、家人影 響因素產生;而在疾病方面,本研究並無發現疾病與吸菸、嚼檳榔、喝酒行為 的顯著關聯性,這可能由於樣本中的疾病筆數非常少,無法發掘相關性。
83
參考文獻
中文部分
1. 王國川(民 85)。青少年健康行為潛在結構之探討。國立台灣師範大學師大學 報教育類,41:177-208。
2. 林杰樑(無日期)。台灣毒品藥物濫用越趨嚴重。民 100 年 10 月 15 日:取 自http://www.greencross.org.tw/drugabuse/drug_abuse.html
3. 約翰.克勞夫頓爵士、大衛.辛普森(民 91 年)「菸草:威脅全球」。香港吸菸與 健康委員會。
4. 張昭容(民 93)。父母教養風格對高中高職五專學生抽菸喝酒嚼檳榔之影響(碩 士論文)。取自臺灣博碩士論文知識加值系統(登陸號:002909561)
5. 張筑涵(民 98)。台灣地區成人健康行為對醫療利用之分析研究(碩士論文)。
取自臺灣博碩士論文知識加值系統(登陸號:003933198)
6. 郭乃菀(民 95)。台灣地區在校青少年吸菸、喝酒及嚼食檳榔與藥物使用之盛 行率。國立台灣師範大學,台北市。
7. 簡貝珊(民 98) 。青少年藥物濫用行為探討-2005 年國民健康訪問暨藥物濫用 調查結果初探 (碩士論文)。取自臺灣博碩士論文知識加值系統(登陸號:
003933191)
8. 顏博文(民 92) 。應用資料探勘技術分析學生選特性與學業表現(碩士論文)。
取自臺灣博碩士論文知識加值系統(登陸號:002549629)
9. 蔡佳玲(民 98 ) 。慢性病連續處方箋之成效評估-以資料探勘技術探討未開立 慢性病連續處方之決定因子(碩士論文)。取自臺灣博碩士論文知識加值系統 (登陸號:003902462)
10. 朱妙慧(民 92) 。台灣地區成年男性物質使用行為的社會層級差異變遷(碩士 論文)。取自臺灣博碩士論文知識加值系統(登陸號:002564323)
84
11. 楊舒媛(民 98) 。台灣老年人居住安排與健康之性別差異分析(碩士論文)。取 自臺灣博碩士論文知識加值系統
12. 吳充平(民 94) 。資料探勘技術於台灣地區國人健康狀況之研究(碩士論文)。
取自臺灣博碩士論文知識加值系統(登陸號:002970026)
13. 林明昌(民 96) 。利用資料探勘技術探討中央健康保險局中區分局資料庫門 診高就診次者之特性(碩士論文)。取自臺灣博碩士論文知識加值系統(登陸號:
003827979)
14. 吳玟蕙(民 98) 。我國老人憂鬱程度、健康狀況與醫療服務利用之相關性探 討-「2005 年國民健康訪問調查」資料分析(碩士論文),取自臺灣博碩士論 文知識加值系統(登陸號:003933224)
15. 林政穎(民 97)。分散式決策樹隱私權防護(碩士論文),取自臺灣博碩士論文 知識加值系統(登陸號:003797258)
16. 林品妤(民 97)。同儕效果對於青少年抽菸、喝酒或吸食藥物的影響(碩士論 文),取自臺灣博碩士論文知識加值系統(登入碼:003760565)
20. 魏嘉玉(民 99)。探討花蓮縣布農族國中生生活技能與嚼食檳榔行為之關係(碩 士論文) 取自臺灣博碩士論文知識加值系統
21. 盧怡吟(98),生活壓力、偏差行為與父母管教方式對國小學童吸菸、飲酒、
嚼食檳榔行為之相關研究。高雄醫學大學,高雄市。
22. 田慶琦(民 98)高中職學生成癮物質認知、使用與盛行率之調查研究-以台南
85
縣為例(碩士論文),取自臺灣博碩士論文知識加值系統(登入碼:003760565) 23. 宋敏仰、陳永昌、張峯銂、林威助、許雅雯、詹惠敏、梁育嬋(民 95)。應用
86 酒檳榔預防性衛生教育計畫介入之成效評價。衛生教育學報,24,71-88 40. 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(民 94)。資料探勘。旗標出版。
41. 陳惠珍(民 98 年 8 月 31 日)。人口結構改變無聲無息但影響社會各層面。全 球中央雜誌網。民 100 年 10 月 30 日,取
自:http://newsworld.cna.com.tw/post/e4babae58fa3e7b590e6a78be694b9e8ae8 ae784a1e881b2e784a1e681afe4bd86e5bdb1e99fbfe7a4bee69c83e59084e5b1a4e 99da2.aspx
42. 吳明燁(民 88)。父母與同儕對於青少年抽煙與飲酒行為之影響。台灣社會問 題研究。民 100 年 11 月 14 日,取
自:http://www.ios.sinica.edu.tw/ios/seminar/sp/socialq/wu_min_ya.htm
43. 葉國樑(民 94 年)。健康行為科學理論應用於健康教育的調查實驗研究。民 100 年 9 月 30 日,取自:http://blog.xuite.net/wengigi/gigi/3416785
44. 呂昌明、王淑方(民 94 年 6 月 14 日)。健康行為理論-跨理論模式在健康行為
87
改變上的應用,民 100 年 10 月 11 日,取 自http://blog.xuite.net/wengigi/gigi/3415912
45. 姜逸群(無日期)。健康促進與生活型態。學校體育雙月刊。民 100 年 11 月 4
自:http://www.nhu.edu.tw/~society/e-j/90/4.htm
47. 陳靜敏,社區衛生護理學二版,台北.新文.2006 出版
48. 張朝凱(民 93)。健康心理學第三章健康行為相關理論。張醫師教授專欄。民 100 年 11 月 1 日,取自:
http://www.lasikeye.idv.tw/paper/paper-3.htm
49. 蘇湘雲(民 100 年 3 月 29 日)。抽菸酗酒之始碰毒率高 10 至 30 倍。台灣新生 報。民 100 年 10 月 26 日,取
自:http://www.tima.org.tw/asap/forum/index.php?topic=2160.0
50. 陳筱蕾(民 100)。台灣青少年飲酒之社會化與認知因素。國家衛生研究院電 子報。第 422 期。民 100 年 10 月 15 日,取自:
51. 慢性病(無日期)。世界衛生組織。民 100 年 10 月 27 日,取自
http://enews.nhri.org.tw/enews_list_new2_more.php?volume_indx=422&showx
=showarticle&article_indx=8690
http://www.who.int/topics/chronic_diseases/zh/index.html
52. 世界衛生組織呼籲全球重視慢性疾病(無日期)。世界衛生組織。民 100 年 10 月 30 日,取
自: http://www.tafm.org.tw/wonca/wonca%20news/WoncaNewsV32No1-3.htm
88
53. 檳榔防制暨口腔癌防治-檳榔嚼塊之致癌性說明(無日期)。台中市:行政院 衛生署。民 100 年 10 月 30 日,取
自:http://www.bhp.doh.gov.tw/bhpnet/portal/Them_Show.aspx?Subject=20071 2250032&Class=2&No=200803270018
54. 伍焜玉(民 96 年 7 月)。2005 年『國民健康訪問暨藥物濫用調查』結果報告。
民 100 年 10 月 24 日取自:
http://nhis.nhri.org.tw/files/2005NHIS_Final%20Report_1.pdf
英文部分
1. Kasl. S, Cobb S. Health behavior, illness behavior, and sick role behavior.
Archives of Environmental Health 1966;246-266.
2. Quinlan, J.R.,”C5.0 Online Tutorial,” http://www.rulequest.com, 2003.
3. J. R. Quinlan,“Introduction of Decision Tree,”Machine Learning, vol.1, pp.81-106, 1986.[ID3]
4. J. R. Quinlan, C4.5: programs for machine learning: Morgan Laufmann Publishers Inc., 1993.[C4.5]
5. Han J., M. Kamber (2001),”Data Mining: Concepts and
Techniques”,Classification and Prediction of Chapter 7. San Francisco, California, Morgan Laufmann Publishers, pp.279-325.
6. Pender. N. J. (1996). Health Promotion in Nursing Practice(3rded.). Stamford.
CT: Appleton & Lange.
7. Manning. T .M. (1997).Defining Health Behavior in Light of Related Disciplines.
American Journal of Health Behavior, 21(2), 88-90.
8. Tannahill, A. (1985). “What is Health Promotion”, Health Education Journal, 44(4), 167-168.
9. Bellow, N. B., and L. Breslow., (1972). “Relationship of Physical Health Status and HealthPractices,” Preventive Medicine, 1:409-421.
89
10. Pender, N. J. (1987). Health promotion in nursing practice (2nded.). Norwalk.
CT:Appleton & Lange.
90
91
-999、-9999=C 6. live-parents 同住(父母) C 是=A
不是=B
-999、-9999=C 7. live-sp 同住(配偶父母) C 是=A
不是=B
-999、-9999=C 8. live-Spous 同住(配偶) C 是=A
不是=B
-999、-9999=C 9. live-son 同住(兒子) C 是=A
不是=B
-999、-9999=C 10. live-wife 同住(媳婦) C 是=A
不是=B
-999、-9999=C 11. live-dau 同住(女兒) C 是=A
不是=B
-999、-9999=C 12. live-sil 同住(女婿) C 是=A
不是=B
-999、-9999=C 13. live-bas 同住(親兄弟姊妹) C 是=A
不是=B
-999、-9999=C 14. live-grand 同住(外祖父母) C 是=A
不是=B
-999、-9999=C
(續下頁)
92
-999、-9999=C 16. live-other-relate 同住(其他親戚) C 是=A
不是=B
-999、-9999=C 17. live-friend 同住(同儕朋友) C 是=A
-999、-9999=C 19. Hypertension 高血壓 C 是=A
不是=B
-999、-9999=C 20. Diabetes 糖尿病 C 是=A
不是=B
-999、-9999=C
21. H-fat 高血脂 C 是=A
不是=B
-999、-9999=C
22. Stoke 中風 C 是=A
不是=B
-999、-9999=C 23. B_AST 是否有氣喘的情形發
生
C 是=A 不是=B
-999、-9999=C 24. B_KD 是否患過腎臟病 C 是=A
不是=B
-999、-9999=C
(續下頁)
93
-999、-9999=C 26. HD 心臟病種類 C 無此項:HD00
-999、-9999=C 28. B_GOUT 是否有痛風症狀 C 是=A
不是=B
-999、-9999=C 29. B_GU 是否有胃潰瘍或十
二指腸潰瘍
C 是=A 不是=B
-999、-9999=C 30. B_SNS 是否有鼻竇炎 C 是=A
不是=B
-999、-9999=C 31. B_SPT 是否有慢性呼吸道
疾病
C 是=A 不是=B
-999、-9999=C 32. B_OST 是否有骨質疏鬆症 C 是=A
不是=B
-999、-9999=C
(續下頁)
94
-999、-9999=C
34. CA 癌症種類 C 無此項:CA00
-999、-9999=C 36. B_MI 是否有精神疾病 C 是=A
不是=B-999、-9999=C 37.. B_PRD 是否有攝護腺疾病 C 是=A
不是=B
-999、-9999=C 38. B_OUD 是否有子宮卵巢疾病 C 是=A
不是=B
-999、-9999=C
(續下頁)
95
-999、-9999=C
40. B_JO 工作狀況 C 是=A -999、-9999=C 42. SOw 幾歲開始吸 -999,-9999=C
44. Areca 嚼檳榔 C 否=AN
嚼過一兩次=AO 以前嚼,現在不嚼
=AP 是=AY
-999,-9999=C
(續下頁)
96
-999、-9999=C 46. DRw 多久喝一次酒 C 每月不到一次
-999、-9999=C 47. Ddegree 喝酒程度 C 淺酌(不醉)=ND
微醺(半醉)=HD 常喝醉(爛醉)=FU -999、-9999=C
97
98
學歷 Education 學歷翻譯:Education 取用此單 字
欄位說明:分成小學翻譯 Primary School 取用這兩個單字 的第一個字母在以年級去編 號,如 PS-01 為小學一年級、
高中翻譯 High School 各取單字 的第一個字母、大學翻譯 University 取單字的第一個字 母、研究所以上翻譯 Institute 取單字的前三個字母、空中大 學肄業、空中行專肄業、識字、
不識字
99
live-bas 兄弟姊妹翻譯:brothers and sisters
取這三個單字的第一個字母 是否與外祖父母同住 live-grand 外祖父母翻譯:grandparents
取前五個字母
是否與外孫子女同住 live-grandchild 外孫子女翻譯:grandchild 取用此單字
是否與其他親戚同住 live-other-relate 其他親戚翻譯:live-other-relate 取用此單字
100
疾病
中文 代碼 說明
是否罹患高血壓 Hypertension 高血壓翻譯:Hypertension 取用 是否罹患糖尿病 Diabetes 糖尿病翻譯:Diabetes 取用此單
Kidney disease 各取單字第一個字
B_GU 胃潰瘍翻譯:Gastric ulcer 十二指腸潰瘍翻譯:Duodenal ulcer
取胃潰瘍,單字第一個字 是否有鼻竇炎 B_SNS 鼻竇炎翻譯:Sinusitis
因,單字較多,跳著取 是否有慢性呼吸道疾病 B_SPT 慢性呼吸道疾病:
Chronic respiratory disease 取中間單字的各別字母
101
中文 代碼 說明
癌症種類 CA 癌症翻譯:Cancer
取前兩個字母 是否有癌症的徵狀 B_CA 『B』、『_ 』
有在下面說明
是否有精神疾病 B_MI 精神疾病翻譯:Mental illness 各取第一個單字的第一個字母
是否有攝護腺疾病 B_PRD 攝護腺疾病翻譯:
Prostate disease
取第一個單字的前三個字母 是否有子宮卵巢疾病 B_OUD 子宮卵巢疾病翻譯:
Ovary and uterus diseases 取三個單字的第一個字母 是否有關節炎疾病 B_ART 關節炎疾病翻譯:Arthritis
取前三個字母 註:是否就以 Booolen 的”B”表示之。
“_”代表區隔開疾病與是否易於辨認。
102
榮耀事蹟
103 e-mail:[email protected]*
摘要
104 算法包括 C4.5、ID3、CHAID、CART,而 Quinlan 於 1998 提出的 C5.0 演算法,
此 C5.0 演算法是 C4.5 演算法的修訂版,運用軟體處理資料上比 C4.5 計算還要 快和佔用資源較少,並且處理了 ID3 無法探勘連續屬性的問題,C5.0 演算法主 要改進是採用提升(Boosting)方式提高模型的準確率,又稱為 Boosting
Trees(Quinlan,2003)。於 Quinlan(2003)中說明,C5.0 演算法運算分割規則為增 益比(Gain Ratio),規則為測試前的資訊量減測試後的資訊量,資訊增益
(Information Gain)算式如下:
𝑰�𝑃(𝑉1), … , 𝑃(𝑉𝑛)� = � −𝑃(𝑉𝑖) log2𝑃(𝑉𝑖)
105 C5.0 演算法先建立預估錯誤率(Predicted Error Rate)修剪樹枝。此演算法按序列 建立多重模型,第一個模型,隨後建立第二座模型,聚焦於第一個模型錯誤分 類的紀錄,第三座模型聚焦於第二座模型的錯誤,以此方式類推模型規則,提
105 C5.0 演算法先建立預估錯誤率(Predicted Error Rate)修剪樹枝。此演算法按序列 建立多重模型,第一個模型,隨後建立第二座模型,聚焦於第一個模型錯誤分 類的紀錄,第三座模型聚焦於第二座模型的錯誤,以此方式類推模型規則,提