全民健保資料庫分析:重大傷病及癌症之研究 - 政大學術集成
71
0
0
全文
(2) 謝 誌 在打這篇謝誌的時候,研究所的生涯即將告一段落,兩年的時光雖然說長不 長說短不短,但過程卻十分充實,讓我獲益良多。也很幸運在研究所的生活中, 能結交不少好朋友,及遇到好老師和好學長,能在我困難的時候給予幫助,讓我 能順利畢業。 本來想說「要感謝的人太多了還是謝天吧」,不過這好像是抄襲而且太過敷 衍哈哈,那在這邊我就慢慢感謝吧。回想起我大學四年級正要升碩一的時候,便. 政 治 大 人大方且很有想法,在課堂及討論的時候也常教導我們從不同角度思考事情的重 立 加入了余老師的健保資料庫計畫,在這邊要先感謝我的老闆余清祥老師,老師為. 要性,有些東西換個角度思考可以有不一樣的結果,也謝謝老師提供的意見讓我. ‧ 國. 學. 能完成這篇論文,也培養我更多獨立思考的能力。接著要感謝小馬學長,是他帶. ‧. 領我們了解資料庫的功用,及教我們寫程式的一些細節及管理的方法,也謝謝他. y. Nat. 在我碩士生涯遇到問題的時候都不厭其煩的幫忙。再來感謝研究所遇到的同學們,. er. io. sit. 謝謝你們陪我打發無聊的時間,不管是玩神魔、打 LOL 還是打籃球,而在需要 認真討論的時候也都很 Carry ,猛!另外也感謝所有教過我的老師們,因為有. n. al. Ch. 你們的教導,我才能從中成長。. engchi. i n U. v. 在學校外,也要感謝我的國中、高中和大學朋友們,儘管你們有無數白爛的 垃圾話和一堆低能的舉動,但你們仍舊可以讓我放鬆心情和找回自己的熱情,謝 謝。另外,最重要的是要感謝我的家人,謝謝我的父親和母親,讓我能沒有後顧 之憂的攻讀碩士班學位,也謝謝你們一路的支持與鼓勵,讓我能走自己想走的路, 再謝謝你們把我養的這麼大,千言萬語道不盡對你們的感謝,也謝謝我的弟弟在 家陪我度過玩樂的時光。最後要謝謝我的女朋友,在我無聊的時候陪我度過,在 我遇到挫折的時候給我支持,讓我每次都能充滿能量的繼續迎接挑戰,能遇到妳 真好,謝謝妳包容我哈哈。.
(3) 在研究所的生涯中我學到了許多,不論是做人處事的道理、統計相關的知識 或是程式語言,其中我認為最重要的就是獨立思考的能力,幫助我能有自己的想 法。有鑒於得之於人者太多,在將要步入社會的這個時候,希望往後我能充分發 揮所學,回饋社會,並期許未來能有所貢獻。最後也希望這篇論文,能夠對社會 有一點點的幫助。再次謝謝文中提及到的人,謝謝你們,我畢業了!爽啦!!!. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v.
(4) 摘 要 重大傷病是我國全民健康保險的重要特色之一,透過社會保險的風險分擔機 制,病患享有免部分負擔等優惠,降低因為罹病帶來的財務負擔,但重大傷病同 時也成為全民健保的主要支出項目。民國 102 年領取重大傷病證明者不過 98 餘 萬人(約總人口的 4%) ,但其一年的醫療費用多達一千五百多億元(接近總支出 的 27%) ,平均每位重大傷病患者的醫療費用約為平均值的 7.34 倍,其中癌症又 是重大傷病中人數最多者,大約佔了 49%(資料來源:衛生福利部中央健康保險. 政 治 大 未來隨著人口老化,全民健保支出也將跟著上升。 立. 署) 。因為許多重大傷病的發生率、盛行率與年齡成正比(黃泓智等人,2004),. 本文使用全民健保資料庫,探討近十年重大傷病(尤其是癌症)趨勢,估計. ‧ 國. 學. 重大傷病的年齡別發生率、死亡率,評估人口老化對全民健保造成的影響,其中. ‧. 承保資料檔(ID) 、重大傷病檔(HV)為本研究主要的依據資料。而由於健保資. y. Nat. 料庫的資料種類及數量龐雜,在初期資料的偵錯及處理上非常重要但也相當費時,. er. io. sit. 至於發生率、死亡與否的判斷亦十分棘手,因此過程中我們將一一說明資料分析 步驟及注意事項。本文發現癌症及重大傷病的盛行率逐年上升,但發生率並沒有. al. n. v i n 明顯變化,加上近年癌症死亡率幾乎不變 , C h (但台灣全體國民的死亡率逐年遞降) engchi U 因為台灣的人口老化,預期未來罹患癌症人數會逐年增加,癌症將繼續蟬聯十大. 死因之首,但罹癌死亡率的下降也可發現近年醫療進步所造成的影響。此外,我 們也考量隨機死亡模型(Lee-Carter Model) ,發現無論是癌症死亡率、或是罹癌 死亡率都有不錯的估計結果。而在文末也提出癌症病患的就醫行為以供後續研究 者參考。. 關鍵詞:全民健保資料庫、重大傷病、癌症、人口老化、Lee-Carter 模型. I.
(5) Abstract Catastrophic illness (CI) is one of the key features of Taiwan’s National Health Insurance (NHI). Through risk-sharing mechanisms of social insurance, it can reduce the financial burden of the CI patients since treating the CI is usually expensive. However, the CI also becomes a major expenditure item of NHI. The people receiving the CI card are just 0.98 million in 2013 (about 4% of the total population), but their smedical costs are over 150 billion NT dollars (nearly 27% of total expenditures). The. 政 治 大 (Source: Department of Health and National Health Insurance Agency). Because the 立. average medical cost per CI patient is about 7.34 times of the national average.. incidence and prevalence rates increase with age (Huang et al, 2004), the total NHI. ‧ 國. 學. expenditure is expected to increase in the future due to population aging.. ‧. This study intends to use the NHI database, including the records of personal. sit. y. Nat. identification and out-patient visit from all CI patients, to explore the incidence and. io. er. mortality rates, for example, of CI patients. Because the NHI database is big and messy, we shall first debug and clean them. Also, since the death of CI patients are not. al. n. v i n C h we propose a method fully reported in the NHI database, to identify the deaths and engchi U. use the official statistics to evaluate. The results show that the prevalence rates of all CI increased every year, but their incidence rates did not change significantly. The mortality rates of cancer patients also did not change much. Based on these findings, we expect the proportion of CI patients and their size will continue to grow. In addition, we applied the Lee-Carter model to the cancer mortality rates, and the fit is pretty good.. Keywords: National Health Insurance Database, Catastrophic Diseases, Cancer, Aging Population, Lee-Carter Model II.
(6) 目 錄 第一章 緒論 ................................................................................................................. 1 第一節 研究動機.................................................................................................. 1 第二節 研究目的.................................................................................................. 2 第二章 文獻回顧及研究方法 ..................................................................................... 5 第一節 文獻回顧.................................................................................................. 5 第二節 研究方法.................................................................................................. 6 第三章 資料庫探索 ................................................................................................... 10. 政 治 大. 第一節 資料庫介紹............................................................................................ 10 第二節 資料庫問題與限制................................................................................ 12. 立. 第三節 重大傷病及癌症之基本資料分析........................................................ 14. ‧ 國. 學. 第四章 癌症死亡研究 ............................................................................................... 19 第一節 死亡判斷研究........................................................................................ 19. ‧. 第二節 癌症死亡人數計算方法........................................................................ 24 第三節 癌症死亡率............................................................................................ 30. Nat. sit. y. 第四節 罹癌死亡率............................................................................................ 34. er. io. 第五節 存活函數................................................................................................ 36 第六節 Lee-Carter 死亡率模型 ........................................................................ 37. al. n. v i n 第五章 癌症病患就醫研究 ....................................................................................... 42 Ch engchi U 第一節 癌症分類................................................................................................ 42 第二節 就醫行為................................................................................................ 48 第六章 結論與建議 ................................................................................................... 51 第一節 結論........................................................................................................ 51 第二節 研究限制與建議.................................................................................... 53 參考文獻...................................................................................................................... 55 附錄.............................................................................................................................. 58. III.
(7) 表目錄 表 1-1、健保資料庫檔案說明 .................................................................................... 3 表 2-1、MAPE 值評估標準 ........................................................................................ 9 表 3-1、健保資料庫容量概況 .................................................................................. 11 表 3-2、健保資料庫檔案概況 .................................................................................. 12 表 4-1、死亡註記欄位檢查 ...................................................................................... 19 表 4-2、持卡註記欄位檢查 ...................................................................................... 20. 政 治 大 表 4-4、死亡欄位問題整理 ...................................................................................... 22 立 表 4-3、退保欄位檢查 .............................................................................................. 21. 表 4-5、自訂死亡計算方法比較 .............................................................................. 22. ‧ 國. 學. 表 4-6、癌症病患就醫情形整理 .............................................................................. 23. ‧. 表 4-7、使用案件分類篩選死亡人數 ...................................................................... 26. y. Nat. 表 4-8、使用就診次數篩選估計死亡人數 .............................................................. 27. er. io. sit. 表 4-9、死亡人數篩選方法比較 .............................................................................. 27 表 4-10、估計準確度比較 ........................................................................................ 28. al. n. v i n 表 4-11、估計死亡人數性別準確率 29 C h ........................................................................ engchi U 表 4-12、MAPE 預測值 ............................................................................................ 41 表 5-1、癌症分類 ...................................................................................................... 42 表 5-2、癌症各種類分群(依發生率及死亡率) .................................................. 46 附表 1、HV 與 HV_CD 新增人數比較 .................................................................... 58 附表 2、HV 檔死亡未刪除情形 ................................................................................ 58 附表 3、死亡註記準確性........................................................................................... 58 附表 4、死亡日期錯誤範例....................................................................................... 59 附表 5、持卡註記準確性........................................................................................... 59 附表 6、退保準確性................................................................................................... 59 IV.
(8) 附表 7、癌症病患就醫情形....................................................................................... 60 附表 8、死前就醫次數............................................................................................... 60 附表 9、十大死因....................................................................................................... 61. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. V. i n U. v.
(9) 圖目錄 圖 1-1、癌症與一般病患平均就醫金額比較 ............................................................ 2 圖 3-1、各檔案重大傷病人數比較 .......................................................................... 13 圖 3-2、各檔案癌症人數比較 .................................................................................. 14 圖 3-3、重大傷病概況 .............................................................................................. 15 圖 3-4、癌症各年齡層盛行率 .................................................................................. 16 圖 3-5、癌症各年齡層發生率 .................................................................................. 17. 政 治 大 圖 4-1、初步癌症死亡人數比較 .............................................................................. 23 立 圖 3-6、癌症發生率比較 .......................................................................................... 18. 圖 4-2、死亡人數算法示意圖 .................................................................................. 24. ‧ 國. 學. 圖 4-3、死前就診次數分配 ...................................................................................... 25. ‧. 圖 4-4、各方法估計死亡人數比較 .......................................................................... 28. y. Nat. 圖 4-5、2009 年癌症各年齡層死亡人數比較 ......................................................... 29. er. io. sit. 圖 4-6、近年估計死亡人數與實際比值 .................................................................. 30 圖 4-7、衛福部公布癌症死亡率 .............................................................................. 31. al. n. v i n 圖 4-8、衛福部公布癌症各年齡層死亡率 .............................................................. 31 Ch engchi U 圖 4-9、癌症死亡率比較 .......................................................................................... 32 圖 4-10、估算癌症各年齡層死亡率 ........................................................................ 32 圖 4-11、死亡率比值比較 ........................................................................................ 33 圖 4-12、罹癌死亡率概況 ........................................................................................ 34 圖 4-13、各年齡層罹癌死亡率 ................................................................................ 35 圖 4-14、存活函數比較 ............................................................................................ 36 圖 4-15、台灣死亡率與 L-C 模型參數估計 ............................................................ 38 圖 4-16、台灣死亡率與 L-C 模型配適情形 ............................................................ 38 圖 4-17、癌症死亡率(公布)與 L-C 模型參數估計 ............................................. 39 VI.
(10) 圖 4-18、癌症死亡率(公布)與 L-C 模型配適情形 ............................................ 39 圖 4-19、罹癌死亡率(推估)與 L-C 模型參數估計 ............................................ 40 圖 4-20、罹癌死亡率(推估)與 L-C 模型配適情形 ............................................ 40 圖 5-1、癌症各種類盛行率 ...................................................................................... 43 圖 5-2、男性癌症各種類盛行率 .............................................................................. 43 圖 5-3、女性癌症各種類盛行率 .............................................................................. 44 圖 5-4、整體癌症各種類發生率死亡率分佈 .......................................................... 44 圖 5-5、男性癌症各種類發生率死亡率分佈 .......................................................... 45. 政 治 大 圖 5-7、存活函數概況 .............................................................................................. 47 立 圖 5-6、女性癌症各種類發生率死亡率分佈 .......................................................... 45. 圖 5-8、性別存活函數 .............................................................................................. 47. ‧ 國. 學. 圖 5-9、癌症病患就醫行為 ...................................................................................... 48. ‧. 圖 5-10、癌症病患每人平均就醫點數 .................................................................... 49. y. Nat. 圖 5-11、癌症病患每次平均就醫點數 .................................................................... 50. n. al. er. io. sit. 附圖 1、各年存活函數圖........................................................................................... 61. Ch. engchi. VII. i n U. v.
(11) 第一章. 緒論. 第一節 研究動機 我國全民健康保險自 1995 年開始實施,凡是具有中華民國國籍,在台灣地 區設有戶籍滿四個月以上之民眾都必須參加全民健康保險(以下簡稱健保),目 前健保的納保率已達 99%(全民健康保險研究資料庫1) 。其中重大傷病是我國健 保的主要特色之一,為了減輕民眾負擔,凡是符合行政院衛生福利部(以下簡稱 衛福部)公告的「重大傷病」類別者,均可申請重大傷病證明,通過審核者就醫. 政 治 大 慢性精神病、…等。其中癌症是重大傷病就醫人數最多的類別,也是衛福部公告 立. 可享有免部分負擔;目前公告的重大傷病範圍分為 30 類,包含癌症、尿毒症、. ‧ 國. 學. 的第一大類重大傷病,截至 2013 年 11 月,共發出 48 餘萬張癌症類別的重大傷 病卡,約佔全部重大傷病就醫人數 49%,每年近 552 億元用於治療癌症患者。. ‧. 「癌症」是「惡性腫瘤」的俗稱,是指人體內不正常的細胞增生,因為生長. sit. y. Nat. 速度快,而影響到其他正常的組織器官,導致出血、疼痛或喪失功能等症狀(癌. al. er. io. 症基金會2)。根據衛福部的資料,癌症近 30 年來位居國人十大死因之首,對國. v. n. 人健康造成深遠影響,在 2013 年 2 月 4 日的世界癌症日上,世界衛生組織「國. Ch. engchi. i n U. 際癌症研究署」發表的「世界癌症報告3」更指出,全球每年癌症新增病例已從 2008 年的 1270 萬人上升至 2012 年的 1410 萬人,且仍在持續增加,而 2010 年 全球耗費於癌症治療與相關照護的費用已高達 1.16 兆元,由此可見癌症對於健 康造成的傷害。 而在台灣,根據衛福部資料顯示,2009 年重大傷病項目所支付之醫療點數 共 1378 億,約佔全民健保總醫療點數之 26.9%,其中癌症佔全部重大傷病醫療 點數的 35%;2011 年重大傷病項目所支付之醫療點數為 1,504 億點,約占全國總. 1 2 3. 全民健康保險研究資料庫:http://nhird.nhri.org.tw/brief_01.htm 癌症基金會:http://www.cancer-fund.org/tc/cancer.html 世界癌症報告:World Cancer Report 2014 (http://www.iarc.fr/) 1.
(12) 醫療費用 27.2%。若維持此一趨勢,未來罹患重大傷病及癌症的人數及醫療需求 將繼續成長,對個人(及家庭)、國家帶來沈重的負擔。另外根據健保資料庫的 數據顯示,近年來癌症病患的平均就醫金額遠超過國人平均的就醫金額(圖 1-1) , 說明癌症對於國內醫療的影響,值得我們深入探討。. 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. 圖 1-1、癌症與一般病患平均就醫金額比較. 第二節 研究目的. Ch. engchi. i n U. v. 有鑑於此,本文以重大傷病為研究目標,欲探討其對國人健康的影響,其中 癌症長年來位居國人十大死因之首,因此將焦點放在癌症的發生率、死亡率。過 去國外有關癌症等的研究,大多受限於資料取得,樣本規模通常較小、且未必能 反映研究母體的結構(亦即樣本代表性) ,例如:Heinävaara (2002)的癌症研究中, 其資料抽取自 30 歲以上患者,但因為樣本數較少,可能會有誤差較大、以及抽 樣偏差的問題(例:富有者醫療資源較為充沛)。台灣因為有全民健保的社會保 險制度,不但納保率達到 99%,且重大傷病患者可免部分負擔,若使用全民健康 2.
(13) 保險研究資料庫(以下簡稱健保資料庫)為資料來源,較能避免抽樣偏差的問題, 預期本文的研究結果能套用至全臺灣居民。 健保資料庫是由中央健康保險局所負責管理,將身分欄位加密後,交由國衛 院製作成「全民健康保險研究資料庫」以供研究使用,本文使用此健保資料庫為 資料來源,使用檔案為基本資料檔,包含承保資料檔(ID)、重大傷病證明明細 檔(HV)及重大傷病門診處方及治療明細檔(HV_CD),而這三個檔案皆為普 查檔。由於各個檔案皆需要與政府機關購買申請才得以做為研究用途使用,因此 文中使用到的各檔案因申請因素會造成持有年份會有所差異,各檔案的詳細說明. 政 治 大. 如表 1-1 所示。. 立 表 1-1、健保資料庫檔案說明 承保資料檔(普查檔). HV. 重大傷病證明明細檔. 2002~2011 1997~2001、. HV_CD. 重大傷病門診處方及 治療明細檔. 2007~2011. 當年投保人的投保資料。 當年重大傷病卡的領卡資料。 當年持有重大傷病卡的人之就 診紀錄。. n. al. er. io. sit. Nat. 1996~2011. 檔案說明. y. ID. ‧ 國. 持有年份. ‧. 中文檔名. 學. 英文檔名. i n U. v. 我國健康保險制度自 2003 年五月,由以往的紙本健保卡改為統一使用健保. Ch. engchi. IC 卡4,自此健保資料庫的品質獲得改善,因此本文使用近十年之資料,分析台 灣重大傷病的變化趨勢,有別於先前研究使用 2000 年前後的資料(例如:黃泓 智等人,2004)。因為癌症是重大傷病的最大宗,本文以癌症的盛行率、發生率 及死亡率為主要探討項目,並經由配適 Lee-Carter 死亡率模型及觀察癌症病患的 就醫行為,希望能藉此推估出癌症對國人的影響。 本文在第二章將先回顧與重大傷病有關的研究,並說明本文使用的研究方法, 包括盛行率、發生率、死亡率等計算量,及介紹常用的參數死亡模型(Lee-Carter 死亡模型)。此外,由於健保資料庫的內容龐雜。第三章除了介紹健保資料庫的. 4. 衛生福利部中央健康保險署:http://www.nhi.gov.tw 3.
(14) 基本特性,也說明資料庫的問題及處理步驟(如:偵錯等初步資料處理),以及 資料庫的後續分析方法,包括癌症的盛行率、發生率及相關的基本資料分析。另 外也因健保資料庫缺乏完整的死亡記錄,本文在第四章也將使用健保資料庫找出 判斷病患是否死亡的方法,以彌補無法取得衛福部死因檔的不足,並與衛福部公 布之資料比較,以客觀的外部資料來驗證我們的方法;接著使用此方法來探討癌 症病患的死亡率趨勢及使用使用隨機死亡模型(Lee-Carter 死亡模型)評估未來 死亡率的變化。第五章則針對癌症的罹病部位及人數將癌症分類,並觀察癌症病 患的就醫行為,包括存活函數及罹癌後的就診次數,以利於對癌症病患做全面性. 政 治 大. 的分析。在最後第六章會提出本文的結論,並說明本文的研究限制與後續研究的 建議方向。. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 4. i n U. v.
(15) 第二章 文獻回顧及研究方法 第一節 文獻回顧 參考過去國外的癌症研究,Heinävaara (2002)所使用的資料來源為 1968 年到 1996 年 30 歲以上患者的抽樣資料來做為分析,而如同緒論所述,抽樣資料的問 題在於樣本數較少,且可能發生抽樣偏差,無法代表母體的情況,且因為國外的 罹病情況與台灣不一定相似,並不能代表全體國人的醫療行為。 朱淑惠(2006)提到,政府長期皆有出版醫療相關的統計刊物,但各醫院所. 政 治 大 版之各年度「癌症登記報告」中,其登記資料雖然已經涵蓋全台灣地區的民眾, 立 出版之癌症統計資料,多僅侷限於該院病患的就醫資料,而行政院衛生福利部出. 然而其僅以五十床以上的醫療院所為資料蒐集對象,對於未符合五十床以上的醫. ‧ 國. 學. 療院所,其癌症就醫資料,並未納入癌症登記報告中。而文中也使用健保資料庫. ‧. 做為資料來源,但所使用的資料年度較早(1996 年~2003 年),且使用的檔案為. y. Nat. HV_DD (重大傷病住院醫療費用清單明細檔)及 DD (住院醫療費用清單明細檔),. 題,需經由事先處理才能抓出我們所需要的資料。. al. er. io. sit. 為本文研究團隊沒有申請到的檔案。文內也指出,健保資料庫的欄位存在許多問. n. v i n 黃瑞笙(2013)提出的女性乳癌相關研究,其資料來源同樣也是使用健保資 Ch engchi U. 料庫,而資料的使用年份則為 2003 年到 2009 年。但文中提到死亡日期的的欄位. 格式存在問題,無法藉此來判斷死亡時間,另外也提到,HV 檔中會存在未註銷 的問題。而文中對於死亡人數的計算方式則參考游智涵(2012)所提出,使用死 亡註記來做為計算,但因為健保資料庫中的死亡日期會有沒註記到的情形,因此 使用下列方式修改 1.病患最後一次的出院記錄,轉歸代碼為病危出院、死亡、自 殺則採用出院日期改為病患的死亡日期;2.若病患在 DD 檔中並未被註記死亡, 則採用 ID 檔之退保日期改為病患的死亡日期;3.若前兩檔案均無日期,則採用 HV 檔中之死亡註記日期。. 5.
(16) 從這些相關研究中,我們相信使用全民健保資料庫做為資料來源是可行的, 且可以充分代表全體國人的就醫行為,本文為了研究的準確性採用近十年的資料 做為分析。但由其他文獻可知,健保資料庫存在著許多問題需要處理,像是會有 欄位註記與說明不相符的情形發生。其他文獻所提到的重大傷病死亡人數算法為 使用死亡註記欄位來做計算,但使用本團隊的資料庫發現,HV 檔的死亡註記欄 位人數過少,要藉使用欄位來判斷死亡人數會有些偏差,因此本文有別於過去研 究,會詳細說明的資料庫處理過程,且提出其他方法來計算死亡人數並驗證方法 的準確性。. 立. 第二節 研究方法. 政 治 大. ‧ 國. 學. 有鑑於衛福部只公布大類別的數據,像是癌症發生率及死亡率等,並沒有公 布人數較少的疾病之數據,因此本文決定使用健保資料庫做為資料來源,以供更. ‧. 深入的了解病患的就醫行為,而本文所應用到之研究方法,為參考有關癌症醫學. sit. y. Nat. 書籍以及期刊,了解癌症之盛行率、發生率、死亡率,並經由配適 Lee-Carter 死. al. er. io. 亡率模型及觀察癌症病患的就醫行為,以觀察癌症病患的罹病情況。. v. n. 由於健保資料庫的內容繁雜,本研究會先針對健保資料庫的內容進行偵錯及. Ch. engchi. i n U. 整併處理,找出適合的方式來從健保資料庫取得數據,而實證分析的資料計算方 式如下:. 一、盛行率 盛行率的計算方式為參考衛福部定義的計算方法,用來計算當年疾病的盛行 程度,計算如下:. 盛行率 =. 當年該疾病人數 全台人數. 6.
(17) 二、發生率 發生率的計算方式依照定義,為發生新個案的人數除以有此風險的人口數, 本文考慮健保資料庫的使用情況,將發生率的計算方法定義如下:. 發生率 =. (當年該疾病人數 − 當年有得該病且前兩年有該病史人數) (全台人數 − 暴露人數). 其中暴露人數的定義與分子的被減項相同,為當年投保健保且於前兩年有病史之 人數。而式中「當年有得該病且前兩年有該病史」是代表前兩年中只要有一年罹. 政 治 大 排除部份復發的病患進入計算中,經與衛福部資料比較後也有較高的準確性。 立. 患該疾病便會計算到,此方法可包含到較只使用前一年有病史更多的人數,且可. ‧ 國. 學. 三、癌症死亡率. ‧. 本文為了使用健保資料庫算出的死亡人數與衛福部的數據做比較,以確定算. er. io. sit. y. Nat. 法的準確性,因此癌症死亡率算法與衛福部的定義相似,如下:. n. 癌症死亡人數 a癌症死亡率 = iv l C 全台人數 n hengchi U. 其中,衛福部公布的癌症死亡率之分子,為計算死因為癌症的病患人數,而本文 因考慮健保資料庫的處理問題,分子為使用健保資料庫找出的計算方式計算出的 癌症病患死亡的人數(不論死因為何)。. 四、罹癌死亡率 另外,本文想要了解病患罹患癌症後死亡的危險性,觀察這些病患有多少機 率會死亡,因此定義罹癌死亡率的算法如下:. 7.
(18) 罹癌死亡率 =. 癌症死亡人數 癌症病患人數. 其中癌症死亡人數及癌症病患皆為使用健保資料庫所計算出之數據來做計算。. 五、Lee-Carter 模型 關於死亡率的模型,國外已有相當多的探討,以 Lee and Carter (1992)所提出 的 Lee-Carter 模型最廣為使用,模型參數淺顯易懂,配適效果也相當不錯,模型 如下:. 立. 𝑙𝑛(𝑚𝑥𝑡 ) = 𝛼𝑥 + 𝛽𝑥 𝜅𝑡 + 𝜀𝑥𝑡. 政 治 大 , 𝑥 = {𝑥 , 𝑥 , … , 𝑥 } , 1. 2. ℎ. 𝑡 = {𝑡1 , 𝑡2 , … , 𝑡𝑛 }. ‧ 國. 學. 此模型中 𝑚𝑥𝑡 表示 𝑥 年齡組人口在 𝑡 年時的中央死亡率, 𝑥 之下標 ℎ 表示. ‧. 有 ℎ 個年齡層,可以分為年齡組或是單年齡的資料。 𝑡 之下標 𝑛 表示有 𝑛 個. y. Nat. 年代。 𝛼𝑥 、 𝛽𝑥 、 𝜅𝑡 為欲估計之參數,參數 𝛼𝑥 指年齡對於死亡率之平均影. io. sit. 響,參數 𝛽𝑥 指在同一年度內,年齡對死亡率的影響,參數 𝜅𝑡 指年度對死亡率. er. 的影響, 𝜀𝑥𝑡 為平均數 0、變異數 𝜎𝜀 2 的隨機誤差項。 𝛼𝑥 為中央死亡率的對. al. n. v i n 數的平均值,而造成死亡率的惡化或改善來自於 𝛽 𝜅 。為了在模型的參數估計 Ch e n g c h i U𝑥 𝑡 中得到唯一解,Lee-Carter 模型同時進行以下假設:. ∑ 𝛽𝑥 = 1 , 𝑥. ∑ 𝜅𝑡 = 0 𝑡. Lee-Carter 模型參數的估計方法可分兩大類,第一種是非概似估計方法,主要包 括奇異值分解法(Singular value decomposition ; SVD)和最小平方法(Ordinary least squares ; OLS),第二種是概似估計方法,應用最多的是最大概似估計法 ( Maximum likelihood estimation ; MLE )。 本 文 將 使 用 奇 異 值 分 解 法 作 為 Lee-Carter 模型的參數估計,此方法的估計步驟如下: 8.
(19) 𝑡𝑛. 1. 第一步:𝛼̂𝑥 = log ∏ 𝑚𝑥𝑡 ℎ ,其中 ℎ = 𝑡1 − 𝑡𝑛 𝑡=𝑡1 min(ℎ,𝑘). 第二步:𝑧𝑥𝑡 = log𝑚𝑥𝑡 − 𝛼̂𝑥 =. ∑ 𝑠𝑖 𝑢𝑖 (𝑥)𝑣𝑖 (𝑡) 𝑖=1. 利用 SVD 分解 𝑧𝑥𝑡 得到 𝑠𝑖 、 𝑢𝑖 (𝑥) 與 𝑣𝑖 (𝑡) ,其中 𝑠𝑖 、 𝑢𝑖 (𝑥) 與 𝑣𝑖 (𝑡) 表 示單一值(Singular value)以及左側與右側的單一向量(Singular vector) 。 (翁宏 明與曾奕翔,2010) 本文將使用全台死亡率、衛福部公布的癌症死亡率及健保資料庫估算出之罹. 政 治 大 Absolute Percentage Error Test) 做為檢定模型之好壞的標準,主因為 MAPE 是相 立 癌死亡率配適模型,以評估未來死亡率的變化。另外,也將使用 MAPE (Mean. 對數值,不受測量值與預估值的單位與大小影響,能夠客觀得獲得兩者間的差異. ‧ 國. 學. 程度。在此,模型的適合度我們採用 MAPE 檢定模型之優劣,MAPE 的定義如. ‧. 下(Lewis ,1982):. n. Ch. y. sit. io. al. 𝑖=1. er. Nat. 𝑛. |𝑦𝑖 − 𝑦̂| 1 𝑖 MAPE = ∑ × 100% 𝑦𝑖 𝑛. engchi. 其中, 𝑦𝑖 為第 i 個死亡率觀察值. i n U. v. 𝑦̂𝑖 為第 i 個死亡率估計值 n 為觀察值個數 Lewis (1982) 依據 MAPE 值來檢視模型的適合度與預測能力,將 MAPE 值的大 小分為四個等級,如表 2-1 所示 表 2-1、MAPE 值評估標準 MAPE 值. 10%以下. 模型預測能力. 準確. 10%~20% 優良. 9. 20~50% 合理. 50%以上 低.
(20) 第三章. 資料庫探索. 本章節從資料庫的內容著手,先呈現我們使用的健保資料庫中各檔案的概況, 進而探討健保資料庫會存在什麼問題,並說明我們健保資料庫的使用方式,最後 使用整理過後的資料來做基本資料分析,其中包含發生率及盛行率,而由於癌症 死亡率的探討牽扯到計算癌症死亡人數較為複雜,將放在下一章節來做描述。. 第一節 資料庫介紹. 政 治 大 康保險局所負責管理,民國 87 年委託國家衛生研究院建置健保資料庫,自民國 立 本研究將使用全民健康保險資料庫為資料來源,全民健保資料庫是由中央健. 89 年起正式開放資料庫給各界單位申請使用。在每年的年中健保署會將前一年. ‧ 國. 學. 的健保資料選取可供研究使用的檔案匯出,將身分欄位加密後,交由國衛院製作. ‧. 成「全民健康保險研究資料庫」及各加值資料檔案。其中的資料分為抽樣檔及母. y. Nat. 體檔兩大類,若母體較小(如重大傷病人口),則提供母體檔,而若母體較大(如全. er. io. sit. 國保戶),則提供抽樣檔。每個檔案資料欄位名稱和資料描述,在「譯碼簿」中 有詳細的說明。本文所使用的健保資料庫檔案為普查檔,包含 ID 檔、HV 檔及. n. al. Ch. HV_CD 檔,各檔案介紹如下:. engchi. i n U. v. 一、承保資料檔:ID (2002 年~2011 年) 當年所有投保人的投保資料,包含 ID、性別、出生日期、加保日期、退保 日期、加退保別…等欄位。其中 ID 檔 2002 年的資料為歷史資料,包含 1996 年 ~2002 年的紀錄,自 2003 年起開始提供在保及停保紀錄。. 二、重大傷病證明明細檔:HV (1997 年~2001 年、2007 年~2011 年) 當年重大傷病卡的領卡資料,包括 ID、重大傷病卡類別、申請日期、死亡 註記、死亡日期…等欄位。 10.
(21) 三、重大傷病門診紀錄檔:HV_CD (1996 年~2011 年) 當年持有重大傷病卡的人之就診紀錄 (有可能是看普通疾病),包括 ID、ICD9、 就醫日期、就醫金額…等欄位。. 資料庫各檔案詳加說明後,我們觀察各檔案的資料概況如下表 3-1: 表 3-1、健保資料庫容量概況 ID. HV. HV_CD. 政 治 大. 資料筆數 記憶體(GB) 資料筆數 記憶體(GB) 資料筆數 記憶體(GB) 1996. 立. 1999. 0.71. 4,821,312. 3.34. 988,862. 0.69. 6,115,871. 4.24. 1,043,563. 0.77. 7,288,350. 5.06. 1,109,357. 0.91. 8,539,223. 5.93. 1,311,013. 1.12. 10,062,997. 6.98. 15.19. 11,897,596. 7.57. 2003. 25,130,194. 5.33. 8.64. 2004. 25,002,871 25,941,824. 5.50. v n i 17,829,677. 10.36. 2005. al. 2006. 26,336,050. 5.58. 18,550,542. 11.79. 2007. 26,619,007. 5.64. 1,518,127. 1.43. 17,946,211. 12.45. 2008. 26,970,225. 5.72. 1,583,690. 1.46. 19,173,919. 13.30. 2009. 27,223,008. 5.77. 1,785,961. 1.65. 20,357,193. 14.12. 2010. 27,509,909. 7.03. 1,923,757. 1.83. 21,619,442. 15.00. 2011. 27,841,406. 5.74. 1,996,987. 1.90. 22,861,178. 15.86. er. 13,591,212. 5.30. 16,287,990. n. 合計. io. 71,657,446. y. Nat. 2002. sit. 2001. 877398. ‧. 2000. 2.43. 學. 1998. ‧ 國. 1997. 3,823,415. 66.79 GB. Ch. engchi U. 12.47 GB. 11.34. 148.39 GB. 由上表即可發現健保資料庫的檔案十分龐大,因此本文使用 SQL Server 軟 體做為資料庫處理軟體,使用此軟體的好處為操作快速、可處理大量資料及具有 11.
(22) 資料保護措施。並使用轉碼過後的身分證字號串聯健保資料庫的檔案,以藉此觀 察病患的就醫行為。而觀察各檔案的資料筆數如下表 3-2 所示: 表 3-2、健保資料庫檔案概況 ID 人數. HV 人次. 人數. HV_CD 人數 人次. 人次. 2007. 26,421,498 26,619,007 1,103,431 1,453,483. 649,106. 17,946,211. 2008. 26,780,636 26,970,225 1,164,465 1,529,866. 678,544. 19,173,919. 2009. 27,067,952 27,223,008 1,276,315 1,733,251. 712,828. 20,357,173. 2010. 27,369,795 27,509,909 1,350,786 1,863,254. 746,746. 21,619,442. 2011. 27,699,442 27,841,406 1,401,449 1,933,455. 779,179. 22,861,178. 政 治 大 可看出各年度 HV 檔人數皆較 HV_CD 檔多出許多,從 HV 檔的人數與人次差異, 立. ‧ 國. 學. 可知道同一名病患可能會領兩張以上的重大傷病卡,從 HV_CD 檔的人數與人次, 可算出重大傷病每人平均就診次數為 27 次~30 次,最後從 HV 檔與 HV_CD 檔的. er. io. sit. Nat. 理,在下一節會做探討,並提出處理方法及使用方式。. y. ‧. 人數差異可以發現,此兩檔案的人數不相符,可能會存在一些問題尚需研究及處. 第二節 資料庫問題與限制 a. n. iv l C n h eHV_DD(重大傷病病患住院醫療費用清單明 由於本研究未能取得死因檔及 ngchi U. 細檔),無法藉由與死因檔串檔找出病患確切的死因甚至是確認該病患是否已死 亡,也無法與 HV_DD 檔做串檔來觀察重大傷病病患的住院行為。因此本研究中 之就診次數及就醫行為的發現,皆只使用 HV_CD 檔做為觀察。而從上一節的說 明中可以看出健保資料庫存在一些問題需先處理,以確保資料方便使用,經過整 理後可發現,健保資料庫中與本研究有關的問題大至可分為兩個,一是死亡相關 欄位的可用性,另外一個則是 HV 檔與 HV_CD 檔的差異。而本節將針對 HV 檔 與 HV_CD 檔的差異做探討,找出計算各疾病人數的方法,以利於盛行率和發生 率的計算。至於死亡欄位的部份將放在第四章癌症死亡研究做深入的探討。 12.
(23) 前面的資料庫介紹中觀察到,HV 檔的人次及人數與 HV_CD 檔人數不相符, 可能原因有三: 1. 病患領有多張重大傷病卡,因一名病患可能同時持有多張不 同的重大傷病卡; 2. HV 檔的舊紀錄未註銷,代表該病患可能已死亡或康復, 不再持有重大傷病卡但 HV 檔卻仍保留其紀錄; 3. 因住院而領證,代表該病患 並無經過門診,只有住院資料即領到重大傷病卡。第一種情況會造成 HV 檔人次 多出 HV 檔人數與 HV_CD 檔人數許多,而第二與第三種情況皆會造成 HV 檔整 體人數多出 HV_CD 檔人數許多。本文因未能取得住院紀錄,因此針對「舊紀錄 未註銷」做檢查,使用此兩檔案的新增人數觀察(見附表 1),發現新增人數相. 政 治 大 原因在第四章會提到),檢查 HV 檔是否會有已經死亡的病患仍存在檔案中的情 立 近,而使用「隔兩年皆未就診」來做為計算死亡人數的計算方法(使用此方法之. 形,可發現 HV 檔中確實可能會有判定死亡的病患未刪除(見附表 2)。因此本. ‧ 國. 學. 文傾向使用 HV_CD 檔做為計算疾病人數的依據,兩檔案的人數與實際領證數比. ‧. 較如下圖所示:. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-1、各檔案重大傷病人數比較. 13.
(24) 由上圖可看出使用 HV_CD 檔計算出的人數會較 HV 檔更接近衛福部公布的實際 領證數,而會稍微低估的原因除了未取得 HV_DD 檔可能造成的差異外,也可能 是因為同一人可以領多張重大傷病卡,所造成人數與人次不同的差異。而若針對 癌症病患做分析,則各檔案人數的比較如圖 3-2 所示:. 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. n. a圖l 3-2、各檔案癌症人數比較i v n Ch U engchi 可以發現使用 HV_CD 檔計算癌症人數也十分準確,低估的部分可能是人數與人 次的差異造成(因為衛福部公布的是領證數),因此本文將使用 HV_CD 檔是否 罹患過該疾病做為計算各疾病人數的方法,以利於進行後續盛行率與發生率計 算。. 第三節 重大傷病及癌症之基本資料分析 在確定了資料庫的使用方式後,由於衛福部並沒有公布整體重大傷病的盛行 率及發生率情形,因此本文將使用 HV_CD 檔來計算整體重大傷病的盛行率與發 生率概況,並將癌症單獨做計算且與衛福部公布之資料做比較。 14.
(25) 盛行率的計算公式如下:. 盛行率 =. 當年該疾病人數 全台人數. 發生率的計算公式如下:. 發生率 =. (當年該疾病罹病人數 − 當年有得該病且前兩年有該病史人數) (全台人數 − 暴露人數). 立. 政 治 大. 上述的暴露人數的定義與分子的被減項相同,為當年投保健保且於前兩年有病史. ‧ 國. 學. 之人數。將重大傷病的各疾病盛行率及發生率作圖,圖中由於其他疾病的盛行率 相較於前幾大類小許多,因此圖中不放入,如下圖 3-3 所示:. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. 圖 3-3、重大傷病概況. 15. v.
(26) 上圖可以看出癌症不論是盛行率還是發生率皆高居重大傷病之首,而各疾病 的盛行率皆呈現上升的趨勢,盛行率前四大的疾病依序為癌症、慢性精神病、尿 毒症、全身性自體免疫症候群。另外,急性腦血管的發生率有上升的趨勢,慢性 精神病的發生率逐年下降,其他疾病的發生率皆呈現穩定的現象。接著觀察各年 齡層癌症的盛行率(如圖 3-4) ,可看出各年度的癌症盛行率皆隨著年齡而增加, 約在 80 歲達到最高點。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i n U. 圖 3-4、癌症各年齡層盛行率. engchi. 16. v.
(27) 政 治 大 圖 3-5、癌症各年齡層發生率 立. ‧ 國. 學. 另外,觀察癌症各年齡層的發生率(圖 3-5) ,可看出各年度的癌症發生率皆 隨著年齡而增加,約在 80 歲達到最高點。接著,由於衛福部會公布癌症的發生. ‧. 率,因此我們使用由健保資料庫計算出之數據與衛福部公布的數據作比較,比較. y. Nat. sit. 結果如圖 3-6。可看出各年齡層所畫出之發生率情形與實際公布之數值類似,且. n. al. er. io. 皆隨著年齡層增加。而我們也可以看到,衛福部公布的發生率與我們使用健保資. i n U. v. 料庫算出的發生率大至相同,也再次驗證了使用 HV_CD 檔來做計算的結果十分. Ch. engchi. 優良,健保資料庫的資料品質佳。. 17.
(28) 政 治 大 立圖 3-6、癌症發生率比較. ‧ 國. 學. 根據以上的分析結果,我們發現癌症的盛行率逐年增加,發生率卻無明顯上 升,但在高年齡層有些微上升的情形,可能代表因壽命延長而積極就醫。若死亡. ‧. 率也無明顯的上升趨勢,則可能是由於人口老化所導致這個情形,因此我們將接. y. Nat. n. er. io. al. sit. 著分析癌症的死亡情形。. Ch. engchi. 18. i n U. v.
(29) 第四章. 癌症死亡研究. 在前一章以健保資料庫計算出之數據觀察癌症的盛行率與發生率後,可發現 使用健保資料庫算出之數值皆與衛福部公布之數據相當接近。若估計出之死亡率 也可與衛福部公布之數據相仿,即代表使用健保資料庫得出之結論有很大的可信 度,而本研究礙於無法使用死因檔,因此將在資料有限的情形下,只使用 HV_CD 檔找出取得癌症死亡病患的方法。. 第一節 死亡判斷研究. 政 治 大 依照健保資料庫的譯碼簿說明,可發現以下四個欄位與死亡有關,分別為 立. HV 檔的 DEATH_MARK(死亡註記) 、DEATH_DATE(死亡日期) 、CARD_MARK. ‧ 國. 學. (持卡註記)及 ID 檔的 ID_OUT_TYPE(退保別)或 TX_CODE(異動別) ,其. er. io. sit. y. Nat. 結果。. ‧. 中 ID 檔的這兩個欄位是由於資料年份不同所導致,而以下為這四個欄位的檢查. 一、HV:DEATH_MARK (死亡註記). al. n. v i n 依照健保資料庫的譯碼簿之說明,此欄位代碼為 Y 代表死亡。因此我們使 Ch engchi U. 用 HV 檔 2007 年之資料來檢查死亡註記的情形,來觀察此欄位是否適合用來做 為判斷死亡的標準,檢查結果如下表 4-1 所示: 表 4-1、死亡註記欄位檢查 死亡註記. [空白]. 0. 1. 2. 3. 4. 人數. 675,923. 288,325. 35,353. 136,591. 10,184. 15,820. 死亡註記. 5. 6. 7. 8. 9. Y. 人數. 9,382. 9,015. 9,641. 6,892. 11,828. 7,517. 19.
(30) 可發現此欄位存在除了 Y 之外之代碼,而這些代碼因健保資料庫的譯碼簿上未 做說明,且搜尋過相關資料也沒有發現,不知這些代碼代表意義為何。但與其他 文獻不同的是,本團隊的資料庫發現死亡註記為 Y(代表死亡)的人數在 2007 年為 7,517 人,這與整體重大傷病的死亡人數不相符(衛福部公布之 2007 年癌 症死亡人數就已達到 40,306 人) ,故無法用來計算重大傷病死亡人數。但註記為 Y 的這些人之後皆沒有就診紀錄(見附表 3),這顯示此欄位的正確性很高,應 可確定該病患在當年或隔年之前即已死亡。因此死亡註記欄位可用來做為判斷當 年是否已死亡之依據。. 政 治 大 二、HV:DEATH_DATE(死亡日期) 立. 依照健保資料庫的譯碼簿之說明,此欄位之欄位格式應為日期格式,代表. ‧ 國. 學. YYYYMMDD,即前四碼為年份,第五、六碼為月份,最後兩碼為日期。檢查. ‧. 結果發現此欄位資料格式與譯碼簿之說明不符,無法判別,而欄位錯誤比例接近. er. io. sit. y. Nat. 100%,無法使用,附表 4 為資料一隅。. 三、HV:CARD_MARK(持卡註記). al. n. v i n 依照健保資料庫的譯碼簿之說明,此欄位代碼為 2 代表死亡註銷,而其他代 Ch engchi U. 碼說明分別代表 [空白]:有效正常卡、1:重複、2:死亡註銷、3:換卡註銷、 4:逾期註銷、5:更正/補發註銷、6:撤銷卡證。我們使用 HV 檔 2007 年之資 料來觀察持卡註記欄位的分布情形,如下表 4-2 所示: 表 4-2、持卡註記欄位檢查 持卡註記. [空白]. 0. 1. 2. 3. 4. 人數. 177,517. 523,358. 249,209. 144,219. 47,804. 16,146. 持卡註記. 5. 6. 7. 8. 9. 人數. 21,233. 13,354. 18,814. 25,668. 27,232. 20.
(31) 可發現此欄位存在譯碼簿上未說明之未知代碼(0、7、8、9),且搜尋過相關資 料也沒有發現,不知這些代碼代表意義為何。而 HV 檔 2007 年代碼為 2(代表 死亡註銷)的這些病患在往後有很高的比例會再就診(見附表 5),因此無法用 來判斷是否死亡。. 四、ID:ID_OUT_TYPE(退保別)、TX_CODE(異動別) 依照健保資料庫的譯碼簿之說明,2002 年~2009 年的承保紀錄檔是使用退保 別欄位,而 2010 年~2011 年之資料則將加保別與退保別這兩個欄位整合為異動. 政 治 大 依照代碼說明,退保包含死亡、服刑、失蹤、喪失投保條件,因此我們決定先使 立. 別欄位,退保別欄位代碼為 1 代表退保、異動別欄位代碼為 08 也代表退保,而. 用 ID 檔 2007 年之資料來觀察退保是否可用來判斷死亡,退保別欄位的分布情形,. 表 4-3、退保欄位檢查. 1. 39,479. 315. 5. al. 10,801. n. 2. Ch. 667. 11,088. engchi U 740. 693,235. sit. 662,935. 404. er. 595,737. io. [空白]. y. 當年就診人數 隔年就診人數 隔兩年就診人數. Nat. 退保別. ‧. ‧ 國. 學. 如下表 4-3 所示:. v ni. 12,640 930. 可發現退保的人在隔年有就診的比例很低(約 0.8%) ,但隔兩年仍會有就診紀錄 (見附表 6),且人數為 39,479 人這也與整體重大傷病的死亡人數不相符,因此 退保別與異動別欄位只可用來做為判斷是否當年死亡之輔助標準,但可能會發生 錯判的情形。. 五、其他方法研究 從以上結果可以發現,本研究觀察的這些關於死亡之欄位皆無法用來計算重 大傷病的死亡人數,各個欄位的缺失可整理成表 4-4 所示。從表中可知只有死亡 21.
(32) 註記欄位與退保可幫助判斷該病患是否死亡,但只依據這些資料判斷病患是否死 亡,與衛福部公佈的結果相差非常多,必須找出其他方法判斷,接下來繼續說明 本文的判斷方法。 表 4-4、死亡欄位問題整理 欄位名稱. 欄位格式. 之後會就診比例. 準確性. 趨近於 0. 可判斷該病患是否死亡. DEATH_MARK 會有未知代碼 DEATH_DATE. 錯誤. 無法使用. X. CARD_MARK. 會有未知代碼. 高. ID_OUT_TYPE. 正確. 低. X 可判斷該病患是否已死亡. 政 治 大. 由於重大傷病多半是不容易痊癒的疾病,我們認為若未繼續就診,即有可能. 立. 代表該病患死亡,因此我們考慮使用 HV_CD 檔的就診紀錄來觀察,以「隔年未. ‧ 國. 學. 就診」或「隔兩年皆未就診」做為準則,希望藉此計算重大傷病的死亡人數,而. ‧. 使用 HV_CD 檔 2007 年之資料來計算,此兩種方法的比較結果如下表 4-5 所示:. y. 人數(認為死亡) 下一年就診人數 誤判比例. sit. Nat. 表 4-5、自訂死亡計算方法比較 11,780. 10.88%. al. 96,490. 4,955. v ni. 5.14%. n. 隔兩年皆未就診之病患. Ch. engchi U. er. 108,270. io. 隔年未就診之病患. 可發現使用「隔兩年皆未就診」做為判斷標準的誤判率會比使用「隔年未就 診」的誤判率低,而我們前面研究過 DEATH_MARK (死亡註記)的準確率很高, 因此我們使用死亡註記為 Y 且當年有就診隔年未就診的人數中,觀察有多少人 會包含在「隔兩年皆未就診」的人數中,可發現全部的病患皆會包含在「隔兩年 皆未就診」中,因此使用此方法來判斷死亡具有十分高的準確率,且計算出之死 亡人數也較使用健保資料庫的欄位計算出的人數可信(因使用健保資料庫的欄位 計算出之死亡人數太低),而若使用此方法來計算癌症的死亡人數,與衛福部公 布數據的比較如下圖 4-1 所示: 22.
(33) 政 治 大. 立. ‧ 國. 學. 圖 4-1、初步癌症死亡人數比較. ‧. 可看出衛福部公布的癌症的死亡人數逐年上升,但在 2008 年有稍微下降的情形。 經調查可能原因是 2008 年起政府所公布的死因表開始採用 ICD-10-CM 來登記所. y. Nat. io. sit. 導致(2008 年以前為使用 ICD-9-CM) 。我們也可以發現使用「隔兩年皆未就診」. n. al. er. 這個方法所估算的癌症死亡人數較公布人數多,但相差不會太多。而我們針對癌. Ch. i n U. v. 症病患的就醫行為進行研究,將 2005 年癌症病患做為觀察對象,觀察其往後四. engchi. 年就醫情形,如附表 7,若病患在有罹病紀錄的下一年沒有癌症的就診紀錄但在 再下一年有,則計算在「隔一年未就診之後在就醫」的人數中,依此類推,而可 將附表 7 整理成表 4-6 所示: 表 4-6、癌症病患就醫情形整理 就醫情形. 人數. 持續就醫. 比例. 127,326 49.27%. 隔一年未就診之後再就醫. 14,448. 5.59%. 隔兩年皆未就診之後再就醫. 3,782. 1.46%. 隔三年皆未就診之後再就醫. 1,179. 0.46%. 其他. 111,704 43.22% 23.
(34) 可發現使用「隔兩年皆未就診」來做為判斷死亡的方法,只有約 2%的病患之後 會再就診(代表痊癒或復發),誤判比例會很低,因此「隔兩年皆未就診」這個 方法可以用來初步判斷癌症病患是否死亡。但這結果似乎仍有高估,這可能因為 我們計算出的人數代表的是癌症病患死亡(不論死因)及痊癒的人數,而衛福部 公布的死亡人數是癌症病患死於癌症的人數,示意情形如下圖 4-2 所示:. 死於癌症 癌 症 病 患. 死於其他 非積極治療. 立. 衛福部公布 我們的算法 (隔兩年皆未就診). 政 治 大. 圖 4-2、死亡人數算法示意圖. 學. ‧ 國. 持續就醫. ‧. 表示「隔兩年皆未就診」這個算法可能會計算到「非積極治療」的病患,這些病. y. Nat. n. al. er. io. 亡人數多出許多。. sit. 患可能是痊癒或是不再繼續就診,但卻會被計算到死亡人數中,導致估計出的死. Ch. engchi. i n U. v. 第二節 癌症死亡人數計算方法. 在確定了「隔兩年皆未就診」這個方法在判斷癌症病患是否死亡有很高的準 確性後,我們想要加入篩選方法來將「非積極就醫」的病患剔除,並希望能與衛 福部公布之數據更一致,因此提出以下三種方法,希望能找到適合的判斷依據。. 一、死前就醫次數 根據連宏銘(2000)提到,癌症病患在死亡前可能會有醫療使用頻繁的情 況發生,而李大正(2011)也提到,病患在死亡前的就醫金額會有增加的情形。 24.
(35) 以這個想法為基礎,我們認為若病患接近死亡,則其他在死前應會有較為密集的 就醫情形發生,因此我們將 HV_CD2007 檔分成兩個部分,分別為判定死亡的病 患和未死亡的病患,來探討這兩個群體之間的就醫次數有無差異。 第一部分的病患為使用先前研究發現較為確定死亡的兩個欄位:退保別為 1 及死亡註記為 Y。並將有兩個註記的人之就診記錄挑出做為第一群樣本,而這群 患者又可依照是否罹患癌症來分為一般死亡病患及癌症死亡病患兩部分。觀察這 些病患最後一筆就醫紀錄前各個月份的就診次數,可發現不論是否罹患癌症,病 患越接近死亡(最後一次就醫)則就診次數越多(見附表 8)。. 政 治 大 取其中一萬名病患做為樣本,來觀察這些人的就診次數。與第一部分的病患不同 立 第二部分的病患為扣除上述病患之資料,而由於病患人數眾多,因此我們抽. 的是,因為這些病患尚未死亡,故沒有最後一筆就診紀錄,因此我們選擇使用當. ‧ 國. 學. 年全年的就診次數除以 12 來估計一個月的就診次數,結果顯示未死亡病患平均. ‧. 每月的就診次數為 2.3 次,標準差為 2.55。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. 圖 4-3、死前就診次數分配. 25. v.
(36) 將兩部分的就診次數整理,如圖 4-3 所示,圖中虛線為標準差之值。而由圖 可發現判定死亡的病患在死前之平均就診次數與一般病患有所差異,表示即將死 亡的病患確實會有密集就醫的情形,因此加入「就診次數」有助於篩選死亡人數。. 二、HV_CD:CASE_TYPE (案件分類) 依照健保資料庫譯碼簿的說明,此欄位代碼為 04 代表西醫慢性病(不含結 核病) 、代碼為 08 代表慢性病連續處方調劑,此兩個代碼較符合癌症病患的特徵, 因此我們使用這兩個代碼做為篩選,來觀察是否可以用來估計癌症死亡人數,依. 政 治 大. 照「隔兩年皆未就診」且符合這個條件來做為篩選,如表 4-7 所示:. 立. 表 4-7、使用案件分類篩選死亡人數. ‧ 國. 人數. 學. 方法. 隔兩年皆未就診 and CASE_TYPE = 04. 36,644. 隔兩年皆未就診 and CASE_TYPE = 08. 1,530. ‧. 隔兩年皆未就診 and CASE_TYPE = 04 or 08. Nat. y. 37,213. io. sit. 經檢驗在隔兩年皆未就診 and CASE_TYPE = 04 or 08 的這些人中,共有 24,127. n. al. er. 人的退保別為 1 或死亡註記為 Y (癌症病患中退保別為 1 或死亡註記為 Y 的總人. i n U. v. 數有 28,265 人),故使用此方法來篩選可能會造成誤判,且由於 2007 年衛福部公. Ch. engchi. 布之癌症死亡人數為 40,306 人,使用此方法做為篩選的人數也較少,因此並不 適用。. 三、十大死因 因衛福部公布的死亡人數算法為癌症病患因癌症死亡的人數,而本文使用健 保資料庫的算法則為計算癌症病患是否死亡,而不論其死亡原因為何(因無法判 斷),但考慮到癌症病患可能並非死於癌症,故想使用最後一筆就診紀錄的疾病 為十大死因做為篩選條件,觀察是否能較為精確的估計死亡人數。參考 2008 年 至 2012 年的國人十大死因及其所對應之 ICD-9-CM 做為篩選條件(見附表 9), 26.
(37) 使用「隔兩年未就診且最後一筆就診紀錄為十大死因」計算出的人數為 47,483 人,而由於 2007 年衛福部公布之癌症死亡人數為 40,306 人,可發現加入此條件 無法減少足夠的人數,篩選並無達到實際效果,因此使用十大死因做為篩選條件 並不適合。. 經過上述的篩選條件的探討後,我們可以發現只有「就診次數」可以用來幫 助篩選癌症死亡人數,則找出該如何定義最後一筆就診紀錄前的就醫次數來判斷 該病患是否死亡成為了現在重要的課題。本文將「隔兩年皆未就診」之癌症病患. 政 治 大 表 4-8) ,藉此觀察估計的死亡人數,希望能找到定義死前就醫次數的條件。 立. 最後一筆就診紀錄前一個月及兩個月的就診次數大於等於該數值之人數列出(如. ‧ 國. 次數. 1. 2. 3. 學. 表 4-8、使用就診次數篩選估計死亡人數. 4. 5. 6. ‧. 前兩個月大於等於該次數之人數 47,976 44,552 39,877 34,593 31,950 30,004 前一個月大於等於該次數之人數 47,976 43,199 36,912 29,401 25,764 23,106. y. Nat. er. io. sit. 由於 2007 年衛福部公布之癌症死亡人數為 40,306 人,與上表比對後可發現, 最後一筆就診紀錄前一個月的就醫次數大於等於 2 次或 3 次的人數與實際死亡人. al. n. v i n Ch 數相當接近,而三次則恰好較一般病患的平均每月就診次數(2.32 次)多,因此 engchi U. 我們考慮使用最後一筆就診紀錄前一個月的就醫次數大於等於 2 次或 3 次做為篩 選方式,藉此用來估計癌症死亡人數。將目前可使用的幾種方法做比較,希望能 得到較為精準的死亡人數估計法,表 4-9 為使用就診次數來做篩選的結果。 表 4-9、死亡人數篩選方法比較 方法. 2005 2006 2007 2008 2009. 公布死亡人數. 37,222 37,998 40,306 38,913 39,917. 隔兩年皆未就診. 41,875 44,473 48,219 51,980 54,907. 隔兩年皆未就診&死前一個月 > = 2 次. 37,042 39,931 43,199 46,615 49,338. 隔兩年皆未就診&死前一個月 > = 3 次. 31,619 34,303 36,912 39,877 42,195. 27.
(38) 可發現使用「隔兩年皆未就診且最後一筆就醫紀錄前一個月的就診次數大於等於 三次」這個方法來估計公布的癌症死亡人數,在各年與實際死亡人數的比值皆相 當接近,如下圖 4-4。我們也可以發現,使用此方法來判斷死亡的誤判比例會較 使用「隔兩年皆未就診」更低,如表 4-10 所示:. 政 治 大. 立. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. 圖 4-4、各方法估計死亡人數比較. Ch. engchi. i n U. v. 表 4-10、估計準確度比較 方法. 隔兩年皆未就診 判斷死亡. 估計人數. 48,219. 36,912. 隔兩年未就診之後再就醫人數. 2,182. 1,088. 隔三年未就診之後再就醫就診人數. 2,256. 1,132. 誤判比例. 0.092. 0.0601. 接下來,我們比較衛福部公布的死亡人數與健保資料庫的估計死亡人數在男 女及各年齡層的準確度。由於衛福部的十大死因人數只能查到 2008 年以後分性 別的死亡人數,因此我們針對 2008 年及 2009 年的資料來做比較,可發現使用此 28.
(39) 方法來估計男性的死亡人數十分準確,但估計女性會準確度較差,如表 4-11 所 示。接著為了比較各年齡層估計的準確性,我們針將各年齡層公布死亡人數與估 計死亡人數比較(如圖 4-5) 。可看出低年齡層的死亡人數會高估而高年齡層會有 些微低估的情形,但大致上各年齡層的估計死亡人數都和公布死亡人數接近。 表 4-11、估計死亡人數性別準確率 年度. 男性. 女性. 公布. 估計. 差距比例. 公布. 估計. 差距比例. 2008. 24,972. 23,838. 4.54%. 13,941. 16,039. 15.05%. 2009. 25,284. 24,873. 1.63%. 14,634. 17,322. 18.37%. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-5、2009 年癌症各年齡層死亡人數比較 而對近年各年度的年齡層死亡率作圖比較,如圖 4-6。可看出各年齡層的估 計死亡人數與公布死亡人數趨勢相近,而 75~84 歲這個區間估計的十分準確,到 了 85 歲以上就會出現低估的情形。因此,根據「隔兩年未就診且死前一個月就 醫次數大於等於三次」這個估計方法算是相當準確,故本文將使用此方法來計算 癌症死亡人數。. 29.
(40) 立. 政 治 大. ‧. ‧ 國. 學. 圖 4-6、近年估計死亡人數與實際比值. 第三節 癌症死亡率. y. Nat. sit. 根據上一節定義的癌症死亡人數計算方式,我們可以藉此計算出癌症的死亡. n. al. er. io. 率並與衛福部公布的數值做比較,而癌症死亡率的計算公式如下:. Ch. i n U. v. e n g癌症死亡人數 chi. 癌症死亡率 =. 全台人數. 首先我們將衛福部公布的各年度的死亡率整理成下圖 4-7,圖中可以發現癌症的 死亡率逐年在上升但在 2008 年有下降的情形。此狀況的原因在前面提過,可能 是因 2008 年起政府所公布的死因表開始採用 ICD-10-CM 來登記所導致(之前為 使用 ICD-9-CM) 。而標準化死亡率則持平幾乎不變,在 2008 年起也有下降的情 形,這與未標準化前相同,至於未標準化前的死亡率上升則可能是因為人口老化 所導致。. 30.
(41) 立. 政 治 大. 圖 4-7、衛福部公布癌症死亡率. ‧ 國. 學. 接著觀察各年齡層的死亡率(圖 4-8) ,從這張圖也可以看出,公布的癌症各. ‧. 年齡層死亡率在各年度間並無明顯差異。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-8、衛福部公布癌症各年齡層死亡率. 31.
(42) 再來我們使用先前研究出的方法,用來計算癌症死亡率並與衛福部公布的數 據比較,如圖 4-9。可看出前幾年的死亡率會低估,近幾年的死亡率則相當接近。 可能原因是自 2003 年以後統一改為使用健保 IC 卡,使資料品質獲得改善導致。. 立. 政 治 大. ‧ 國. 學 圖 4-9、癌症死亡率比較. ‧. y. Nat. 因 2003 年之後之資料較為準確且資料年份眾多,故以下的圖將使用 2003. n. er. io. al. sit. 年開始,以每隔兩年畫一條線,如下圖 4-10 所示:. Ch. engchi. i n U. v. 圖 4-10、估算癌症各年齡層死亡率 32.
(43) 可看出各年度的死亡率無明顯的變化,這與實際死亡率的情形相同,接著將估計 的結果與公布死亡率做比較,如下圖 4-11 所示:. 立. 政 治 大. y. ‧. ‧ 國. 學. Nat. er. io. al. sit. 圖 4-11、死亡率比值比較. v. n. 可看出各年齡層的估計癌症死亡率與公布癌症死亡率相近,因此使用「隔兩年未. Ch. engchi. i n U. 就診且死前一個月就醫次數大於等於三次」這個方法計算癌症死亡人數,之後估 計出的癌症死亡率會與公布的數值十分接近,因此使用本文提出的方式可用來估 計癌症死亡率。另外,因衛福部並不會公布較為細項的癌症死亡率,無法得知各 類癌症的死亡情形,但因本團隊可使用健保資料庫來做分析,可藉由其中的 HV_CD 檔來觀察病患罹患何種癌症,並使用本文定義的癌症死亡人數計算方法, 進而算出各種類癌症的死亡率,以利於更深入了解罹患何種癌症對病患而言會有 較大的風險。. 33.
(44) 第四節 罹癌死亡率 前面兩節提到,使用「隔兩年皆未就診且最後一筆就診紀錄前一個月就醫次 數大於等於三次」計算出的癌症人數會與衛福部公布的數值十分接近,因此可使 用此方法來估計癌症死亡的人數。而本文在這一節想要探討癌症病患罹癌之後的 死亡率有多少,相信這也是大眾皆在意的議題,但又因衛福部只有公布近年的癌 症總領證數而不是癌症病患的人數,另外也沒有分性別及年齡層的數據,且會有 人數不等於人次的問題,因此本文將使用健保資料庫的 HV_CD 檔觀察病患有無 就診過癌症,藉此來計算出癌症病患的人數並算出罹癌死亡率,希望能用來觀察. 政 治 大. 病患罹患癌症之後,有多高的死亡風險。罹癌死亡率的計算方法如下:. 立. 癌症病患人數. ‧. ‧ 國. 癌症死亡人數. 學. 罹癌死亡率 =. 首先畫出近年的罹癌死亡率,如圖 4-12 所示:. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. 圖 4-12、罹癌死亡率概況 34. v.
(45) 可看出男性的罹癌死亡率較女性高。而若將各年度分年齡層的罹癌死亡率畫圖, 如圖 4-13 所示。可以發現罹癌死亡率隨著年齡層有上升的情形,而從兩張圖皆 可看出近年的罹癌死亡率有下降的趨勢。. 立. 政 治 大. n. er. io. al. sit. y. ‧. ‧ 國. 學. Nat. 圖 4-13、各年齡層罹癌死亡率. i n U. v. 從這邊我們可以發現與上一節不一樣的結果,估算的癌症死亡率有上升的趨. Ch. engchi. 勢,但罹癌死亡率卻在下降,造成此差異的原因可能是分母不同導致,因為癌症 死亡率的分母是使用全台人口,而罹癌死亡率的分母為使用癌症病患人數,若全 台人口的成長較癌症死亡人數少,而癌症死亡人數的成長較癌症病患少即有可能 導致此情況。另外,罹癌死亡率下降所代表的意義我們推測是因為醫療不斷的進 步,使得癌症病患罹癌後可能會較早發現並提早治療,也可能因為醫療的改善導 致癌症病患罹癌後的死亡率也隨之下降。. 35.
(46) 第五節 存活函數 本節我們想要探討,若病患罹患癌症後,還有多久的存活機率。在這邊我們 使用「前兩年未就診過癌症但當年有就診癌症」做為初次罹患癌症的人數算法, 而本文第四章提出,以「隔兩年皆未就診且最後一筆就診紀錄前一個月就醫次數 大於等於三次」做為死亡判斷條件可找出癌症死亡病患,將此兩種方法應用在一 起,觀察 2005 年初次罹癌的病患,可得出以下存活函數(圖 4-14)。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-14、存活函數比較 可看出我們估計出的存活函數會較衛福部公布的數值略高一些,這有可能是 因為衛福部存活函數的估計多為使用在醫院觀察到的病患來做追蹤,以此篩選到 的樣本病情可能會較為嚴重所導致。而我們使用 2005 年~2009 年的資料做檢查, 發現各年度的存活函數皆呈相同的趨勢(如附表 10),應可避免資料疏失的問 題。. 36.
(47) 第六節 Lee-Carter 死亡率模型 經過癌症死亡率的計算後,我們可以對死亡率進行配模並預測,本文將針對 三筆死亡率數據配模,分別是台灣整體死亡率、衛福部公布的癌症死亡率即估算 的罹癌死亡率三種,以推估未來可能的趨勢。而死亡率的模型可分為靜態和動態 兩種,靜態死亡率模型主要包括 Gompertz (1825) 提出的 Gompertz 模型、 Makeham (1860) 以 Gompertz 模型為基礎改良的 Makeham 模型以及 Helligman (1980) 針對不同年齡群體提出的分年齡靜態死亡率模型(HP 模型)。而考慮到 死亡率變動的不確定性以及死亡率變動與年齡、時間的相關性,本文將使用 Lee. 政 治 大 點為明顯易懂,配適效果也相當不錯,模型如下: 立 𝑙𝑛(𝑚𝑥𝑡 ) = 𝛼𝑥 + 𝛽𝑥 𝜅𝑡 + 𝜀𝑥𝑡 ,. 學. ‧ 國. and Carter (1992) 所提出的一個動態死亡率模型(Lee-Carter Model),此模型優. 𝑥 = {𝑥1 , 𝑥2 , … , 𝑥ℎ } , 𝑡 = {𝑡1 , 𝑡2 , … , 𝑡𝑛 }. ‧. 此模型中 𝑚𝑥𝑡 表示 𝑥 年齡組人口在 𝑡 年時的中央死亡率, 𝑥 之下標 ℎ 表示. y. Nat. sit. 有 ℎ 個年齡層,可以分為年齡組或是單年齡的資料。 𝑡 之下標 𝑛 表示有 𝑛 個. n. al. er. io. 年代。𝛼𝑥、 𝛽𝑥、 𝜅𝑡 為欲估計之參數,參數 𝛼𝑥 指年齡對於死亡率之平均影響,. i n U. v. 參數 𝛽𝑥 指在同一年度內,年齡對死亡率的影響,參數 𝜅𝑡 指年度對死亡率的影. Ch. engchi. 響, 𝜀𝑥𝑡 為平均數 0、變異數 𝜎𝜀 2 的隨機誤差項。𝛼𝑥 為中央死亡率的對數的平 均值,而造成死亡率的惡化或改善來自於 𝛽𝑥 𝜅𝑡 。 首先,將全台灣整體死亡率配適模型,參數的估計情形如圖 4-15,配適情形 如圖 4-16。接著使用衛福部公布的癌症死亡率配適模型,參數的估計情形如圖 4-17,配適情形如圖 4-18。從 L-C 模型的參數估計來看,可以發現癌症死亡率與 全台死亡率的趨勢大致上相同,除了癌症的高年齡層之外所有疾病及癌症的死亡 率都有改善,但癌症的死亡改善率沒有整體的死亡改善率好。另外,全台死亡率 在低年齡層改善較多,而癌症死亡率可發現在高年齡層的死亡率惡化,與全台情 形不一致。 37.
(48) 立. 政 治 大. ‧ 國. 學. 圖 4-15、台灣死亡率與 L-C 模型參數估計. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-16、台灣死亡率與 L-C 模型配適情形. 38.
(49) 立. 政 治 大. ‧ 國. 學. 圖 4-17、癌症死亡率(公布)與 L-C 模型參數估計. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-18、癌症死亡率(公布)與 L-C 模型配適情形. 39.
(50) 最後使用估算出的罹癌死亡率配適模型,參數估計情形如圖 4-19,而模型的 配適情形如圖 4-20 所示:. 立. 政 治 大. ‧. ‧ 國. 學. 圖 4-19、罹癌死亡率(推估)與 L-C 模型參數估計. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-20、罹癌死亡率(推估)與 L-C 模型配適情形. 40.
(51) 從 Lee-Carter 模型的參數估計可看出罹癌的死亡率也在改善,而在高年齡層改善 的程度較低。另外與衛福部公布的癌症死亡率配模不同的是,公布的癌症死亡率 配模結果顯示高年齡層的癌症死亡率有惡化的情形,可能原因在前面提過,可能 是分母不同所導致。而以模型的預測能力而言,表 4-12 列出了這三個模型的 MAPE 值,可以看出這三個模型皆具有高準確的預測能力。但從圖 4-16 與圖 4-18 的 𝜅𝑡 估計來看,由於沒有一個明顯的趨勢,似乎無法藉此推估未來癌症死亡率 及罹癌死亡率的變化。 表 4-12、MAPE 預測值. MAPE 值(%) 治 政 台灣整體死亡率配適 Lee-Carter 模型 大 2.57 立 衛福部公布癌症死亡率配適 Lee-Carter 模型 3.01 模型. 推估罹癌死亡率配適 Lee-Carter 模型. ‧. ‧ 國. 學. 3.24. n. er. io. sit. y. Nat. al. Ch. engchi. 41. i n U. v.
(52) 第五章. 癌症病患就醫研究. 經過第四章的研究,我們可以透過健保資料庫計算出癌症的死亡人數,並計 算出癌症死亡率及罹癌死亡率,以探討近年來癌症病患的死亡趨勢。而本章節將 以健保資料庫觀察癌症病患的就醫行為,包括將癌症依照罹癌部位分類來探討各 種類癌症的危險性,並提出癌症病患自罹癌到死亡的就醫行為,希望能藉此觀察 出特殊的情形並提供後續研究者一些研究的動機與想法。. 第一節 癌症分類. 政 治 大 依照衛福部國際疾病傷害及死因分類標準將癌症分為八大類,而本文依照此 立. 分類方式為標準,再依照其罹癌部位及該癌症所佔比例,進而將癌症分為十大類,. 表 5-1、癌症分類. al. sit. 155-159 腹內器官 160-165 呼吸及胸內器官. v ni. n. 170-176. 比例. 35,496 11.7%. er. io. 140-149 唇、口腔及咽喉 150-154 消化器. 人數. y. 分類項目. Nat. ICD9. ‧. ‧ 國. 學. 如下表 5-1 所示:. Ch. engchi U 骨、結締組織、皮膚、乳房及卡波西氏肉瘤. 63,038 20.7% 33,893 11.1% 25,070. 8.2%. 60,886 20.0%. 179-184 女性生殖器 185-187 男性生殖器. 30,646 10.1% 15,784. 5.2%. 188-189 泌尿系統 190-199 其他及未明示位置. 19,826. 6.5%. 200-208 淋巴及造血組織. 15,678. 37,075 12.2% 5.2%. 依照上表的分類方式,我們對這十大類的癌症盛行率做圖,如下圖 5-1,接著分 性別來觀察,男性的癌症十大類盛行率如圖 5-2,女性的癌症十大類盛行率如圖 5-3 所示:. 42.
(53) 政 治 大. 立圖 5-1、癌症各種類盛行率. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 5-2、男性癌症各種類盛行率. 43.
(54) 政 治 大 圖 5-3、女性癌症各種類盛行率 立. ‧ 國. 學. 可看出消化器的癌症盛行率很高,但男女的罹癌情形有所差別,男性以消化 器、口腔及腹內器官佔大多數,而女性則以乳癌盛行率最高,其次是女性生殖器. ‧. 及消化器,可見這些癌症是值得多加注意的類別。接著,若將這十大類的癌症依. y. Nat. n. er. io. al. sit. 照發生率與死亡率分類,如下圖 5-4 所示:. Ch. engchi. i n U. v. 圖 5-4、整體癌症各種類發生率死亡率分佈 44.
數據
Outline
相關文件
利用 Microsoft Access 資料庫管理軟體,在 PC Windows 作業系 統環境下,將給與的紙本或電子檔(如 excel
本次修正是因藥物 Canagliflozin 詴驗團隊發布之 安全性資訊更新資料顯示,比較使用詴驗藥物 Canagliflozin
根據國民健康署統計資料顯示,食道癌 發生率在台灣地區每年約有 2000 多名新 病例發生,於 2017
(四)於結訓後一百二十日 TIMS
共集放大器 MATLAB 分析. CC
近年科技業工程師、客運業駕駛、保全人員及醫療機構醫師等接連發
減少身體脂肪、降低患上癌症、心血管疾病和糖尿病的風險、促
减少身体脂肪、降低患上癌症、心血管疾病和糖尿病的风险、促