第三章 資料庫探索
第三節 重大傷病及癌症之基本資料分析
國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
14
由上圖可看出使用 HV_CD 檔計算出的人數會較 HV 檔更接近衛福部公布的實際 領證數,而會稍微低估的原因除了未取得 HV_DD 檔可能造成的差異外,也可能 是因為同一人可以領多張重大傷病卡,所造成人數與人次不同的差異。而若針對 癌症病患做分析,則各檔案人數的比較如圖 3-2 所示:
圖 3-2、各檔案癌症人數比較
可以發現使用 HV_CD 檔計算癌症人數也十分準確,低估的部分可能是人數與人 次的差異造成(因為衛福部公布的是領證數),因此本文將使用 HV_CD 檔是否 罹患過該疾病做為計算各疾病人數的方法,以利於進行後續盛行率與發生率計 算。
第三節 重大傷病及癌症之基本資料分析
在確定了資料庫的使用方式後,由於衛福部並沒有公布整體重大傷病的盛行 率及發生率情形,因此本文將使用 HV_CD 檔來計算整體重大傷病的盛行率與發 生率概況,並將癌症單獨做計算且與衛福部公布之資料做比較。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
15
盛行率的計算公式如下:
盛行率=當年該疾病人數 全台人數
發生率的計算公式如下:
發生率=(當年該疾病罹病人數 − 當年有得該病且前兩年有該病史人數) (全台人數 − 暴露人數)
上述的暴露人數的定義與分子的被減項相同,為當年投保健保且於前兩年有病史 之人數。將重大傷病的各疾病盛行率及發生率作圖,圖中由於其他疾病的盛行率 相較於前幾大類小許多,因此圖中不放入,如下圖 3-3 所示:
圖 3-3、重大傷病概況
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
16
上圖可以看出癌症不論是盛行率還是發生率皆高居重大傷病之首,而各疾病 的盛行率皆呈現上升的趨勢,盛行率前四大的疾病依序為癌症、慢性精神病、尿 毒症、全身性自體免疫症候群。另外,急性腦血管的發生率有上升的趨勢,慢性 精神病的發生率逐年下降,其他疾病的發生率皆呈現穩定的現象。接著觀察各年 齡層癌症的盛行率(如圖 3-4),可看出各年度的癌症盛行率皆隨著年齡而增加,
約在 80 歲達到最高點。
圖 3-4、癌症各年齡層盛行率
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
17
圖 3-5、癌症各年齡層發生率
另外,觀察癌症各年齡層的發生率(圖 3-5),可看出各年度的癌症發生率皆 隨著年齡而增加,約在 80 歲達到最高點。接著,由於衛福部會公布癌症的發生 率,因此我們使用由健保資料庫計算出之數據與衛福部公布的數據作比較,比較 結果如圖 3-6。可看出各年齡層所畫出之發生率情形與實際公布之數值類似,且 皆隨著年齡層增加。而我們也可以看到,衛福部公布的發生率與我們使用健保資 料庫算出的發生率大至相同,也再次驗證了使用 HV_CD 檔來做計算的結果十分 優良,健保資料庫的資料品質佳。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
18
圖 3-6、癌症發生率比較
根據以上的分析結果,我們發現癌症的盛行率逐年增加,發生率卻無明顯上 升,但在高年齡層有些微上升的情形,可能代表因壽命延長而積極就醫。若死亡 率也無明顯的上升趨勢,則可能是由於人口老化所導致這個情形,因此我們將接 著分析癌症的死亡情形。
‧
HV 檔的 DEATH_MARK(死亡註記)、DEATH_DATE(死亡日期)、CARD_MARK(持卡註記)及 ID 檔的 ID_OUT_TYPE(退保別)或 TX_CODE(異動別),其 中 ID 檔的這兩個欄位是由於資料年份不同所導致,而以下為這四個欄位的檢查 結果。
一、HV:DEATH_MARK (死亡註記)
依照健保資料庫的譯碼簿之說明,此欄位代碼為 Y 代表死亡。因此我們使