• 沒有找到結果。

其他變項因素定義

第三章 研究方法

第五節 其他變項因素定義

一、失眠暴露時間(exposure duration of insomnia)

針對流行病學劑量效應(dose-response relationship)的概念,追蹤失眠暴露時間 (duration)與T2DM發生風險的差異,因此,本論文將累計失眠暴露時間,意即在研 究期間,365天內3次有上述任一項失眠 ICD-9-CM 診斷碼,即計算暴露1年,以 此類推,累計暴露時間,計算暴露的累計時間。

二、安眠藥種類(hypnotics type)

依據安眠藥化學結構分類為BZDs、Non – BZDs 二類。BZDs 成分名稱包括 DIAZEPAM、CHLORDIAZEPOXIDE、CHLORDIAZEPOXIDE HCL、

MEDAZEPAM、OXAZEPAM、CLORAZEPATE DIPOTASSL、LORAZEPAM、

BROMAZEPAM、CLOBAZAM、PRAZEPAM、ALPRAZOLAM、OXAZOLAM、

NORDAZEPAM、FLUDIAZEPAM、LORMETAZEPAM、FLURAZEPAM (HCL)、

MIDAZOLAM、FLUNITRAZEPAM、ESTAZOLAM、TRIAZOLAM、

NITRAZEPAM、BROTIZOLAM、NIMETAZEPAM 等(附錄四)。

Non – BZDs 成分名稱包括三類,分別是 Zopiclone、Zaleplon、Zolpidem (林,

2003)。但先前研究結果,發現 Zolpidem 與血糖穩定性有關(Gramaglia et al., 2014),

另外,基於臨床實務經驗興趣,因此,本論文將Zolpidem 獨立分出成為另外一組(附 錄四)。除了僅用 BZDs、僅用 Non–BZD、僅用 Zolpidem 三組外,再增加一 Mixed 組(使用超過一種以上的安眠藥) 。

根據BZDs 上述成分名稱,進入衛福部中央健康保險署,利用健保用藥品項 網路查詢服務(http://www.nhi.gov.tw/query/query1.aspx),依序輸入各組「成分名 稱」,查詢藥品代碼,建構成附錄四,由資深藥師檢覈過無誤,並已利用附錄四 的安眠藥的分類發表相關研究(Lin et al., 2015)。本論文定義在研究期間,只要曾使 用過安眠藥皆算列安眠藥使用。

操作方式:將門診處方醫令明細檔 (Details of ambulatory care orders, OO) 的 葯品(項目)代號( DRUG_NO)中符合各項藥物申報代碼,利用選擇觀察值中「當如

果滿足設定條件」選出,未滿足條件則刪除,然後新增變項,然後利用6 個索引

碼串聯CD 檔,而串檔採用之變項計有費用年月(FEE_YM )、醫事機構代號 (HOSP_ID)、申報日期(APPL_DATE)、申報類別(APPL_TYPE)、案件分類 (CASE_TYPE )、流水號(SEQ_NO),將 OO 檔匯入 CD 檔。

三、研究族群人口學特性

(一)、年齡(age)

自門診處方及治療明細檔 (CD)所紀錄之「出生日期」,與最後一次門診日期 相減換算為研究對象年齡。計算方式如下:(門診日期年+月/12)-出生年月+月/12)。

參考先前研究對年齡分層(Lai et al., 2013),依序為青年(40 歲)、中年(41-65 歲)

及老年(65 歲以上),區分為 3 組。

(二)、性別(sex)

自門診處方及治療明細檔 (CD)所紀錄「性別」欄位,欄位為「M」為男性,

「F」為女性。

(三)、共病症(comorbidity)

共伴疾病資料由門診處方及治療明細檔 (CD) 中的變項 ICD9CM_CODE、變 項ICD9CM_CODE_1、變項 ICD9CM_CODE_2、變項 ICD9CM_CODE_3,即在研 究期間,一年 (365 天內)3 次有下述任一項共病症 ICD-9-CM 診斷碼,代表有共

病症。共病症則參考先前研究(Lai et al., 2013; Lin et al., 2015),將可能的共病症 (comorbidity) 列於下表。

Table 3-1 Comorbidities in ICD-9-CM

Comorbidities ICD-9-CM Anxiety 300.00 Depression 296.2, 296.3, 300.4, 311

COPD 490-496

CVD 410–414 Hypertension 401–405

Hyperlipidemia 272

Heart failure 428

Obesity 278

Stroke 430–438

(四)、都市化程度(Urbanization level):

在NHIRD 中,地理相關的變項僅有以鄉鎮市區為地理單位的投保地與就醫地 (醫療院所所在地),並不包含被保險人居住或生活所在的地理區位資訊(林、楊、

溫,2011)。目前使用 NHIRD 進行的相關研究,當需要估計鄉鎮層次的居住地變 項來探究地理位置差異對於健康狀態的影響時,常以被保險人投保地或被保險人 的就醫所在地地,透過被保險人就醫地點的位置來推估其居住地。因台灣就醫可 近性高,社區民眾不是太嚴重的疾病,其就醫處往往選擇距離較近的醫療院所(吳,

2004),因此推估其居住地時,納入此概念,或許能反映社區民眾的居住地所在,

而在都市化程度越高的鄉鎮,此方法估計結果越佳(林、楊、溫,2011)。本論文透 過被保險人最後一次就醫地點的醫療院所位置來推估其居住地。再參考學者劉等 人將台灣地區359 個鄉鎮市區依據分成七個都市化程度之集群(1.高度都市化市 鎮、2.中度都市化市鎮、3.新興市鎮、4.一般鄉鎮市區、5.高齡化市鎮、6.農業市鎮、

7.偏遠鄉鎮)( 劉、洪、莊、陳、翁、劉、梁,2006),再參考先前研究(Hsu, et al., 2013) 將等級1-3、4-5、6-7,合併為都市化程度高、中、低三個等級。

操作方式:由醫事機構資料基本資料檔(HOSB 檔),利用醫事機構代號(HOSP_ID) 串聯CD 檔,然後匯入 HOSB 檔的縣市區碼 (AREA_NO_H)至 CD 檔。

Figure 3-3 the flowchart of study sample selection from National Health Insurance Research Database in Taiwan

第六節 研究資料庫信、效度

台灣健保自1995 開辦以來,歷經初期各項制度建立的萌芽期及資料的不完 整,疾病分類編碼錯誤率明顯偏高,隨著疾病分類系統的愈臻成熟,在其準確性 上皆有明顯的提升(張,2004),同時也發現近年來分析健保資料庫的學術性文章蓬 勃發展,其中不乏權威或著名的學術期刊,除提升各科醫學專業知識領域與公共 衛生流行病學的各項指標外,另外一方面也顯示台灣健保資料庫的有效性與穩定 性,資料品質呈現一定水準(Chen, Yeh, et al., 2011)。健保資料成為醫藥衛生相關領 域研究中具有代表性的實證資料,其研究成果可作為醫藥衛生政策的參考,為重 要的研究資源。同時顯示醫學巨量資料(big data)分析趨勢世代的來臨。

以下就針對台灣健保資料庫信度、效度,優勢與限制進行描述。

一、健保資料庫信度、效度

健保資料庫具有良好的信度與效度。Lin 等人利用郵寄問卷串聯健保資料庫的 糖尿病患者診斷碼的準確性,將兩者資料就交叉比對,發現健保資料庫中糖尿病 診斷的準確性為74.6%(Lin, et al., 2005)。Cheng 等人以南部一所醫學中心的出院 病歷串聯健保資料庫,發現糖尿病診斷的敏感度(Sensitivity)為 94%,陽性預測值 (Positive Predict Value, PPV)為 90%,特異性(Specificity) 95%,陰性預測值(Negative Predict Value, NPV)為 97%,顯示糖尿病診斷碼有相當高的準確性(Cheng, Kao, Lin, Lee, & Lai, 2011)。

張(2004)以隨機選取 600 名在北部某醫學中心住院的內科病人,利用經過訓練 之專業人員摘取既有疾病之資料並記錄,且隨機抽取100 份病歷進行信度檢測,

擷取此600 名病人之電腦申報資料,以 Kappa 檢定健保申報資料既有疾病診斷之 正確性,兩者資料中疾病一致性的整體Kappa 值介於 0.31-0.86 間;糖尿病 Kappa 值0.77,其診斷的敏感度 86.67%,陽性預測值為 77.12%,特異性 94.55%,陰性 預測值為97.10%,在人口學之變項(性別、年齡) Kappa 值在 95%以上。

Cheng 等人利用病歷與健保資料庫檢視缺血性中風診斷碼與 aspirin 的有效 性,發現缺血性中風(Ischemic stroke)診斷碼準確度達 94%,住院期間 aspirin 陽性 預測值為0.88(Cheng, et al., 2011)。上述資料顯示健保資料庫具有良好資料品質。

二、健保資料庫優勢

全民健保自開辦至今,已累積超過10 年的健保資料,有關健保資料庫特色包 括具代表性:自 1995 年 3 月全民健保開辦以來,至 2009 年已達 99.6%,涵蓋率高,

健保資料庫100 萬健保抽樣歸人檔具有隨機抽樣性質,與 2300 萬的母群在年齡、

性別、地區特性分布上並無顯著差異,顯示具國家級抽樣代表性及大樣本的特色(全 民健康保險研究資料庫,2013)。

因全民健保的涵蓋率高,使得健保資料成為醫藥衛生相關領域研究中具有代 表性的實證資料,其研究成果可作為醫藥衛生政策的參考,為重要的研究資源。

其次準確性:研究指出健保資料庫中的診斷碼資料的準確性介於 74.6-94%,診斷碼 的準確性與疾病型態、門診次數出現該診斷碼頻率及醫院等級有關(Lin, Lai, Syu, Chang, & Tseng, 2005)。長時期追蹤研究(panel data),涵蓋時間長達 17 年,資料是 屬於動態的,經過層層加密,可觀察其趨勢的發展與改變。

相關文件