資料處理與研究方法

在文檔中 以全民健保資料庫探討臺灣人口特性與變遷 - 政大學術集成 (頁 21-30)

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

第三章 資料處理與研究方法

目前臺灣官方的人口統計資料有兩大來源:戶籍人口與常住人口,兩者皆有 其特色及限制。戶籍人口來自於內政部統計月報資料,其特色為較多元,時間較 即時,但其戶籍地僅代表法令上的居住地,未必能夠反應人口真實的居住地。常 住人口來自於「人口及住宅普查」,普查表中問項包含「經常居住情形」(即為常 住地)能夠反映真實居住地;但每十年一次、成本高,使用頗多侷限。政府在分 配地方資源、施政規劃時,需要配合各地方的人口數及人口結構。因兩大資料都 有各自的限制,本文提出另一種可能的資料參考來源:全民健康保險研究資料庫。

臺灣目前全民健保納保率已達到 99%以上,全民健康保險研究資料庫(後稱 健保資料庫)的就醫資料成為醫學相關領域中最具有代表性的實證資料。除了醫 學相關領域外,人口研究對於健保資料庫的依賴程度也越來越高,其研究成果可 作為國家政策之參考,為重要的研究資源。自民國87 年起,中央健康保險局(現 改制為健保署)即委託國衛院推動「全民健康保險研究資料庫」之建置,經過兩 年籌備,國衛院自民國 89 年起提供學界健保資料庫加值服務,以利相關研究。

本研究使用國衛院的健保資料可分為三種:基本資料檔、承保抽樣歸人檔與 特殊需求檔;基本資料檔如:醫事機構基本資料檔(HOSB);承保抽樣歸人檔如:

承保資料(ID)、門診處方及治療明細檔(CD)等。每個檔之資料欄位名稱和資料描 述在「譯碼簿10」中有詳細的說明。

健保資料庫的資料量龐大,資料中出現輸入錯誤或是標示不明等問題相當常 見,因此本研究使用的資料庫已經過除錯、整合、正規化等處理,資料中異常的 部分已被排除,確保資料的正確性。

10 譯碼簿,資料來源:國家衛生院全民健康保險研究資料庫,http://nhird.nhri.org.tw/date_02.html

Registry for beneficiaries (ID檔)

2005-2012 承保資料檔(普查檔): 紀錄當年度投 保人的投保資料。

Catastrophicillnessdataset (HV_CD檔)

2005-2012 擷取門診處方及治療明細檔(CD),

欄位名稱為「部分負擔代號」,其 值為 001(重大傷病)之所有資 料。

Longitudinal Health Insurance Database 2005 (ID百萬人抽樣檔)

2005-2012 2005年承保抽樣歸人檔:在2005年,

從ID承保檔抽出100萬人,包含就診 紀錄、住院紀錄等資訊。

Registry for contracted medical facilities (HOSB檔)

2005-2012 醫事機構基本資料檔。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

將上呼吸道疾病(後稱感冒)的就醫地作為判斷為投保人口的居住地依據。

圖3-1、2005 年各鄉鎮市區之基層院所數(資料來源:HOSB 檔)

就醫常住地的概念為:醫療利用、就診上的常住地,在時間區間內最經常感 冒看診的醫療院所所在的地區。如圖3-2,假設在一個人的生活圈不會距離常住 地太遠,感冒的就醫地會選擇較近的基層院所,此時就醫常住地會近似於常住地。

因此,就醫常住地相當適合作為投保人口的居住地。

圖3-2、就醫常住地概念圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

本文使用健保資料庫中的Ambulatory care expenditures by visits(後稱 CD 檔) 的就醫記錄判斷就醫常住地。本文參照林民浩(2011)所提出的上呼吸道感染定義 為ICD-9-CM:460-466、480-487,抓取 CD 檔中滿足此條件的就醫記錄;接著,

針對每一個投保對象去計算感冒就診之就醫地的分佈,找出最經常感冒就診的地 區作為其就醫常住地;若有一個以上的就醫地感冒就診次數相同,則取時間距離 現在最近的感冒就醫地作為就醫常住地。資料處理流程如圖3-3:

圖3-3、就醫常住地判斷之資料處理流程

以 2005 年承保抽樣歸人檔為例,當年度投保人數為 100 萬人,而有在 CD 檔中就診的人數為925409(參考附表 3-2),代表超過九成的投保人口一年內會有 就診記錄;從中挑選出上呼吸道感染就診後的人數為 700159,代表超過七成的 投保人口一年內會有感冒就診記錄。因就醫常住地的判斷方式是針對有感冒就診 記錄的投保人口,因此可以判斷就醫常住地的人數為700159 人,含概承保抽樣 歸人檔約70%,亦稱這些可以判斷就醫常住地的投保人口為「就醫常住人口」,

作為常住人口的估計。接著本文將就醫常住人口在各縣市的分佈比例與戶籍人口、

普查、投保人口、常住人口進行比較,檢驗三者人口資料之間的差異性。

3-4 之盒型圖(Box-Plot),參考圖 3-4。發現 2000 年四者之間以戶籍與普查結構最 相似(平均差值為 0.15%),接著到 2010 時,戶籍與普查的結構差異變大(平均差

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

口結構有所差異,其代表著不同的特性。如上述,就醫常住人口為推估常住人口 之可行依據之ㄧ。

圖3-4、投保、就醫、普查、戶籍資料之人口結構比較

除了感冒外,本文一併比較不同的疾病種類;感冒、皮膚科、牙科皆從2005 年承保抽樣歸人檔的CD 檔取出,癌症、慢性精神病則是從重大傷病證明明細檔 (特殊需求檔)取出,比較各種疾病的樣本代表性。小病如:感冒、牙科、皮膚科,

皆有蠻高的人數比例;癌症與慢性精神病為重大傷病中罹患人數最多的兩類,如 表3-2 其比例僅分別為 1.5%及 0.6%。整體比較來看,感冒就醫人口最具有代表 性。

表3-2、各種疾病之樣本代表性

疾病種類 2005 年人數 2005 年人數比例 感冒 700159 70.0%

皮膚科 201058 20.1%

牙科 388594 38.8%

癌症 342983 1.5%

慢性精神病 140056 0.6%

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

就醫常住地遷移與跨區就醫之判斷

一、就醫常住地遷移

關於遷移的資料,目前僅由內政部提供的戶籍遷移資料。但僅包含縣市層級 的 遷 入 遷 出 人 數 , 縣 市 之 間 的 遷 移 人 數 僅 有 六 都 之 間 的 遷 移 矩 陣 (Origin-Destination Matrix)。無法針對人口特性去探討遷移行為的誘因或遷移者的特性。

然而,本文透過感冒常住地判斷投保人口的居住地,且資料年份從2005 年至 2012 年,因此我們可以追蹤投保人口各年度的就醫常住地,判斷是否有遷移的行為發 生,同時又具有遷移者的人口特性:如年齡、性別、遷移起點、遷移終點、就醫 習性、是否罹患重大傷病等等。

如先前所假設,一個人的生活圈不會距離常住地太遠,感冒的就醫地會選擇 較近的基層院所,此時就醫常住地會近似於常住地。且就醫常住地的的改變,極 有可能是因為常住地改變,因此本文判斷就醫常住地的方式如圖3-5,2005 年某 投保人口就診4 次,其中 3 次為 A 地,則判斷此投保人口於 2005 年的就醫常住 地為 A 地;而 2006 年就診 3 次,其中在 B 地就診 2 次,則判斷此投保人口於 2006 年的就醫常住地為 B 地;若 2005 年與 2006 年的就醫常住地不同,我們將 判斷此投保人口在2005 以及 2006 年間就醫常住地有遷移之情形。

圖3-5、判斷就醫常住地之示意圖

然而我們也觀察到如圖3-5 中 2006 所描述的情形,同一年內病患先在 B 地 就診了兩次,後又在回A 地就診一次,是否有回流遷移11(Return Migration)的行 為發生呢?因資料處理限制的關係,我們無法得知是否真有回到原居住地,本文

11 回流遷徙指的是回到之前居住地的遷徙活動,通常是回到他們出生或成長的地方(Da Vanzo

and Morrison, 1981:85)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

先不討論此行為,且假定會在2005 年居住於 A 地,2006 年居住於 B 地;此外,

本文觀察投保人口的感冒就醫行為,如圖3-6 所示,發現僅在「單一個縣市」感 冒就診的比例將近九成,換句話說,即為將近九成的人不會在兩個不同縣市感冒 就診;因本文所探討的遷移層級為縣市之間,因此即便有回流遷移的情況發生,

在討論縣市之間的遷移時,影響應不大。參考附表3-4。

圖3-6、2005 年每人感冒就醫地個數之分配

二、跨區就醫

醫療資源不均儼然是臺灣目前的問題,通常較嚴重的病情往往會需要較好的 醫療資源,因此在醫療資源較不足的地區,病患可能需要跨區尋求更好的醫療資 源。而林維娟(2003)則提到醫院層級中以醫學中心的門診跨區率最高,且就醫地 往往為大都市地區。判斷是否跨區就醫有許多方法,陳珮青等(2003)利用電話訪 問進行調查,詢問其病患居住地與就醫地來判斷。然而,本文欲使用就醫常住地 的方法作為居住地的判斷,探討重大傷病病患的跨區就醫行為,本文使用重大傷 病中罹患人數最多的癌症做實證分析,與陳珮青等(2003)跨區就診結果做比較。

章殷超等 (2009)文中提到,研究跨區就醫與醫療資源的關係時,認為使用就醫距 離遠近會比跨區就醫更合適,本文亦將各縣市就醫常住人口中的癌症病患挑出,

觀察跨區就醫的行為與特性:跨區比例、跨區就醫成本等。

透過就醫常住地,本文可以判斷癌症病患是否有跨區就醫之行為。如圖3-7,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

本文從HV_CD 檔挑選出癌症相關的就診記錄,觀察癌症就診的就醫地,並同時 與2005 承保抽樣歸人檔做串接,利用 CD 檔判斷為就醫常住地;若癌症就醫地 與就醫常住地不相符,則判斷為該次癌症就診為跨區就診。參考附表3-5。

圖3-7、判斷癌症跨區就醫之資料處理流程

全民健保資料庫有了就醫常住地的輔助後,可以作為另一種人口資料參考之 依據,本文在第四章以及第五章運用就醫常住人口在人口遷移、就醫習性等領域 上。

在文檔中 以全民健保資料庫探討臺灣人口特性與變遷 - 政大學術集成 (頁 21-30)