• 沒有找到結果。

 資料匯入及分割

N/A
N/A
Protected

Academic year: 2022

Share " 資料匯入及分割"

Copied!
52
0
0

加載中.... (立即查看全文)

全文

(1)

全民健保資料庫分析實務 01 資料處理

(2)

Agenda

 資料匯入及分割

 變項轉置及分組

 篩選主題需求檔案

 變相計算及排序

 歸戶 (人)作業

 分析實例

2

(3)

檔案介紹

(4)

全民健保急診病患醫療利用與非計畫性返診之探討

4

(5)
(6)

資料匯入及分割

6

(7)

資料匯入及分割

 選取匯入資料

 或將檔案拖曳至SPSS空白處,

進行讀取。

• 檔案匯入通常用於剛取得之原始資料,常見檔案包含dat、csv等。

(8)

資料匯入及分割

 選則檔案類型.dat

 直接執行該項指令

 產生語法檔案

8

(9)

資料匯入及分割

 有無語法匯入

• 匯入語法僅包含分割 部分,不含檔案讀取。

• 為PPT #11所儲存之 語法。

 檔案預覽

(10)

資料匯入及分割

10

 分隔,常用於CSV檔

 健保資料庫皆為固定寬度,即每 筆資料都以一行作為儲存原則。

 第一行是否為各變項名稱

 健保資料庫第一筆即為資料,未包含變項名稱。

• 各變項名稱及屬性於 Step 5.鍵入。

(11)

資料匯入及分割

 資料由第一行開始,每一行代表一筆資料。

 選擇匯入資料筆數

(12)

資料匯入及分割

12

 依國衛院全民健康保險研究資料庫,

coding book 進行檔案分割。

(13)

資料匯入及分割

 輸入變項名稱。

 需注意該變相含有阿拉伯數字以外之字元者,若 選擇數值型,則該變相之資料將全部消失。

如:ICD 9 CM之E-Code。

(14)

資料匯入及分割

14

 儲存分割語法

(15)

資料匯入及分割

(16)

資料匯入及分割

16 GET DATA

/TYPE=TXT

/FILE="E:\原始資料檔\CD檔\2004\R201_CD2004.DAT"

/FIXCASE=1

/ARRANGEMENT=FIXED /FIRSTCASE=1

/IMPORTCASE=ALL /VARIABLES=

/1 費用年月 0-5 F6.0 申報類別 6-6 F1.0

醫事機構代號 7-40 A34 申報日期 41-48 F8.0 案件分類 49-50 A2 流水號 51-56 F6.0

特定治療項目一 57-58 A2

………

CACHE.

EXECUTE.

DATASET NAME 資料集1 WINDOW=FRONT.

(17)

變項轉置及分組

(18)

變項轉置

18

 依原變項之值,直接進行變更 X →X

 新增一欄新變項,並進行變更 X →Y

•應用範圍:

常用於年齡分組比較(如邏輯斯回歸分析),或共伴疾病之統計,或將 某變項內的值進行分組(如將相同藥理的藥歸屬為同一群組)

(19)

變項轉置

 輸入新變項名稱,並點選 變更。

 輸入變項變更規則

(20)

變項轉置

20

 用於數值(尺度)變項。

 用於字串(名義)變項。  變更後的新值。

 輸入完成後點選新增。

(21)

變項轉置

 為新變項的值命名。

 輸入新值所代表意義。

 點選新增

(22)

變項分組

22

 將數值(尺度)變項分組為名義變項

(23)

變項分組

 檔案內所有數值變項

 選取變項後點選新增

(24)

變項分組

24

 該變項分布型態

 點選分割檔案

(25)

變項分組

 自訂組間寬度進行分割

 選擇分割的點數(切幾刀)

(26)

變項分組

26

 可拖曳分割線進行組間修正

 顯示分割點

(27)

篩選主題需求檔案

(28)

篩選主題需求檔案

28

 點選選擇觀察值

•應用範圍:

將需求檔案游資 料庫中篩選出來。

(如依ICD-9將某年齡 層病患篩選出。)

(29)

篩選主題需求檔案

 依特定條件篩選觀察值

•應用範圍:

將需求檔案游資料庫中篩選出來。

(如依ICD-9將某年齡層病患篩選出。)

(30)

篩選主題需求檔案

30

• 名義變項=“K”

• 尺度變相= 值

• &=且; |=或

• 區間=(1<X<9) X

(X>1& X<9) ○

• 例:

篩選65歲以上,主、

次診斷為ICD=272 之病患。

 注意

(31)

篩選主題需求檔案

 將篩選的觀察值複製成 一新檔案

(32)

32

篩選主題需求檔案

DATASET ACTIVATE 資料集1.

DATASET COPY ned.

DATASET ACTIVATE ned.

FILTER OFF.

USE ALL.

SELECT IF ((年齡 >= 65 & 年齡 <= 110) & (ICD1_1 = 272 | ICD2_1 = 272 | ICD3_1 = 272 | ICD4_1 = 272 |

(ICD5_1 = "272"))).

EXECUTE.

DATASET ACTIVATE 資料集1.

(33)

變項計算及排序

(34)

變項計算及排序

34

 選擇計算變數

(35)

變項計算及排序

 計算後的變項名稱

 計算內容

(36)

變項計算及排序

36

 點選觀察值排序

 選擇欲排序變項

(37)

歸戶 (人)作業

(38)

歸戶 (人)作業

38

 點選識別重複觀察值

•應用範圍:

篩選出重複的觀察值,並統計重複次數(如計算病患再住院比率,

或某段期間住院次數)

(39)

歸戶 (人)作業

 依某變項為依據進行篩選

 排序篩選條件

 只以1、0進行區分

 區分外並統計次數

(40)

歸戶 (人)作業_解讀

40

•1為主要觀察值,0為重覆觀察值。

•0為無重複觀察值,其他值為第X筆重 複筆數。

(41)

分析實例

(42)

追蹤性研究

42

•假設資料為2005-2010年,ICD=272住院就診資料

 求這些人每年累計住院事件總數

 統計排序住院主診斷碼及手術碼

 計算第一次就診各類醫療費用

 再住院次數

 再住院診斷碼及手術碼

 再住院醫療費用

(43)

STEP1. 選擇觀察值

•選擇所有觀察值中,某一診斷碼包含ICD=272者即篩選出。

DATASET ACTIVATE 資料集1.

DATASET COPY icd272.

DATASET ACTIVATE icd272.

FILTER OFF.

USE ALL.

(44)

STEP2.1 分析就診次數

44

•分析統計期間內,ICD=272病患再就診人次、再就診次數。

DATASET ACTIVATE icd272.

* 識別重複觀察值.

SORT CASES BY 身分證統一編號(A) 費用年月(A).

MATCH FILES /FILE=*

/BY 身分證統一編號 /FIRST=PrimaryFirst /LAST=PrimaryLast.

DO IF (PrimaryFirst).

COMPUTE MatchSequence=1-PrimaryLast.

ELSE.

COMPUTE MatchSequence=MatchSequence+1.

END IF.

LEAVE MatchSequence.

FORMATS MatchSequence (f7).

COMPUTE InDupGrp=MatchSequence>0.

SORT CASES InDupGrp(D).

MATCH FILES /FILE=*

/DROP=PrimaryLast InDupGrp.

VARIABLE LABELS PrimaryFirst '將所有第一個相符觀察值標為主要的 指標' MatchSequence '相符觀察值的循序個數'.

VALUE LABELS PrimaryFirst 0 '重複觀察值' 1 '主要觀察值'.

VARIABLE LEVEL PrimaryFirst (ORDINAL) /MatchSequence (SCALE).

FREQUENCIES VARIABLES=PrimaryFirst MatchSequence.

EXECUTE.

(45)

STEP2.2 分析就診次數

解讀:

•期間內總住院次數為162,244次

•住院人數為115,162人

解讀:

期間僅住院一次者共89,317人

•住院一次以上者共25,845人

每年新住院病患有多少人?

(46)

STEP2.3 分析就診次數

46

* 自訂表格.

CTABLES

/VLABELS VARIABLES=MatchSequence V1 DISPLAY=LABEL

/TABLE MatchSequence BY V1 [COUNT F40.0]

/CATEGORIES VARIABLES=MatchSequence V1 ORDER=A KEY=VALUE

EMPTY=EXCLUDE.

(47)

STEP3. 串檔

•使用時機

 新增變項

 世代性研究

 考慮時間序因素之研究

• 方式

 以人工方式新增變項

 資料庫重新架構

(48)

STEP3.1 串檔

48

• 將首次住院及再次住院之檔案分別篩選出

DATASET ACTIVATE icd272.

DATASET COPY fir.

DATASET ACTIVATE fir.

FILTER OFF.

USE ALL.

SELECT IF (PrimaryFirst = 1).

EXECUTE.

DATASET ACTIVATE icd272.

DATASET ACTIVATE icd272.

DATASET COPY sec.

DATASET ACTIVATE sec.

FILTER OFF.

USE ALL.

SELECT IF (PrimaryFirst = 0).

EXECUTE.

DATASET ACTIVATE icd272.

(49)

STEP3.2串檔

• 將兩組檔案分別以ID進行排序,排序後新增變項。

(50)

STEP3.2 串檔語法

50

DATASET ACTIVATE fir.

SORT CASES BY 身分證統一編號(A).

DATASET ACTIVATE sec.

SORT CASES BY 身分證統一編號(A).

MATCH FILES /FILE=*

/TABLE='fir'

/RENAME (V1 主治醫師代碼 代辦費 入院年月日 出生年 出生日 出生月 出院年月日 外因分類一 外因分類二 嬰兒費 PrimaryFirst 就醫序號 就醫科別 復健治療費

急性病床天數 性別 慢性病床天數 手術費 放射線診療費 案件分類 檢查費 汽車交通事故 治療處置費 注射技術費 流 水號 特殊材料費 申報日期 申報期間起 申報期間迄 申報類別 申請費用金額 病房費

MatchSequence 管灌膳食費 精神科治療費 給付類別 葯事服務費 葯費 血液血漿費 血液透析費 診察費 費用年月 轉 歸代碼 部份負擔註記 部份負擔金額 部費急1_30 部費急31_60

部費急61 部費慢1 部費慢2 部費慢3 醫費急1_30 醫費急31_60 醫費急61 醫費慢1 醫費慢2 醫費慢3 醫費慢4 麻醉費

= d0 d1 d2 d3 d4 d5 d6 d7 d8 d9

d10 d11 d12 d13 d14 d15 d16 d17 d18 d19 d20 d21 d22 d23 d24 d25 d26 d27 d28 d29 d30 d31 d32 d33 d34 d35 d36 d37 d38 d39 d40 d41 d42 d43 d44 d45 d46 d47 d48 d49 d50 d51 d52 d53 d54 d55 d56 d57 d58 d59)

/BY 身分證統一編號

/DROP= d0 d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 d12 d13 d14 d15 d16 d17 d18 d19 d20 d21 d22 d23 d24 d25 d26 d27 d28 d29 d30 d31 d32 d33 d34 d35 d36 d37 d38 d39 d40 d41 d42 d43 d44 d45 d46 d47 d48 d49 d50 d51 d52 d53 d54 d55 d56 d57 d58 d59.

EXECUTE.

(51)

STEP4. 分析

•比較再次住院醫療費用是否高於初次住院

•統計再次住院的ICD分布

•比較初次住院與再次住院ICD差異

•比較再次住院與初次住院之手術或處置之類型

•分析初次住院有使用某種藥物之病患,其再次住院ICD分布

(52)

Thank For Your Attention

52

參考文獻

相關文件

主要指標 單位 參考期.

主要指標 單位 參考期.

主要指標 單位 參考期.

主要指標 單位 參考期.

主要指標 單位 參考期.

主要指標 單位 參考期.

主要指標 單位 參考期.

數值 按年變動