• 沒有找到結果。

資料處理方式

在文檔中 一、資料所有權 (頁 33-39)

關於資料建檔與處理方式,以及權數調整,如下所述。

(一) 資料建檔方式

「台灣貧窮兒少資料庫:弱勢兒少生活趨勢調查」計畫中的兒少問卷、家長問卷等,

都是由受試兒少及主要照顧者(或協助訪問的訪員)直接將答案劃記在問卷題本上,

再由閱卷王讀取答案。選擇以閱卷王處理資料的主要考量是:

1. 節省過錄與鍵入的時間。

2. 省去設計答案卡的開版及印刷費用。

由閱卷王掃瞄題本讀取答案的過程中,不論掃瞄位置的設定、印刷題本的正確 率、掃瞄題本時放置的角度差異,都會影響答案讀取的結果。因此,在正式進 行答案掃瞄之前,已先使用印刷好的題本來進行掃瞄位置設定測試,並在確認 讀取位置的設定與讀卡機器均能達到快速且正確讀取的要求後,才開始所有的 掃瞄作業。除此之外,在劃記題本時,如果經立可白修改、原子筆劃記太輕或 劃記範圍過大過小等,皆會讓最後讀取答案的結果產生誤差。為了減少這過程

並提升資料品質。

(二) 資料處理方式

在資料處理的流程中,從人工逐一檢查題本開始,到最後以統計程式進行邏輯檢核,

經過多道關卡,希望能藉此提高資料完整度及正確性。

1. 人工檢查題本:

(1) 清點家扶各地分事務所寄回問卷題本箱數,以人工方式檢查書面題本進行第 一道的篩檢。

(2) 如果題本劃記方式有誤或劃記呈現過淡、錯誤塗改率太高等,則以原子筆加 粗答案,若問卷題本汙損則重新謄寫再進行掃瞄。

2. 閱卷王設定讀取檢查:

使用的閱卷王軟體已將所有題目設定好為單選題、複選題與文字題。選擇題部分 若答案讀取結果為單選答複選或空白,則會直接查詢已掃瞄歸檔的題本圖檔,來 確認答案的正確性。若確認為因題本放置歪斜使電腦讀取錯誤,則直接更正答案。

文字題部分,則是直接在閱卷王上看該題對應的圖檔位置,將答案鍵入,掃瞄後 的每筆資料會以人工方式再逐題進行檢查,以減少電腦判讀可能產生的錯誤。

3. 複選題資料過錄:

為了日後資料使用的便利與普及,在過錄資料時將原本單一複選題所記錄的選 項數值,直接轉換為多題單選題的形式。

範例說明:

第二版自填問卷:

A18 你平常都如何運用你的零用錢?【可複選】

買學業用品 用於休閒娛樂

買東西吃 存起來

購買衣服、鞋子等 ⑥ 其他(請說明):_____

資料狀況:

變項名稱:w3a18_1、w3a18_2、w3a18_3、w3a18_4、w3a18_5、w3a18_6 選項數值:0(沒有劃記)、1(有劃記)

某受訪者填寫答案:1、3、5

讀取後結果:w3a18_1 → 1、w3a18_2 → 0、w3a18_3 → 1、

w3a18_4 → 0、w3a18_5 → 1、w3a18_6 → 0

4. 不合理值檢核:

所謂不合理值泛指答案出現問卷既有選項數值以外的答案。例如:複選題型同 時出現互斥的答案;或單選題型卻出現兩個以上的答案;這些狀況均為不合理 值的篩檢範圍。不合理值的出現,可能是劃記過程不小心劃錯,或電腦判讀出 現錯誤所產生。

針對不合理值的處理,檢誤人員會再次確認問卷圖檔或問卷紙本答案後再進行 更正。若為單選題題型,卻勾選兩個答案,則將答案歸類至遺漏值「99、999 或9999……」。

範例說明:

題型一、複選題

jsq 問卷 _A12 你住的地方有下列這些情形嗎?【可複選】

家裡或附近常有臭味 ⑤ 家裡空間擁擠

水不乾淨 環境很吵雜

老鼠或蟑螂很多 常沒水或沒電

蚊蟲很多 都沒有 修改前資料狀況:

變項名稱:w3a12

選項範圍:1、2、3、4、5、6、7、8 受訪者答案:1、2、8 → 複選互斥題。

修改後資料狀況:

受訪者答案修改:保留答案1、2,答案 8 未劃記,為電腦判讀錯誤,故刪除。

題型二、單選題 第二版自填問卷:

A3 通常一個星期哩,你有幾天會吃蔬菜或水果?

不吃 每週一天 每週二到三天

每週四到五天 每天或幾乎每天吃 修改前資料狀況:

變項名稱:w3a3(w3 指 wave 3,為第三波 jsq 問卷 A3 題)

選項範圍:1、2、3、4、5

受訪者答案:2、3 → 勾選兩個答案。

修改後資料狀況:

受訪者答案修改:將答案視為遺漏值,修改為「99」。

5. 邏輯檢核:

邏輯檢核主要是經由檢誤程式,來檢查受訪者整份問卷中的答案是否前後一致、

合理。由於問卷部分題項間存有邏輯關係,故針對這些題項,進行資料邏輯檢 核。例如:第二版自填問卷A17 題,受訪者回答平常家裡有沒有給零用錢的答 案為「沒有給零用錢」,受訪者應跳答A18 題「回答平時運用零用錢的方式」

範例說明:

第二版自填問卷:

A17 平常家裡有沒有給你零用錢?

沒有給零用錢(請跳答 A19 題)

有給零用錢,但不固定

有給零用錢,每月固定給 ______ 元 A18 你平常都如何運用你的零用錢?【可複選】

買學業用品 用於休閒娛樂

買東西吃 存起來

購買衣服、鞋子等 ⑥ 其他(請說明):_____

修改前資料狀況:

變項名稱:w3a17 與 w3a18

選項範圍:當w3a17 選填 1,跳答 w3a18。

w3a17 選填 2、3,續答 w3a18。

受訪者答案:w3a17 填答 1,卻續答 w3a18。

修改後資料狀況:

受訪者答案修改:w3a18 將答案視為遺漏值,修改為「99」。

6. 未填答值處理:

所有「應答而未填答」均視為遺漏值,以代碼「99、999、9999……」代表,

過錄碼數視過錄欄位長度而定。

7. 文字及數字開放題題型:

經檢誤後會將文字及數字開放題題型做歸類,另recode 為新變項,以便使用者 使用及閱讀。

(三) 權數調整

本資料的樣本已依據「性別」、「年齡」與「鄉鎮市」三個特性進行代表性檢定。

本計畫的原母體數為42,167 人,由於執行調查的抽樣樣本皆為學齡後兒童,故調查 樣本無法代表原初的母體42,167 人(含學齡前),第二波調查檢定時扣除學齡前兒 童後的母體數為40,851 人,而第三波母體為另因樣本代表性檢驗結果顯示,樣本 結構並不完全與母體結構相符,故針對樣本加權進行校正。我們採事後加權( post-weighting)進行權數的調整,依據變項為鄉鎮市地區(7 組) * 性別(2 組) * 年齡

(4 組)三個變項進行加權,然檢定時仍依照三個變項分別各自檢定及加權。

加權後再進行一次適合度檢定,檢定結果三個變項p 值均大於 0.05,即加權後的樣 本分配已與母體一致。而本調查報告係採未加權前的資料進行分析。

1. 加權前 (1) 兒少性別

未經加權處理前,受訪兒少的性別比,男生所占比率為47.6%;女生占 52.4%。

表 4. 訪問成功樣本與母體性別結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

19,789 48.4% 2,102 47.6% χ²=1.190 df=1 p>0.05 樣本與母體一致 21,062 51.6% 2,312 52.4%

合計 40,851 100.0% 4,414 100.0%

(2) 兒少年齡

未經加權處理前,受訪兒少的年齡比,「民國80 年以前」占 13.4%;「民 國81-85 年」占 40.2%;「民國 86-90 年」占 35.8%;「民國 91 以後」占 10.6%。

表 5. 訪問成功樣本與母體年齡結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

民國80 年以前 7,059 17.3% 591 13.4%

χ²=157.425 df=3 p<0.05 樣本與母體不一致 民國81-85 年 18,004 44.1% 1,775 40.2%

民國86-90 年 12,924 31.6% 1,582 35.8%

民國91 年以後 2,864 7.0% 466 10.6%

合計 40,851 100.0% 4,414 100.0%

(3) 兒少居住縣市

未經加權處理前,受訪兒少的居住縣市比「高度都市化(都會核心區)」占 7.2%;「中度都市化(工商市集)」占 26.9%;「新興市鎮」占 20.8%;「一 般城鄉市區(傳統產業市鎮)」占10.9%;「高齡化市鎮」占 6.5%;「農 業市鎮(低度發展鄉鎮)」占22.0%;「偏遠鄉鎮」占 5.8%。

表 6. 訪問成功樣本與母體居住縣市結構之差異檢定

母體 樣本

人數 百分比 人數 百分比 檢定結果

高度都市化

(都會核心區) 3,677 9.0% 316 7.2% χ²=2,922.278 df=6 p<0.05 樣本與母體不一致 中度都市化

(工商市集) 8,060 19.7% 1,187 26.9%

新興市鎮 13,490 33.0% 918 20.8%

一般城鄉市區

(傳統產業市鎮) 9,343 22.9% 479 10.9%

χ²=2,922.278 df=6 p<0.05 樣本與母體不一致 高齡化市鎮 3,089 7.6% 288 6.5%

農業市鎮

(低度發展鄉鎮) 2,657 6.5% 969 22.0%

偏遠鄉鎮 535 1.3% 257 5.8%

合計 40,851 100.0% 4,414 100.0%

2. 加權後 (1) 兒少年齡

經加權處理後,受訪兒少的年齡比,「民國80 年以前」占 17.3%;「民國 81-85 年」占 44.1%;「民國 86-90 年」占 31.6%;「91 年以後」占 7.0%。

表 7. 訪問成功樣本與母體年齡結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

民國80 年以前 7,059 17.3% 763 17.3%

χ ²=1.000 df=3 p>0.05 樣本與母體一致 民國81-85 年 18,004 44.1% 1,945 44.1%

民國86-90 年 12,924 31.6% 1,396 31.6%

民國91 年以後 2,864 7.0% 309 7.0%

合計 40,851 100.0% 4,414 100.0%

(2) 兒少居住縣市

經加權處理後,受訪兒少的居住縣市比「高度都市化(都會核心區)」占 9.0%;「中度都市化(工商市集)」占 19.7%;「新興市鎮」占 33.1%;「一 般城鄉市區(傳統產業市鎮)」占22.9%;「高齡化市鎮」占 7.6%;「農 業市鎮(低度發展鄉鎮)」占6.5%;「偏遠鄉鎮」占 1.3%。

表8. 訪問成功樣本與母體居住縣市結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

高度都市化

(都會核心區) 3,677 9.0% 397 9.0%

χ²=1.000 df=6 p>0.05 樣本與母體一致 中度都市化

(工商市集) 8,060 19.7% 871 19.7%

新興市鎮 13,490 33.0% 1,459 33.1%

一般城鄉市區

(傳統產業市鎮) 9,343 22.9% 1,010 22.9%

高齡化市鎮 3,089 7.6% 334 7.6%

農業市鎮

(低度發展鄉鎮) 2,657 6.5% 287 6.5%

偏遠鄉鎮 535 1.3% 58 1.3%

合計 40,851 100.0% 4,414 100.0%

在文檔中 一、資料所有權 (頁 33-39)

相關文件