• 沒有找到結果。

資料處理方式

在文檔中 一、資料所有權 (頁 33-39)

(二) 抽樣步驟

家扶基金會進行抽樣的步驟如下:

1. 以家扶基金會扶助系統為母體,由於母體人數每日會有停扶或新增的情形,因 此,調查計畫以2008 年 11 月 12 日當日系統的母體數做為抽樣的基準。

2. 2008 年 11 月 12 日從家扶扶助系統下載 23 個分事務所的樣本名單,將各分事 務所樣本名單依「開案日期」進行排序。

3. 排序後新增一欄母體序號,預估該分事務所要抽多少筆才能達到有效樣本數(例 如臺北市預計抽樣300 名),並將總筆數 / 有效樣本數,計算出等距為 K 值(若 有小數點,取至小數第一位四捨五入)。

在K 的範圍內,至亂數表取一亂數為 R。

K = 該分事務所樣本總筆數 / 有效樣本數。

K = 1200/300 = 4,則 K = 4。

另由亂數表1-4 的範圍中,取亂數 R 為 3,

R 亦為抽出的第一筆樣本序號。

4. 藉由 Excel 的抽樣功能,輸入資料範圍與週期,即自動抽出第二筆樣本序號 ~ 最後一筆樣本序號,即可取得該分事務所的300 名樣本。

並提升資料品質。

(二) 資料處理方式

在資料處理的流程中,從人工逐一檢查題本開始,到最後以統計程式進行邏輯檢核,

經過多道關卡,希望能藉此提高資料完整度及正確性。

1. 人工檢查題本:

(1) 清點家扶各地分事務所寄回問卷題本箱數,以人工方式檢查書面題本進行第 一道的篩檢。

(2) 如果題本劃記方式有誤或劃記呈現過淡、錯誤塗改率太高等,則以原子筆加 粗答案,若問卷題本汙損則重新謄寫再進行掃瞄。

2. 閱卷王設定讀取檢查:

使用的閱卷王軟體已將所有題目設定好為單選題、複選題與文字題。選擇題部分 若答案讀取結果為單選答複選或空白,則會直接查詢已掃瞄歸檔的題本圖檔,來 確認答案的正確性。若確認為因題本放置歪斜使電腦讀取錯誤,則直接更正答案。

文字題部分,則是直接在閱卷王上看該題對應的圖檔位置,將答案鍵入,掃瞄後 的每筆資料會以人工方式再逐題進行檢查,以減少電腦判讀可能產生的錯誤。

3. 複選題資料過錄:

為了日後資料使用的便利與普及,在過錄資料時將原本單一複選題所記錄的選 項數值,直接轉換為多題單選題的形式。

範例說明:

第二版自填問卷:

A18 你平常都如何運用你的零用錢?【可複選】

買學業用品 用於休閒娛樂

買東西吃 存起來

購買衣服、鞋子等 ⑥ 其他(請說明):_____

資料狀況:

變項名稱:w3a18_1、w3a18_2、w3a18_3、w3a18_4、w3a18_5、w3a18_6 選項數值:0(沒有劃記)、1(有劃記)

某受訪者填寫答案:1、3、5

讀取後結果:w3a18_1 → 1、w3a18_2 → 0、w3a18_3 → 1、

w3a18_4 → 0、w3a18_5 → 1、w3a18_6 → 0

4. 不合理值檢核:

所謂不合理值泛指答案出現問卷既有選項數值以外的答案。例如:複選題型同 時出現互斥的答案;或單選題型卻出現兩個以上的答案;這些狀況均為不合理 值的篩檢範圍。不合理值的出現,可能是劃記過程不小心劃錯,或電腦判讀出 現錯誤所產生。

針對不合理值的處理,檢誤人員會再次確認問卷圖檔或問卷紙本答案後再進行 更正。若為單選題題型,卻勾選兩個答案,則將答案歸類至遺漏值「99、999 或9999……」。

範例說明:

題型一、複選題

jsq 問卷 _A12 你住的地方有下列這些情形嗎?【可複選】

家裡或附近常有臭味 ⑤ 家裡空間擁擠

水不乾淨 環境很吵雜

老鼠或蟑螂很多 常沒水或沒電

蚊蟲很多 都沒有 修改前資料狀況:

變項名稱:w3a12

選項範圍:1、2、3、4、5、6、7、8 受訪者答案:1、2、8 → 複選互斥題。

修改後資料狀況:

受訪者答案修改:保留答案1、2,答案 8 未劃記,為電腦判讀錯誤,故刪除。

題型二、單選題 第二版自填問卷:

A3 通常一個星期哩,你有幾天會吃蔬菜或水果?

不吃 每週一天 每週二到三天

每週四到五天 每天或幾乎每天吃 修改前資料狀況:

變項名稱:w3a3(w3 指 wave 3,為第三波 jsq 問卷 A3 題)

選項範圍:1、2、3、4、5

受訪者答案:2、3 → 勾選兩個答案。

修改後資料狀況:

受訪者答案修改:將答案視為遺漏值,修改為「99」。

5. 邏輯檢核:

邏輯檢核主要是經由檢誤程式,來檢查受訪者整份問卷中的答案是否前後一致、

合理。由於問卷部分題項間存有邏輯關係,故針對這些題項,進行資料邏輯檢 核。例如:第二版自填問卷A17 題,受訪者回答平常家裡有沒有給零用錢的答 案為「沒有給零用錢」,受訪者應跳答A18 題「回答平時運用零用錢的方式」

範例說明:

第二版自填問卷:

A17 平常家裡有沒有給你零用錢?

沒有給零用錢(請跳答 A19 題)

有給零用錢,但不固定

有給零用錢,每月固定給 ______ 元 A18 你平常都如何運用你的零用錢?【可複選】

買學業用品 用於休閒娛樂

買東西吃 存起來

購買衣服、鞋子等 ⑥ 其他(請說明):_____

修改前資料狀況:

變項名稱:w3a17 與 w3a18

選項範圍:當w3a17 選填 1,跳答 w3a18。

w3a17 選填 2、3,續答 w3a18。

受訪者答案:w3a17 填答 1,卻續答 w3a18。

修改後資料狀況:

受訪者答案修改:w3a18 將答案視為遺漏值,修改為「99」。

6. 未填答值處理:

所有「應答而未填答」均視為遺漏值,以代碼「99、999、9999……」代表,

過錄碼數視過錄欄位長度而定。

7. 文字及數字開放題題型:

經檢誤後會將文字及數字開放題題型做歸類,另recode 為新變項,以便使用者 使用及閱讀。

(三) 權數調整

本資料的樣本已依據「性別」、「年齡」與「鄉鎮市」三個特性進行代表性檢定。

本計畫的原母體數為42,167 人,由於執行調查的抽樣樣本皆為學齡後兒童,故調查 樣本無法代表原初的母體42,167 人(含學齡前),第二波調查檢定時扣除學齡前兒 童後的母體數為40,851 人,而第三波母體為另因樣本代表性檢驗結果顯示,樣本 結構並不完全與母體結構相符,故針對樣本加權進行校正。我們採事後加權( post-weighting)進行權數的調整,依據變項為鄉鎮市地區(7 組) * 性別(2 組) * 年齡

(4 組)三個變項進行加權,然檢定時仍依照三個變項分別各自檢定及加權。

加權後再進行一次適合度檢定,檢定結果三個變項p 值均大於 0.05,即加權後的樣 本分配已與母體一致。而本調查報告係採未加權前的資料進行分析。

1. 加權前 (1) 兒少性別

未經加權處理前,受訪兒少的性別比,男生所占比率為47.6%;女生占 52.4%。

表 4. 訪問成功樣本與母體性別結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

19,789 48.4% 2,102 47.6% χ²=1.190 df=1 p>0.05 樣本與母體一致 21,062 51.6% 2,312 52.4%

合計 40,851 100.0% 4,414 100.0%

(2) 兒少年齡

未經加權處理前,受訪兒少的年齡比,「民國80 年以前」占 13.4%;「民 國81-85 年」占 40.2%;「民國 86-90 年」占 35.8%;「民國 91 以後」占 10.6%。

表 5. 訪問成功樣本與母體年齡結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

民國80 年以前 7,059 17.3% 591 13.4%

χ²=157.425 df=3 p<0.05 樣本與母體不一致 民國81-85 年 18,004 44.1% 1,775 40.2%

民國86-90 年 12,924 31.6% 1,582 35.8%

民國91 年以後 2,864 7.0% 466 10.6%

合計 40,851 100.0% 4,414 100.0%

(3) 兒少居住縣市

未經加權處理前,受訪兒少的居住縣市比「高度都市化(都會核心區)」占 7.2%;「中度都市化(工商市集)」占 26.9%;「新興市鎮」占 20.8%;「一 般城鄉市區(傳統產業市鎮)」占10.9%;「高齡化市鎮」占 6.5%;「農 業市鎮(低度發展鄉鎮)」占22.0%;「偏遠鄉鎮」占 5.8%。

表 6. 訪問成功樣本與母體居住縣市結構之差異檢定

母體 樣本

人數 百分比 人數 百分比 檢定結果

高度都市化

(都會核心區) 3,677 9.0% 316 7.2% χ²=2,922.278 df=6 p<0.05 樣本與母體不一致 中度都市化

(工商市集) 8,060 19.7% 1,187 26.9%

新興市鎮 13,490 33.0% 918 20.8%

一般城鄉市區

(傳統產業市鎮) 9,343 22.9% 479 10.9%

χ²=2,922.278 df=6 p<0.05 樣本與母體不一致 高齡化市鎮 3,089 7.6% 288 6.5%

農業市鎮

(低度發展鄉鎮) 2,657 6.5% 969 22.0%

偏遠鄉鎮 535 1.3% 257 5.8%

合計 40,851 100.0% 4,414 100.0%

2. 加權後 (1) 兒少年齡

經加權處理後,受訪兒少的年齡比,「民國80 年以前」占 17.3%;「民國 81-85 年」占 44.1%;「民國 86-90 年」占 31.6%;「91 年以後」占 7.0%。

表 7. 訪問成功樣本與母體年齡結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

民國80 年以前 7,059 17.3% 763 17.3%

χ ²=1.000 df=3 p>0.05 樣本與母體一致 民國81-85 年 18,004 44.1% 1,945 44.1%

民國86-90 年 12,924 31.6% 1,396 31.6%

民國91 年以後 2,864 7.0% 309 7.0%

合計 40,851 100.0% 4,414 100.0%

(2) 兒少居住縣市

經加權處理後,受訪兒少的居住縣市比「高度都市化(都會核心區)」占 9.0%;「中度都市化(工商市集)」占 19.7%;「新興市鎮」占 33.1%;「一 般城鄉市區(傳統產業市鎮)」占22.9%;「高齡化市鎮」占 7.6%;「農 業市鎮(低度發展鄉鎮)」占6.5%;「偏遠鄉鎮」占 1.3%。

表8. 訪問成功樣本與母體居住縣市結構之差異檢定

母體 樣本

檢定結果

人數 百分比 人數 百分比

高度都市化

(都會核心區) 3,677 9.0% 397 9.0%

χ²=1.000 df=6 p>0.05 樣本與母體一致 中度都市化

(工商市集) 8,060 19.7% 871 19.7%

新興市鎮 13,490 33.0% 1,459 33.1%

一般城鄉市區

(傳統產業市鎮) 9,343 22.9% 1,010 22.9%

高齡化市鎮 3,089 7.6% 334 7.6%

農業市鎮

(低度發展鄉鎮) 2,657 6.5% 287 6.5%

偏遠鄉鎮 535 1.3% 58 1.3%

合計 40,851 100.0% 4,414 100.0%

在文檔中 一、資料所有權 (頁 33-39)

相關文件