• 沒有找到結果。

探討調查代替普的可行性 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "探討調查代替普的可行性 - 政大學術集成"

Copied!
59
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學 統計學系 碩士學位論文. 探討調查代替普查的可行性 政 治. 大. 立possibility on survey instead of census To probe into the. sit. y. ‧. ‧ 國. 學. Nat. n. er. io. 指 導 教 授:余清祥 博士 al v i n 研 究C 生:楊宗龍 hengchi U 撰. 中 華 民 國 一 百 零 三 年 三 月.

(2) 摘要 普查旨在蒐集一個國家或地區的人民總數、結構及其相關資訊。普查資料的用途 非常廣泛,包括政府機關的施政規劃、商業組織的策略佈局,或是民眾對自己居住地 區的認識,都可參考這些資料。為了因應社會變遷及需求,節省人力、物力等資源, 近年有些國家發展新的普查方式,例如:登記式普查、登記式普查結合抽樣調查以及 滾動式普查,以提升普查效率,其中臺灣在 2010 年時的普查即是首次使用登記式普 查結合抽樣調查,大致為抽出全臺灣 16%的民眾,有別於以往的全人口普查。然而, 為何抽出 16%、這些樣本可否準確推估出全臺灣母體等問題,政府相關單位並未提出. 政 治 大 有鑑於此,本文探討調查代替普查所需搭配條件為研究目標。其中,以人口的年 立. 說明。. ‧ 國. 學. 齡及性別結構為主要驗證對象,提出兩種衡量標準,且在簡單隨機抽樣的假設之下, 透過電腦模擬及卡方檢定,探討抽出放回與否、母體結構、分組數與抽出率等各因素. ‧. 中,何者對抽樣調查的設計影響較大。. sit. y. Nat. 本研究的實驗中,兩種衡量標準所造成的結果有所差異,其中相對標準為滿足抽. al. er. io. 出率的要求,以確保母體與樣本的一致性;而絕對標準則是對樣本數的要求,以確保. v. n. 母體估計的容許誤差不大於主觀研究者的要求。因此,若結合兩種衡量標準則可因地. Ch. engchi. i n U. 制宜,選擇以相對標準或絕對標準為主導並同時保有兩者的優點,為分組數與樣本數 之間訂立準則。. 關鍵詞:普查、登記式普查結合抽樣調查、卡方檢定、電腦模擬. I.

(3) Abstract Census aims to collect the information of the population, including its size, structure, and other related information, in a country or region. Census data are used widely, including policy planning for the government, business strategies for private sectors, or individuals who are interested in their living environment. In order to reduce the rising non-response rate and survey cost, some countries are looking for the possibility of introducing new census methods, such as registered-based census and rolling census. Taiwan also conducted the first registered-base census in 2010 and about 16% of people were asked to fill in the census form. This is very different from the previous full population census and we are interested in knowing if 16% of population is sufficient to provide accurate e s-. 政 治 大 The objective of this study is thus to explore how many people shall we survey (in 立. timate of the whole Taiwan population.. percentage of population) to acquire reliable estimate of the total population. In particular,. ‧ 國. 學. we are interested in the sex and age structures of population, in addition to the population size. To simplify the discussion, we shall only consider the simple random sampling since. ‧. more complicated sampling plan (e.g., two-stage or clustered sampling). Also, we assume. sit. y. Nat. that the sampling is without replacement and the chi-square test is applied to check if the. io. er. sample estimate of population structure is the same as the true population. There are two types of evaluation criteria: relative and absolute errors. We found that 16% of sample. n. al. i n U. v. can only provide reliable population estimate up to age 80 (5-age group: ages 0-4, 5-9, …, 75-79, 80+).. Ch. engchi. Key Words: Census, Registered-Based Census with Sampling Survey, Chi-square test, Computer Simulation. II.

(4) 目錄. 第壹章. 緒 論 … … … …… … … …… … … …… … … …… … … …… … … …… . 1. 第一節. 研 究 動 機 … … … . …… … … …… … … …… … … …… … … … .1. 第二節. 研 究 目 的 … … …… … … …… … … …… … … …… … … …… . . 2. 普 查 與 調 查 … …… … … …… … … …… … … …… … … …… … … . . . 3. 第一節 第二節. 研 究 方 法 … … …… … … …… … … …… … … …… … … …… … … …9 相 對 標 準 的 方 法 …… … … …… … … …… … … …… … … … .9. y. Nat. 絕 對 標 準 的 方 法 …… … … …… … … …… … … …… … … …13. io. sit. 第二節. ‧. 第一節. 電 腦 模 擬 … … …… … … …… … … …… … … …… … … … . …… …1 7. al. v i n C 電 腦 模 擬 … … …… 相對標準的h e n g c h i U … … …… … … …… … … . . 17 n. 第肆章. 普 查 與 調 查 的 比 較 … … … …… … … …… … … …… … … … .6. er. 第參章. 治 政 調 查 簡 介 … … …… … … …… … 大… …… … … …… … … …… . . 5 立 學. 第三節. 普 查 簡 介 … … …… … … …… … … …… … … …… … … …… . . 3. ‧ 國. 第貳章. 第一節 第二節. 絕 對 標 準 的 電 腦 模 擬 … … …… … … …… … … …… … … . . 29. 第三節. 結 合 絕 對 標 準 與 相 對 標 準 … …… … … …… … … …… … . 35. 第伍章. 結 論 與 建 議 … …… … … …… … … …… … … …… … … …… … … . 39. 第 一 節 結 論 … … … …… … … …… … … …… … … …… … … …… … … . 39 第 二 節 討 論 與 建 議 … …… … … …… … … …… … … …… … … …… … 40 參 考 文 獻 … … …… … … …… … … …… … … …… … … …… … … …… … … …49 附錄一. 抽 出 不 放 回 卡 方 檢 定 的 p- val ue 盒 鬚 圖 . . … … … …… … … . . 52. III.

(5) 圖目錄. 圖 4 -1 、 抽 出 是 否 放 回 與 抽 出 率 的 關 係 圖 …… … … . . … … …… … … … .1 8 圖 4 -2 、 分 組 數 與 抽 出 率 的 關 係 圖 … … …… … … …… . . … … … … …… . . 2 0 圖 4 -3、母 體 數 與 抽 出 率 的 關 係 圖 … … … …… … … …… … … …… … … . . 22 圖 4 -4、利 用 Bo nfe r ro ni 法 探 討 單 一 縣 市 所 需 的 錯 誤 率 … …… … … . . 23 圖 4 -5、 相 對 標 準 對 照 圖 … … …… … … …… … … …… … … …… … … …… 25 圖 4 -6 、 總 母 體 1 0 萬 抽 出 率 皆 為 15 % . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 6. 政 治 大. 圖 4 -7、 各 縣 市 抽 取 不 同 比 例 後 與 全 台 灣 人 口 做 檢 定 … … …… … … . . 27. 立. 圖 4 -8 、 五 都 比 值 的 盒 鬚 圖 …… … … …… … … …… … … …… … … … . . . . . 3 0. ‧ 國. 學. 圖 4 -9 、 抽 出 率 與 相 對 誤 差 範 例 ( E 市 ) … …… … … …… … … …… … . 31. ‧. 圖 4 -1 0、 樣 本 數 與 誤 差 之 關 係 圖 … … …… … … …… … … …… … … …… 32 圖 4 - 11、 常 用 的 無 限 母 體 與 有 限 母 體 樣 本 數 圖 一 … …… … … …… … . 33. y. Nat. io. sit. 圖 4 -1 2、 常 用 的 有 限 母 體 與 有 限 母 體 樣 本 數 圖 二 … …… … … …… . . . . 3 4. n. al. er. 圖 5 -1、 探 討 不 同 結 構 的 誤 差 是 否 有 所 影 響 … …… … … …… … … …… 42. i n U. v. 圖 5 -2 、 探 討 人 口 數 的 影 響 …… … … …… … … …… … … …… … … …… . . 4 3. Ch. engchi. 圖 5 -3 、 試 圖 尋 找 最 差 的 母 體 結 構 … … …… … … …… … … …… … … … .4 5 圖 5 -4、 常 住 與 戶 籍 差 異 的 五 種 情 境 … … … …… … … …… … … …… . . . . 4 7. IV.

(6) 表目錄. 表 2 -1 、 世 界 各 國 及 地 區 辦 理 2 01 0 年 普 查 的 方 法 …… … … …… … … . . 4 表 3 -1 、 五 齡 組 分 法 且 10 0 歲 以 上 合 併 … …… … … …… … … …… … . . . 1 2 表 3 -2 、 五 齡 組 分 法 且 8 0 歲 以 上 合 併 … … … …… … … …… … … …… . . 1 2 表 3 -3、 老 中 幼 的 分 法 … … … …… … … …… … … …… … … …… … … …… 12 表 4 -1、利 用 Bo nfe r ro ni 法 探 討 單 一 縣 市 所 需 的 錯 誤 率 … …… … … . . 24. 治 政 表 4 -2、 五 個 都 市 10 0 歲 以 上 兩 性 的 最 小 大 比 例 以 及 人 口 數 … … . …… 29 立 ‧ 國. 學. 表 4 -3、常 用 的 無 限 母 體 樣 本 數 表 … … … … … … …… … … …… … … …… 32 表 4 -4、常 用 的 無 限 母 體 與 有 限 母 體 樣 本 數 表 一 … … … …… … … . . . . . . 3 3. ‧. 表 4 -5、常 用 的 有 限 母 體 與 有 限 母 體 樣 本 數 表 二 … … … …… … … …… 34. y. Nat. er. io. sit. 表 4 -6、五 個 都 市 中 五 齡 組 的 最 小 值 … … …… … … …… … … …… … … . . 36 表 4 -7、五 個 都 市 中 6 5 歲 以 上 五 齡 組 的 最 小 值 … …… … … …… … … . . 37. al. n. v i n C 今 社 會 結 構U的 轉 變 期 … … … …… … … . . 41 5 -1: 結 構 一 台 灣 早 期 到h現 engchi. 表. 表 5 -2 : 結 構 二 台 灣 現 今 小 家 庭 社 會 結 構 …… … … …… … … …… … …4 1 表 5 -3 : 結 構 三 台 灣 早 期 大 家 庭 社 會 結 構 . . … … …… … … . … …… … …4 1 表 5 -4 : 均 勻 結 構 一 … … …… … … … . …… … … …… … … …… … … … . . . . . 4 4 表 5 -5 : 均 勻 結 構 二 … … …… . … … … …… … … …… … … …… … . . . . . . . . . . . 4 4 表 5 -6 : 均 勻 結 構 三 … … … . . … . . . . . . … … … … … … …… … … …… … . . . . . . . 4 4 表 5 -7 : 均 勻 結 構 四 . . … … … … … . . . … … …… … … …… … … …… … . . . . . . . 4 4. V.

(7) 第壹章、緒論. 第一節、研究動機 由普查資料可以獲得一個國家或者地區的人口相關特徵資 料,可 供 政 府 機 關、企 業、學 術 機關 等 單 位 使 用,協助 其 制 訂 政 策 以 及 規 劃 人 力 等 方 面。例 如 中 央 健 康 保 險 局 應 用 普 查 資 料,了 解 家 戶 社 經 特 質 相 關 資 訊,作 為 分 析、研 擬 及 評 估 全 民 健 康 保 險. 政 治 大. 相 關 政 策 之 參 考 ( 主 計 總 處 , 2 0 11 ), 因 此 普 查 的 資 料 必 須 是 完 整且正確的。. 立. ‧ 國. 學. 在使用普查資料時,資料的精確度經常是必須被關注的焦 點 , 而 要 如 何 得 到 精 確 的 普 查 資 料 , 是 一 個 重 大 的 挑 戰。 例 如 古. ‧. 代 人 們 怕 被 強 徵 當 兵 或 者 被 苛 徵 重 稅,所 以 為 了 躲 避 政 府 的 普 查 ,. sit. y. Nat. 人 民 謊 報 情 況 嚴 重,而 且 普 查 計 算 單 位 不 一,有 時 為 人 頭 或 男 丁,. io. er. 性 別 以 及 年 齡 等 其 他 項 目 尚 未 分 類。到 了 民 國 初 年 因 為 經 費、時. al. v i n C h 、 居 住 習 性 改U變 , 普 查 拒 訪 率 逐 年 上 近 年 來 又 因 為 個 人意 識 抬 頭 engchi n. 間、識 字 率 及 普 查 技 術 不 夠 成 熟 等 因 素,影 響 了 普 查 資 料 的 品 質;. 升 ( 龍 文 彬 , 1 99 8), 因 此 隨 著 時 代 演 進 至 今 , 普 查 依 然 有 著 各 種 不 全 然 相 同 的 問 題,使 普 查 不 太 可 能 做 到 零 誤 差,如 果 能 將 調 查 的 誤 差 與 普 查 的 誤 差 近 似,將 可 以 省 去 許 多 人 力、物 力 的 消 耗, 以 及 減 少 普 查 擾 民 的 問 題,又 能 得 出 相 近 的 結 果,是 一 件 相 當 值 得探討的事情。. 1.

(8) 第二節、研究目的 此問題在外國已有許多的學術探討,雖然已有許多國家使 用 調 查 代 替 普 查,但 是 台 灣 過 去 的 學 術 研 究 卻 鮮 少 以 台 灣 為 對 象 , 探 討 以 調 查 代 替 普 查 的 要 件,以 及 可 執 行 的 相 關 條 件。本 研 究 主 要 在 探 討 具 有 母 體 清 冊 且 簡 單 隨 機 抽 樣 的 情 況 下,如 何 抽 取 樣 本 才 會 推 估 出 準 確 的 母 體 人 口 結 構,通 常 用 於 檢 查 樣 本 代 表 性 的 問 項 有 七 個,本 文以 性 別 和 年 齡為 例,縣 市別 分 開 進 行 研究。所 以 本 論 文 提 出 兩 個 方 法,相 對 標 準 與 絕 對 標 準。相 對 標 準 利 用 卡 方. 政 治 大. 檢 定 進 行 電 腦 模 擬, 探 討 抽 出 放 回 與 否 、母 體 結 構 、分 組 數 與 抽. 立. 出 率 之 中 何 者 是 重 要 因 子,再 說 明 為 何 需 要 有 絕 對 標 準 的 必 要 ,. ‧ 國. 學. 並 且 計 算 在 5 %顯 著 水 準 之 下 , 不 同 誤 差 範 圍 內 的 有 限 母 體 與 無 限 母 體 的 樣 本 數。最 後 提 出 不 同 標 準 結 合 在 一 起 的 方 法,將 會 具. ‧. Nat. io. sit. 本 數 之 後 , 樣 本 調查 結 構 將 與 母體 結 構 相 似 。. y. 有 兩 種 標 準 的 優 點,兩 個 標 準 的 結 果 為 滿 足 一 定 的 抽 出 率 以 及 樣. n. al. er. 本論文的編排如下,第貳章分別簡述普查及調查的簡史與. Ch. i n U. v. 辦 理 方 式,接 著 說 明 調 查 代 替 普 查 該 注 意 什 麼 事 項;第 參 章 介 紹. engchi. 本 研 究 提 出 的 兩 個 標 準 的 電 腦 模 擬 假 設;第 肆 章 為 兩 個 標 準 的 電 腦 模 擬 結 果,以 及 說 明 如 何 結 合 應 用 兩 種 標 準;第 伍 章 給 出 結 論 與建議。. 2.

(9) 第貳章、普查與調查 在介紹本文的研究方法前,本章第一節首先對普查的歷史 做 簡 單 的 介 紹,接 著 介 紹 主 要 辦 理 方 式 以 及 調 查 方 式;第 二 節 也 是 先 對 調 查 的 歷 史 做 簡 單 的 介 紹,接 著 介 紹 方 法,以 便 接 下 來 的 討 論 , 最 後 再 論 述調 查 代 替 普 查應 該 注 意 的 事項 。. 第一節、普查簡介. 政 治 大 透過普查可以暸解一個國家或地區的人口及其相關特徵, 立. 工 商 團 體 以 及 政 府 機 關 皆 會 需 要 利 用 普 查 資 料。古 代 人 類 社 會 就. ‧ 國. 學. 已 經 有 普 查 的 實 施,與 現 代 社 會 實 施 普 查 的 目 的 不 盡 相 同,古 代. ‧. 社 會 為 了 課 稅、徵 兵 而 調 查 人 口,人 們 怕 被 強 徵 當 兵 或 者 被 苛 徵. y. Nat. 重 稅 , 為 了 躲 避 政 府 的 普 查, 人 民 謊 報 情 況 嚴 重 , 而 且 普 查 計 算. er. io. sit. 單 位 不 一,所 以 古 代 社 會 調 查 結 果 可 能 會 相 當 不 準 確。現 代 社 會 為 了 經 濟 發 展 以 及 增 進 人 民 福 祉 而 調 查 人 口,因 此 現 代 社 會 人 民. al. n. v i n C比h 古 代 社 會 還 要U來 的 高 。 此 外 , 普 查 需 接 受 普 查 的 意 願, 應 該 會 engchi. 要 大 量 的 經 費 與 人 力,加 上 對 普 查 結 果 的 重 視,所 以 長 期 以 來 各 國 在 普 查 方 法 及 技術 上 均 不 斷 精進 。 隨著科技的發達,公務登記資料高度電腦化,以及各界對 於 資 料 內 容、時 效 之 需 求 增 加 的 情 況 下,許 多 國 家 運 用 既 有 的 公 務 資 料 適 度 改 變 傳 統 普 查 的 方 式,就 其 辦 理 方 式 可 分 為 四 類:第 一 類 為 傳 統 問 卷 式 普 查,因 為 缺 乏 完 善 可 用 之 登 記 資 料 或 者 法 令 的 限 制,所 以 仍 維 持 全 面 普 查 方 式 蒐 集 資 料;第 二 類 為 登 記 式 普 查,這 是 連 結 整 合 多 種 公 務 資 料 或 者 利 用 既 有 調 查 資 料 的 普 查 方 法;第 三 類 為 登 記 式 普 查 結 合 抽 樣 調 查,基 本 資 料 改 由 連 接 公 務 3.

(10) 登 記 資 料 取 得,無 法 由 公 務 資 料 取 得 的 項 目 則 由 調 查 取 得;第 四 類 為 滾 動 式 普 查,就 是 將 普 查 長 表 問 卷 的 樣 本 蒐 集 方 式 改 為 透 過 連 續 蒐 集「 分 時、 分批 」資 料 的 方式 進 行。 表 2-1 為世 界 各 國 及 地 區 辦 理 20 10 年 普 查 的 方 法 。. 表 2 -1 、 世 界 各 國 及 地 區 辦 理 2 01 0 年 普 查 的 方 法 洲別. 亞洲. 歐洲. 美洲. 大 洋 洲、 非 洲. 滾動式 普查 (2 國). 無. n. 台灣、新加 坡、土耳其、 以色列、印度. 1.西歐:比利 時 2.中歐:德 國、波蘭、 2.中歐:奧地 利、瑞士 西歐:法國. Ch. engchi U. y. 無. sit. io. al. 登記式 普查結合 抽樣調查 (10 國). 無. ‧. 1.所有北歐國 家(含冰島) 2.西歐:荷蘭 3.中歐:斯洛 維尼亞. 全部. 學. 無. Nat. 登記式 普查 (7 國). ‧ 國. 立. 加拿大、 治 政 中南美洲各國 大 1.所有東歐與 南歐國家 2.西歐僅有英 國與愛爾蘭 3.中歐僅有捷 克與匈牙利. er. 傳統問卷式普 中華人民共和 查 國、香港、日 (多數) 本、韓國等國 家. 無. 美國. 無. 無 v i n. 資料來源:顏 貝 珊 與 余 清 祥 (2 010 ). 調查方式可分為派員面訪、郵寄問卷、電話訪問與網路調 查 等 四 種 方 式。派 員 面 訪 為 四 種 方 式 中 最 早 使 用 的 調 查 方 法,因. 4.

(11) 為 派 員 面 訪 與 其 他 調 查 方 式 相 比 之 下 限 制 較 少,其 他 調 查 方 式 需 要 調 查 地 區 具 備 一 定 的 郵 政、電 話 與 網 路 服 務 才 能 夠 實 施。目 前 大 多 數 的 國 家 及 地 區 皆 採 用 派 員 面 訪 的 方 式 進 行 普 查,有 些 則 為 了 節 省 成 本 而 利 用 郵 寄 問 卷 或 電 話 訪 問 執 行 普 查,但 偏 遠 地 區 則 會 結 合 派 員 面 訪 彌補 了 地 區 性 偏遠 導 致 的 缺 陷。 調查地區郵政服務具備某種程度之後,就可以使用郵寄問 卷 進 行 調 查 及 普 查。將 問 卷 寄 出 後,讓 受 訪 者 自 行 填 完 後 再 將 問 卷 寄 回 。 郵 寄 問 卷 缺 點 在 於, 受 訪 者 可 能 因 為 識 字 率 不 佳 、 誤 解. 政 治 大. 問 卷 或 者 答 題 不 回 整,而 有 非 抽 樣 誤 差 的 問 題 產 生;或 郵 寄 問 卷 的回收率低迷。. 立. 電話訪問多用於輔助普查,而非主要的調查方式。缺點在. ‧ 國. 學. 於 長 表 問 卷 項 目 過 於 冗 長,受 訪 者 卻 只 能 以 電 話 方 式 回 覆,不 僅. ‧. 會 花 費 太 多 時 間 且 擾 民;短 表 問 卷 中 內 容 多 為 受 訪 者 的 基 本 資 料 ,. io. er. 的 調 查 方 式 會 有 許多 問 題 產 生 。. sit. y. Nat. 有 侵 犯 隱 私 權 以 及 詐 騙 事 件 的 頻 傳,因 此 使 用 電 話 調 查 當 作 主 要. 網路調查優點為能夠確認受訪者的完整填答,且透過電腦. al. n. v i n C本h 以 及 非 抽 樣 誤U差 , 缺 點 則 為 必 須 在 高 化 的 處 理,降 低 了 許 多 成 engchi 都 市 化 的 地 區 或 國家 才 有 實 施 的可 能 性 。. 第二節、調查簡介 一開始人們對抽樣的概念還處於未開發階段,但由於使用 調 查 可 以 省 去 大 部 分 繁 重 的 工 作 , 因 此 K i ae r 倡 導 抽 樣 調 查 使 國 際 統 計 學 會 決 定 支 持 , 在 之 後 的 Ro t ham s t e d 實 驗 站 、 印 度 統 計 研 究 中 心、美 國 農 業 部 愛 荷 華 州 立 大 學 實 驗 站、美 國 普 查 局 等 單 位 的 貢 獻 下 , 現 代的 調 查 概 念 、方 法 才 逐 漸 成型 。 5.

(12) 調查是種從調查對象之母體中抽取部份個體,加以觀察再 推 估 母 體 的 行 為。使 用 調 查 之 前,必 須 知 道 方 法 的 限 制 以 及 使 用 時 機,且 注 意 樣 本 代 表 性 的 問 題。抽 樣 方 法 可 概 分 為 非 機 率 抽 樣 與 機 率 抽 樣,非 機 率 抽 樣 難 以 評 斷 樣 本 代 表 性 也 無 法 估 計 精 確 度 , 但 是 在 某 些 調 查 時 有 實 施 的 必 要, 可 概 分 為 四 類 : 便 利 抽 樣 、 立 意 抽 樣 、 滾 式 抽 樣 和 配 額 抽 樣; 機 率 抽 樣 較 具 樣 本 代 表 性 , 也 可 估 計 精 確 度,即 使 混 合 多 種 抽 樣 方 法 之 後 也 不 失 其 優 點,方 法 例 如 : 簡 單 隨 機 、 分層 隨 機 、 系 統抽 樣 和 集 體 抽樣 。. 立. 政 治 大. 第三節、調查與普查的比較. ‧ 國. 學. 普查與調查的主要差異之處,在於普查訪查母體的所有成. ‧. 員,而 調 查 只 調 查 母 體 中 的 部 份 個 體。調 查 抽 取 的 樣 本 數 越 多 ,. y. Nat. 越 能 推 估 出 與 普 查 相 似 的 結 論,但 是 抽 取 的 越 多 所 耗 費 的 成 本 也. er. io. sit. 會 越 多,也 越 會 失 去 調 查 節 省 人 力 與 物 力 的 目 的,在 此 相 同 的 精 確 度 之 下,相 對 較 大 的 樣 本 數 推 估 的 資 訊 較 有 參 考 的 價 值,因 此. n. al. Ch. 調 查 要 避 免 這 部 分過 度 推 估 的 情況 。. engchi. i n U. v. 因此調查如有完善的抽樣推估理論、有適當的抽樣方法與 有 優 良 的 樣 本 代 表 性,則 有 可 能 代 替 普 查,並 且 省 下 許 多 時 間 、 經費和人力。 為了使抽出的樣本具有代表性,本研究提出了兩個衡量標 準,主 要 想 法 在 於 以 統 計 檢 定 標 準 衡 量 母 體 與 樣 本 是 否 一 致 以 及 母 體 估 計 的 容 許 最 大 誤 差 不 大 於 某 標 準。第 一 個 標 準 為 相 對 標 準 , 是 利 用 卡 方 適 合 度 檢 定 對 兩 組 樣 本 進 行 檢 定,兩 組 樣 本 為 真 實 母 體 組 與 調 查 組 ,其 中 , 真 實 母 體 組 可 能 是 某 地 區 的 男 女 人 數 , 或 者 是 男 女 的 年 齡 人 數;另 外,調 查 組 則 是 從 真 實 母 體 組 樣 本 中 簡 6.

(13) 單 隨 機 抽 取 部 份 比 例 的 樣 本,至 於 為 何 使 用 抽 取 比 例 將 於 後 續 說 明。此 標 準 將 探 討 從 真 實 母 體 組 中 簡 單 隨 機 抽 取 多 少 比 例 才 能 與 真 實 母 體 組 差 異 不大 , 至 於 差 異判 斷 的 標 準 也將 在 後 續 說 明。 第二個標準是彌補第一個標準缺失所產生的,由於第一個 標 準 的 結 論 只 要 求 抽 出 率 必 須 隨 著 分 組 數 變 動,與 母 體 結 構、母 體 總 數 並 無 關 係,因 此 在 不 同 地 區 皆 採 用 相 同 的 抽 出 率 時,每 個 地 區 母 體 數 量 的 多 寡 卻 不 相 同,因 此 對 於 之 後 的 估 計 將 會 產 生 影 響 。 以 台 灣 20 10 年 的 戶 籍 資 料 為 例 , 對 連 江 縣 以 及 新 北 市 皆 同. 政 治 大 7 5 ~7 9 歲 的 男 性 比 例,新 北 市 75 ~ 79 歲 的 男 性 真 實 比 例 為 0 . 709 8 %, 立 樣 採 取 簡 單 隨 機 抽 取 , 而 抽 取 的 比 例 為 2 0 %, 假 設 只 想 要 估 計. 有 9 5 .7 % 的 機 率 估 計 值 落 在 0 . 68 89 % 和 0 . 72 35 % 之 間 , 而 連 江 縣. ‧ 國. 學. 真 實 的 比 例 為 0 . 86 48 % , 有 95 . 5 % 的 機 率 估 計 值 落 在 0 . 55 30 % 和. y. Nat. 例 的 誤 差 會 大 於 母體 數 較 大 的 地區 。. ‧. 1 . 25 69 % 之 間 ; 也 就 是 說 母 體 數 過 小 的 地 區 , 估 計 75 ~ 79 歲 之 比. er. io. sit. 然而,同樣的問題在面對有兩組分組數時,較容易解決, 原 因 在 於 當 顯 著 水 準 為 5 % 時 , 要 使 最 大 誤 差 不 超 過 3 %, 不 論 母. al. n. v i n 體 數 大 小 為 何 , 只需 要 C 10 68 個 樣 本 數 就U可 以 達 到 此 效 果 , 因 此 hengchi. 在 二 項 式 分 配 假 設 之 下,計 算 樣 本 數 是 一 個 非 常 簡 單 的 方 法。但. 是,在 許 多 情 況下,分 組 數通 常 不 會 只 有兩 組,所 以我 們 需 要 利 用 到 多 項 式 分 配 來 計 算 樣 本 數,而 第 二 個 標 準 是 Tho m ps o n( 19 87 ) 的 多 項 式 分 配 計 算 樣 本 數 的 方 法,但 是 不 論 在 二 項 式 分 配 還 是 多 項 式 分 配 中,計 算 樣 本 數 的 方 法 皆 假 設 母 體 數 是 無 限;但 是 無 限 母 體 的 假 設 可 能 會 發 生 所 需 的 樣 本 數 大 於 母 體 數 的 情 況 發 生,所 以 有 限 母 體 的 假 設 會 較 為 實 用,本 研 究 主 要 貢 獻 之 一 是 將 多 項 式 分 配 計 算 樣 本 數 的方 法 從 無 限 母體 改 為 有 限 母體 。 目 前 台 灣 由 主 計 總 處 在 執 行 普 查 的 工 作 , 主 計 總 處 在 2 01 0 7.

(14) 年 首 次 使 用 登 記 式 普 查 結 合 抽 樣 調 查,登 記 式 普 查 結 合 抽 樣 調 查 主 要 是 改 進 傳 統 普 查 的 長 短 表 問 卷,短 表 問 卷 改 由 公 務 登 記 資 料 取 得,長 表 問 卷 可 能 因 較 私 人 的 問 題 或 者 填 表 時 間 過 長 而 造 成 問 卷 資 料 品 質 有 問 題 ( 未 回 應 率 或 者 遺 漏 ), 因 此 抽 取 一 些 樣 本 來 做 調 查;其 中 新 的 普 查 方 法:未 回 應 率 僅 發 生 在 長 表 調 查 的 部 分 。 (因 為 短 卷 由 公務 登 記 資 料 取得 ) 在 長 表 問 卷 的 調 查 中 , 總 抽 出 率 為 16 % , 各 縣 市 獨 立 辦 理 各 自 的 調 查,每 個 縣 市 再 將 自 己 的 鄉 鎮 市 區 設 為 副 母 體,副 母 體. 政 治 大 定 各 副 母 體 層 數,各 層 樣 本 數 以 紐 曼 配 置 法( N e ym an Al l o c at i o n ) 立 內 採 分 層 集 體 抽 樣 法,普 查 區 為 集 體 抽 樣 單 位,依 戶 籍 人 口 數 決. 分 配 各 層 樣 本 數,各 層 再 以 系 統 抽 樣 方 式 抽 選 普 查 區,普 查 區 內. ‧ 國. 學. 人 口 及 住 宅 將 全 部訪 查 。. ‧. 長 表 問 卷 當 中 的 抽 出 率 1 6 %是 沒 有 來 自 數 學 模 型 的 參 考 依. y. Nat. 據,如 果 可 以 使 用 相 對 標 準 與 絕 對 標 準 的 方 式,可 以 使 其 得 到 更. n. er. io. al. sit. 具 有 代 表 性 的 樣 本。. Ch. engchi. 8. i n U. v.

(15) 第參章、研究方法 在簡略介紹完普查與調查之後,本章將介紹相對標準與絕 對 標 準 的 電 腦 模 擬 假 設,第 一 節 先 說 明 相 對 標 準 所 使 用 的 統 計 量 、 判 斷 方 式、母 體結 構、分 組數 及 如 何 使 用正 確 率;第二 節 將 介 紹 為 何 有 使 用 絕 對 標 準 的 必 要,接 著 介 紹 正 確 率 判 斷 方 式、多 項 式 分 配 樣 本 數 的 公 式以 及 最 差 的 母體 結 構 。. 治 政 第一節、相對標準的方法 大 立. 適 合 度 檢 定 中 較 著 名 的 是 卡 方 適 合 度 檢 定,此 檢 定 可 用 於 離. ‧ 國. 學. 散型及連續型的樣本觀察值;此外,常見的適合度檢定還有. ‧. K o l m o gor o v- Sm i r no v 檢 定 和 Cr am e r - vo n M i s e s 檢 定 , 但 是 兩 者. y. Nat. 都 只 能 用 於 連 續 型 分 配,不 像 卡 方 檢 定 可 用 於 離 散 型,且 卡 方 檢. er. io. sit. 定 在 統 計 上 也 是 個 相 當 重 要 的 檢 定 之 ㄧ,有 許 多 的 檢 定 都 和 卡 方 檢 定 有 很 大 關 係,卡 方 檢 定 主 要 可 以 用 來 檢 定 母 體 是 否 來 自 某 一. al. n. v i n C個h 母 體 中 的 兩 個U變 數 是 否 相 互 獨 立 , 或 特 定 機 率 分 配,和 檢 定 一 engchi. 者 是 檢 定 不 同 的 母 體 是 否 具 有 相 同 的 分 配 或 比 例,現 今 仍 有 許 多 調 查 會 使 用 卡 方 檢 定 來 當 作 檢 定 樣 本 代 表 性 的 方 法,因 此 我 們 使 用 卡 方 檢 定 做 為 適 合 度 檢 定 的 方 法。但 卡 方 檢 定 在 使 用 上 有 個 唯 一 的 限 制,那 就 是 觀 察 值 的 期 望 個 數 不 可 過 小,一 般 建 議 不 可 小 於 5。 卡方檢定用以衡量母體的分佈與實際樣本觀察值之間的差 距,計 算 卡 方 檢 定 的 統 計 量 可 以 進 行 檢 定,統 計 量 大 於 臨 界 值 則 拒絕虛無假設。. 9.

(16) 例 如 : 假 設 k 組 類 別 發 生 的 機 率 為 p1, p2,..., pk , 期 望 值 為 e1,e2,...,ek , 觀 k. 察 值 為 o1,o2,...,ok , 其 中 pi 為 非 負 值 且 滿 足. k. oi  ei 2. i 1. ei. 2  .  p 1 , 統 計 量 : i 1. i. ( 3 .1 ). 在 虛 無 假 設 當 樣 本 服 從 母 體 分 配  p1 , p2 , , pk  下 , 為 具 有 自 由 度 k- 1 的 卡 方 分 配 。 在真實母體組抽取部份比例的過程中,由於使用了簡單隨. 政 治 大. 機 抽 取,因 此 在 本 研 究 中,將 利 用 電 腦 模 擬 進 行 簡 單 隨 機 抽 取 。. 立. 首 先 , 在 給 定 抽 樣 比 例 以 及 模 擬 次 數 之 下, 使 用 卡 方 檢 定 時 , 每. ‧ 國. 學. 個 抽 樣 比 例 將 會 有 個 p- val ue , 落 在 5 % 以 上 的 p- val ue 將 會 是 正 確 的 個 數,再 將 正 確 的 個 數 除 以 電 腦 模 擬 的 次 數 即 可 得 到 正 確 率 ;. ‧. 反 之 , 5 % 以 下 的 p- val ue 就 是 錯 誤 的 個 數 , 故 將 錯 誤 的 個 數 除 以. y. Nat. sit. 電 腦 模 擬 的 次 數 就可 得 到 錯 誤 率。. n. al. er. io. 在執行電腦模擬之前,我們必須要先設定好合理的假設,. i n U. v. 也 就 是 能 夠 合 理 的 代 表 出 各 地 區 人 口 特 性 的 假 設。雖 然 從 二 項 分. Ch. engchi. 配 計 算 樣 本 數 中,我 們 可 以 知 道 母 體 結 構 對 於 樣 本 數 是 有 影 響 的 , 但 在 卡 方 檢 定 中 不同 的 母 體 結 構是 否 存 在 顯 著影 響 還 無 法 確定。 人 口 學 上 會 使 用 人口 金 字 塔 來 研究 一 個 地 區 或國 家 的 人 口 結構, 每 個 國 家 的 人 口 金 字 塔 會 呈 現 不 同 的 形 狀,主 要 可 以 分 成 三 種 , 分 別 是 靜 止 型 金 字 塔 、 縮 減 型 金 字 塔 、 擴 張 型 金 字 塔( 陳 寬 政 , 2 00 9)。 靜止型金字塔則是各年齡組的比例在相對上較相似。縮減 型 金 字 塔 又 稱 為 彈 頭 型 金 字 塔,為 人 口 負 成 長 結 構,長 期 死 亡 率 超 過 出 生 率 時 發 生。擴 張 型 金 字 塔 又 稱 為 低 金 字 塔,底 部 寬 表 示 10.

(17) 出 幼 年 人 口 多 出 生 率 高,頂 部 窄 顯 示 老 年 人 口 少 死 亡 率 高。以 數 學 式 子 表 達 的 假 設 如 下 ( m 為 分 組 數 ): 人 口 結 構 1 (靜 止 型 金 字 塔 ) : 1 1 1 1  , , ,  ,  m m m m. ( 3 .2 ). 人 口 結 構 2 (縮 減 型 金 字 塔 ) :      1 , 2 , 3 ,  , m  m m m  m  i i i i     i 1   i1 i 1 i 1. ( 3 .3 ). 政 治 大. 人 口 結 構 3 (擴 張 型 金 字 塔 ) :.     1 6 11 1  5m  1   , m , m , , m   m 1  5i  1   1  5i  1 1  5i  1 1  5i  1  i 1 i 1 i 1  i 1 . 立. ( 3 .4 ). ‧. ‧ 國. 學. 為了能夠襯托出均勻與不均勻母體結構的差異,所以數學. y. Nat. sit. 式 子 沒 有 男 女 對 稱 的 概 念,只 有 均 等 結 構 與 等 差 結 構,因 為 如 此. n. al. er. io. 極 端 的 母 體 結 構 若 是 電 腦 模 擬 的 結 果 為 沒 有 差 異,那 介 於 均 勻 與. i n U. v. 極 度 不 均 勻 的 大 多 數 真 實 人 口 結 構 也 會 沒 有 差 異;反 之,若 均 勻. Ch. engchi. 與 極 度 不 均 勻 有 差異 , 再 來 考 慮介 於 中 間 的 母體 結 構 。 而關於分組數的選擇有三種分法,最多組的是不同性別的 五 齡 組 , 五 齡 組 代 表 的 是 男 女 分 開 0 ~ 4 歲 、 5 ~ 9 歲 、 … 、 9 5 ~9 9 歲 、1 00 歲 以 上 ( 表 3- 1) ;次 多 組 別 的 則 是 參 考 主 計 總 處 99 年 人 口 及 住 宅 普 查 總 報 告 結 果 提 要 分 析,裡 頭 調 查 了 許 多 項 目,像 是 各 地 區 不 同 性 別 的 常 住 人 口、遷 移 通 學、工 作 行 業 等 許 多 的 項 目 , 其 中 各 項 目 裡 面 分 成 最 多 組 的 是 各 縣 市 不 同 性 別 的 常 住 人 口,年 齡 分 法 為 0 ~ 4 歲 、 5 ~ 9 歲 、 …、 8 0 歲 以 上 總 共 34 組 ( 表 3 -2 ); 而 最 少 組 的 就 是 全 國 男 女 性 別,但 是 多 這 裡 不 以 2 組 代 入 電 腦 模 擬 11.

(18) 中 , 而 是 以 6 組 代 入 , 6 組 代 表 的 是 男 女 分 開 的 0 ~1 4 歲 、 15 歲 ~6 4 歲 、6 5 歲 以 上 的 人 口 數 , 為 幼 年 、 工 作 人 口 , 以 及 老 年 時 期 ( 表 3 -3 ) ; 考 慮 了 最 大 和 較 小 的 分 組 數 之 下 , 介 於 中 間 的 應 該 也 會有同樣的結果。. 表 3 -1 、 五 齡 組 分 法 且 10 0 歲 以 上 合 併 0 ~4 歲. 5 ~9 歲. …. 1 0 ~1 4 歲. 1 00 歲 以 上. 男 女. 立. 政 治 大. ‧ 國. 0 ~4 歲. 80 歲 以 上. n. a表l. 3 -3 、 老 中 幼 的 分 法. er. io. sit. y. Nat. 女. …. 1 0 ~1 4 歲. ‧. 男. 5 ~9 歲. 學. 表 3 -2 、 五 齡 組 分 法 且 8 0 歲 以 上 合 併. i n C 0 ~1 4 歲 h e n g c1h5 ~6 i 4U歲. v. 65 歲 以 上. 男 女. 上述的假設主要在探討調查一個縣市時,何種因子是重要 的,但 是 仍 不 明 白 要 調 查 單 一 縣 市 或 者 同 時 調 查 許 多 個 縣 市,要 如何使用結果。 要 調 查 一 個 縣 市 , 我 們 假 定 錯 誤 率 為 5% 以 下 , 而 根 據 卡 方 檢 定 的 使 用 限 制,單 一 縣 市 只 需 要 滿 足 期 望 個 數 大 於 5 的 條 件 即. 12.

(19) 可。但 是,台 灣 總 共 有 22 個 縣 市,所 以 並 不 是 只 調 查 單 一 縣 市 , 調 查 時 也 可 能 將 台 灣 分 成 許 多 區,而 只 要 求 單 一 縣 市 正 確 率 9 5 % 的 話,要 調 查 不 止 一 個 縣 市 的 時 候,整 體 正 確 率 會 隨 著 縣 市 越 多 而 降 低,解 決 方 法 是 加 入 D unn( 1 9 61 )提 出 的 Bo nfe r ro ni 方 法,就 是 將 單 一 縣 市 的 正 確 率 的 標 準 拉 高 , 使 得 整 體 錯 誤 率 不 到 5 %。 因 此 , 使 用 此 方 法最 重 要 的 式 子如 下 :. n.     總和過後各縣市的錯誤率  1 -    1     n . 立. ( 3 . 5). 政 治 大. 其 中 n 為 縣 市 數 ,  為 0 . 05 。. ‧ 國. 學. 此 外,各 縣 市 正 確 率 可 利 用 過 去 縣 市 的 資 料 先 做 電 腦 模 擬 找 尋 正 確 率 , 或 者 利 用 調 查 的 資 料 做 電 腦 模 擬 , 式 ( 3 .5 ) 是 正 確 率 最 嚴 格. ‧. 的要求。. y. Nat. sit. 本 研 究 的 主 要 貢 獻 之 一 , 就 是 利用 卡 方 檢 定 去找 出 具 有 樣. n. al. er. io. 本 代 表 性 的 抽 出 率, 自 行 設 立 一 組 母 體 ,抽 取 一 定 的 比 例 , 再 進. i n U. v. 行 卡 方 檢 定,探 討 母 體 結 構 的 分 組 數、母 體 結 構、抽 出 放 回 與 否 ,. Ch. engchi. 何 者 對 卡 方 檢 定 的結 果 有 顯 著 的影 響 。. 第二節、絕對標準的方法 使 用 式 ( 3 .5 ) , 就 表 示 樣 本 代 表 性 已 經 足 夠 , 通 過 卡 方 檢 定 可 以 保 證 整 體 的 樣 本 具 有 代 表 性,但 是 單 一 組 別 的 樣 本 代 表 性 卻 可 能 無 法 通 過。絕 對 標 準 的 部 份 就 是 在 探 討 要 增 加 多 少 樣 本 才 算 足 夠 , 為 了 解 決 這 個 問 題 , 我 們 使 用 Tho m ps o n( 1 98 7 ) 提 出 的 給 定 誤 差 範 圍 以 及 信 心 水 準 之 下,多 項 式 分 配 計 算 樣 本 數 的 方 法 , 只 要 在 給 定 誤 差 範 圍 以 及 信 心 水 準 之 下,不 管 調 查 所 要 調 查 的 分 13.

(20) 組 數 有 幾 組,用 這 個 方 法 計 算 出 來 的 樣 本 數 都 適 用。但 是 由 於 多 項 式 分 配 是 無 限 母 體 的 假 設 , 在 使 用 Tho m ps o n( 1 98 7 ) 的 方 法 時 可 能 會 造 成 需 要 的 樣 本 數 過 多,甚 至 有 可 能 樣 本 數 比 全 部 的 母 體 數 還 要 多,所 以 本 文 主 要 貢 獻 是 將 無 限 母 體 的 假 設 修 改 成 有 限 母 體 的 假 設,再 利 用 電 腦 模 擬 計 算 出 有 限 母 體 的 條 件 之 下,給 定 誤 差 範 圍 以 及 信 心 水準 所 需 的 樣 本數 各 是 多 少 。 在 介 紹 Tho m ps o n( 1 98 7) 的 公 式 之 前 , 先 簡 單 的 敘 述 多 項 式 分 配 樣 本 數 公 式 的 發 展 過 程 , Q ue e ns bur y an d H ur s t ( 1 96 4) 首 先 利. 政 治 大 G o o dm an( 1 96 5 ) 則 提 出 新 方 法 改 善 了 信 賴 區 間 的 寬 度 , 此 時 立. 用 近 似 的 卡 方 檢 定 計 算 出 多 項 式 分 配 的 信 賴 區 間 ,. G o o dm an 還 未 提 出 如 何 計 算 出 樣 本 數 的 方 法 , 但 是 Go o dm an 的. ‧ 國. 學. 作 法 對 於 後 續 研 究 是 非 常 重 要 的。Ange r s ( 197 4 )推 廣 G oo dm an 的. ‧. 方 法 計 算 出 了 多 項 式 分 配 的 樣 本 數,但 此 方 法 需 事 先 給 出 母 體 參. y. Nat. 數 , To r to r a(1 978 ) 提 出 最 差 母 體 結 構 之 下 所 需 的 樣 本 數 , 也 就 是. er. io. sit. 不 需 要 事 先 給 出 母 體 參 數,Ange r s (1 979 ) 認 為 To r to r a 的 方 法 太 過 保 守 , 因 此 Ange r s ( 19 79 , 1 984 ) 提 出 更 好 的 事 先 給 定 母 體 參 數 計. al. n. v i n C用h 蒙 地 卡 羅 法 ,U計 算 出 不 同 顯 著 水 準 之 算 樣 本 數 的 方 法,而 且 利 engchi. 下 最 差 的 母 體 結 構。Tho m ps o n( 19 87 ) 的 公 式 屬 於 最 差 母 體 結 構 之 下 計 算 出 來 的 樣 本 數,本 研 究 選 用 此 法 的 原 因 是 許 多 國 家 並 沒 有 母 體 清 冊,因 此 估 計 上 有 一 定 的 難 度,所 以 選 用 Tho m ps o n( 19 87 ) 是 最 為 簡 便 好 理 解的 方 法 。 在 二 項 式 分 配 的 條 件 之 下, 給 定 誤 差 範 圍 3 % 以 及 顯 著 水 準 5 % , 可 以 算 出 所 需 要 的 樣 本 數 是 1 06 8, 代 表 的 是 不 管 母 體 大 小 只 要 抽 取 10 68, 估 計 的 比 例 與 真 實 比 例 的 差 距 再 3 %以 內 的 機 率 是 9 5 %。 多 項 式 分 配 也 是 類 似 的 情 形 , 只 是 從 二 項 推 廣 成 多 項 。 絕 對 誤 差 與 相 對 誤 差 的 錯 誤 率 不 同,絕 對 誤 差 錯 誤 率 這 裡 定 義 為 14.

(21) 抽樣所抽出的每組比例與真實的每組比例是否相差給定的誤差 範 圍 以 上 , 只 要 有一 組 超 過 誤 差範 圍 就 算 錯 誤。 Tho m ps o n( 19 87 ) 提 出 了 一 個 多 項 式 分 配 計 算 樣 本 數 的 方 法 , 再 給 定 合 理 的 顯 著 水 準 和 誤 差 之 下,都 可 算 出 所 需 要 的 樣 本 數 。 多 項 式 分 配 計 算 樣本 數 的 公 式 為:.  1  m  1  z 2    m  m   n  max m d2. ( 3 .6 ). 政 治 大 最差的母體結構會讓給定的誤差範圍以及信心水準之下, 立. 所 需 要 的 樣 本 數 達 到 最 大,在 二 項 式 分 配 假 設 時 用 到 估 計 的 比 例. ‧ 國. 學. 是 50 %,如 此 假 設 可 讓 所 需 要 的 樣 本 數 達 到 最 大,舉 例 來 說 有 A、. ‧. B 兩 人 競 選 , 如 果 雙 方 掌 握 的 選 民 均 接 近 50 %, 即 雙 方 愈 相 峙 不. y. Nat. 下、選 民 意 見 愈紛 歧,那 麼預 測 誰 會 當 選的 調 查,所需 要 的 樣 本. er. io. sit. 就 要 大 ; 如 果 選 情 呈 一 面 倒, 彼 此 相 差 懸 殊 , 即 選 民 的 意 見 很 一 致 , 那 麼 不 需 要 很大 的 樣 本 , 也可 以 預 測 勝 負了 。. al. n. v i n 多 項 式 分 配 的 情 況C 也 是 類 似 的 , 均U hengchi 勻才能讓 所需要的樣本. 數 最 大,但 是 還 是 有 不 同 的 地 方。舉 例 來 說 如 果 有 一 多 項 式 且 都 是 均 勻 的 結 構,而 我 們 所 要 求 的 誤 差 範 圍 太 大,可 想 而 知 全 部 都 是 均 勻 的 結 構 不 會 是 最 差 的 母 體 結 構,因 為 只 要 某 幾 組 是 均 勻 其 它 都 是 0,所 需 要 的 樣 本 數 會 比 全 部 都 是 均 勻 的 結 構 還 要 多 ( 也 就 是誤差大於. 1 , 不 管 怎 麼 抽 都 會 在誤 差 範 圍 內)。 m. 根 據 Tho m ps o n( 19 87 ) 所 證 明 的 定 理 , 最 差 的 情 況 為 : 1 1 1   , , ,  ,0,  ,0  m m m  15. ( 3 .7 ).

(22) 其 中 : 非 0 的 個 數 m 個 , 0 的 個 數 k- m 個 , k: 分 組 數 , m 小 於 或 等 於 k, m 為 非 負 整 數 。 1 Tho m ps o n( 19 87 ) 證 明 出 m 個 比 例 為 m 以 及 k- m 個 0 的 母 體. 結 構,會 是 我 們 最 差 的 無 限 母 體 結 構,這 個 母 體 結 構 在 普 查 上 面 是 一 個 非 常 極 端 的 結 構,因 為 幾 乎 不 會 碰 到 某 個 年 齡 組 的 人 數 為 0 人 , 這 個方 法 是 在 所 有多 項 式 分 配 的情 況 之 下 使 用的 。 m 的 選 取 , Tho m ps o n( 1 9 87 ) 也 有 詳 盡 的 介 紹 , 若 固 定 誤 差 界 限 , 樣 本 數 只 和 顯 著 水 準 有 關 係 , 顯 著 水 準 在 0 和 0 . 03 44 之 間 , m =2 會 有. 政 治 大 之 間 , m =4 有 最 大 值立 、 0 .6 311 和 0 . 89 34 之 間 , m =5 有 最 大 值 、. 最 大 值、0 . 03 4 4 和 0 . 34 66 之 間,m = 3 會 有 最 大 值、0 .3 46 6 和 0 . 6 311. ‧ 國. 學. 0 . 89 3 4 和 1 之 間 , m= 6 有 最 大 值 ; 顯 著 水 準 在 這 上 述 的 區 間 之 內 都 會 有 對 應 的 樣 本 數,對 應 的 樣 本 數 不 管 調 查 將 受 訪 對 象 分 成 幾. ‧. 組 , 都 會 有 給 定 的誤 差 範 圍 以 及給 定 的 顯 著 水準 。. sit. y. Nat. 本研究的主要貢獻之一,推廣最差母體結構的概念後,利. al. er. io. 用 電 腦 模 擬 找 出 有 限 母 體 抽 出 不 放 回 之 下 的 樣 本,也 就 是 高 維 度. v. n. 超 幾 何 分 配 的 樣 本 數,但 是 有 限 母 體 的 最 差 結 構 與 無 限 母 體 不 同 ,. Ch. engchi. i n U. 大 多 數 情 況 雖 然 會 相 同,但 是 有 些 情 況 會 不 同,因 此 建 議 用 電 腦 模 擬 計 算 時 , 需 要 計 算 m =2、 3、 4、 5、 6 找 出 最 差 的 母 體 結 構 。. 16.

(23) 第肆章、電腦模擬 在說明完相對標準以及絕對標準的使用方法及電腦模擬假 設 之 後,本 章 將 進 行 電 腦 模 擬,第 一 節 相 對 標 準 將 逐 步 探 討 抽 出 放 回 與 否、母 體結 構、分 組數 與 抽 出 率 之中 何 者 是 重 要因 子,接 著 說 明 如 何 利 用 結 果;第 二 節 將 進 行 模 擬 為 何 要 有 絕 對 標 準 的 必 要 , 接 著 計 算 在 5 %顯 著 水 準 之 下 , 不 同 誤 差 範 圍 內 的 有 限 母 體 與 無 限 母 體 的 樣 本 數;第 三 節 提 出 不 同 標 準 結 合 在 一 起 的 方 法 , 使 用 過 後 將 會 具 有兩 種 標 準 的 優點 。. 立. 政 治 大. 第一節、相對標準的電腦模擬. ‧ 國. 學. 一般的調查並不需要考慮抽出放回與否,因為通常只會抽 取 不 到 一 千 或 者 數 千 的 樣 本 數,抽 取 的 樣 本 通 常 也 不 會 多 到 可 以. ‧. 改 變 母 體 結 構;但 是 當 抽 出 的 樣 本 數 多 到 有 可 能 改 變 母 體 結 構 時 ,. y. Nat. sit. 這 就 需 要 考 慮 抽 出 不 放 回 了。這 在 統 計 上 的 概 念 是 有 限 母 體 修 正. n. al. er. io. 因 子 , 因 此 本 研 究的 電 腦 模 擬 首先 將 會 檢 驗 兩者 的 差 異 。. i n U. v. 除 了 第 參 章 假 設 條 件 之 外 , 這 裡 還 假 設 總 母 體 數 10 萬 , 原. Ch. engchi. 因 為 總 母 體 數 在 5 0 萬 與 10 萬 時 差 異 不 大。而 抽 出 率 為 5 % 到 3 0 %; 為 了 觀 察 不 同 抽 出 率 的 情 況 , 因 此 電 腦 模 擬 假 設 為 5 % 到 30 % 。 最後,電腦模擬的母體結構使用結構 1 靜止型金字塔以及模擬 1 00 0 次 。. 17.

(24) 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. v i n C是h否 放 回 與 抽 出U率 的 關 係 圖 4 -1 、 抽 出 engchi. 圖. 從 圖 4 - 1 可 以 觀 察 到,雖 然 兩 個 方 式 都 抽 取 了 相 同 的 比 例 , 但 是 抽 出 放 回 不 管 怎 麼 增 加 抽 出 率 錯 誤 率 都 一 樣;而 抽 出 不 放 回 會 隨 著 抽 出 率 越 來 越 高,錯 誤 率 也 會 越 來 越 低。抽 出 放 回 的 壞 處 是 無 法 提 高 精 確 度,因 此 建 議 以 後 只 需 要 考 慮 抽 出 不 放 回 即 可 ; 如 此 一 來 , 樣 本 所 能 得 到 的 資 訊 也 會 比 較 多。 此 外 ,卡 方 檢 定 在 不 同 自 由 度 之 下 的 p- val ue 應 該 呈 現 均 勻 分 佈 , 可 是 從 圖 4 - 1 也 可 以 觀 察 到 , 這 僅限 於 抽 出 放 回的 情 況 下 才 會有 。. 18.

(25) 從 圖 4-1 還 可 以 觀 察 到 , 抽出 不 放 回 的 6 組 與其 他 兩 組 之 間 似 乎 有 所 差 異 , 雖 然 電 腦 模 擬 只 有 10 00 次 可 能 會 有 所 不 足 , 所 以 接 下 來 提 高 模 擬 次 數,檢 驗 不 同 的 分 組 數 對 於 錯 誤 率 有 沒 有 顯 著 影 響;若 電 腦 模 擬 的 結 果 為 不 同 的 分 組 數 對 於 錯 誤 率 有 所 影 響,則 必 須 將 分 組 數 列 入 影 響 錯 誤 率 的 重 要 因 子 中。此 外 也 順 便 以電腦模擬檢驗三種不同人口金字塔的母體結構對於錯誤率有 沒 有 顯 著 的 差 異,若 母 體 結 構 對 於 錯 誤 率 會 有 顯 著 影 響,那 就 必 須 要 找 到 最 差 的 母 體 結 構,最 差 的 母 體 結 構 與 其 他 母 體 結 構 相 較. 政 治 大 要 利 用 到 母 體 結 構 時 只 需 要 使 用 最 差 的 母 體 結 構 即 可。其 餘 的 電 立 且 其 餘 條 件 都 相 同 的 情 況 下 錯 誤 率 會 是 最 大 的;如 此 一 來,若 需. 腦 模 擬 假 設 同 上 , 除 了 電 腦 模 擬 次 數 改 為 10 萬 。. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 19. i n U. v.

(26) 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. v i n 4 -2 、 C 分h 組 數 與抽 出 率 的 engchi U關 係圖. 圖. 圖 4 -2 我 們 可 以 觀 察 到 , 三 種 不 同 人 口 金 字 塔 的 母 體 結 構 對 於 錯 誤 率 沒 有 顯 著 的 影 響,表 示 以 後 需 要 用 到 母 體 結 構 的 假 設 時 可 以 選 擇 個 簡 單 好 操 作 的 即 可。三 個 分 組 數 之 間 有 差 別 的 地 方 在 於 分 組 數 越 少,為 了 達 到 相 同 的 精 確 度,所 需 要 的 抽 出 率 反 而 比 較 多,會 有 這 種 現 象 是 因 為 不 要 把 多 項 分 配 假 設 計 算 樣 本 數 的 方 法 和 卡 方 檢 定 的 抽 出 率 搞 混,多 項 分 配 明 顯 可 以 知 道 n 組 所 需 要 的 樣 本 數 一 定 會 至 少 大 於 或 者 等 於 n- 1 組 所 需 要 的 樣 本 數 , 因. 20.

(27) 為 額 外 多 出 來 的 一 組 可 以 為 0, 但 是 卡 方 檢 定 有 期 望 個 數 大 於 5 的 限 制,所 以 和 多 項 分 配 是 不 太 一 樣 的。會 有 上 述 的 現 象 是 因 為 在 同 樣 的 母 體 數 與 抽 出 率 之 下,分 組 數 少 的 時 候 越 偏 向 均 勻,分 組 數 多 則 偏 斜 情 況 越 嚴 重,也 就 是 越 容 易 出 現 較 高 的 p- val ue 值 ; 又 或 者 可 以 觀 察 卡 方 檢 定 顯 著 水 準 5 %的 查 表 值 , 自 由 度 越 高 臨 界 值 會 越 來 越 大,可 以 想 像 成 抽 出 放 回 且 母 體 大 小 一 樣 的 情 況 下 , 分 組 數 越 多 卡 方 值 會 越 來 越 大;而 在 抽 出 不 放 回 且 母 體 大 小 一 樣 的 情 況 下,分 組 數 越 多 每 組 裡 面 的 觀 察 個 數 會 越 來 越 接 近 期 望 個. 政 治 大. 數,所 以 卡 方 值 才 會 相 對 而 言 距 離 臨 界 值 越 來 越 遠;附 錄 將 會 有 電 腦 模 擬 加 以 解 釋。. 立. 目前確定只有抽出不放回情況下的分組數以及抽出率會顯. ‧ 國. 學. 著 影 響 錯 誤 率,從 先 前 電 腦 模 擬 所 用 到 的 假 設 來 看,還 有 一 個 因. ‧. 子 還 沒 有 檢 驗 是 否 有 所 影 響,那 就 是 母 體 數 的 變 化 對 於 錯 誤 率 是. y. Nat. 否 有 顯 著 差 異,接 著 就 是 電 腦 模 擬 探 討 母 體 數 是 否 會 有 影 響。將. er. io. sit. 母 體 數 作 為 變 動 的因 子 , 除 了 選 擇 10 萬 當 做 第 一 個變 數 之 外 , 第 二 個 變 數 選 擇 4 50 萬 , 若 母 體 數 對 錯 誤 率 有 顯 著 影 響 , 那 未 來. al. n. v i n C要 考 慮 能 代 表 人 口 特性 的 重 要U根 據 母 體 數 的 不 同 而 有 h e因n子g時,就 i h c 不 同 的 考 慮 ; 其 餘 的 假 設 為 電 腦 模 擬 10 00 次 , 母 體 結 構 為 結 構 1 靜 止 型 金 字 塔 , 抽 出 率 為 1 5 % 到 3 0 %。. 21.

(28) 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. v i n 4 -3 、 C 母 體 數 與抽 出 率 的 關 係圖 hengchi U. 圖. 圖 4 -3 的 線 條 不 夠 平 滑 以 及 有 許 多 尖 點 , 可 能 是 因 為 模 擬 次 數 太 少 的 關 係。此 外 還 是 可 以 觀 察 出 變 動 母 體 數 並 沒 有 出 現 顯 著 的 影 響 , 更 可 以 從 圖 4 -3 觀 察 出 抽 出 率 才 是 影 響 錯 誤 率 的 重 要 因 子 而 不 是 樣 本 數,因 為 母 體 數 的 不 同 抽 出 率 換 算 的 樣 本 數 會 不 相 同,但 是 若 使 用 相 同 的 樣 本 數 進 行 電 腦 模 擬,錯 誤 率 一 定 會 有 顯著差異。 從 圖 4 - 1 至 4 -3 中,可 以 得 知 抽 出 放 回 與 否 是 非 常 重 要 的 因 子,選 擇 抽 出 不 放 回 可 以 從 樣 本 獲 得 的 資 訊 較 多,只 要 滿 足 卡 方 22.

(29) 檢 定 的 使 用 要 求,母 體 結 構 與 母 體 數 並 不 是 非 常 重 要 的 因 子。分 組 數 也 是 一 個 相 當 重 要 的 因 子,分 組 數 越 多 錯 誤 率 越 小,分 組 數 越少則反之。 在 釐 清 了 何 種 因 子 是 重 要 因 子 之 後 , 接 著 將 利 用 式 ( 3 .5 ) Bo nf e rr o ni 的 概 念 計 算 出 , 每 個 縣 市 的 錯 誤 率 需 要 小 於 多 少 才 足 夠 , 最 後 將 列 出 抽 出 放 回 之 下 不 同 分 組 數 的 錯 誤 率 。 圖 4- 4 是 將 式 ( 3 . 5 ) 代 入 數 字 的 結 果 , 表 4 -1 則 是 式 (3 . 5) 代 入 特 定 數 字 的 結 果。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -4 、 利 用 Bo nfe r ro ni 法 探 討 單 一 縣 市 所 需 的 錯 誤 率. 23.

(30) 表 4 -1 、 利 用 Bo nfe r ro ni 法 探 討 單 一 縣 市 所 需 的 錯 誤 率 縣市數. 5. 10. 15. 22. 50. 所需錯誤率. 1%. 0 .5 %. 0 . 33 33 %. 0 . 22 72 %. 0 .1 %. 42 組 所 需抽 出 率. 1 5 %以 下. 17%. 19%. 21%. 2 4 .5 %. 34 組 所 需抽 出 率. 1 5 %以 下. 2 1 .%. 24%. 2 5 .5 %. 30%. 6 組所需抽出率. 3 0 %以 上. 3 0 %以 上. 3 0 %以 上. 3 0 %以 上. 立. 政 治3 0上% 以大. ‧ 國. 學. 舉 例 : 台 灣 2 01 0 年 縣 市 升 格 之 後 有 2 2 個 縣 市 , 若 22 個 縣 市 錯. ‧. 誤 率 都 剛 好 只 達 5 %, 總 和 過 後 則 錯 誤 率 為 6 7 .6 5 %。 因 此 , 我 們 必 須 降 低 各 縣 市 的 錯 誤 率 , 使 得 總 和 過 後 錯 誤 率 仍 有 5 %, 各 別. y. Nat. io. sit. 計 算 過 後 錯 誤 率 需 為 0 . 22 72 %。 但 是 上 述 的 取 法 , 若 有 兩 個 某 年. n. al. er. 齡 人 口 相 近 的 縣 市,第 一 個 縣 市 對 某 年 齡 是 高 估 的,第 二 個 縣 市. Ch. i n U. v. 對 某 個 年 齡 是 低 估 的,則 兩 個 縣 市 總 和 過 後 就 會 是 正 確 的;但 是. engchi. 根 據 我 們 上 面 的 定 義,第 一 或 二 個 縣 市 不 管 是 高 估 或 是 低 估 就 都 算 是 錯 誤 了,所 以 若 照 上 面 的 取 法 會 導 致 浪 費 樣 本 數 的 情 況 發 生 , 辦 法 就 是 利 用 過 去 縣 市 的 資 料 先 做 電 腦 模 擬 找 尋 錯 誤 率,或 者 利 用 調 查 的 資 料 做 電 腦 模 擬。而 5 0 個 縣 市 是 以 美 國 5 0 個 州 為 例 , 雖 然 所 要 求 的 正 確 率 可 能 會 過 高,但 是 因 為 式 (3 . 5 ) 是 嚴 格 的 取 法 , 所 以 還 是 可 以 利 用電 腦 模 擬 降 低抽 出 率 。 接著根據以上的結論,可以從均勻母體結構為例,直接模 擬 出 最 後 結 果,接 下 來 只 需 要 根 據 分 組 數 以 及 錯 誤 率 去 查 詢 抽 出 率 即 可 ; 最 後 在 34 組 和 6 組 之 間 , 加 上 11 組 以 及 22 組 , 新 加 24.

(31) 上 的 錯 誤 率 在 34 組 和 6 組 之 間 , 就 是 圖 3-5 的 結 果 。 11 組 代 表 的 是 男 女 合 併 的 0 ~ 9 歲 、 … 90 ~ 99 歲 、 1 00 歲 以 上 的 人 ; 2 2 組 則 是 11 組 男 女 分 開 的 結 果 。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -5 、 相 對 標 準 對 照 圖 根 據 圖 4 -5 可 知 , 在 做 相 對 標 準 的 檢 定 時 , 只 需 要 找 最 少 組 別 的 抽 出 率,其 餘 組 別 皆 可 滿 足 相 對 標 準 的 要 求,但 是 注 意 每 組 期 望 觀 察 個 數 皆要 大 於 5。. 25.

(32) 但是在同樣的抽出率之下,分組數越大錯誤率就越小,也 就 是 會 發 生 同 樣 一 筆 資 料 原 本 不 會 通 過 相 對 標 準 的 要 求,但 是 提 高 分 組 數 之 後 卻 通 過 了 相 對 標 準 的 要 求,因 此 建 議 分 組 數 不 可 過 大 。 至 於 建 議 該 分 成 幾 組 ,接 下 來 以 電 腦 模 擬 的 結 果 來 判 斷 , 分 組 數 為 2 到 30 組 , 母 體 數 1 0 萬 , 抽 出 率 固 定 為 1 5 %, 以 均 等 結 構 式 1 為 例 , 進 行電 腦 模 擬 。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -6 、 總 母 體 1 0 萬 抽 出 率 皆 為 15 %. 從 圖 4 -6 可 以 觀 察 到 , 分 組 數 越 大 錯 誤 率 越 小 , 這 是 先 前 就 有 的 結 果,除 此 之 外,還 可 以 觀 察 到 錯 誤 率 下 降 的 速 度 越 來 越 慢 ; 在 2 組 和 7 組 之 間 , 每 提 高 一 個 組 別 , 錯 誤 率 就 下 降 0 .1 % 26.

(33) 以 上 , 在 7 組 和 2 0 組 之 間 , 錯 誤 率 下 降 速 度 稍 緩 , 20 組 以 後 就 都 以 非 常 緩 慢 的 速 度 下 降 了;因 此 建 議 將 分 組 數 盡 量 分 在 7 組 和 20 組 之 間, 分 組 數 在 7 組 以 前 , 有 可能 在 最 後 的 結果 所 需 要 的 抽 出 率 非 常 高 , 這違 背 了 調 查 節省 經 費 的 目 的, 分 組 數 在 20 組 之 後,檢 定 能 力 可 能 會 很 差,因 為 只 要 盲 目 的 提 高 分 組 數 就 能 夠 具有樣本代表性。 接 下 來,我 們 以 台 灣 2 01 0 年 戶 籍 資 料 為 例 做 電 腦 模 擬 1 00 0 次 的 盒 鬚 圖 , 每 個 縣 市 抽 取 16 % 以 及 2 5 .5 % 與 全 台 灣 的 結 果 相 比. 政 治 大 查 中 的 總 抽 出 率 , 雖 然 每 個 縣 市 不 是 都 剛 好 抽 取 16 %, 但 是 本 研 立. 較 , 觀 察 最 後 檢 定 結 果 是 否 可 接 受 。 16 % 為 本 次 台 灣 2 010 年 普. 究 仍 然 假 設 16 % 以 便 與 後 兩 者 比 較 , 因 此 分 組 數 與 201 0 年 普 查. ‧ 國. 學. 的 分 組 數 相 同,為 34 組;25 . 5 % 則 為 利 用 式 (3 . 5) 所 計 算 出 的 結 果 ,. ‧. 結 果 如 圖 4 -7 。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -7 、 各 縣 市 抽 取 不 同 比 例 後 與 全 台 灣 人 口 做 檢 定. 從 圖 4 -7 的 結 果 來 看 , 在 沒 有 明 確 的 規 範 之 下 , 二 種 抽 出 27.

(34) 率 的 結 果 似 乎 都 不 錯 , 但 是 在 式 ( 3 .5 ) 的 規 範 之 下 , 25 . 5 % 是 比 較 恰 當 的 , 因 為 幾 乎 不 可 能 p- val ue 會 小 於 5 % 。 最後,我們在考慮了母體結構、抽出率、母體數、分組數 之 後,可 以 從 電 腦 模 擬 中 觀 察 出 抽 出 率、分 組 數 是 重 要 的 因 子 ; 而 其 餘 沒 有 列 入 考 慮 的 因 子 有 很 多 , 例 如 非 抽 樣 誤 差 、成 本 、 時 間、抽 樣 方 式。前 面 三 個 因 子 可 能 不 太 清 楚 對 調 查 結 果 的 影 響 , 又 或 者 每 年 影 響 的程 度 不 同 , 因此 較 難 以 列 入電 腦 模 擬 中 。 抽樣方式指的是在普查的調查中,通常不會使用簡單隨機. 政 治 大 設 計 ( 侯 佩 君 , 201 0) , 使 用 簡 單 隨 機 法 是 因 為 沒 有 各 鄉 鎮 詳 細 的 立 法,而 會 使 用 由 分 層 和 集 群 抽 樣 法 等 搭 配 起 來 的 多 階 段 複 雜 抽 樣. 人 口 資 料。而 使 用 多 階 段 複 雜 抽 樣 設 計 的 原 因 是 執 行 調 查 工 作 時 ,. ‧ 國. 學. 有 許 多 的 問 題 必 須 考 慮 或 妥 協, 例 如 調 查 時 間 、 資 源 及 成 本 , 以. ‧. 及 無 法 取 得 抽 樣 清 冊 等,且 從 策 劃 調 查 到 公 佈 調 查 結 果 這 段 時 間. y. Nat. 內 動 作 必 須 要 快 ,所 以 必 須 在 精確 度 與 成 本 之間 做 出 取 捨 。. er. io. sit. 因此,在規劃抽樣設計時,通常會採取分層抽樣搭配集群 抽 樣 等 方 法 , 用 以 提 昇 調 查 時 的 可 行 性 , 例 如 先 依 照「 同 層 之 內. al. n. v i n 同 質 性 大,不 同 層 之 間 異C質 性 大 」的 原 理,將 hengchi U 母 體 分 成數 個 分 層 ;. 在 各 層 中 再 利 用 既 有 的 行 政 集 群( 例 如 縣 市 、 鄉 鎮 或 村 里 ) 或 自 然 形 成 的 集 群 ( 例如 原 住 民 部 落等 ) 來 分 群 抽取 。 由於同一集群內的個體往往存在著某種相似性,故使用集 群 抽 樣 法 會 導 致 精 確 度 比 簡 單 隨 機 抽 樣 抽 出 放 回 好。總 體 而 言 , 由 分 層 和 集 群 抽 樣 法 等 搭 配 起 來 的 多 階 段 複 雜 抽 樣 設 計,雖 然 會 降 低 統 計 上 的 精 確 度,但 卻 可 在 資 料 蒐 集 上 提 供 最 實 際 與 最 經 濟 的 效 益,是 在 確 度 和 成 本 上 取 得 平 衡 的 作 法。雖 然 以 上 的 因 子 目 前 沒 有 列 進 電 腦 模 擬,但 在 將 來 的 後 續 研 究 中 可 以 考 慮 放 進 去 。. 28.

(35) 第二節、絕對標準的電腦模擬 使 用 式 ( 3 .5 ) , 就 表 示 樣 本 代 表 性 已 經 足 夠 , 通 過 卡 方 檢 定 可 以 保 證 整 體 的 樣 本 具 有 代 表 性,但 是 單 一 組 別 的 樣 本 代 表 性 卻 可 能 無 法 通 過 。 以 五 齡 組 為 例 , 10 0 歲 以 上 的 男 性 或 者 女 性 比 例 通 常 是 42 組 中 最 小 的 一組 ; 而 根 據 相對 標 準 的 結 論, 不 管 縣 市 人 口 多 寡 , 只 要 求 相 同 的 抽 出 率 即 可 , 這 對 於 10 0 歲 以 上 男 性 或 者 女 性 比 例 的 估 計 可 能 會 有 某 種 程 度 的 影 響。表 4-2 為 本 研 究 自 行 設 定,列 出 五 個 都 市 1 00 歲 以 上 男 性 或 者 女 性 的 最 小 比 例 以 及 人口數。. 立. 政 治 大. 總人口數. 1 00 歲 以 上 兩 性 的 最. 1 00 歲 以 上 兩 性 的. ‧. ‧ 國. 最少人口數. 0 . 00 56 %. B市. 2 61 877 2. 0 . 00 82 %. C市. 2 64 841 9. D市. 1 87 379 4. E市. 2 77 348 3. io. n. al. Ch. 0 . 00 16 %. e n0 .g00c20h%i U 0 . 00 21 %. er. 3 89 736 7. Nat. A市. y. 小比例. sit. 縣市名稱. 學. 表 4 -2 、 五 個 都 市 1 00 歲 以 上 兩 性 的 最 小 比 例 以 及 人 口 數. v ni. 2 21 2 16 45 39 59. 從 表 4 - 2 可 知,10 0 歲 以 上 兩 性 的 最 小 比 例 以 及 人 口 數 都 非 常 小 , 以 二 項 式 分 配 的 角 度 來 檢 視 表 4 -2 , 100 歲 以 上 兩 性 的 最 小 比 例 值 為 第 一 項 , 其 餘 0 ~99 和 10 0 歲 以 上 兩 性 的 最 大 比 例 值 為 第 二 項 。 在 二 項 式 分 配 的 條 件 之 下 , 給 定 誤 差 範 圍 3 %以 及 顯 著 水 準 5 %, 可 以 算 出 所 需 要 的 樣 本 數 是 106 8。 可 是 第 一 項 的 比 例 值 全 部 都 比 0 . 01 % 還 要 小,誤 差 範 圍 3 % 將 會 無 法 準 確 的 估 計 。. 29.

(36) 我 們 以 電 腦 模 擬 來 展 示 這 個 問 題 的 嚴 重 性 , 假 設 與 表 4-2 相 同 , 此 外 五 都 抽 出 率 皆 為 16 % , 電 腦 模 擬 1 00 0 次 , 而 且 結 果 改 為 比 值 的 盒 鬚 圖,比 值 分 子 為 抽 樣 所 調 查 出 的 10 0 歲 以 上 兩 性 的 最 小 比 例 , 分 母為 分 子 的 真 實比 例 。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -8 、 五 都 比 值 的 盒 鬚 圖. 從 圖 4 - 8 可 以 知 道,1 00 歲 以 上 兩 性 的 最 小 比 例 值 是 影 響 比 值 的 關 鍵 因 素, 因 為 B 市、 C 市、 E 市 的 人 口 數 都相 差 不 遠, 可 是 三 個 縣 市 的 盒 鬚 圖 卻 有 顯 著 差 異,但 是 也 不 能 說 人 口 數 沒 有 影 響,只 是 重 要 程 度 沒 有 來 比 前 者 來 的 大。增 加 抽 出 率 可 以 改 善 比 30.

(37) 值 的 問 題 , 圖 4 -9 以 E 市 為 例 , 抽 出 率 為 1 0 ~3 0 % , 模 擬 比 值 大 於 1 .5 和 小 於 0 .5 的 百 分 比 。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 -9 、 抽 出 率 與 相 對 誤 差 範 例 ( E 市 ). 圖 4-9 雖 然 只有 以 E 市 為 例 子 ,但 是 其 他 縣 市的 情 況 也 是 相 同 的,皆 可 以 增 加 抽 出 率 改 善 比 值 的 問 題。至 於 增 加 多 少 樣 本 才 算 足 夠 , 則 是 絕 對 標 準 想 解 決 的 問 題 , 我 們 使 用 Tho m ps o n( 19 87 ) 提 出 的 給 定 誤 差 範 圍 以 及 信 心 水 準 之 下,多 項 式 分 配 計 算 樣 本 數 的 方 法。但 是 由 於 多 項 式 分 配 是 無 限 母 體 的 假 設 , 所 以 本 研 究 將 無 限 母 體 的 假 設 修 改 成 有 限 母 體 的 假 設,再 利 用 電 31.

(38) 腦 模 擬 計 算 出 有 限母 體 的 條 件 之下 所 需 的 樣 本數 是 多 少 。. 本節接下來將舉例,在給定的條件之下計算多項式分配之 下 所 需 的 樣 本 數,假 設 有 名 生 物 學 家 想 要 知 道 某 種 魚 類 的 各 年 齡 比 例 , 不 管 魚 類 有 幾 組 , 在 顯 著 水 準 5 % 之 下 誤 差 不 超 過 5 %, 我 們 可 以 從 式 ( 3 .6 ) 知 道 給 定 顯 著 水 準 可 以 算 出 一 個 值,也就是 1 m 1 max z 2 ( )( ),該 值 除 以 誤 差 的 平 方 就 是 樣 本 數,所 以 可 以 算 出 m m m. 樣 本 數 就 是 51 0。關 於 m 的 挑 選 以 及 母 體 結 構 已 於 研 究 方 法 中 說. 政 治 大 準 之 下 所 需 要 的 樣 本立 數。. 明 。 表 4 -3 將 列 出 幾 個 常 用 的 無 限 母 體 數 誤 差 範 圍 , 以 及 信 心 水. ‧ 國. 學. 表 4-3、 常 用 的 無 限 母 體 樣 本 數 表. d=0.5%. d=0.1%. 1119. 2 51 7. 1 00 67. 4 02 65. 1 00 662 3. 1415. 3183. 12729. 4936. 19741. n. Ch. engchi U. sit. y. al. 2194. 50916. er. io. 顯 著 水 準 1%. d=1%. ‧. 顯 著 水 準 5%. d=2%. Nat. 顯 著 水 準 10%. d=3%. v ni. 78961. 圖 4 -1 0 、 樣 本 數 與 誤 差 之 關 係 圖. 32. 1272899 1974025.

(39) 找 出 我 們 想 要 的 樣 本 數 , 該 樣 本數 會 在 我 們 給定 的 條 件 之 下 ( 誤 差 、 顯 著 水 準 以 及 母 體 數 )滿 足 要 求 , 以 下 皆 是 稍 微 大 於 真 實 值 的 近 似 值 。 表 4- 4 將 列 出 幾 個 常 用 的 無 限 以 及 無 限 母 體 數 誤 差 範 圍 , 以 及 信 心水 準 之 下 所 需要 的 樣 本 數 。. 表 4 -4 、 常 用 的 無 限 母 體 與 有 限 母 體 樣 本 數 表 一 顯 著 水 準 5%. d= 3 %. d= 2 %. d= 1 %. d= 0 . 5 %. d= 0 . 1 %. 無限母體. 1 41 5. 3 18 3. 1 27 29. 5 09 16. 1 27 289 9. 20 萬 15 萬. 1 40 0 1 39 5. 3 15 0 3 10 0. 1 21 50 1 20 00. 4 00 00 3 80 00. 1 73 000 1 34 000. 10 萬. 1 39 0. 3 40 00. 9 25 00. 1 .5 萬 1 萬. 1 30 0 1 23 0. 11 600 8 40 0. 1 48 25 9 92 0. 立. 2 95 0 治11 000 政 2 55 0 6 85大 0 2 40 0. 5 60 0. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 - 11 、 常 用 的 無 限 母 體 與 有 限 母 體 樣 本 數 圖 一. 表 4 - 4 可 以 觀 察 出 , 誤 差 範 圍 在 0 .5 %以 上 , 有 限 母 體 只 要 到 達 了 2 0 萬 , 和 無 限 母 體 的 樣 本 數 就 相 差 不 遠 , 因 此 表 4 -5 列 出 誤 差 範 圍 0 .5 % 以 下 的 樣 本 數 表 ( 如 下 表 所 示 )。. 33.

(40) 表 4 -5 、 常 用 的 有 限 母 體 與 有 限 母 體 樣 本 數 表 二 顯 著 水 準 5%. d= 0 . 5 %. d= 0 . 4 %. d= 0 . 3 %. d= 0 . 2 %. d= 0 . 1 %. 無限母體. 5 09 16. 7 95 57. 1 41 434. 3 18 225. 1 27 289 9. 60 萬 30 萬. 4 60 00 4 25 00. 6 80 00 6 20 00. 11 200 0 9 40 00. 2 05 000 1 52 000. 4 05 000 2 41 000. 20 萬. 4 00 00. 5 60 00. 8 20 00. 1 21 500. 1 73 000. 15 萬 10 萬. 3 80 00 3 40 00. 5 15 00 4 40 00. 7 15 00 5 80 00. 1 01 000 7 55 00. 1 34 000 9 25 00. 1 .5 萬. 11 600. 1 26 00. 1 35 50. 1 43 30. 1 48 25. 1 萬. 8 40 0. 8 90 0. 9 35 0. 9 69 0. 9 95 0. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. i n U. v. 圖 4-12、常 用 的 有 限 母 體 與 有 限 母 體 樣 本 數 圖 二. Ch. engchi. 誤 差 範 圍 在 0 .1 %以 下 不 列 出 , 因 為 誤 差 範 圍 太 小 可 能 會 使 得 成 本 與 精 確 度 無 法 取 得 平 衡 。 根 據 表 4- 5 的 樣 本 數 表 , 我 們 就 可 以 知 道 估 計 的 比 例 與 真 實 的 比 例 誤 差 範 圍,如 果 誤 差 範 圍 比 估 計 的 比 例 還 大 , 則必 須 增 加 樣 本數 , 反 之 , 則可 自 行 判 斷 。. 34.

(41) 第三節、結合絕對標準與相對標準 根據我們使用相對誤差所計算出來的結果,每個縣市需要 滿 足 式 ( 3 .5 ) 的 樣 本 比 例,我 們 可 以 從 絕 對 標 準 知 道 人 口 少 的 縣 市 會 有 問 題,原 因 在 於 人 口 少 的 縣 市 只 抽 取 滿 足 式 (3 . 5 )的 抽 出 率 會 估 計 不 出 真 實 的 比 例。所 以 人 口 少 的 縣 市 需 要 額 外 抽 取 樣 本,至 於 抽 取 多 少 樣 本 則 是 要 參 考 表 4-5 去 決 定 樣 本 數,可 是 實 務 上 人 口 多 的 縣 市 可 能 不 太 需 要 多 抽 取 樣 本,人 口 少 的 縣 市 由 於 總 母 體 少 , 所 以 使 用 Tho m ps o n( 19 87 ) 公 式 的 效 果 也 不 好 , 因 此 本 研 究. 政 治 大 而關於有限母體 立樣 本 數 的 用 法 , 並 不 是 主 觀 研 究 者 決 定 一. 的 貢 獻 就 是 提 供 有限 母 體 的 樣 本數 。. ‧ 國. 學. 個 誤 差,達 不 到 誤 差 範 圍 以 內 就 多 抽 樣 本 數。這 樣 子 將 會 面 臨 到 當 我 們 所 要 估 計 的 比 例 值 如 果 過 小 時,我 們 便 無 法 精 確 的 估 計 比. ‧. 例 值,解 決 方 法 就 是 誤 差 範 圍 至 少 不 能 大 於 要 估 計 的 比 例 值。也. sit. y. Nat. 就 是 說 主 觀 研 究 者所 要 決 定 的 就是 誤 差 範 圍 除以 估 計 的 比 例值,. al. er. io. 決 定 0 ~ 1 之 間 的 該 取 什 麼 值 會 比 較 恰 當,決 定 該 值 的 因 素 必 須 在. v. n. 準 確 度 與 成 本 上 面 做 出 平 衡;要 估 計 的 比 例 值 很 多,我 們 不 需 要. Ch. engchi. i n U. 將 誤 差 範 圍 除 以 每 個 要 估 計 的 比 例 值,只 需 要 除 以 最 小 的 要 估 計 的比例值即可。 簡單來說有以下 8 個步驟 1 .必 須 先 知 道 各 個 縣 市 的 母 體 數 。 2 .決 定 調 查 的 結 果 分 成 幾 組 , 以 方 便 帶 入 步 驟 3 決 定 抽 取 率 。 3 . 從 式 (3 . 5 )決 定 各 個 縣 市 抽 取 率 。 4 .將 所 決 定 的 抽 樣 比 例 乘 以 母 體 數 換 成 樣 本 數 。 5 .將 各 個 縣 市 的 樣 本 數 參 考 表 4 - 5 找 出 誤 差 範 圍 。 6 .將 各 個 縣 市 的 誤 差 範 圍 除 以 最 小 的 估 計 比 例 。. 35.

(42) 7 .主 觀 研 究 者 決 定 步 驟 6 中 各 縣 市 的 值,各 縣 市 的 值 需 在 0 ~1 中 挑選。 8 .決 定 步 驟 7 的 值 之 後 , 對 達 不 到 的 縣 市 增 加 樣 本 數 。 如 此 一 來 , 我 們 的 相 對 誤 差 就 可以 保 證 我 們 的整 體 差 異 不 會 太 大,絕 對 誤 差 又 兼 顧 了 真 實 比 例 與 估 計 比 例 不 會 相 差 太 大 , 但 是 重 點 在 於 誤 差範 圍 除 以 真 實比 例 不 可 太 大。 另外,有關分組數每組內的範圍以及組數,也是一個重要 的 問 題,以 下 將 建 議 分 組 數 的 取 法。有 關 年 齡 的 取 法 經 常 是 分 成. 政 治 大 上 , 單 齡 組 則 是 1 歲 、 …、 99 歲 、 1 00 歲 以 上 , 與 主 計 總 處 2 01 0 立 五 齡 組 以 及 單 齡 組 , 五 齡 組 是 0 ~4 歲 、 … 、 9 5 ~9 9 歲 、 10 0 歲 以. 年 普 查 時,使 用 到 的 年 齡 方 法 不 同。例 如 在 編 算 生 命 表 時 經 常 以. ‧ 國. 學. 五 齡 組 為 單 位 來 計 算 死 亡 率,戶 籍 資 料 則 是 以 單 齡 組 來 呈 現 結 果 。. ‧. 現 在,將 相 對 標 準 以 及 絕 對 標 準 的 標 準,應 用 在 五 齡 組 以 及 單 齡. y. Nat. 組 當 中 , 尋 找 適 當的 抽 出 率 以 及樣 本 數 。. er. io. sit. 相對標準的部份,只要找出抽出率即可,但是假如有縣市 單 齡 組 的 人 數 不 足 5 人,故 若 不 併 組 時,將 會 無 法 滿 足 卡 方 檢 定. al. n. v i n C準h 的 方 法 無 法 在U單 齡 組 上 使 用 。 絕 對 標 的 使 用 要 求,所 以 相 對 標 engchi 準 的 部 份 , 例 子 如 同 相 對 標 準, 在 五 齡 組 中 , 最 小 值 通 常 是 出 現 在 1 00 歲 以 上 的 部 分 。 因 此 , 表 4 - 6 列 出 五 個 都 市 不 同 性 別 , 五 齡 組 中 的 最 小 值 比例 。. 表 4 -6 、 五 個 都 市 中 五 齡 組 的 最 小 值 縣市名稱. A市. 總人口數. 3 89 736 7. 1 00 歲 以 上 兩 性 的 最. 1 00 歲 以 上 兩 性 的. 小比例. 最少人口數. 0 . 00 56 %. 2 21. 36.

(43) B市. 2 61 877 2. 0 . 00 82 %. 2 16. C市. 2 64 841 9. 0 . 00 16 %. 45. D市. 1 87 379 4. 0 . 00 20 %. 39. E市. 2 77 348 3. 0 . 00 21 %. 59. 從 絕 對 標 準 的 樣 本 數 表 可 知,要 使 得 最 大 誤 差 在 0 . 1 %以 內, 所 需 要 的 樣 本 數 就 已 經 極 為 龐 大 , 更 何 況 表 4- 6 中 的 最 小 值 又 比 0 . 1 % 更 小 , 因 此 表 4 -6 中 五 齡 組 皆 很 難 滿 足 絕 對 標 準 的 要 求 。 因. 政 治 大 在使用調查來調查單齡組以及五齡組,在滿足相對標準以 立. 此 由 於 最 小 值 都 過於 小 , 所 以 無法 準 確 的 估 計。. ‧ 國. 學. 及 絕 對 標 準 的 情 況 下,所 需 要 的 樣 本 過 多,合 併 高 齡 組 會 是 降 低 總 抽 出 率 的 好 方 法。主 計 總 處 20 10 年 普 查 時 3 4 組 的 年 齡 分 法 ,. ‧. 就 是 合 併 高 齡 組 的 作 法 之 一 。 34 組 的 年 齡 分 法 在 滿 足 相 對 標 準. sit. y. Nat. 以 及 絕 對 標 準 時,所 需 要 的 總 抽 出 率 與 五 齡 組 相 較 下 少 了 許 多 。. io. er. 因 此 在 預 算 有 限 的 情 況 之 下 , 34 組 的 分 法 能 夠 達 到 從 部 份 樣 本 推 估 母 體 的 目 的 。 但 是 若 將 80 歲 以 上 合 併 為 一 組 時 , 會 無 法 準. al. n. v i n C資 確 的 掌 握 高 齡 人 口的 詳 細 且 非高 年 人 口 由 於人 數 眾 多 , h e訊,而 ngchi U 有 些 年 齡 組 採 取 單齡 組 的 分 法 也能 夠 滿 足 本 研究 的 兩 個 標 準。. 此 外,以 某 高 齡 數 為 界 線 上 下 分 開 調 查 是 可 行 的 方 法 之 ㄧ , 再 次 以 表 4 -6 的 五 個 都 市 為 例, 資 料 為 自 行 設 定 的 結 果, 列 出 6 5 歲 以 上 的 五 齡 組 最小 值 。 表 4 -7 、 五 個 都 市 中 6 5 歲 以 上 五 齡 組 的 最 小 值 縣市名稱. 五齡組的最小值. A市. 0 . 13 28 %. B市. 0 . 12 33 %. 37.

參考文獻

相關文件

Based on the results of Census 2001 and the data on subsequent population changes, resident population of Macao was estimated at 465 333 as at 31 st December 2004, which represented

Classical information theory uses Shannon entropy to quantify the uncer- tainty of probability distributions or information sources, the information obtained after the value of a

In 2007, results of the analysis carried out by the Laboratory of the Civic and Municipal Affairs Bureau indicated that the quality of the potable water of the distribution

In 2007, results of the analysis carried out by the Laboratory of the Civic and Municipal Affairs Bureau indicated that the quality of the potable water of the distribution

In 2007, results of the analysis carried out by the Laboratory of the Civic and Municipal Affairs Bureau indicated that the quality of the potable water of the distribution

Matrix factorization (MF) and its extensions are now widely used in recommender systems.. In this talk I will briefly discuss three research works related to

Students are asked to collect information (including materials from books, pamphlet from Environmental Protection Department...etc.) of the possible effects of pollution on our

An information literate person is able to recognise that information processing skills and freedom of information access are pivotal to sustaining the development of a