「台灣社會變遷調查五期一次」抽樣分層報告
侯佩君、杜素豪、廖培珊、洪永泰、章英華
在實證研究中,利用調查訪問方法作為資料分析的蒐集方式,儼然已成為社會及行為 科學研究的主流。其中,若以是否遴選訪問對象而言,可簡單區分為普查與抽樣調查。然 而,礙於普查所耗費的時間、金錢、與人力過於龐大,再加上耗費如此龐大的資源所獲得的 資料品質不見得優於抽樣調查,因此,在一般性的調查訪問中,若母體(population)所涵 蓋的受訪對象數量過多時,往往是以抽樣調查的方式來處理。
在 台 灣 地 區 進 行 抽 樣 調 查 時 , 普 遍 採 取 的 基 本 抽 樣 方 式 是 以 分 層 抽 樣 ( stratified sampling)搭配機率抽樣(probability sampling)的方式執行。前述方式即是將母體中具有共 通特質的單位或區域劃入同一層級,依此劃分成數個子母體(一組一組的團體),使其具有 同層之間同質性高、異層之間差異性大的特性。其後,再個別於各分層獨立進行機率抽樣。
這種方式有下列幾項優點:第一、是有助於簡化抽樣工作的行政管理作業;其次,是可藉此 估計出抽樣機率與誤差;最後,則是因為降低了抽樣誤差,而可獲得較精確的母體估計量
(洪永泰,1992;Fowler,1993)。
「台灣地區社會變遷調查計畫」於第四期計畫執行時,所據以抽樣的分層子群體乃是 採用羅啟宏(1992)對台灣地區 309 個鄉鎮所分群的七個類別,再加上省轄市、高雄市、台 北市等共計分成十個集群。然而,有鑑於羅啟宏所賴以分群者為民國七十九年的相關統計資 料,其年代距今已久遠而無法實質反映出近幾年來由經濟結構改變與社會環境變遷所造成的 城鄉差距程度。因此,從第五期計畫開始,為能精確地配置符合調查母體人文區位結構的訪 問樣本,以使調查資料能與當前的都市化差異串連在一起,進而將可能性的誤差降至最低,
乃著手於利用最新的人文區位資料重新進行抽樣分層分類。
這次的分層分類所依循的項目共計有六項,包括:商業人口百分比、工業人口百分 比、15-64 歲人口百分比、65 歲及以上人口百分比、專科及以上教育等級人口百分比及人口 密度等。在這六個項目中,除了商業與工業人口數資料取自於 2000 年戶口普查之外,其餘 四項資料皆採用內政部戶政司所提供之 93 年度人口統計資料。各項資料的計算方式如下所 示:
總人口數 商業就業人口數 1.商業人口百分比:
總人口數 工業就業人口數 2.工業人口百分比:
總人口數 歲人口數 64
15− 3.15-64 歲人口百分比:
總人口數 歲及以上人口數 4.65 歲及以上人口百分比:65
歲及以上人口數
人口數 歲及以上專上教育程度
15 5.專科及以上教育等級人口百分比: 15
6.人口密度:每平方公里的人口數
集群分析(cluster analysis)分類資料的基本原理,乃是利用變項之間的相同或相異性 特質,將同質性越高者(相異性越低者)群聚在一起,因此,相當程度能有效發揮資料簡化 的功能。本次在進行抽樣分層分析時,即利用集群分析簡化資料的特性,將前述六個項目加 以分類;而分群時,所選擇的測量方式為計算同一變項間相異性方式的華德最小變異數法
( Ward`s Minimum Variance Method ) , 並 以 歐 幾 里 德 距 離 的 平 方 ( Squared Euclidean distance)作為測量距離方法,將台灣地區 358 個鄉鎮分成七個集群(請參考附錄一)。分 群後的相關統計資料與效果,請參考表一至表二所示:
151
152
1 1.3005491 -0.8240857 0.9889246 -0.5558032 1.8336278 3.2904936 2 1.2979193 -0.3903894 0.8651508 -0.8318988 1.3389973 0.4795337 3 0.0430067 0.9394683 0.6123095 -0.8014132 0.3920078 -0.1577593 4 -0.4976636 1.3061763 -0.6469485 0.1235990 -0.0108842 -0.3517682 5 -0.2311474 -0.6662008 -0.3853942 0.5687943 -0.5659861 -0.4035058 6 -0.3400994 0.0276050 -1.2472155 1.6487326 -0.7777581 -0.4362083 7 -0.8112729 -0.8705260 0.4495091 -0.6904365 -1.1809080 -0.4695897
*表中分數為各變項標準化後的平均數
153
商業高度發展之地區,故名之為「一般都市」。在這集群中,是以基隆市、台北市 及台北縣分佈的地區數最多,分別是 6 個、5 個、5 個;其餘縣市所佔的數額則比 較少,分佈範圍包括台中市、台南市、高雄市、宜蘭縣、高雄縣、花蓮縣、新竹 縣、新竹市、桃園縣、台中縣、台南縣、屏東縣等九縣市。在這九個縣市中,除少 數佔 3-4 個以外,其他各約為 1-2 個。
集群三:此集群在商業人口百分比、15-64 歲人口百分比、專科及以上教育等級人口百分比 及人口密集度都屈居於第三,而在工業人口百分比卻優於前二個集群,並僅次於第 四個集群,顯示此集群具有活絡的工業生產活動,也有足夠的商業活動與具有工作 能力的人來發展該項產業,故名之為「新興市鎮」。在新興市鎮中共涵蓋 70 個鄉 鎮市區,其中,佔最多數者為高雄縣與台中縣,其次為台北縣、彰化縣、台南縣、
桃園縣,其他縣市則僅佔 1-2 個地區。
集群四:在這個集群中,舉凡商業、就業人口、居住人口密度及居民教育程度等四項皆次於 前三個集群,惟工業人口百分比及 65 歲及以上人口百分比是高於前三個集群。換 言之,在這集群所屬的鄉鎮市區中,礙於就業人口的供給較低及為數不少的老年居 民,其都市發展遠不如前幾個集群,而造就這些鄉鎮市區依舊從事既有的傳統產 業,故名之為「傳統產業市鎮」。在此市鎮中共計有 47 個地區,其分佈於各縣,
但未存在於直轄市與省轄市。地區分佈數量最多者為台南縣、新竹縣、苗栗縣、彰 化縣等。
集群五:這個集群是屬於就業人口少、老年人口偏多、工商業不發達、教育程度偏低的城 鎮。它的特色是沒有明顯的工商業活動與都市化發展,故名之為「一般鄉鎮」。包 含於這個集群的鄉鎮,以隸屬於屏東縣與雲林縣者為最多,其次分別為南投縣、彰 化縣、嘉義縣、花蓮縣、台東縣等。
集群六:高齡化人口眾多是這個集群的重大特色,而伴隨於老年人口眾多的另一個面向,即 是類屬於 15-64 歲的主要就業人口是七個集群中最少者。在這兩個條件的相輔相成 下,舉凡工商業的任何活動都排名較低,更遑論人口密度與教育程度此二項,也相 形是屬於比較低度化的,綜合以上特性,這個集群名之為「高齡化鄉鎮」。在高齡 化鄉鎮中,除了不存在於直轄市、省轄市、新竹縣、台中縣、台東縣及花蓮縣之
154
外,其餘各縣均至少有一個地區。其中,又以台南縣為數最多,計有 11 個地區,
其次分別為嘉義縣、苗栗縣等各有 6-7 個。
集群七:綜觀這個集群在六個變項的表現,不難發現,除了「15-64 歲人口百分比」及「65 歲及以上人口百分比」這二項略高於幾個集群以外,其餘如工、商業人口百分比、
專科以上人口數百分比及人口密度等四項,均是列為最末者。換言之,這些鄉鎮的 工商業活動相當低度,並存有最低層級的教育程度及人數稀少的居民,故名之為
「偏遠鄉鎮」。在這些鄉鎮中,乃是以屏東縣與台東縣所佔的地區為最多,分別為 8 個與 9 個。除了直轄市、省轄市、台中縣、彰化縣、台南縣以外,其他各縣均各 涵蓋 1-2 個地區。
155 表三 各集群鄉鎮市區數與人口數統計一覽表
集群一 集群二 集群三 集群四 集群五 集群六 集群七 鄉鎮市區
縣市 地區
數 人口數 地區
數 人口數 地區
數 人口數 地區
數 人口數 地區
數 人口數 地區
數 人口數 地區
數 人口數 總數
台北縣 6 2135663 5 842577 8 583668 1 45195 5 72653 3 23464 1 4879 29
宜蘭縣 2 167384 3 133288 4 128434 1 21530 2 11650 12
桃園縣 1 368765 6 1065708 5 407545 1 11011 13
新竹縣 1 105651 9 342533 1 6233 2 12829 13
苗栗縣 2 163504 8 282427 1 19137 6 90059 1 5516 18
台中縣 1 184164 14 1157341 3 91791 3 93744 21
彰化縣 8 669097 8 317339 7 254578 3 75748 26
南投縣 2 204698 8 283785 1 17031 2 32899 13
雲林縣 1 103910 1 21036 15 527402 3 84424 20
嘉義縣 2 127727 7 234699 7 185765 2 9712 18
台南縣 1 78390 6 468420 10 298129 3 40728 11 220007 31
高雄縣 2 373603 13 652011 1 31618 5 133608 3 38099 3 9986 27 屏東縣 1 216777 1 11792 1 50188 21 556384 1 10460 8 54598 33
台東縣 7 179953 9 60420 16
花蓮縣 2 187342 1 21042 7 111406 3 29359 13
澎湖縣 5 78875 1 12933 6
基隆市 6 336818 1 55519 7
新竹市 2 319027 1 67923 3
台中市 4 393355 4 627937 8
嘉義市 2 270341 2
台南市 2 276395 3 310104 1 168418 6
台北市 7 1452333 5 1170139 12
高雄市 6 704798 3 492947 2 314932 11
總計 25 4962544 40 5946315 73 6074649 47 1887801 98 2715386 41 785753 34 242859 358 人口數
百分比 21.94% 26.29% 26.86% 8.35% 12.01% 3.47% 1.07% 100.00%
「台灣地區社會變遷調查計畫」在執行第五期的抽樣設計時,即是採取前述的集群分 層方式。但為了便利於調查行政上的作業,乃將集群六與集群七合併為同一集群;換言之,
實 際 執 行 抽 樣 時 , 是 利 用 合 併 後 的 六 個 集 群 作 為 抽 樣 分 層 的 依 據 , 再 搭 配 分 層 抽 樣
(stratified sampling)與等距抽樣(systematic sampling)二種方式,進行分層三階段等機率 抽樣(Probability Proportional to size,PPS)。這種作法除了符合機率抽樣原則,使每一個 人均有一個「不為零」的被抽中機會之外,也同時保障每一個人的中選機率相同。各分層的 相關統計與抽取數,請參見表四。
156
表四 第五期第一次社會變遷抽樣分層之統計資料
層別 該層人口數 鄉鎮數 比例 應抽取數 鄉鎮數 村里數 各村里抽取數 總抽取數
1 3853671 25 0.445 445.877 12 2 19 456
2 4522719 40 0.523 523.287 12 2 22 528
3 4546622 73 0.526 526.052 10 2 26 520
4 1420249 47 0.164 164.325 4 2 21 168
5 2122665 98 0.245 245.596 4 2 31 248
6 819874 75 0.094 94.860 2 2 24 96
總數 17285800 358 44 12 143 2016
*1.「第六層」為合併前述集群之第六層與第七層。
2. 表中人口數為民國九十三年底前滿 18 歲之人口數。
參考文獻:
洪永泰. 1992. 民意調查的抽樣設計. 研考會雙月刊, 第16卷第1期. 頁22-34.
羅啟宏. 1992. 台灣省鄉鎮發展類型之研究. 台灣經濟月刊, 190期. 頁41-68.
Fowler, Floyed. J. Jr. 1993. Survey Research Methods. Newbury Park : Sage.
<附錄一> 台灣地區 358 個鄉鎮市區七分層一覽表
高雄縣美濃鎮、高雄縣六龜鄉、高雄縣甲仙鄉、屏東縣潮州鎮、屏東縣恆春鎮 屏東縣萬丹鄉、屏東縣長治鄉、屏東縣九如鄉、屏東縣里港鄉、屏東縣鹽埔鄉 屏東縣高樹鄉、屏東縣萬巒鄉、屏東縣內埔鄉、屏東縣竹田鄉、屏東縣新埤鄉 屏東縣枋寮鄉、屏東縣新園鄉、屏東縣崁頂鄉、屏東縣林邊鄉、屏東縣南州鄉 屏東縣佳冬鄉、屏東縣滿州鄉、屏東縣枋山鄉、屏東縣霧台鄉、台東縣台東市 台東縣關山鎮、台東縣卑南鄉、台東縣鹿野鄉、台東縣池上鄉、台東縣東河鄉 台東縣長濱鄉、花蓮縣鳳林鎮、花蓮縣玉里鎮、花蓮縣壽豐鄉、花蓮縣光復鄉 花蓮縣豐濱鄉、花蓮縣瑞穗鄉、花蓮縣富里鄉、澎湖縣馬公市、澎湖縣白沙鄉 澎湖縣西嶼鄉、澎湖縣望安鄉、澎湖縣七美鄉
台北縣石碇鄉、台北縣平溪鄉、台北縣雙溪鄉、宜蘭縣三星鄉、新竹縣峨眉鄉
集群六
苗栗縣通霄鎮、苗栗縣大湖鄉、苗栗縣南庄鄉、苗栗縣西湖鄉、苗栗縣三灣鄉 (高齡化鄉鎮)
苗栗縣獅潭鄉、彰化縣二水鄉、彰化縣芳苑鄉、彰化縣大城鄉、南投縣中寮鄉
苗栗縣獅潭鄉、彰化縣二水鄉、彰化縣芳苑鄉、彰化縣大城鄉、南投縣中寮鄉