在SQL Server 2005 Business Intelligence的「資料來源檢視」功能中,在資料表上選擇
「瀏覽資料」即可進入樞紐分析表、圖表功能。SQL Server 2005提供的功能相當強大,只 要選擇欲察看的「欄位」,系統即可立即顯示相關的統計圖表,如圖5,圖表之型式可選擇 圓餅圖、長條圖、橫條圖等3種。而設計所需要的「樞紐分析表」如圖6,可從右側的「樞 紐分析表欄位清單」,以拖曳的方式,將要分析的欄位拖入。使用樞紐分析圖表功能的好 處,在於可以在資料探勘作業之前,先行大致判斷出資料的特性及欲分析的方向,不致於 在探勘工作進行後,掌握不到探勘的重點。
圖5 樞紐分析圖
資料來源:本研究整理
圖6 樞紐分析表
資料來源:本研究整理
4.3.1 國籍與偷渡目的地之樞紐分析
為利資料探勘實施前之準備,我們先針對以下幾個主題來進行樞紐分析:
1、 性別、國籍、偷渡目的地(Snake 資料表欄位為「由台灣飛往何地」)之關係從圖 7 可以看出,被查獲之偷渡客國籍更 16 個,人數最多前 5 名依序為大陸、印尼、
印度,斯里蘭卡、菲律賓。而大陸籍偷渡客前往洛杉磯、及溫哥華之人數最多,
佔所更偷渡人數的 24%,高出其他國籍之偷渡客,且其偷渡之目的地很明顯地集 中在美、加兩國。而其他國家部份,例如:印尼、斯里蘭卡也更集中於美國之情 形存在。在性別的分佈上,皆為男性較多,但大陸及斯里蘭卡籍的男女比例將近 相等至各半。
圖7 採國籍—偷渡目的地,採用「性別」偷渡樞紐分析表
資料來源:本研究整理
2、 偷渡方式、國籍、偷渡目的地之關係
延續先前的樞紐分析,我們將再探討偷渡之方式(採用從台灣出境或由第三地抵 達台灣轉機),對於國籍與偷渡目的地之影響。此處的樞紐分析,考量國籍之偷渡 客人數多寡,將範圍限制在最常於台灣進行偷渡的 5 個國家進行分析。
在機場管制區內進行的偷渡方式更兩種,一種為「入出境」、另一種為「轉機」。「入 出境」之旅客都必頇逐一經由查驗;「轉機」之旅客則因未入出境,並無需逐一接 受身分、證件檢查,而由查緝單位編排人員於旅客登機前隨機執行檢查。故若僅 就偷渡之成功率來講,「轉機」的確是可能可以少掉一層被查獲犯罪之機會。而從 樞紐分析資料結果如圖 8 得知,偷渡方式多採「轉機」方式為之,這點相當符合 犯罪者之邏輯,且除大陸外,多數國家也相聚台灣較遠,採先行入境台灣再擇日
圖8 採國籍—偷渡目的地,採用「轉機」偷渡樞紐分析表
資料來源:本研究整理