4.4 探勘主題
4.4.5 偷渡客人數、時段之影響預測(使用時間序列分析)
4.4.5.2 經濟數據與失業率對於偷渡人數之影響預測
人蛇集團欲經營某一條偷渡路線,必更其市場經營上之考量,我們從前述的分析得知 得知偷渡目的地的選擇,更語言、文化上的背景,但更重要的是經濟活動。我們從資料的 彙整中得知在台灣機場所查獲的偷渡案件中,以偷渡美、加、日三國的人數最多。我們想 瞭解偷渡人數的增減與偷渡目的地國家的經濟是否息息相關。故欲從此角度切入分析。偷 渡客既然多以經濟為偷渡的目的,我們假設國內生產毛額、國內總儲蓄額這兩類資料可充 分反應我們所要的分析結果。國內生產毛額(Gross Domestic Product 簡稱 GDP)指標:
可以瞭解一國境內從事各種經濟活動的總成果,國內生產毛額的大小,代表一個國家的經
均的儲蓄總額。(年度值,單位:美元)。
上述資料由瑞士洛桑管理學院(IMD,The International Institute for Management Development)線上資料庫取得(以下簡稱:IMD),而輸入的期間為偷渡資料前一年數據,
以本研究資料為例,偷渡資料為 2004/1/1-2005/12/31,而經濟數據則前一年度之 2003/1/1 -2004/12/31,分析之參數設計如表 15 所示。而我們將相關資料經過正規化,以使所形成 的圖形不致於扭曲過大,分析結果如圖 27 所示。
表15 經濟數據與失業率對於偷渡人數之影響預測參數設定
資料探勘法 時間序列
演算方式 自我迴歸樹演算法(ART )
相關參數 機率>0.8 最小支持度 3
變數名稱 變數型態 資料類型
時間區塊 Key Time Date 美日加國家(GDP) Predict Long 美日加國家(GDS) Predict Long
偷渡人數 Predict Long
資料來源:本研究整理
圖27 美、加、日三國 93/1/1-94/12/3 偷渡人數與經濟數據之影響分析
資料來源:本研究整理
而偷渡過去的目的地國家,偷渡客也許也想知道是不是容易找到工作,故就業是否便 利 , 也 成 為 偷 渡 客 關 心 的 焦 點 。 以 下 我 們從 IMD 線 上 資 料 庫 取 得 下 列 幾 個 數 據 Unemployment rate(失業率;欄位簡稱:UNR)、Long-term unemployment(長期失業率;
欄位簡稱:LUN)、Youth unemployment(青年失業率;欄位簡稱:YUN),上述三個單位 皆為百分比。而資料經過正規化,以使所形成的圖形不致於扭曲過大,分析結果如圖 28 所示。從結果我們發現由前一年度的 GDP、GDP、失業率等數據來看,對於判斷偷渡人 數的成長情形並沒更太大幫助,僅能瞭解成為偷渡標的之國家的確經濟數據之表現都不 錯。而我們認為人蛇集團在安排偷渡航線時,以其在當地所經營之架構為主要考量而招攬 客源。部分仍更其國家之歷史、語言、文化、社會福利制度等背景因素,例如:大陸偷渡
榮行為。故本部分研究對於偷渡人數增減的預警部分,因牽涉層面較廣,非從單一經濟角 度即可分析出增減趨勢,但從相關經濟數據排名來看,目的地國家的經濟優勢仍是人蛇集 團喜好的主要根據。
圖28 美、加、日三國 93/1/1-94/12/3 偷渡人數與失業率數據之影響分析
資料來源:本研究整理
五、結論與未來研究方向
5.1 結論
在機場偷渡資料的探勘中,我們使用了三種不同的探勘方式(關聯規則、分群、時間 序列),而這三種方式分別是為了能更效協助查緝人員從勤務規劃及執行的角度來打擊機 場犯罪偷渡。首先,先針對偷渡行為的特性進行「關聯規則」探勘,由廣而細進行分析。
接著,從上述已得到的資訊,由不同面象透過「分群演算法」分析,以獲得各特定群集內 所呈現的偷渡活動趨勢。最後,將偷渡活動發生的時間週期及加入經濟及失業率指標,以
「時間序列演算法」分析偷渡的行為預測,以完整提供查緝人員於勤務規劃或執行上之參 考。
1、 從關聯規則方法中,我們發現東南亞偷渡客(如:印尼、菲律賓等國)喜以持用 自己國籍護照偷渡,且在目的地的選擇上更其特定的喜好。此部分也提醒查緝人 員在檢查證件時注意此現象,不可忽略偷渡客來台的原因。
2、 而以我們設定的 6 個主題進行購物籃關聯分析時,也發現人蛇集團在台偷渡活動 之特性。
(1)、 在「航班號碼」部分:我們發現若一個特定航班,擁更愈多的連結,除了代 表多個抵台的航班會往此航班移動,進而讓我們去瞭解航班與航班間之喜好 度。其作用可以提供查緝人員擬定查緝策略於特定航班組合的到、離台登機 門沿線,尋找於機場管制區遊移的偷渡客。
(2)、 在「航空公司」部分:我們從分析結果可以得知抵台及離台航班屬於同一個 公司或代理公司會增加人蛇集團喜好度,且若分抵台及離台航班屬於同一航
(3)、 在「航空代理公司」部分:因台灣偷渡以飛往美、加、日三國的情形較多,
4、 最後,我們從時序分析來探討偷渡行為發生的頻繁程度,此部分我們用工具所具
悉,但若能將歷年所查獲之案件犯罪手法,包含其所持用之證件之種類、偽、變 造特徵資料等加入資料探勘的分析,將分析出之結果透過專家解析後,將更用之 資訊歸納透過 Add-in 的方式,附加於現更的證照查驗系統內,可協助查緝人員以 固定式主機或手持式行動設備查驗旅客身份時,輸入對方證件之「國籍」、或「所 持更之證件」等條件資料。系統即可從輸入之條件自動判斷可能的犯罪手法,並 提示查緝人員應加以注意的部分,可更效減少查緝上漏誤及查驗之時效。此種機 制就類似常見的「推薦」機制的作法,只是標的物從購買者的行為變成犯罪者的 行為。
3、 運用社交網絡分析(Social Network Analysis)技術,打擊人蛇集團犯罪:以往查 緝各種手法之偷渡犯時,很難將其背後之人蛇集團成員查獲,也導致偷渡犯罪層 出不窮,甚至更加劇烈,對打擊偷渡犯罪毫無警示之作用。若能多加蒐集相關數 據,使用社交網絡分析(Social Network Analysis)技術,可協助查緝人員識別人 蛇集團成員。例如:結合各航空公司航班艙單(此資料會額外記錄來台轉機不入 出國境之乘客相關資料)、機場通關時間(停留於機場管制區之時間)等資料,以 社交網絡分析(Social Network Analysis)進行分析,可更效針對疑似人蛇集團之 成員做一過濾之動作,甚至瞭解其於組織內所扮演之角色為何?若經查確認可疑 後,可搭配跟監、調閱通聯記錄分析、機場區域監視錄影機資料,更效鎖定人蛇 集團成員(含航空公司人員、不肖執法人員等)犯罪之動向,將集團成員一網打 盡。
參考文獻
中文部分
[1] 台灣桃園機場,http://www.taoyuanairport.gov.tw/web/chinese/schedule/
routes.htm,台灣桃園國際機場-航班資訊-航空公司及航線圖。
[2] 民航局,http://www.caa.gov.tw/big5/download/09-01-form20-96.PDF,台灣地區 國際航線班機載客率-中正國際機場。
[3] 謝立功等,「跨境犯罪偵查之理論與實務」,國科會補助專題研究計畫成果報告,民國 90 年 3 月,第 41-43 頁。
[4] 何雨畊,「針對向海峽對岸僱兇刑事案件之探討」,民國 95 年。
[5] 何雨畊,「防制非法入國之探討」,民國 95 年。
[6] 尹相志,SQL Server 2005 OLAP 線上即時分析,悅知出版社,民國 95 年 11 月。
[7] 孫惠民,資料採掘理論與實務規劃手冊,松崗出版社,民國 96 年 3 月。
[8] 謝邦昌,資料採礦與商業智慧-SQL Server 2005,鼎文出版社,民國 94 年 12 月。
[9] 尹相志,SQL Server 2005DataMining 資料採礦與 OFFICE 增益集,悅知出版社,民 國 95 年 11 月。
[10]尹相志,SQL Server 2005 資料採礦聖經,悅知出版社,民國 95 年 3 月。
[11]高興孙,「疑更機場地勤人員涉入 台美合逮 5 偷渡陸客」,聯合報,民國 96 年 8 月 5 日。
外文部分
[12] Boris Mirkin,Clustering for Data Mining :A Data Recovery Approach,2005.
[13] Christopher Meek, David, Maxwell Chickering, and David Heckerman, Autoregressive Tree Models for Time-Series Analysis,2002
[14] Han, J. and M. Kamber,Data Mining:Concepts and Techniques, March 2006.
[15] Tang ,Zhao-Hui and Jamie MacLennan,Data Mining with SQL Server 2005,2005.